[教程]Python攻略：轻松读取文件中多个文件夹内的数据，一文掌握技巧！

csdn大佬

发布于 2025-06-24 21:30:21

247

在Python中，读取文件中的多个文件夹内的数据是一个常见的任务，尤其是在处理大量数据集或进行文件分析时。以下是一篇文章，将详细指导你如何轻松地在Python中读取文件中多个文件夹内的数据。1. 环境...

在Python中，读取文件中的多个文件夹内的数据是一个常见的任务，尤其是在处理大量数据集或进行文件分析时。以下是一篇文章，将详细指导你如何轻松地在Python中读取文件中多个文件夹内的数据。

1. 环境准备

在开始之前，确保你的Python环境中安装了以下库：

os：用于与操作系统交互。
os.path：用于处理文件路径。
glob：用于搜索符合特定模式匹配的文件。

你可以使用以下命令安装glob库（如果尚未安装）：

pip install glob

2. 使用`os`和`os.path`

os和os.path是Python标准库中的模块，用于处理文件和目录。

2.1 列出文件夹中的文件

假设你有一个文件夹，里面包含多个子文件夹，每个子文件夹中都有文件。你可以使用os.listdir()和os.path.isdir()来列出这些子文件夹。

import os
# 假设文件夹路径为'path_to_folder'
folder_path = 'path_to_folder'
subfolders = [f for f in os.listdir(folder_path) if os.path.isdir(os.path.join(folder_path, f))]
# 打印子文件夹列表
print(subfolders)

2.2 遍历文件夹和文件

使用os.walk()可以遍历文件夹及其所有子文件夹中的文件。

for root, dirs, files in os.walk(folder_path): for file in files: # 处理文件 print(os.path.join(root, file))

3. 使用`glob`

glob模块提供了更强大的文件模式匹配功能。

3.1 搜索特定模式的文件

假设你想要搜索所有.txt文件，可以使用以下代码：

import glob
pattern = os.path.join(folder_path, '*.txt')
for file in glob.glob(pattern): print(file)

3.2 搜索子文件夹中的文件

如果你想要搜索所有子文件夹中的.txt文件，可以使用以下代码：

pattern = os.path.join(folder_path, '**/*.txt')
for file in glob.glob(pattern, recursive=True): print(file)

4. 读取文件内容

一旦你有了文件列表，你可以使用Python的内置功能来读取它们的内容。

4.1 读取文本文件

with open(file, 'r') as f: content = f.read() print(content)

4.2 读取二进制文件

with open(file, 'rb') as f: content = f.read() print(content)

5. 实际案例

以下是一个实际案例，演示如何读取一个名为data的文件夹中所有子文件夹内的.csv文件，并打印每个文件的内容。

import os
data_folder = 'data'
pattern = os.path.join(data_folder, '**/*.csv', recursive=True)
for file in glob.glob(pattern): with open(file, 'r') as f: content = f.read() print(f"Content of {file}:\n{content}\n")

6. 总结

通过使用os和os.path模块，以及glob模块，你可以轻松地在Python中读取文件中多个文件夹内的数据。这些技巧对于数据处理和分析非常有用，可以帮助你更高效地处理大量文件。

一个月内的热帖推荐