[教程]破解Python高效遍历文件夹：轻松掌控每一份文件奥秘

发布于 2025-06-24 21:30:33

1340

在Python中，遍历文件夹是一个常见且基础的操作，无论是进行文件搜索、读取文件内容还是执行其他文件操作，都需要对文件夹进行遍历。高效地遍历文件夹可以提高程序的性能，减少资源消耗。以下是一些方法，可以...

在Python中，遍历文件夹是一个常见且基础的操作，无论是进行文件搜索、读取文件内容还是执行其他文件操作，都需要对文件夹进行遍历。高效地遍历文件夹可以提高程序的性能，减少资源消耗。以下是一些方法，可以帮助你轻松掌控Python中的文件夹遍历。

1. 使用`os`模块

Python的os模块提供了遍历文件夹的功能。以下是使用os.listdir()和os.path的一些基本用法：

import os
# 遍历当前目录
for filename in os.listdir('.'): print(filename)
# 遍历指定目录
for filename in os.listdir('path_to_directory'): print(filename)

这种方法简单直接，但是它只能列出当前目录下的文件和子目录。如果你想递归地遍历所有子目录，可以使用os.walk()：

for root, dirs, files in os.walk('path_to_directory'): for name in files: print(os.path.join(root, name))

这里，os.walk()会返回一个三元组（root, dirs, files），其中root是当前正在遍历的目录的路径，dirs是该目录下的子目录列表，files是该目录下的文件列表。

2. 使用`glob`模块

glob模块提供了一种更高级的方式来匹配文件名模式，并遍历匹配的文件：

import glob
# 遍历当前目录下所有`.txt`文件
for file in glob.glob('*.txt'): print(file)
# 遍历指定目录下所有`.txt`文件
for file in glob.glob('path_to_directory/*.txt'): print(file)

glob.glob()可以接受通配符（如*和?），这使得它非常适合于搜索具有特定模式的文件。

3. 使用`pathlib`模块

Python 3.4及以上版本引入了pathlib模块，它提供了一种面向对象的方式来处理文件系统路径。使用pathlib遍历文件夹的方法如下：

from pathlib import Path
# 遍历当前目录
for path in Path('.').iterdir(): print(path)
# 遍历指定目录
for path in Path('path_to_directory').iterdir(): print(path)

iterdir()方法返回一个迭代器，它会产生目录下的所有条目。与os.walk()类似，Path也提供了rglob()方法，可以递归遍历所有子目录：

for path in Path('path_to_directory').rglob('*.txt'): print(path)

4. 性能优化

当遍历大量文件时，性能成为一个重要考虑因素。以下是一些优化建议：

使用生成器而不是列表来遍历文件，这样可以减少内存消耗。
在可能的情况下使用多线程或多进程来并行处理文件，尤其是在处理IO密集型任务时。
避免在循环中进行不必要的文件操作，例如，不要在循环中打开和关闭文件。

5. 示例：批量处理文件

以下是一个使用pathlib模块遍历文件夹并批量处理文件的示例：

from pathlib import Path
# 指定目录和文件扩展名
directory = Path('path_to_directory')
file_extension = '.txt'
# 遍历并处理所有.txt文件
for file in directory.glob(f'*{file_extension}'): # 执行文件处理操作 print(f"Processing file: {file}") # 例如，读取文件内容 with file.open('r') as f: content = f.read() # 处理文件内容

在这个例子中，我们使用了pathlib的glob方法来匹配所有.txt文件，并使用with语句来安全地打开和处理每个文件。

通过以上方法，你可以轻松地在Python中遍历文件夹，并高效地处理文件。无论是简单的文件列表打印还是复杂的文件操作，这些工具和技巧都能帮助你实现目标。

一个月内的热帖推荐

[教程]破解Python高效遍历文件夹：轻松掌控每一份文件奥秘

1. 使用os模块

2. 使用glob模块

3. 使用pathlib模块

4. 性能优化

5. 示例：批量处理文件

csdn大佬

1. 使用`os`模块

2. 使用`glob`模块

3. 使用`pathlib`模块