[教程]揭秘Python高效遍历文件夹：轻松依次读取每个文件的秘密

csdn大佬

发布于 2025-06-25 03:30:35

引言在Python编程中，遍历文件夹以读取文件内容是一个常见的任务。对于大型文件或复杂的项目结构，如何高效地遍历文件夹并依次读取每个文件是一个需要考虑的问题。本文将深入探讨Python中高效遍历文件夹...

引言

在Python编程中，遍历文件夹以读取文件内容是一个常见的任务。对于大型文件或复杂的项目结构，如何高效地遍历文件夹并依次读取每个文件是一个需要考虑的问题。本文将深入探讨Python中高效遍历文件夹的方法，并提供详细的代码示例。

文件夹遍历方法

在Python中，有几个常用的模块可以用来遍历文件夹，包括os和pathlib。以下是两种常用的遍历方法：

1. 使用`os`模块

os模块提供了丰富的文件和目录操作函数。使用os.walk()函数可以递归遍历文件夹，并返回一个三元组(root, dirs, files)，其中：

root是当前正在遍历的文件夹的路径。
dirs是一个列表，包含了root文件夹下的所有子文件夹。
files是一个列表，包含了root文件夹下的所有文件。

以下是一个使用os.walk()遍历文件夹的示例：

import os
def list_files(directory): for root, dirs, files in os.walk(directory): for file in files: print(os.path.join(root, file))
list_files('/path/to/your/directory')

2. 使用`pathlib`模块

pathlib是Python 3.4及以上版本中引入的一个模块，提供了面向对象的文件系统路径操作。使用Path类和它的glob()方法可以轻松地遍历文件夹。

以下是一个使用pathlib遍历文件夹的示例：

from pathlib import Path
def list_files(directory): for file in Path(directory).glob('*'): print(file)
list_files('/path/to/your/directory')

高效读取文件内容

在遍历文件夹时，高效地读取文件内容同样重要。以下是一些读取文件内容的方法：

1. 使用文件对象

文件对象是Python中最常见的读取文件的方式。以下是一个简单的例子：

def read_file(file_path): with open(file_path, 'r') as file: content = file.read() print(content)
read_file('/path/to/your/file.txt')

2. 使用生成器

如果你需要处理大量的小文件，使用生成器可以节省内存。以下是一个使用生成器的例子：

def read_files(directory): for file in Path(directory).glob('*'): with file.open('r') as f: yield f.read()
for content in read_files('/path/to/your/directory'): print(content)

总结

本文介绍了Python中高效遍历文件夹的方法，包括使用os模块和pathlib模块。同时，还讨论了读取文件内容的不同方法，包括使用文件对象和生成器。通过这些方法，你可以轻松地在Python中遍历文件夹并读取文件内容。

一个月内的热帖推荐