[教程]揭秘Python高效拆分Excel，完美保留原始格式技巧

发布于 2025-07-01 15:30:09

940

引言在数据处理和文件管理中，Excel文件因其强大的功能和灵活性而被广泛使用。然而，当处理包含大量数据的Excel文件时，对其进行拆分以优化管理和访问效率变得尤为重要。Python作为一种功能强大的编...

引言

在数据处理和文件管理中，Excel文件因其强大的功能和灵活性而被广泛使用。然而，当处理包含大量数据的Excel文件时，对其进行拆分以优化管理和访问效率变得尤为重要。Python作为一种功能强大的编程语言，提供了多种方法来高效拆分Excel文件，同时保留原始格式。本文将详细介绍这些技巧，帮助您轻松实现Excel文件的拆分。

准备工作

在开始之前，请确保您已安装以下Python库：

pandas
openpyxl
xlrd
xlwt

您可以使用以下命令进行安装：

pip install pandas openpyxl xlrd xlwt

方法一：使用pandas按列值拆分

pandas库是Python中处理数据的主要工具之一，它可以轻松地读取、操作和保存Excel文件。

1. 读取Excel文件

首先，使用pandas读取Excel文件：

import pandas as pd
df = pd.read_excel('example.xlsx')

2. 按列值拆分

假设您要根据“部门”列的值来拆分Excel文件：

grouped = df.groupby('Department')

3. 保存拆分后的文件

遍历每个分组，并将它们保存为单独的Excel文件：

for department, group in grouped: group.to_excel(f'{department}.xlsx', index=False)

方法二：使用openpyxl按工作表拆分

openpyxl库是处理Excel文件的另一个强大工具，它可以读取和写入Excel文件，同时保留原始格式。

1. 读取Excel文件

使用openpyxl读取Excel文件：

from openpyxl import load_workbook
wb = load_workbook('example.xlsx')

2. 按工作表拆分

遍历所有工作表，并将它们保存为单独的Excel文件：

for sheetname in wb.sheetnames: newwb = openpyxl.Workbook() newws = newwb.active ws = wb[sheetname] for row in ws.iter_rows(values_only=True): newws.append(row) newwb.save(f'{sheetname}.xlsx')

方法三：使用xlrd和xlwt按行数拆分

xlrd和xlwt库可以用来读取和写入Excel文件，同时保留原始格式。

1. 读取Excel文件

使用xlrd读取Excel文件：

import xlrd
wb = xlrd.open_workbook('example.xlsx')

2. 按行数拆分

遍历所有工作表，并根据行数进行拆分：

for sheet in wb.sheets(): rows_per_file = 100 for i in range(0, sheet.nrows, rows_per_file): data = sheet.read_only() rows = data.sheets[sheet.j].get_rows() for row in rows[i:i+rows_per_file]: # 处理行数据

3. 保存拆分后的文件

将拆分后的数据保存为新的Excel文件：

import xlwt
new_wb = xlwt.Workbook()
new_ws = new_wb.add_sheet('Sheet1')
for row in data: new_ws.write(rowx, 0, row[0]) new_ws.write(rowx, 1, row[1]) new_wb.save('new_file.xlsx')