[教程]掌握Pandas快速生成表格的实用技巧

csdn大佬

发布于 2025-11-23 03:30:40

773

引言Pandas 是 Python 中一个强大的数据分析库，它提供了丰富的数据结构和数据分析工具。在数据处理和分析中，快速生成表格是基础且关键的一步。本文将介绍一些实用的 Pandas 技巧，帮助您快...

引言

Pandas 是 Python 中一个强大的数据分析库，它提供了丰富的数据结构和数据分析工具。在数据处理和分析中，快速生成表格是基础且关键的一步。本文将介绍一些实用的 Pandas 技巧，帮助您快速生成表格。

一、创建基本表格

1. 使用 DataFrame 创建表格

DataFrame 是 Pandas 中的主要数据结构，类似于 Excel 表格或 SQL 表。以下是一个简单的示例：

import pandas as pd
# 创建一个包含列名和数据的字典
data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago']
}
# 使用字典创建 DataFrame
df = pd.DataFrame(data)
# 显示 DataFrame
print(df)

2. 使用 `read_csv` 读取 CSV 文件

CSV 文件是数据交换的常用格式。以下是如何使用 Pandas 读取 CSV 文件并创建表格：

# 读取 CSV 文件
df = pd.read_csv('data.csv')
# 显示 DataFrame
print(df)

二、数据操作

1. 添加列

在 DataFrame 中添加列非常简单：

df['Gender'] = ['Female', 'Male', 'Male']
print(df)

2. 删除列

删除列同样简单：

df.drop('Gender', axis=1, inplace=True)
print(df)

3. 修改列名

修改列名可以使用 rename 方法：

df.rename(columns={'Name': 'Full Name'}, inplace=True)
print(df)

三、数据筛选

1. 条件筛选

使用布尔索引进行条件筛选：

filtered_df = df[df['Age'] > 30]
print(filtered_df)

2. 筛选特定行

使用 loc 或 iloc 索引器筛选特定行：

# 使用 loc
print(df.loc[1:3])
# 使用 iloc
print(df.iloc[1:3])

四、数据排序

1. 按列排序

使用 sort_values 方法按列排序：

sorted_df = df.sort_values(by='Age')
print(sorted_df)

2. 降序排序

使用 sort_values 方法的 ascending 参数实现降序排序：

sorted_df = df.sort_values(by='Age', ascending=False)
print(sorted_df)

五、数据透视表

1. 创建数据透视表

使用 pivot_table 方法创建数据透视表：

pivot_table = df.pivot_table(values='Age', index='City', aggfunc='mean')
print(pivot_table)

六、总结

通过以上技巧，您可以使用 Pandas 快速生成表格并进行数据处理。熟练掌握这些技巧将大大提高您在数据分析中的效率。

一个月内的热帖推荐