[教程]Python中设置两个行索引：掌握高效多条件筛选技巧

csdn大佬

发布于 2025-12-06 21:30:44

1488

引言在Python中，经常需要对数据进行行筛选，尤其是在处理大型数据集时。多条件筛选是数据处理的常见需求，掌握高效的筛选技巧可以大大提高数据处理效率。本文将介绍如何在Python中使用Pandas库来...

引言

在Python中，经常需要对数据进行行筛选，尤其是在处理大型数据集时。多条件筛选是数据处理的常见需求，掌握高效的筛选技巧可以大大提高数据处理效率。本文将介绍如何在Python中使用Pandas库来设置两个行索引，并运用多条件筛选技巧。

1. 准备工作

在开始之前，请确保已经安装了Pandas库。如果没有安装，可以使用以下命令进行安装：

pip install pandas

2. 创建数据集

为了演示如何进行多条件筛选，我们首先创建一个简单的DataFrame：

import pandas as pd
# 创建数据集
data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'], 'Age': [25, 30, 35, 40, 45], 'Salary': [50000, 60000, 70000, 80000, 90000]
}
df = pd.DataFrame(data)
print(df)

输出结果如下：

 Name Age Salary
0 Alice 25 50000
1 Bob 30 60000
2 Charlie 35 70000
3 David 40 80000
4 Eve 45 90000

3. 设置行索引

为了进行多条件筛选，我们需要先设置行索引。以下是设置两个行索引的示例：

df.set_index(['Name', 'Age'], inplace=True)
print(df)

输出结果如下：

 Salary
Name Age
Alice 25 50000
Alice 30 60000
Bob 30 60000
Charlie 35 70000
David 40 80000
Eve 45 90000

4. 多条件筛选

现在我们可以使用Pandas的布尔索引功能来执行多条件筛选。以下是一个筛选年龄大于30且工资大于70000的员工的示例：

filtered_df = df.loc[(df.index.get_level_values('Age') > 30) & (df.index.get_level_values('Salary') > 70000)]
print(filtered_df)

输出结果如下：

 Salary
Name Age
Charlie 35 70000
David 40 80000
Eve 45 90000

5. 总结

本文介绍了如何在Python中使用Pandas设置两个行索引，并运用多条件筛选技巧。通过以上示例，您应该能够理解如何根据不同的条件筛选数据。在实际应用中，您可以根据需要调整筛选条件，以满足您的需求。

6. 代码示例

以下是本文中使用的代码示例：

import pandas as pd
# 创建数据集
data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'], 'Age': [25, 30, 35, 40, 45], 'Salary': [50000, 60000, 70000, 80000, 90000]
}
df = pd.DataFrame(data)
# 设置行索引
df.set_index(['Name', 'Age'], inplace=True)
# 多条件筛选
filtered_df = df.loc[(df.index.get_level_values('Age') > 30) & (df.index.get_level_values('Salary') > 70000)]
print(filtered_df)

希望本文能帮助您掌握Python中的多条件筛选技巧。如果您有任何疑问或建议，请随时提出。

一个月内的热帖推荐