[教程]揭秘Python中值空描述的5种高效方法

csdn大佬

发布于 2025-11-25 21:30:13

826

1. 使用pandas填充缺失值pandas是一个强大的数据分析库，它提供了多种方法来处理缺失值。以下是一些常见的方法：1.1 使用fillna()方法fillna()方法可以直接填充缺失值，可以使用...

1. 使用pandas填充缺失值

pandas是一个强大的数据分析库，它提供了多种方法来处理缺失值。以下是一些常见的方法：

1.1 使用`fillna()`方法

fillna()方法可以直接填充缺失值，可以使用一个具体的值、前一个值、后一个值或者一个函数来填充。

import pandas as pd
# 创建一个包含缺失值的DataFrame
data = {'A': [1, 2, None, 4], 'B': [5, None, 7, 8]}
df = pd.DataFrame(data)
# 使用具体值填充
df_filled = df.fillna(0)
# 使用前一个值填充
df_filled = df.fillna(method='ffill')
# 使用后一个值填充
df_filled = df.fillna(method='bfill')
# 使用函数填充
df_filled = df.fillna(lambda x: x.mean())

1.2 使用`dropna()`方法

dropna()方法可以删除含有缺失值的行或列。

# 删除含有缺失值的行
df_dropped = df.dropna()
# 删除含有缺失值的列
df_dropped = df.dropna(axis=1)

2. 使用numpy处理缺失值

numpy是一个高性能的科学计算库，它也提供了处理缺失值的方法。

2.1 使用`np.nan_to_num()`方法

np.nan_to_num()方法可以将NaN值替换为0或其他指定的值。

import numpy as np
# 创建一个包含缺失值的numpy数组
data = np.array([1, 2, np.nan, 4])
data_filled = np.nan_to_num(data, nan=0)

3. 使用sklearn的`SimpleImputer`类

sklearn提供了SimpleImputer类，可以用来填充缺失值。

3.1 使用`SimpleImputer`填充

from sklearn.impute import SimpleImputer
# 创建一个包含缺失值的DataFrame
data = {'A': [1, 2, None, 4], 'B': [5, None, 7, 8]}
df = pd.DataFrame(data)
# 使用均值填充
imputer = SimpleImputer(strategy='mean')
df_filled = pd.DataFrame(imputer.fit_transform(df), columns=df.columns)

4. 使用scipy的`mode()`方法

mode()方法可以找到数组中的众数，并使用它来填充缺失值。

4.1 使用`mode()`方法填充

from scipy import stats
# 创建一个包含缺失值的numpy数组
data = np.array([1, 2, np.nan, 4])
data_filled = stats.mode(data, nan_policy='omit').mode[0]

5. 使用自定义函数处理缺失值

有时，你可能需要根据特定的规则来填充缺失值。这时，你可以编写一个自定义函数来实现。

5.1 自定义函数填充

def custom_fillna(value): if pd.isna(value): return 0 else: return value
# 创建一个包含缺失值的DataFrame
data = {'A': [1, 2, None, 4], 'B': [5, None, 7, 8]}
df = pd.DataFrame(data)
# 使用自定义函数填充
df_filled = df.applymap(custom_fillna)

以上就是Python中处理缺失值的5种高效方法。根据你的具体需求和数据特点，选择最合适的方法来填充缺失值。

一个月内的热帖推荐

[教程]揭秘Python中值空描述的5种高效方法

1. 使用pandas填充缺失值

1.1 使用fillna()方法

1.2 使用dropna()方法

2. 使用numpy处理缺失值

2.1 使用np.nan_to_num()方法

3. 使用sklearn的SimpleImputer类

3.1 使用SimpleImputer填充

4. 使用scipy的mode()方法

4.1 使用mode()方法填充