如果您的数据集包含空值,则可以使用dropna()函数分析并删除数据集中的行/列。
DataFrameName.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
它返回删除了NA条目的DataFrame。
对于演示,首先,获取一个csv文件,该文件将从数据集中删除任何列。
import pandas as pd aa = pd.read_csv("aa.csv") aa.head()
输出
Name | Hire Date | Salary | Leaves Remaining |
---|---|---|---|
0 John Idle | 03/15/14 | 50000.0 | 10 |
1 Learnfk Gilliam | 06/01/15 | 65000.0 | 8 |
2 Parker Chapman | 05/12/14 | 45000.0 | 10 |
3 Jones Palin | 11/01/13 | 70000.0 | 3 |
4 Terry Gilliam | 08/12/14 | 48000.0 | 7 |
5 Michael Palin | 05/23/13 | 66000.0 | 8 |
# importing pandas module import pandas as pd # 从csv文件制作数据框 info = pd.read_csv("aa.csv") # 制作旧数据框的副本 copy = pd.read_csv("aa.csv") # 在新数据框中使用所有空值创建值 copy["Null Column"]= None # 检查列是否正确插入 print(info.columns.values, "\n", copy.columns.values) # 在删除空列之前比较值 print("\nColumn number before dropping Null column\n", len(info.dtypes), len(copy.dtypes)) # 删除所有空值的列 copy.dropna(axis = 1, how ='all', inplace = True) # 删除空列后比较值 print("\nColumn number after dropping Null column\n", len(info.dtypes), len(info.dtypes))
输出
[' Name Hire Date Salary Leaves Remaining'] [' Name Hire Date Salary Leaves Remaining' 'Null Column'] Column number before dropping Null column 1 2 Column number after dropping Null column 1 1
上面的代码从数据集中删除了null列,并返回了一个新的DataFrame。
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)