在Pandas中,DataFrame有多种有用的数据操作,如下所示:
可以通过传递行和列的名称来选择DataFrame的任何行和列。当您从DataFrame中选择它时,它将变为一维并被视为Series。
可以通过在DataFrame中提供一些布尔表达式来过滤数据。
当没有数据提供给项目时,可能会出现Null值。各个列可能不包含通常表示为NaN的值。在Pandas中,有几个有用的函数可用于检测,删除和替换dataframe中的空值。这些函数如下:
isnull() - isull()的主要任务是,如果任何行具有空值,则返回true值。
notnull() - 与isull()函数相反,它为非空值返回真值。
dropna() - 此方法分析并删除空值的行/列。
fillna() - 它允许用户将NaN值替换为其他一些值。
replace() - 这是一个非常丰富的函数,可以替换字符串,正则表达式,Series,字典等。
interpolate() - 这是一个非常强大的函数,可填充DataFrame或Series中的空值。
Pandas提供了一组字符串函数,可对字符串数据进行操作,并忽略missing/ NaN值。使用 .str。选项可以执行不同的字符串操作。这些函数如下:
lower() - 它将Series或索引的任何字符串转换为小写字母。
upper() - 它将Series或索引的任何字符串转换为大写字母。
strip() - 此函数有助于从Series/index中的每个字符串中去除空格,包括换行。
split('') - 是使用给定模式分割字符串的函数。
cat(sep ='') - 它将Series/Index元素与给定的分隔符连接在一起。
contains(pattern) - 如果元素中存在子字符串,则返回True,否则返回False。
replace(a,b) - 它将值a替换为值b。
repeat(value) - 它将每个元素重复指定的次数。
count(pattern) - 它返回每个元素中样式外观的计数。
startswith(pattern) - 如果Series中的所有元素均以模式开头,则返回True。
endswith(pattern) - 如果Series中的所有元素均以模式结尾,则返回True。
find(pattern) - 用于返回图案的第一个匹配项。
findall(pattern) - 它返回所有出现的模式的列表。
swapcase - 用于交换大小写。
islower() - 如果Series/Index字符串中的所有字符均为小写,则返回True。否则,它返回False。
isupper() - 如果"Series/Index"字符串中的所有字符均为大写,则返回True。否则,它返回False。
isnumeric() - 如果"Series/Index"字符串中的所有字符均为数字,则返回True。否则,它返回False。
Count Values - 此操作用于使用' value_counts()'选项对出现的总数进行计数。
Plots - Pandas使用 matplotlib 库绘制图形。 .plot()方法允许您绘制数据图。
.plot()函数针对每个列绘制索引,您还可以将参数传递到 plot()函数以绘制特定的列。
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)