我有以下几点

ID   date    v1   v2  v3   v4  v5  v6
A     ..      1   2   3   NaN NaN NaN 
A     ..      0   2  NaN  NaN NaN NaN
B     ..      0   2   4    5   3   9
B     ..      2   6   6    6   3  NaN
D     ..      2  NaN NaN  NaN NaN NaN
D     ..      9   2   2   NaN NaN NaN
D     ..      2   2   6    6   1   2

我想提取列(来自v1-v5)不丢失的行.

期望输出

ID   date    v1   v2  v3   v4  v5  v6
B     ..      0   2   4    5   3   9
B     ..      2   6   6    6   3  NaN
D     ..      2   2   6    6   1   2

谢谢

推荐答案

dropna与子集一起使用:

cols = ['v1', 'v2', 'v3', 'v4', 'v5']
df2 = df.dropna(subset=cols)

或者,使用notnaall组合表示boolean indexing:

cols = ['v1', 'v2', 'v3', 'v4', 'v5']

df2 = df[df[cols].notna().all(axis=1)]

如果v1-v5是连续的,则可 Select :

df2 = df[df.loc[:, 'v1':'v5'].notna().all(axis=1)]

输出:

  ID date  v1   v2   v3   v4   v5   v6
2  B   ..   0  2.0  4.0  5.0  3.0  9.0
3  B   ..   2  6.0  6.0  6.0  3.0  NaN
6  D   ..   2  2.0  6.0  6.0  1.0  2.0

Python相关问答推荐

Python:MultiIndex Dataframe到类似json的字典列表

具有多个组的条形图的不同y标度

将嵌套列表的字典转换为数据框中的行

Ibis中是否有一个ANY或ANY_UTE表达,可以让我比较子查询返回的一组值中的值?

symy.分段使用numpy数组

如何让我的Tkinter应用程序适合整个窗口,无论大小如何?

仿制药的类型铸造

需要计算60,000个坐标之间的距离

如何制作10,000年及以后的日期时间对象?

管道冻结和管道卸载

Julia CSV for Python中的等效性Pandas index_col参数

Godot:需要碰撞的对象的AdditionerBody2D或Area2D以及queue_free?

如何将多进程池声明为变量并将其导入到另一个Python文件

Django REST Framework:无法正确地将值注释到多对多模型,不断得到错误字段名称字段对模型无效'<><>

如何在UserSerializer中添加显式字段?

如何在图中标记平均点?

如何并行化/加速并行numba代码?

为什么np. exp(1000)给出溢出警告,而np. exp(—100000)没有给出下溢警告?

以逻辑方式获取自己的pyproject.toml依赖项

如何获取Python synsets列表的第一个内容?