Python 如果某些列没有缺失值，如何计算唯一 ID

发布于05月02日

我有以下几点

ID   date    v1   v2  v3   v4  v5  v6
A     ..      1   2   3   NaN NaN NaN 
A     ..      0   2  NaN  NaN NaN NaN
B     ..      0   2   4    5   3   9
B     ..      2   6   6    6   3  NaN
D     ..      2  NaN NaN  NaN NaN NaN
D     ..      9   2   2   NaN NaN NaN
D     ..      2   2   6    6   1   2

我想提取列(来自v1-v5)不丢失的行.

期望输出

ID   date    v1   v2  v3   v4  v5  v6
B     ..      0   2   4    5   3   9
B     ..      2   6   6    6   3  NaN
D     ..      2   2   6    6   1   2

谢谢

推荐答案

将dropna与子集一起使用:

cols = ['v1', 'v2', 'v3', 'v4', 'v5']
df2 = df.dropna(subset=cols)

或者，使用notna和all组合表示boolean indexing:

cols = ['v1', 'v2', 'v3', 'v4', 'v5']

df2 = df[df[cols].notna().all(axis=1)]

如果v1-v5是连续的，则可 Select :

df2 = df[df.loc[:, 'v1':'v5'].notna().all(axis=1)]

输出:

  ID date  v1   v2   v3   v4   v5   v6
2  B   ..   0  2.0  4.0  5.0  3.0  9.0
3  B   ..   2  6.0  6.0  6.0  3.0  NaN
6  D   ..   2  2.0  6.0  6.0  1.0  2.0