在python的Pandas框架中完成两个条件时删除行

发布于02月12日

我有以下DataFrame:

  column1  column2  columns3  column4
0       A        1         2      3.0
1       B        1         2      3.0
2       B        1         2      NaN
3       B        1         2      NaN

我正在try 删除在column1中值为"B"并且在column4中值为空单元格(或NaN值)的所有行.

这不起作用:

for row in df.iterrows():
    if (df.column1.items() == "B"):
        if (df.column4.isnull()):
            df.drop()

而这也不起作用:

for row in df.iterrows():
    if (df.column1.items() == "B") & (df.column4.isna()):
        df.drop()

我在运行时没有错误，但在打印数据帧时没有任何react .

推荐答案

使用多个条件和boolean indexing:

out = df[df['column1'].ne('B') | df['column4'].notna()]

根据DeMorgan's law的计算，这相当于:

out = df[~(df['column1'].eq('B') & df['column4'].isna())]

输出:

  column1  column2  columns3  column4
0       A        1         2      3.0
1       B        1         2      3.0

第一种方法的中间体:

  column1  column2  columns3  column4  col1 ≠ b  col4.notna()  (col1 ≠ b) OR col4.notna()
0       A        1         2      3.0      True          True                        True
1       B        1         2      3.0     False          True                        True
2       B        1         2      NaN     False         False                       False
3       B        1         2      NaN     False         False                       False

第二种方法的中间体:

  column1  column2  columns3  column4  col1 == b  col4.isna()  (col1 == b) AND col4.isna()      ~
0       A        1         2      3.0      False         True                        False   True
1       B        1         2      3.0       True         True                        False   True
2       B        1         2      NaN       True        False                         True  False
3       B        1         2      NaN       True        False                         True  False