python 如何按条件从Python，Pandas的另一列中删除一列中的部分值

发布于04月01日

我有一个包含许多异常值和许多观察值的房地产数据框架.

从我的数据框中"最小化"提取:

dic = [{'area': 40, 'kitchen_area': 10, 'rooms': 1, 'price': 50000 },
 {'area': 20, 'kitchen_area': 0, 'rooms': 0, 'price': 50000},
 {'area': 60, 'kitchen_area': 0, 'rooms': 2, 'price': 70000},
 {'area': 29, 'kitchen_area': 9, 'rooms': 1, 'price': 30000},
 {'area': 15, 'kitchen_area': 0, 'rooms': 0, 'price': 25000}]
df = pd.DataFrame(dic, index=['apt1', 'apt2','apt3','apt4', 'apt5'])

我的目标是取消apt3，因为根据法律，非工作室公寓的厨房面积不能小于5平方米.

我try 过这样的代码:

df1 = df.drop(df[(df.rooms > 0) & (df.kitchen_area < 5)].index)

但根据我提出的多种条件，它只是消除了第kitchen_area列和第rooms列中的所有数据.

推荐答案

Clean

mask1 = df.rooms > 0
mask2 = df.kitchen_area < 5

df1 = df[~(mask1 & mask2)]
df1

      area  kitchen_area  rooms  price
apt1    40            10      1  50000
apt2    20             0      0  50000
apt4    29             9      1  30000
apt5    15             0      0  25000

`pd.DataFRame.query`

df1 = df.query('rooms == 0 | kitchen_area >= 5')
df1

      area  kitchen_area  rooms  price
apt1    40            10      1  50000
apt2    20             0      0  50000
apt4    29             9      1  30000
apt5    15             0      0  25000