我有一个包含许多异常值和许多观察值的房地产数据框架.

从我的数据框中"最小化"提取:

dic = [{'area': 40, 'kitchen_area': 10, 'rooms': 1, 'price': 50000 },
 {'area': 20, 'kitchen_area': 0, 'rooms': 0, 'price': 50000},
 {'area': 60, 'kitchen_area': 0, 'rooms': 2, 'price': 70000},
 {'area': 29, 'kitchen_area': 9, 'rooms': 1, 'price': 30000},
 {'area': 15, 'kitchen_area': 0, 'rooms': 0, 'price': 25000}]
df = pd.DataFrame(dic, index=['apt1', 'apt2','apt3','apt4', 'apt5'])

我的目标是取消apt3,因为根据法律,非工作室公寓的厨房面积不能小于5平方米.

我try 过这样的代码:

df1 = df.drop(df[(df.rooms > 0) & (df.kitchen_area < 5)].index)

但根据我提出的多种条件,它只是消除了第kitchen_area列和第rooms列中的所有数据.

推荐答案

Clean

mask1 = df.rooms > 0
mask2 = df.kitchen_area < 5

df1 = df[~(mask1 & mask2)]
df1

      area  kitchen_area  rooms  price
apt1    40            10      1  50000
apt2    20             0      0  50000
apt4    29             9      1  30000
apt5    15             0      0  25000

pd.DataFRame.query

df1 = df.query('rooms == 0 | kitchen_area >= 5')
df1

      area  kitchen_area  rooms  price
apt1    40            10      1  50000
apt2    20             0      0  50000
apt4    29             9      1  30000
apt5    15             0      0  25000

Python相关问答推荐

当跨文件且参数化时,Pytest依赖项不起作用

使用子字符串动态更新Python DataFrame中的列

如何输入提示抽象方法属性并让mypy高兴?

合并其中一个具有重叠范围的两个框架的最佳方法是什么?

自动编码器和极坐标

Altair -箱形图边界设置为黑色,中线设置为红色

如何编写一个正规表达式来查找序列中具有2个或更多相同辅音的所有单词

ambda将时间戳与组内另一列的所有时间戳进行比较

如何才能知道Python中2列表中的巧合.顺序很重要,但当1个失败时,其余的不应该失败或是0巧合

对于一个给定的数字,找出一个整数的最小和最大可能的和

如何访问所有文件,例如环境变量

如果值不存在,列表理解返回列表

C#使用程序从Python中执行Exec文件

如何更改分组条形图中条形图的 colored颜色 ?

在含噪声的3D点网格中识别4连通点模式

创建可序列化数据模型的最佳方法

字符串合并语法在哪里记录

什么是合并两个embrame的最佳方法,其中一个有日期范围,另一个有日期没有任何共享列?

如何在FastAPI中为我上传的json文件提供索引ID?

Pandas Data Wrangling/Dataframe Assignment