我有一个充满医疗保险受益人的数据集.问题是:"在自变量阿尔茨海默病、关节炎、癌症、copd、抑郁症、糖尿病、心脏病中,至少有一种慢性病的患者比例是多少?".失败、ihd、肾脏、骨质疏松和中风?"
我try 创建一个子集并使用isnull()&;any(),但我找不到合适的解决方案..还try 了df.但它只允许我命名一列..
为了更好地理解,我附上了数据集!
https://drive.google.com/file/d/1R--YEsBCDHMXjqNzAumT2zzUAYvM1bWA/view?usp=sharing
谢谢
我的try :
claimss.loc[:, ["alzheimers","diabetes","arthritis"] == 1]
(想先用3列试试,一开始就不行.)
try 使用子集:
filtered_df = df.loc[raw_df] == 1]
(创建了一个子集,其中仅显示索引和独立变量(疾病),并try 查找空行)