我正在try 为有缺陷的地址创建一个标志,我的 idea 是删除所有没有数字值的观察结果.我不想要邮政编码,所以第一步是删除这些),然后应用第二个过滤器来删除任何没有非剩余数字值的内容.
在下面的数据框中,我只想保留第二行(包含数字地址).第一行仅包含字符,第三行虽然包含数字值,但实际上仅包含五位邮政编码.
d = {'col1': ['San Diego County, California', '4150 Ute Dr, San Diego, California', 'Vista del Lago, Perris, California, 92570'], 'col2': ['prov_1', 'prov_2', 'prov_3']}
df = pd.DataFrame(data=d)
df