我需要一些python方面的帮助.以下是我想要实现的目标.
我有一个如下所示的数据集:
import pandas as pd
# define data
data = {'A': [55, "g", 35, 10,'pj'], 'B': [454, 27, 895, 3545,34],
'C': [4, 786, 7, 3, 896],
'Phone Number': [123456789, 7, 3456789012, 4567890123, 1],'another_col':[None,234567890,None,None,215478565]}
pd.DataFrame(data)
A B C Phone Number another_col
0 55 454 4 123456789 None
1 g 27 786 7 234567890.0
2 35 895 7 3456789012 None
3 10 3545 3 4567890123 None
4 pj 34 896 1 215478565.0
我从pdf中提取了这些数据,不幸的是,它添加了一些随机字符串,如上图中的数据框所示.我想判断任何列中的任何单元格是否包含字符串或无数值.如果是,则删除该字符串并将整行向左移动.最后,所需的输出如下所示:
A B C Phone Number another_col
0 55 454 4 1.234568e+08 None
1 27 786 7 2.345679e+08 None
2 35 895 7 3.456789e+09 None
3 10 3545 3 4.567890e+09 None
4 34 896 1 2.15478565+8 None
我非常感谢你的帮助.