我必须通读CTG.xls文件,路径如下:

我必须从这个文件中 Select 图纸数据.此外,我必须从K列到文件的AT列进行 Select .因此,在最后,我们有一个包含以下列的数据集:

["LB"、"AC"、"FM"、"UC"、"DL"、"DS"、"DP"、"ASTV"、"MSTV"、"ALTV"、"MLTV"、"Width"、"Min"、"Max"、"Nmax"、"Nzeros"、"Mode"、"Mean"、"Median"、"variation"、"trend"、"CLASS"、"NSP"]

如何使用pandas中的read功能来执行此操作?

推荐答案

使用:

url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00193/CTG.xls'

df = pd.read_excel(url, sheet_name='Data', skipfooter=3)
df = df.drop(columns=df.filter(like='Unnamed').columns)
df.columns = df.iloc[0].to_list()
df = df[1:].reset_index(drop=True)

输出

       LB        AC        FM        UC        DL DS DP ASTV MSTV ALTV  MLTV Width  Min  Max Nmax Nzeros Mode Mean Median Variance Tendency CLASS NSP
0     120         0         0         0         0  0  0   73  0.5   43   2.4    64   62  126    2      0  120  137    121       73        1     9   2
1     132   0.00638         0   0.00638   0.00319  0  0   17  2.1    0  10.4   130   68  198    6      1  141  136    140       12        0     6   1
2     133  0.003322         0  0.008306  0.003322  0  0   16  2.1    0  13.4   130   68  198    5      1  141  135    138       13        0     6   1
3     134  0.002561         0  0.007682  0.002561  0  0   16  2.4    0    23   117   53  170   11      0  137  134    137       13        1     6   1
4     132  0.006515         0  0.008143         0  0  0   16  2.4    0  19.9   117   53  170    9      0  137  136    138       11        1     2   1
...   ...       ...       ...       ...       ... .. ..  ...  ...  ...   ...   ...  ...  ...  ...    ...  ...  ...    ...      ...      ...   ...  ..
2121  140         0         0  0.007426         0  0  0   79  0.2   25   7.2    40  137  177    4      0  153  150    152        2        0     5   2
2122  140  0.000775         0  0.006971         0  0  0   78  0.4   22   7.1    66  103  169    6      0  152  148    151        3        1     5   2
2123  140   0.00098         0  0.006863         0  0  0   79  0.4   20   6.1    67  103  170    5      0  153  148    152        4        1     5   2
2124  140  0.000679         0   0.00611         0  0  0   78  0.4   27     7    66  103  169    6      0  152  147    151        4        1     5   2
2125  142  0.001616  0.001616  0.008078         0  0  0   74  0.4   36     5    42  117  159    2      1  145  143    145        1        0     1   1

[2126 rows x 23 columns]

Python相关问答推荐

CustomTKinter-向表单添加额外的输入字段

当测试字符串100%包含查询字符串时,为什么t fuzzywuzzy s Process.extractBests不给出100%分数?

Flask主机持续 bootstrap 本地IP| Python

在Windows上启动新Python项目的正确步骤顺序

如何防止Plotly在输出到PDF时减少行中的点数?

如何处理嵌套的SON?

如何调整spaCy token 化器,以便在德国模型中将数字拆分为行末端的点

我必须将Sigmoid函数与r2值的两种类型的数据集(每种6个数据集)进行匹配,然后绘制匹配函数的求导.我会犯错

如何在BeautifulSoup中链接Find()方法并处理无?

如何让剧作家等待Python中出现特定cookie(然后返回它)?

' osmnx.shortest_track '返回有效源 node 和目标 node 的'无'

如何在Python数据框架中加速序列的符号化

SQLAlchemy Like ALL ORM analog

在嵌套span下的span中擦除信息

计算空值

如何在Great Table中处理inf和nans

Odoo16:模板中使用的docs变量在哪里定义?

使用__json__的 pyramid 在客户端返回意外格式

如何使用正则表达式修改toml文件中指定字段中的参数值

使用python playwright从 Select 子菜单中 Select 值