无涯教程网

Python 如何从需要点击切换的网页中提取表格

发布于03月31日

我试图从这个网页中提取表格，但我只能得到投球表，例如.我也想得到击球表，理论上这将是这个URL: https://www.covers.com/sport/baseball/mlb/matchup/279605#hitting

但这并没有给我带来任何不同的结果.另外，我希望能够提取像最后5和最后10选项这样的东西，但我假设所有这些选项的答案都是一样的.我该如何设置它，以便它可以动态地 Select 和提取这些表？

import pandas as pd
import requests
from bs4 import BeautifulSoup

url = 'https://www.covers.com/sport/baseball/mlb/matchup/279605'

pd.set_option('display.max_rows', 5000)
pd.set_option('display.max_columns', 5000)
pd.set_option('display.width', 1500)

html = requests.get(url).content   
df_list = pd.read_html(html)
df = df_list[12]
print(df)

推荐答案

命中表从不同的URL加载.您可以使用以下示例来加载它:

import pandas as pd

hitting_table_url = "https://www.covers.com/sport/baseball/mlb/matchup/279605/stats-analysis/hitting/overall"

df = pd.read_html(hitting_table_url)[0]
print(df)

打印:

       Team  Runs/9   AVG.  Hits   HR   BB  EB Hits    OBP
0  Colorado     4.5  0.246   8.4  1.0  2.7      1.0  0.309
1   Arizona     4.7  0.248   8.5  1.1  3.3      1.1  0.320

Python相关问答推荐

将HTML输出转换为表格中的问题

Python json.转储包含一些UTF-8字符的二元组，要么失败，要么转换它们.我希望编码字符按原样保留

从收件箱中的列中删除html格式

沿着数组中的轴计算真实条目

Pandas 都是()，但有一个门槛

有没有一种方法可以从python的pussompy比较结果中提取文本？

如何在WSL2中更新Python到最新版本(3.12.2)？

从一个系列创建一个Dataframe，特别是如何重命名其中的列(例如：使用NAs/NaN)

如何让这个星型模式在Python中只使用一个for循环？

在极性中创建条件累积和

所有列的滚动标准差，忽略NaN

形状弃用警告与组合多边形和多边形如何解决

移动条情节旁边的半小提琴情节在海运

如何根据一列的值有条件地 Select 前N个组，然后按两列分组？

Geopandas未返回正确的缓冲区(单位：米)

为用户输入的整数查找根/幂整数对的Python练习

数据框，如果值在范围内，则获取范围和

如何在Pandas中用迭代器求一个序列的平均值？

PYTHON中的selenium不会打开 chromium URL

如何在Python中创建仅包含完整天数的月份的列表

实用课程推荐

相关教程推荐