出于练习的目的,我试图通过发布数字https://www.ruc.com.py/0000从https://www.ruc.com.py/中检索数据

起初,它检索到一条"禁止访问"消息,所以我添加了标题,这就解决了问题.但现在它只带来一个空白结果,我希望得到一个与输入1000000对应的名称

这是我的代码:

import requests

headers = {
'referer': 'https://www.ruc.com.py/',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36',
'x-requested-with': 'XMLHttpRequest'
}

num=str(1000000)

url = 'https://www.ruc.com.py/index.php/inicio/consulta_ruc'
response = requests.post(url , headers=headers, data=num)

print (response.text)

推荐答案

查看了网站上的"网络"选项卡,发现帖子负载要求搜索位于表单字段buscar

enter image description here

有了它,只需对代码做一点小小的更改,就可以实际发送具有预期数据 struct 的有效负载:

import requests

headers = {
'referer': 'https://www.ruc.com.py/',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36',
'x-requested-with': 'XMLHttpRequest'
}

data={"buscar": 1000000}

url = 'https://www.ruc.com.py/index.php/inicio/consulta_ruc'
response = requests.post(url, headers=headers, data=data)

print(response.json())

Python相关问答推荐

如何使用Selenium访问svg对象内部的元素

Pydantic:如何将对象列表表示为dict(将列表序列化为dict)

如何根据情况丢弃大Pandas 的前n行,使大Pandas 的其余部分完好无损

在应用循环中间保存pandas DataFrame

try 在树叶 map 上应用覆盖磁贴

需要计算60,000个坐标之间的距离

Python中的嵌套Ruby哈希

按列分区,按另一列排序

Python键入协议默认值

Pandas:将多级列名改为一级

mypy无法推断类型参数.List和Iterable的区别

如果初始groupby找不到满足掩码条件的第一行,我如何更改groupby列,以找到它?

如何在达到end_time时自动将状态字段从1更改为0

numpy.unique如何消除重复列?

Numpyro AR(1)均值切换模型抽样不一致性

Python—为什么我的代码返回一个TypeError

如果包含特定值,则筛选Groupby

python的文件. truncate()意外地没有截断'

如何使用大量常量优化代码?

利用SCIPY沿第一轴对数组进行内插