On https://www.bibleprotector.com are files available for download (like TEXT-PCE.zip).
Manual downloading with a 'right click' works just fine.

但是,当try 使用Python下载相同的文件时,会返回699错误.

import requests
url = 'https://www.bibleprotector.com/TEXT-PCE.zip'
r = requests.get(url, allow_redirects=True)
open('test.zip', 'wb').write(r.content)

有没有办法用Python下载这个文件?

推荐答案

我很好奇上面的代码是如何为您工作的.你得到了什么结果?当我运行它时,我得到了一个html文件:

import requests
   url = 'https://www.bibleprotector.com/TEXT-PCE.zip'
   r = requests.get(url, allow_redirects=False)
   open('test.zip', 'wb').write(r.content)

$ cat test.zip
'\n\n\n\n 403 Forbidden\r\n\n\n \n 403\nForbidden\r\n\n

拒绝访问服务器上的此资源!

\n\n'

以下是我如何成功地将压缩文件下载到您的测试URL中的方法:

import shutil
import os
import requests

# Pretend to be a real browser:
user_agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15; rv:109.0) Gecko/20100101 Firefox/118.0"

hdrs = {'user-agent': user_agent}

url = 'https://www.bibleprotector.com/TEXT-PCE.zip'

# Byte-stream the results
r = requests.get(url, headers = hdrs, stream = True)

# Write the bytes to disk
with open('test.zip','wb') as f:
    shutil.copyfileobj(r.raw, f)

$ file test.zip
test.zip: Zip archive data, at least v2.0 to extract, compression method=deflate

解压缩得到了4.3MB的文本文件TEXT-PCE.txt.

Python相关问答推荐

Vectorize多个头寸的止盈/止盈回溯测试pythonpandas

如何在类和classy-fastapi -fastapi- followup中使用FastAPI创建路由

numpy卷积与有效

如何使用Python以编程方式判断和检索Angular网站的动态内容?

多处理队列在与Forking http.server一起使用时随机跳过项目

用砂箱开发Web统计分析

合并帧,但不按合并键排序

将scipy. sparse矩阵直接保存为常规txt文件

lityter不让我输入左边的方括号,'

LocaleError:模块keras._' tf_keras. keras没有属性__internal_'''

在Admin中显示从ManyToMany通过模型的筛选结果

Python避免mypy在相互引用中从另一个类重定义类时失败

如何从pandas DataFrame中获取. groupby()和. agg()之后的子列?

使用__json__的 pyramid 在客户端返回意外格式

如何求相邻对序列中元素 Select 的最小代价

在一个数据帧中,我如何才能发现每个行号是否出现在一列列表中?

将数据从一个单元格保存到Jupyter笔记本中的下一个单元格

如何在Polars中处理用户自定义函数的多行结果?

将参数从另一个python脚本中传递给main(argv

如何在networkx图中提取和绘制直接邻居(以及邻居的邻居)?