我有一个网站有大量的pdf,压缩文件,图片,ppt,html链接.因此,我使用了Python请求方法来判断文件(pdf、压缩、图像、链接等)是否没有损坏.但是,当传递的链接是一个大小很大的压缩文件时,"get"方法需要时间来发送响应.所以想知道是否有其他方法来判断传递的链接(可以是图像、压缩文件、html页面)是否没有损坏.

response = requests.get(pageURL)
if (response.status_code ==404):
    #print("Broken Link")

推荐答案

requests.get正在下载文件,这不是为什么要花这么长时间.使用requests.head仅获取响应

response = requests.head(url)

你可以做的另一件事是一次打开Session,而不是在每次呼叫中打开一个套接字

urls = [...]
with requests.Session() as session:
    for url in urls:
        response = session.head(url)

Python相关问答推荐

如何在超时的情况下同步运行Matplolib服务器端?该过程随机挂起

如何使用矩阵在sklearn中同时对每个列执行matthews_corrcoef?

从numpy数组和参数创建收件箱

如何在Python中并行化以下搜索?

django禁止直接分配到多对多集合的前端.使用user.set()

如何创建一个缓冲区周围的一行与manim?

Pandas:将多级列名改为一级

将9个3x3矩阵按特定顺序排列成9x9矩阵

如何从数据库上传数据到html?

删除marplotlib条形图上的底边

如何将数据帧中的timedelta转换为datetime

如果有2个或3个,则从pandas列中删除空格

判断Python操作:如何从字面上得到所有decorator ?

如何从比较函数生成ngroup?

如何将相同组的值添加到嵌套的Pandas Maprame的倒数第二个索引级别

有没有办法在不先将文件写入内存的情况下做到这一点?

Django.core.exceptions.SynchronousOnlyOperation您不能从异步上下文中调用它-请使用线程或SYNC_TO_ASYNC

pytest、xdist和共享生成的文件依赖项

python3中np. divide(x,y)和x/y有什么区别?'

类型对象';敌人';没有属性';损害';