在python中下载带有请求的大型文件

在python中下载带有请求的大型文件请求是个很好的图书馆。我想用它来下载大文件(>1GB)。问题是不可能将整个文件保存在内存中，我需要以块的形式读取它。下面的代码出现了问题import requestsdef DownloadFile(url) local_filename = url.split('/')[-1] r = requests.get(url) f = open(local_filename, 'wb') for chunk in r.iter_content(chunk_size=512 * 1024): if chunk: # filter out keep-alive new chunks f.write(chunk) f.close() return因为某种原因它不是这样工作的。在将响应保存到文件之前，它仍然会将响应加载到内存中。更新如果您需要一个可以从FTP下载大文件的小客户机(Python2.x/3.x)，您可以找到它这里..它支持多线程和重新连接(它确实监视连接)，还为下载任务调优套接字参数。

查看完整描述

3 回答

慕的地10843

TA贡献1785条经验获得超8个赞

如果你用Response.raw和shutil.copyfileobj():

import requestsimport shutildef download_file(url):
    local_filename = url.split('/')[-1]
    with requests.get(url, stream=True) as r:
        with open(local_filename, 'wb') as f:
            shutil.copyfileobj(r.raw, f)

    return local_filename

这将文件流到磁盘，而不使用过多的内存，代码很简单。

反对回复 2019-06-19

不负相思意

TA贡献1777条经验获得超10个赞

您的块大小可能太大了，您是否尝试过一次删除1024字节？(还有，你可以用with整理语法)

def DownloadFile(url):
    local_filename = url.split('/')[-1]
    r = requests.get(url)
    with open(local_filename, 'wb') as f:
        for chunk in r.iter_content(chunk_size=1024): 
            if chunk: # filter out keep-alive new chunks
                f.write(chunk)
    return

顺便提一句，您是如何推断响应已加载到内存中的？

听起来好像python没有从其他地方刷新要文件的数据。所以问题你可以试试f.flush()和os.fsync()强制文件写入和释放内存；

    with open(local_filename, 'wb') as f:
        for chunk in r.iter_content(chunk_size=1024): 
            if chunk: # filter out keep-alive new chunks
                f.write(chunk)
                f.flush()
                os.fsync(f.fileno())

反对回复 2019-06-19

热搜

最近搜索清空

在python中下载带有请求的大型文件

在python中下载带有请求的大型文件

3 回答

添加回答