为了账号安全,请及时绑定邮箱和手机立即绑定

用 Python 的“wget”覆盖现有文件?

用 Python 的“wget”覆盖现有文件?

MYYA 2023-04-25 16:09:49
我已经在我的 Python 上安装了 wget,我正在用它从不同的 URL 下载文件。到目前为止,我的代码如下所示:import wgeturls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',         'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',        'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',         'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']path = '/home/david/data/files/zip_files'for url in urls:   wget.download(url, path)我希望我的代码覆盖下载的文件(如果它们存在),这样每次我运行代码时我都会获得该文件的最新版本,而不是保留旧文件并下载具有不同名称的新文件(例如,如果epitope_full_v3.zip 已经存在,当我执行代码时它会再次下载,但会保留旧的并将新的重命名为 epitope_full_v3_1.zip)。我知道 wget 可以在 shell 中使用 -O 参数来允许你这样做,但我没有在文档中看到 python 版本的参数。我感谢您的帮助。
查看完整描述

1 回答

?
芜湖不芜

TA贡献1796条经验 获得超7个赞

虽然wget没有提到,你可以自己改变它。使用os.path.basename()获取文件名,并检查它是否存在。像这样:


import wget

import os


urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',

        'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',

        'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',

        'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']


path = '/home/david/data/files/zip_files'


for url in urls:

    filename = path + '/' + os.path.basename(url) # get the full path of the file

    if os.path.exists(filename):

        os.remove(filename) # if exist, remove it directly

    wget.download(url, out=filename) # download it to the specific path.


查看完整回答
反对 回复 2023-04-25
  • 1 回答
  • 0 关注
  • 138 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信