首页手记 Python代码解压的中文文件名是乱码，怎么解决？

Python代码解压的中文文件名是乱码，怎么解决？

标签：

Python 产品算法

大家好，我是Python进阶者。

一、前言

前几天在Python白银交流群【fashjon】问了一个Python自动化办公的问题，问题如下：

import zipfile

def unzip_file(zip_file_path, output_folder_path):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)

# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

以上代码解压的中文文件名是乱码，怎么解决？

二、实现过程

这里【瑜亮老师】给了个思路如下：乱码是什么样子的？最好能传上来一个压缩包，我们好试验。

过了几分钟，【瑜亮老师】补充道：@fashjon 我查看了一下zipfile的源码，发现是使用了’cp437’编码了文件名才导致的文件名错误。既然知道了错误的编码，那么方法就很简单了，1修改源码，2自己写代码读取解压缩路径中的文件名，重新使用’cp437’编码然后用gbk解码，重命名文件名，问题解决。修改后的代码如下：

import zipfile
import os
def unzip_file(zip_file_path, output_folder_path, encoding='gbk'):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)
    # 遍历解压后的目录，检查并修正文件名
    for root, dirs, files in os.walk(output_folder_path):
        for bad_name in files:
            # 假设这里我们知道ZIP文件使用的是'gbk'编码（但实际情况可能不同）
            if not bad_name.isascii():  # 如果文件名包含非ASCII字符
                true_name = bad_name.encode('cp437').decode(encoding)
                os.rename(os.path.join(root, bad_name), os.path.join(root, true_name))
# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

不确定你的电脑里是否安装pathlib，因此使用了os，顺利地解决了粉丝的疑问。

粉丝追问：解压文件用什么库比较好？

回答1：这方面我只知道zipfile和代码调用winrar。平时很少接触匹量处理压缩包。

回答2：批量处理压缩包，直接wps批量解压就可以了；

回答3：何须wps，只要电脑上装的有任意解压软件，全选压缩包，右键，可以解压到一个文件夹，也可以每个压缩包单独生成一个文件夹。代码只不过方便遍历多层文件夹目录，如果都在一个文件夹中，还不如右键点选更方便。

如果你也有类似这种Python相关的小问题，欢迎随时来交流群学习交流哦，有问必答！

三、总结

大家好，我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【fashjon】提出的问题，感谢【瑜亮老师】给出的思路，感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示，大家在群里提问的时候。可以注意下面几点：如果涉及到大文件数据，可以数据脱敏后，发点demo数据来（小文件的意思），然后贴点代码（可以复制的那种），记得发报错截图（截全）。代码不多的话，直接发代码文字即可，代码超过50行这样的话，发个.py文件就行。

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕先生0340613

手记
篇

粉丝

23

获赞与收藏

124

关注作者，订阅最新文章

阅读免费教程

Python 办公自动化教程

17个小节 27554 930

Python 算法入门教程

15个小节 30303 1172

Python 进阶应用教程

38个小节 72994 1146

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

Python代码解压的中文文件名是乱码，怎么解决？

一、前言

二、实现过程

三、总结

阅读免费教程