为了账号安全,请及时绑定邮箱和手机立即绑定

如何确定文本的编码?

如何确定文本的编码?

子衿沉夜 2019-06-05 13:23:16
如何确定文本的编码?我收到了一些编码的文本,但我不知道使用了什么字符集。是否有方法使用Python确定文本文件的编码?如何检测文本文件的编码/代码页处理C#。
查看完整描述

3 回答

?
天涯尽头无女友

TA贡献1831条经验 获得超9个赞

计算编码的另一个选项是使用利布魔术(这是档案指挥)。有大量的python绑定可用。

驻留在文件源树中的python绑定可作为Python-魔术(或python 3-魔法)Debian包。它可以通过执行以下操作来确定文件的编码:

import magic

blob = open('unknown-file').read()m = magic.open(magic.MAGIC_MIME_ENCODING)m.load()encoding = m.buffer(blob)  # "utf-8" "us-ascii" etc

有一个同名但不相容的,Python-魔术pypi上的PIP包,该包还使用libmagic..它还可以通过执行以下操作获得编码:

import magic

blob = open('unknown-file').read()m = magic.Magic(mime_encoding=True)encoding = m.from_buffer(blob)


查看完整回答
反对 回复 2019-06-05
  • 3 回答
  • 0 关注
  • 710 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信