为了账号安全,请及时绑定邮箱和手机立即绑定

将Unicode文本写入文本文件?

将Unicode文本写入文本文件?

繁星点点滴滴 2019-07-16 16:18:56
将Unicode文本写入文本文件?我从Google文档中提取数据,处理数据,并将其写入文件(最终我将粘贴到Wordpress页面)。它有一些非ASCII符号。如何安全地将这些转换为可以在HTML源代码中使用的符号?目前,我正在将所有内容转换为Unicode,并将其连接到Python字符串中,然后执行以下操作:import codecs f = codecs.open('out.txt', mode="w", encoding="iso-8859-1")f.write(all_html.encode("iso-8859-1", "replace"))最后一行存在编码错误:UnicodeDecodeError:‘ASCII’编解码器无法解码12286位置的字节0xa0:序数不在范围内(128个)部分解决办法:此Python运行时没有错误:row = [unicode(x.strip()) if x is not None else u'' for x in row]all_html = row[0] + "<br/>" + row[1]f = open('out.txt', 'w')f. write(all_html.encode("utf-8"))但是如果我打开实际的文本文件,我会看到很多符号,比如:Qur‚Äôan也许我需要写点别的东西而不是文本文件?
查看完整描述

3 回答

?
jeck猫

TA贡献1909条经验 获得超7个赞

在Python 3中,Unicode字符串处理已经标准化。

  1. CHAR已存储在内存中的Unicode(32位)中。
  2. 您只需在utf-8中打开文件即可。
    (32位Unicode到utf-8的转换将自动从内存执行到文件。)

    out1 = "(嘉南大圳 ㄐㄧㄚ ㄋㄢˊ ㄉㄚˋ ㄗㄨㄣˋ )"fobj = open("t1.txt", "w", encoding="utf-8")fobj.write(out1)fobj.close()


查看完整回答
反对 回复 2019-07-16
  • 3 回答
  • 0 关注
  • 752 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信