将Unicode文本写入文本文件?我从Google文档中提取数据,处理数据,并将其写入文件(最终我将粘贴到Wordpress页面)。它有一些非ASCII符号。如何安全地将这些转换为可以在HTML源代码中使用的符号?目前,我正在将所有内容转换为Unicode,并将其连接到Python字符串中,然后执行以下操作:import codecs
f = codecs.open('out.txt', mode="w", encoding="iso-8859-1")f.write(all_html.encode("iso-8859-1", "replace"))最后一行存在编码错误:UnicodeDecodeError:‘ASCII’编解码器无法解码12286位置的字节0xa0:序数不在范围内(128个)部分解决办法:此Python运行时没有错误:row = [unicode(x.strip()) if x is not None else u'' for x in row]all_html = row[0] + "<br/>" + row[1]f = open('out.txt', 'w')f.
write(all_html.encode("utf-8"))但是如果我打开实际的文本文件,我会看到很多符号,比如:Qur‚Äôan也许我需要写点别的东西而不是文本文件?
3 回答
jeck猫
TA贡献1909条经验 获得超7个赞
CHAR已存储在内存中的Unicode(32位)中。 您只需在utf-8中打开文件即可。 (32位Unicode到utf-8的转换将自动从内存执行到文件。) out1 = "(嘉南大圳 ㄐㄧㄚ ㄋㄢˊ ㄉㄚˋ ㄗㄨㄣˋ )"fobj = open("t1.txt", "w", encoding="utf-8")fobj.write(out1)fobj.close()
添加回答
举报
0/150
提交
取消