为了账号安全,请及时绑定邮箱和手机立即绑定

Web抓取Python时的编码问题

Web抓取Python时的编码问题

慕村9548890 2022-11-01 16:48:21
你知道吗,为什么我得到这个ID ГосРеестра而不是得到这个 ID ГосРеестра。我知道编码存在一些问题,因为它是西里尔文。不知道如何解决它。抓取网页是链接我的代码是:dfo_url = "https://opi.dfo.kz/p/ru/DfoObjects/objects/teaser-view/26730?OptionName=ExtraData"r = requests.get(dfo_url)tree = html.fromstring(r.content)tr_elements = tree.xpath('//tr')#Create empty listcol=[]i=0#For each row, store each first element (header) and an empty listfor t in tr_elements[2]:    i+=1    name=t.text_content()    print ('%d:"%s"'%(i,name))    col.append((name,[]))
查看完整描述

1 回答

?
MMMHUHU

TA贡献1834条经验 获得超8个赞

这可能会解决它,请尝试在打印之前执行此操作:

name.encode(encoding='UTF-8',errors='strict')

或者试试这个链接。


查看完整回答
反对 回复 2022-11-01
  • 1 回答
  • 0 关注
  • 97 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信