你知道吗,为什么我得到这个ID ГосРеестра而不是得到这个 ID ГосРеестра。我知道编码存在一些问题,因为它是西里尔文。不知道如何解决它。抓取网页是链接我的代码是:dfo_url = "https://opi.dfo.kz/p/ru/DfoObjects/objects/teaser-view/26730?OptionName=ExtraData"r = requests.get(dfo_url)tree = html.fromstring(r.content)tr_elements = tree.xpath('//tr')#Create empty listcol=[]i=0#For each row, store each first element (header) and an empty listfor t in tr_elements[2]: i+=1 name=t.text_content() print ('%d:"%s"'%(i,name)) col.append((name,[]))
添加回答
举报
0/150
提交
取消