最赞回答 / LoNice
fout = open('output.html', 'w', encoding='utf-8')fout.write("<td>%s</td>" % data['title'])fout.write("<td>%s</td>" % data['summary'])在页面开始解析的时候,使用utf-8解析,后面输出的时候就不需要的
2017-03-02
最新回答 / toneewang
http://www.360doc.com/content/16/1114/13/3852985_606449918.shtml 供参考python默认是ascii,由于中文的问题,我们需要把python的默认编码修改一下
2017-02-28
最新回答 / 雨淋淋大王
正如老师所说 python的网址已经变了,不再是http://baike.baidu.com/view/21087需要更改入口网址 还有修改下相关页面的遍历策略
2017-02-28
最新回答 / Bobzhangxiaotao
重点是这个:for data in self.datas: fout.write("<tr>") fout.write("<td>") fout.write(data['url']) fout.write("</td>") fout.write("<td>") fout.write(data['title']) fout.write("</td>") fout.write("<td>")...
2017-02-24
已采纳回答 / 马里奥的马里奥
class UrlManager(object): def __init__(self): self.new_urls=set() self.old_urls=set() def add_new_url(self,url): if url is None: return if url not in self.new_urls and ur...
2017-02-22