import ullib2
resp = urllib2.urlopen('http://www.baidu.com').read() #得到源代码
resp = urllib2.urlopen('http://www.baidu.com').read() #得到源代码
2017-03-20
该方法可行!!!感谢“IT男的成长记录 ”
如果出现乱码的话,将fout.write('<td>%s<td>' % data['title'] ) 改为
fout.write("<td>")
fout.write(data['title'])
fout.write("</td>")
并且在文件打开语句改为:fout = open('output.html', 'w', encoding='utf-8')
这样就不会出现乱码了
如果出现乱码的话,将fout.write('<td>%s<td>' % data['title'] ) 改为
fout.write("<td>")
fout.write(data['title'])
fout.write("</td>")
并且在文件打开语句改为:fout = open('output.html', 'w', encoding='utf-8')
这样就不会出现乱码了
2017-03-19
已采纳回答 / Hanson_Meng
python3对urllib和urllib2进行了重构,拆分成了urllib.request, urllib.response, urllib.parse, urllib.error等几个子模块,这样的架构从逻辑和结构上说更加合理。urljoin现在对应的函数是urllib.parse.urljoin
2017-03-18