link_node=soup.find('a', href=re.compile(r"ill"))
NameError: name 're' is not defined
NameError: name 're' is not defined
2018-04-12
现在百度的是https加密方式的了,而且目录结构也变了,所以写的时候要改一下
比如使用Request对象
response = urllib2.urlopen(request,context = context)
页面解析的话可以
links = soup.findAll('a',href=re.compile(r"/item/"))
这样子就能匹配到了
比如使用Request对象
response = urllib2.urlopen(request,context = context)
页面解析的话可以
links = soup.findAll('a',href=re.compile(r"/item/"))
这样子就能匹配到了
2018-04-12
ModuleNotFoundError: No module named 'urlparse'
没有这个模块怎门办
没有这个模块怎门办
2018-04-09
输出乱码可尝试做以下修改:
fout = open('output.html', 'w', encoding='utf-8') # 此处添加encoding='utf-8'
# 在fout.write("<html>")后添加这一行:
fout.write("<head><meta http-equiv='content-type' content='text/html;charset=utf-8'></head>")
fout = open('output.html', 'w', encoding='utf-8') # 此处添加encoding='utf-8'
# 在fout.write("<html>")后添加这一行:
fout.write("<head><meta http-equiv='content-type' content='text/html;charset=utf-8'></head>")
2018-04-08