Python3
print('p段落文字')
p_node=soup.find('p',class_='title')
print(p_node.name,p_node.get_text())
print('p段落文字')
p_node=soup.find('p',class_='title')
print(p_node.name,p_node.get_text())
2016-12-07
Python3的写法
print('正则表达')
link_node=soup.find('a',href=re.compile(r'ill'))
print(link_node.name,link_node['href'],link_node.get_text())
print('正则表达')
link_node=soup.find('a',href=re.compile(r'ill'))
print(link_node.name,link_node['href'],link_node.get_text())
2016-12-07
python -m pip install --upgrade pip 升级pip
python -m pip install beautifulsoup4
python -m pip install beautifulsoup4
2016-12-06
用python3,最后输出到html页面后标题和摘要两部分如果有中文显示出来都是 b'anfdsfsfds'这样的字节串,解决办法是在outputer.html中修改两个地方:
1. 打开文件时直接指定编码
fout = open('output.html', 'w', encoding='utf-8')
2.写如内容时取消编码
fout.write('<td>%s</td>' % data['title'])
fout.write('<td>%s</td>' % data['summary'])
1. 打开文件时直接指定编码
fout = open('output.html', 'w', encoding='utf-8')
2.写如内容时取消编码
fout.write('<td>%s</td>' % data['title'])
fout.write('<td>%s</td>' % data['summary'])
2016-12-06
@慕粉4289539 我一开始也和你一样的错误,我的原因是 在url_manager.py中get_new_url()方法忘了return new_url,我知道我很蠢~
2016-12-01