最赞回答 / 时间的力量
我爬了一下 好像最多只能爬下549条数据。 对于正则表达式,可以参看图片<...图片...><...图片...><...图片...><...图片...>
2017-03-17
报错:UserWarning: You provided Unicode markup but also provided a value for from_encoding. Your from_encoding will be ignored.
解决方法:
soup = BeautifulSoup(html_doc,"html.parser")这一句中删除【from_encoding="utf-8"】
原因:python3 缺省的编码是unicode, 再在from_encoding设置为utf8, 会被忽视掉,去掉【from_encoding="utf-8"】这一个好了
解决方法:
soup = BeautifulSoup(html_doc,"html.parser")这一句中删除【from_encoding="utf-8"】
原因:python3 缺省的编码是unicode, 再在from_encoding设置为utf8, 会被忽视掉,去掉【from_encoding="utf-8"】这一个好了
2017-03-16
……楼上搞得好复杂……
直接在命令行里输入pip install beautifulsoup4 就会下载了(没有pip的先easy_install pip)
测试时进入python交互式环境再输入import bs4,没有报错就表示安装正确
直接在命令行里输入pip install beautifulsoup4 就会下载了(没有pip的先easy_install pip)
测试时进入python交互式环境再输入import bs4,没有报错就表示安装正确
2017-03-16
用python3的童靴需要注意:
不知道你发现没,第三种方法print(cj)是无法打印cookies的。
这是因为,带cookie的打印出来必须用opener.open(req).read().decode('utf-8')来发送的请求才会带上cookie,如果用urllib.request.urlopen()是不带cookie的。
所以,办法是在原代码基础上加入r = opener.open(req),然后print(r.read().decode('utf-8'))
不知道你发现没,第三种方法print(cj)是无法打印cookies的。
这是因为,带cookie的打印出来必须用opener.open(req).read().decode('utf-8')来发送的请求才会带上cookie,如果用urllib.request.urlopen()是不带cookie的。
所以,办法是在原代码基础上加入r = opener.open(req),然后print(r.read().decode('utf-8'))
2017-03-15
python3中需要注意:
带cookie的打印出来必须用opener.open(req).read().decode('utf-8')来发送的请求才会带上cookie,如果用urllib.request.urlopen()是不带cookie的。
带cookie的打印出来必须用opener.open(req).read().decode('utf-8')来发送的请求才会带上cookie,如果用urllib.request.urlopen()是不带cookie的。
2017-03-15
我的第二种方法报错 如下'module' object has no attribute 'Request' 第三种类似 用的python2.7 百度没有找到解决的方法 求路过的高人指点 1 2 谢谢
2017-03-15