Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

weixin_慕无忌2429985

我的解析器那里有问题，soup = BeautifulSoup(html_cont,'html.parser')，soup无法返回，也不报错

0 7-5 HTML解析器html_parser

2019-06-28

为什么只爬取了两个url就结束了，而且output.html文件里没有任何内容。求老师帮解答，谢谢啦！

最新回答 / qq_王者之心_1

links=soup.find_all("a", href=re.compile(r"/item/*"))

html_download 里这里要处理下

url = urllib.parse.quote(url, safe='/:?=.')  # 解决地址中有中文的问题
resp = urllib.request.urlopen(url)

2 回答 821 浏览 7-6 HTML输出器

2019-06-17

qq_賢_0

IDE的ctrl+F1是用Alt+Enter

0 7-5 HTML解析器html_parser

2019-06-14

qq_賢_0

现在是连接是http://baike.baidu.com/item/Python
所以links = soup.find_all('a', href=re.compile(r"/item/(.*)"))

另外summary新连接里有中文
fout.write("<td>%s</td>" % data['summary'].encode('utf-8'))

2 7-5 HTML解析器html_parser

2019-06-14

Gubei

只爬取了入口url就结束了，去掉try也一样，没有任何报错，不知道啥情况啊啊啊

0 7-7 开始运行爬虫和爬取结果展示

2019-06-13

Gubei

只爬取了入口url就结束了，去掉try也一样，没有任何报错，不知道啥情况啊啊啊

0 7-7 开始运行爬虫和爬取结果展示

2019-06-13

python爬虫

+ 我来回答回答最高可+2积分

0 回答 689 浏览 7-6 HTML输出器

2019-06-13

来个大佬帮忙看看问题出在哪了？？？

最新回答 / weixin_慕先生6489283

<...code...>

3 回答 944 浏览 6-4 BeautifulSoup实例测试

2019-06-10

诗扬君爱睡觉zZ

只爬取了入口url就结束了，去掉try也一样，没有任何报错，不知道啥情况啊啊啊

2 7-7 开始运行爬虫和爬取结果展示

2019-06-10

运行出现问题求解决方案

最新回答 / 999999999999999997

少了冒号？

1 回答 636 浏览 7-2 调度程序

2019-06-02

这一行print 'craw %d : %s' % (count, new_url)报错

+ 我来回答回答最高可+2积分

3 回答 1586 浏览 7-2 调度程序

2019-06-02

慕先生6393163

讲课很清晰

0 8-1 课程总结

2019-06-01

这是什么问题

+ 我来回答回答最高可+2积分

0 回答 640 浏览 7-2 调度程序

2019-06-01

已解决

+ 我来回答回答最高可+2积分

0 回答 772 浏览 7-7 开始运行爬虫和爬取结果展示

2019-05-31

运行没错误但是爬取数据为空值？

最新回答 / coder丨bonlion

https 换为http

1 回答 2357 浏览 5-3 Python爬虫urlib2实例代码演示

2019-05-27

请大神帮忙看一下这是出了什么问题？

最新回答 / haxixihaha

我用VS Code<...图片...>

2 回答 744 浏览 7-2 调度程序

2019-05-25

首页上一页 6 7 8 9 10 11 12 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫