Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

结果为什么只输出一行

+ 我来回答回答最高可+2积分

10 回答 1389 浏览 7-5 HTML解析器html_parser

2016-10-23

没有结果也没有报错啊

最赞回答 / Spider_Maker4260916

你的spider_main里的if __name__ == __main__错了

5 回答 1391 浏览 7-7 开始运行爬虫和爬取结果展示

2016-10-21

不能用ctrl+1导入re和urlparse啊

最新回答 / 慕粉4149136

python版本不对或者elipse没有装好

1 回答 765 浏览 7-5 HTML解析器html_parser

2016-10-21

为什么只爬去两个词条的网页，就不动了？？？？

+ 我来回答回答最高可+2积分

5 回答 947 浏览 7-7 开始运行爬虫和爬取结果展示

2016-10-17

想学习网络爬虫的步骤

最新回答 / 韩翊

我认为想写一个专业爬虫需要的知识涉及好多方面，如果是单纯的自己的小爬虫实现功能也不多的话，就先看看语法，然后练练相关程序，一步一步来吧。

1 回答 1309 浏览 4-2 Python爬虫URL管理器的实现方式

2016-10-17

提示错误...

最新回答 / 慕粉3209948

我用pycharm写的，建议找个适手的IDE

1 回答 423 浏览 8-1 课程总结

2016-10-15

在抓取一个页面时HTMLParser.HTMLParseError: malformed start tag

最新回答 / Snail_87103145

$ pip install beautifulsoup4$ pip install html5libPython:from bs4 import BeautifulSoupimport urllib2url = 'http://www.example.com'page = urllib2.urlopen(url)soup = BeautifulSoup(page.read(), 'html5lib')links = soup.findAll('a')for link in links: print ...

1 回答 2295 浏览 6-4 BeautifulSoup实例测试

2016-10-11

为什么程序正常运行没有输出结果

最新回答 / oasis77

贴出代码的运行结果才能判断是什么原因以下结果表示正确运行——Process finished with exit code 0

1 回答 1677 浏览 7-7 开始运行爬虫和爬取结果展示

2016-10-10

输出文件output.html里没有记录

+ 我来回答回答最高可+2积分

2 回答 1488 浏览 7-7 开始运行爬虫和爬取结果展示

2016-10-10

运行显示 print'craw %d : %s' % (count, new_url) ^ SyntaxError: invalid syntax

最赞回答 / oasis77

如果用的python 3.x , 就要这样输出：print("craw %d : %s"%(count, new_url))

1 回答 2283 浏览 7-2 调度程序

2016-10-10

爬取失败和在parser模块中的soup前面有个小黄三角。

+ 我来回答回答最高可+2积分

1 回答 636 浏览

2016-10-09

首页上一页 54 55 56 57 58 59 60 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团