Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

南飞的候鸟

满头雾水啊

0 6-3 BeautifulSoup的语法

2016-02-27

为什么第三种方法出来时乱码

最新回答 / 神经旷野舞者

<...图片...>看图说话

2 回答 790 浏览 5-3 Python爬虫urlib2实例代码演示

2016-02-27

carer

https://github.com/MTTTM/crawler/blob/master/muke-pachong/baike_spider/spider_main.py

代码报错了

1 7-2 调度程序

2016-02-27

carer

Traceback (most recent call last):

File "D:/py/muke-pachong/baike_spider/spider_main.py", line 2, in <module>

from baike_spider import url_manger,html_downloader,html_parser,html_outputer

ImportError: No module named baike_spider
这个是为啥

10 7-2 调度程序

2016-02-27

葃咔

好厉害学习了喜欢

0 3-2 Python简单爬虫架构的动态运行流程

2016-02-26

carer

Traceback (most recent call last):
File "D:/py/muke-pachong/baike_spider/spider_main.py", line 2, in <module>
from baike_spider import url_manger,html_downloader,html_parser,html_outputer
ImportError: No module named baike_spider
__init__.py 文件我也有了

1 7-7 开始运行爬虫和爬取结果展示

2016-02-26

carer

Traceback (most recent call last):
File "D:/py/muke-pachong/baidubaike/spider_main.py", line 2, in <module>
from baidubaike import url_manger,html_downloader,html_parser,html_outputer
ImportError: No module named baidubaike
这个是么问题

1 7-7 开始运行爬虫和爬取结果展示

2016-02-26

儒雅的eyu

老师问一下要独立完成这些需要哪些基础,我就学了Python的基本语法

0 7-4 HTML下载器html_downloader

2016-02-25

Roc_J

我用的是python 3.5 终于可以运行了

4 7-5 HTML解析器html_parser

2016-02-25

weibo_一条神经大条的鱼_0

urllib2在python3.x中被改为urllib.request

1 5-2 Python爬虫urlib2下载器网页的三种方法

2016-02-25

用的是pathon2,代码也和视频完全一样，为什么运行出来会这样？

已采纳回答 / Yaffy

#coding:utf-8import urllib2import cookieliburl = "http://www.baidu.com"print '第一种方法'response1 = urllib2.urlopen(url)print response1.getcode()print len(response1.read)第一种方法做后获取长度时response1.read 你少个括号应该是response1.read()

1 回答 1328 浏览 5-3 Python爬虫urlib2实例代码演示

2016-02-24

写好了所有的程序运行遇到bug，不知道怎么改

最新回答 / 昔杨今雨

我找到我的原因了在manager里面有字母打错了造成错误你去查查你的代码是不是有哪儿地方字母打的不对

5 回答 6237 浏览 7-2 调度程序

2016-02-24

程序运行异常，但是不知道怎么回事？

最新回答 / Roc_J

这个问题已经解决

4 回答 841 浏览 7-2 调度程序

2016-02-24

输出问题不是1000个

最新回答 / Roc_J

并且输出第一次就失败，root_url打开就是失败的，为什么，我是pytho3.5

1 回答 606 浏览 7-2 调度程序

2016-02-24

鬼脚飞

感谢老师的讲解，思路非常清晰，听了课程之后，对整个爬虫的工作流程非常清楚了，这对于我们那些入门的同学来说已经足够了，既然已经入门那么接下来可以慢慢的进行深入了，跟着老师的思路做完例子之后，感觉速度还是挺慢的，所以打算接下来研究一下怎么提升一下爬虫的性能！慢慢地提高，老师辛苦了！！

0 8-1 课程总结

2016-02-23

噗噗姑娘

讲得很棒。老师实例爬虫--分析目标这一页ppt有个小错误。简介这边，div少了一个斜线，应该是<div class = "lemma-summary">***</div>

0 7-1 Python爬虫实例-分析目标

2016-02-21

首页上一页 180 181 182 183 184 185 186 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空