Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

幕布斯146888

一个都看不懂

0 5-2 Python爬虫urlib2下载器网页的三种方法

2017-05-17

幕布斯146888

老师厉害了，不但免费讲的还清楚最后还实战！我喜欢！

1 4-2 Python爬虫URL管理器的实现方式

2017-05-17

milton666666

厉害，值得一看

1 7-3 URL管理器

2017-05-17

菜鸟照打的代码也没法执行

最新回答 / qq_海之星_03857916

按道理不会的；我这边用idea；使用第一种方式是没有问题的；第一种方式，节约一个变量的开销，应该是更优的

1 回答 397 浏览 5-3 Python爬虫urlib2实例代码演示

2017-05-16

慕粉3773896

first method
200

Traceback (most recent call last):
File "C:/Python27/test/pachong.py", line 9, in <module>
print len(response1.read())
File "C:\Python27\lib\socket.py", line 355, in read
data = self._sock.recv(rbufsize)

0 5-3 Python爬虫urlib2实例代码演示

2017-05-16

url 乱码怎么搞？？？

已采纳回答 / 请叫我百度

在代码的最顶上加入# coding:utf-8

2 回答 1007 浏览 7-2 调度程序

2017-05-16

Michael_O_O_

“要想学好爬虫，大家的路还长着呢”，哈哈，老师太诚实了

3 8-1 课程总结

2017-05-16

qq_First_Creato_0

老师，我的运行只有一条数据，其他都报craw failed

21 7-5 HTML解析器html_parser

2017-05-16

Eula_dz

urllib.parse 导入失败

2 7-5 HTML解析器html_parser

2017-05-16

慕婉清3477958

爬取几百个之后就卡那不动了……

2 7-7 开始运行爬虫和爬取结果展示

2017-05-16

为什么获取p的内容名字都不行啊

最新回答 / Eula_dz

我知道了用attrs={} 获取

2 回答 824 浏览 6-4 BeautifulSoup实例测试

2017-05-15

慕斯卡3531659

大家写代码真的如果没有IDE的话，如果有IDE的话其实还是很容易出错，
刚开始应该不用try
因为这样很容易找不到出错的地方，
去掉后找错误那是编译器帮你找了 =-=

1 7-7 开始运行爬虫和爬取结果展示

2017-05-15

曦呦

我第一次看也没看下去。后来因为需要在网上看了一些教程，都是一笔带过，或者直接给源码。只有了解了一下名词和流程，再看老师的视频，感觉真是简单易懂。

0 6-4 BeautifulSoup实例测试

2017-05-15

代码自动提示

+ 我来回答回答最高可+2积分

2 回答 494 浏览 5-3 Python爬虫urlib2实例代码演示

2017-05-15

曦呦

老师的讲的好有激情！

1 4-1 Python爬虫URL管理

2017-05-15

spider_main.py中的from baike_spider import url_manager问题

已采纳回答 / 请叫我百度

第一：baike_spider是你创建的包，你所说的url_manager肯定是放在包中的代码，是可以import进去了。第二：只爬取一个网址就结束应该是html_parser中的代码有问题，比如课程中的匹配策略与现在的百度Python词条不匹配，需要改成href = re.compile(r"/item/.*") 再或者find_all 不要丢了下划线，我就没注意到下划线，所以只输出了1条记录就craw faild了。

2 回答 1620 浏览 8-1 课程总结

2017-05-15

首页上一页 91 92 93 94 95 96 97 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空