Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

噗噗姑娘

讲得很棒。老师实例爬虫--分析目标这一页ppt有个小错误。简介这边，div少了一个斜线，应该是<div class = "lemma-summary">***</div>

0 7-1 Python爬虫实例-分析目标

2016-02-21

能不能用python写一个通用的网络爬虫，而不是针对指定某个页面

最新回答 / stonesray

不好做吧，毕竟就算是指定页面，当页面更新后还需要更新代码，通用的爬虫适配是个大问题，除非针对某类网站格式相同的页面......我感觉是这个样的哈~

1 回答 1313 浏览 7-6 HTML输出器

2016-02-21

carer

6666666 老师大爱

0 6-4 BeautifulSoup实例测试

2016-02-21

qq_You_1

讲的太好了！！！！！

0 3-2 Python简单爬虫架构的动态运行流程

2016-02-20

qq_dee_0

mark囖

2016-02-20

请问为什么我按照老师的代码运行后,只能爬取1条url?

最新回答 / 洛央下

没有运行完吧，没有报错？我报错的时候只有一条URL，执行完才能打印出来

1 回答 480 浏览

2016-02-19

参考许多人的问题可以通过把try和except的部分注解掉然后执行的时候会出现TypeError: unbound method parse() must be called with HtmlParser instance as first argument (got str...错误里面提到HtmlParser出错原因应该是你没把 HtmlParser 给实例化检查调度程序spider_main.py中的class SpiderMain里的def __init__(self):发现 self.pars...

2 回答 1105 浏览 8-1 课程总结

2016-02-19

按照老师讲的写的，这是什么错误？

已采纳回答 / avalon3515

你的UrlManager类里并未定义new_urls属性

5 回答 2186 浏览 7-7 开始运行爬虫和爬取结果展示

2016-02-18

TypeError错误，求大神指教啊

+ 我来回答回答最高可+2积分

0 回答 573 浏览

2016-02-18

使用utf-8还是乱码

已采纳回答 / avalon3515

我使用的是python3，根据实际调试发现此处不需要用encode('utf-8')，但是fout = open('output.html', 'w', encoding='utf-8')要把encoding参数加上，因为在windows下默认编码是gbk，忽略次参数会产生错误。

1 回答 2559 浏览 7-7 开始运行爬虫和爬取结果展示

2016-02-17

weibo_这世界就是一和零_0

真的很棒，从思想出发最后才讲代码，感觉自己很适合这种教法

0 5-3 Python爬虫urlib2实例代码演示

2016-02-16

Samuel_sAng

满分啊才开始学python半个月基本都能听懂了老师太棒了

2 7-1 Python爬虫实例-分析目标

2016-02-16

downloader失败

已采纳回答 / blacksea3

有可能中间这一块哪里代码打错了而不是self.urls.has_new_url()==0导致退出循环，python的百科里面是有别的链接的，你可以试着把try-except去掉，让错误直接显示出来中间这一块指的是：<...code...>根据错误位置设置print 相应的变量查看错误原因。

1 回答 1010 浏览 7-7 开始运行爬虫和爬取结果展示

2016-02-16

print( len(response2.read()))一会好一会报错

已采纳回答 / 传说级小白

就比如我们正常打开网页的时候也会报错，可能和你网速有关，也可以是服务端处理请求有关

1 回答 3476 浏览 5-3 Python爬虫urlib2实例代码演示

2016-02-15

我的read()这有问题，注释的那

最新回答 / 隐匿的月亮城

看着很正常啊，出了什么问题？

2 回答 1119 浏览 5-3 Python爬虫urlib2实例代码演示

2016-02-15

daidai190

爬虫
url管理器
网页下载器
网页解析器（解析：url、有用数据）

0 3-1 Python简单爬虫架构

2016-02-15

首页上一页 181 182 183 184 185 186 187 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫