Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

html_downloader,html_parser,html_outputer的类添加不成功。

最新回答 / qq_鱼面晓晓_03572666

貌似可以试试ctrl+shift+o导包

1 回答 593 浏览 7-1 Python爬虫实例-分析目标

2016-07-04

错误提示是什么原因

最新回答 / sheieferd

download()函数忘记了填参数

1 回答 570 浏览 7-7 开始运行爬虫和爬取结果展示

2016-07-02

请问使用版本

最新回答 / 贰到正无穷

Python27

1 回答 884 浏览 2-1 爬虫是什么

2016-07-01

网页乱码问题

+ 我来回答回答最高可+2积分

0 回答 213 浏览

2016-06-28

爬虫编码问题

最新回答 / frgo_03360772

在开始加上代码：import sysreload(sys)sys.setdefaultencoding('utf-8')即可解决~不用谢，请叫我雷锋！！

2 回答 743 浏览 7-3 URL管理器

2016-06-28

response.read()只能执行一次么？

最新回答 / HN_Developer

可以输出，可能是其他部分出问题。

1 回答 1245 浏览 5-3 Python爬虫urlib2实例代码演示

2016-06-28

Python3可能出现到的问题

+ 我来回答回答最高可+2积分

2 回答 718 浏览 7-7 开始运行爬虫和爬取结果展示

2016-06-27

为什么debug可以运行但是直接run不行？

最赞回答 / 许晓北

解决了在python3中需要在html——downloader里面导入import urllib.request 这个而不是import urllib

1 回答 5181 浏览 7-7 开始运行爬虫和爬取结果展示

2016-06-27

程序不报错，但是没有结果。

最赞回答 / ACJ

soup=BeautifulSoup(html_count,'html.parser',form_encoding='utf-8')这一句单词from拼错了

2 回答 1759 浏览 7-7 开始运行爬虫和爬取结果展示

2016-06-27

except后面应该要添加捕捉错误的类型？

最新回答 / UFO2015

PyCharm : 报错提示： too broad exception clauses 的完美解决方案！http://www.imooc.com/qadetail/166784

2 回答 1133 浏览 7-2 调度程序

2016-06-26

为什么在控制台输出是好的，可是在浏览器中输出是乱码

最赞回答 / dreaming2015

需要加一个head标签<...code...>原因是操作系统如果是中文的，浏览器的默认编码是GBK 如果本地写的是UTF-8的编码的文件，会出现乱码

1 回答 1215 浏览 7-7 开始运行爬虫和爬取结果展示

2016-06-24

在spider_main文件中，提示new_urls ,new_data未定义

最新回答 / Jack闪光3276171

直接用啊，还要什么定义啊

1 回答 420 浏览 7-2 调度程序

2016-06-23

我按照您的代码写的，爬取到主页面后就出现craw failed，而且不往下运行了，请问这是哪方面的原因？

最赞回答 / charsandrew

可能有很多种原因（语法错误啊，等等），一个方法是：可以把主函数中的:try:except: print('craw failed')改为：try:except Exception as e: print('craw failed',e)这样就能把错误信息打印出来，然后根据错误信息就比较容易找到，错误原因。

2 回答 1031 浏览 7-7 开始运行爬虫和爬取结果展示

2016-06-22

求代码。xx

+ 我来回答回答最高可+2积分

0 回答 530 浏览

2016-06-22

ImportError: No module named baike_spider

最新回答 / 慕姐5696219

我也是这个问题，不过我的__main__是双下划线啊

4 回答 1853 浏览 7-2 调度程序

2016-06-21

首页上一页 62 63 64 65 66 67 68 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫