Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

qq_SunStepClear_0

pycharm 需要alt+enter

3 7-2 调度程序

2017-06-30

magic3584

按照教程简单写了个爬豆瓣电影 top 250 的，需要的可以参考下。README 命令行直接执行就可以了。
https://github.com/magic3584/crawl_demo

1 7-2 调度程序

2017-06-30

用PyCharm会报错,Why?

最新回答 / mountainguan

= =我用linux环境，直接拿个sublime敲

2 回答 512 浏览 7-2 调度程序

2017-06-30

wsixd

老师逻辑清晰，图示直观，讲的真好

2 7-1 Python爬虫实例-分析目标

2017-06-29

fout.write("</tr>")报错，看起来不应该有问题啊。。。

最新回答 / qq_Smilereplac_0

上一行掉了一个反括号

4 回答 2223 浏览 7-6 HTML输出器

2017-06-29

开发工具怎么下载

+ 我来回答回答最高可+2积分

1 回答 833 浏览 5-3 Python爬虫urlib2实例代码演示

2017-06-29

qq_墨影_1

大赞没有废话！！

1 4-1 Python爬虫URL管理

2017-06-27

如果旅行你想去哪

我知道你们在想什么。。。因为我也是这样想的。。。

9 2-2 爬虫技术的价值

2017-06-26

慕课boy

简谈今天debug是如何解决的，我的环境是python2.7。
首先，百度百科改了目录结构，百科的文件很多都是"/item/XXX.htm"的路径，所以正则匹配的时候修改为:
links = soup.find_all('a', href=re.compile(r'/item')),或自行修改匹配规则.
其次，HtmlParser解析内容时，当页面内容为空时，会报错，需增加一个异常处理，并对data['summary']赋值，否则输出文件时会因为data字典没有这个键而报错。简单代码如下：

2 7-6 HTML输出器

2017-06-26

是否可以跟着老师你学py

最新回答 / shiwanghualuo

你是在问我吗？同学

1 回答 468 浏览 7-1 Python爬虫实例-分析目标

2017-06-26

六域的六

这不是义务教育，爱学学，不学请出门左转。

0 6-3 BeautifulSoup的语法

2017-06-26

Maizing

02：55 要把鼠标放在错误的行上（红色下划线所在行），再按 Ctrl + 1

0 7-2 调度程序

2017-06-25

chikuangren

这个需要很多方面的知识，等我学完python的另一门走进request库再回来\(￣︶￣*\))

2017-06-24

chikuangren

老师说话好快。?

0 5-2 Python爬虫urlib2下载器网页的三种方法

2017-06-24

属性错误:模块“urllib”没有属性“urlopen”是怎么回事？要怎么解决?

最赞回答 / 慕粉和点心

自己已解决

2 回答 1709 浏览

2017-06-23

qidoudou

这个培训的思路太清楚了，赞

1 7-1 Python爬虫实例-分析目标

2017-06-23

首页上一页 83 84 85 86 87 88 89 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空