Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

python运行时出错

最新回答 / 弄风

我自己调试的时候是在怀疑有错误的后面加上<...code...>看看能不能在控制台中运行出来这行字如果能够打印出来说明能运行到这以上的内容再根据实际情况慢慢调试希望可以帮助到你~

1 回答 448 浏览 7-7 开始运行爬虫和爬取结果展示

2017-06-03

我用的PyCharm跑的，一直出问题，解释器选的Python27的

已采纳回答 / 郑小墨

看看你的python27/Lib目录下的urllib2.py里面有没有urlopen 我的python版本是2.7.13，正常

2 回答 2090 浏览 5-3 Python爬虫urlib2实例代码演示

2017-06-02

求教大神啊！

已采纳回答 / 来离

你试试改成 <...code...>

3 回答 1246 浏览 5-3 Python爬虫urlib2实例代码演示

2017-06-02

我想知道答案

已采纳回答 / 慕UI6075258

不应该，这些应该只是简单的功能很有可能还有其他的功能，只是没在这里显示出来而已。感兴趣的话，可以网上搜一下。

1 回答 708 浏览 4-1 Python爬虫URL管理

2017-05-31

初学者求助

最新回答 / 豆腐tf

links = soup.find_all('a', href=re.compile(r'/item/.*?'))

2 回答 693 浏览 7-7 开始运行爬虫和爬取结果展示

2017-05-29

初学者求教

最新回答 / SapereAudor

至少代码是有问题的

1 回答 740 浏览 7-5 HTML解析器html_parser

2017-05-28

大佬们求助

+ 我来回答回答最高可+2积分

2 回答 412 浏览 7-7 开始运行爬虫和爬取结果展示

2017-05-28

如何使用eclipse编译Python

最赞回答 / 肖申克赫本

安装pydev插件，建议离线下载安装http://blog.csdn.net/xue_changkong/article/details/46755639，希望对你有用

1 回答 1233 浏览 5-3 Python爬虫urlib2实例代码演示

2017-05-28

会卡在某一条加载不出来怎么回事，求教

最新回答 / 豆腐tf

links = soup.find_all('a', href=re.compile(r'/item/.*?'))

2 回答 694 浏览 7-7 开始运行爬虫和爬取结果展示

2017-05-26

我之前也遇到过这种情况，纠结了很久，最后才发现一个非常重要的问题，百度的词条信息发生了变化，你可以仔细看看，现在不再是以 .htm结尾了，之前在html_parser模块中的正则表达式已经失效了，原来是href=re.compile(r"/view/\d+\.htm")，现在应该改为href=re.compile(r'/item/\w+')。这也再次证明了在采集数据前，一定要对目标进行仔细认真的分析！

1 回答 1254 浏览 7-7 开始运行爬虫和爬取结果展示

2017-05-25

运行结果提问

最新回答 / 慕移动9181930

==就是Javascript里面的等于号nbsp;=就是赋值号nbsp;nbsp;中间加空格就相当于nbsp;两个赋值号了nbsp;吃了炫迈，停不下来

2 回答 697 浏览

2017-05-25

有人知道如何在JSP页面中点击按钮后运行这个爬虫程序吗

最新回答 / 0嘿_嘿_嘿0

F5吧

1 回答 1099 浏览 7-2 调度程序

2017-05-24

爬到的内容乱码

最新回答 / _Lee

展示的时候不要encode('utf-8')

1 回答 236 浏览 7-2 调度程序

2017-05-23

no module named baike_spider

最赞回答 / 慕粉100117686

我也遇见同样的问题了，直接import就行了，不需要from，参考一下下面从百度上找的回答，前两句是重点的区别吧！小白一枚！！！import Module # 引入模块from Module import Other # 引入模块中的类、函数或者变量from Module import * # 引入模块中的所有‘公开’成员PS:当有一个包名为pname时,其内部 *.py 文件的模块名就是 pname.* 也就是说模块名中包含了 Package包这个概念。其区别就是:第一...

3 回答 2195 浏览 7-2 调度程序

2017-05-23

运行后只能显示第一个网址

最新回答 / cwlml

如果是soup这句话不执行的话，应该是downloader中的htm_cont出现了问题，无法进行解析，你回到解析的文件查看下呢

1 回答 627 浏览

2017-05-22

首页上一页 45 46 47 48 49 50 51 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫