Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

这是最后输出的结果，请教怎么解决啊？

已采纳回答 / 慕虎9378224

print "第二种方法"request = urllib2.urlopen(url)#应该是：request = urllib2.Request(url)

2 回答 1269 浏览 5-3 Python爬虫urlib2实例代码演示

2018-09-04

collect_data（）方法传入了参数也报错说没有传入参数，为了找到问题我先没有在try中调用

最新回答 / Great_cc

我也是这个报错，你解决了吗

1 回答 858 浏览 7-7 开始运行爬虫和爬取结果展示

2018-09-04

这里输出文件地址问题

最新回答 / Beacon008

输出到你py文件的地址。想指定就指定个路径就好了

1 回答 850 浏览 7-6 HTML输出器

2018-09-04

qq__9416

在进行添加url集合的时候应该判断该集合中的url是否与已存在的url重复

1 7-3 URL管理器

2018-08-27

如何引用创建的url_manager,html_outputer等对象

最新回答 / 小胖脸码农

<...图片...>

from . import html_downloader, html_ouputer, html_parser, url_manager

2 回答 1000 浏览 7-2 调度程序

2018-08-25

解析器里面的page_url是什么？为什么前面没有定义

最新回答 / 慕粉193046834

当然不需要定义啊这是在main方法里调用parser时传递的参数，而在main方法里是通过方法get_new_url获取的new_url<...图片...><...图片...>

2 回答 1605 浏览 7-5 HTML解析器html_parser

2018-08-23

我用的pycharm不能编写这个案例

最赞回答 / Bazinga9505443

html_doc = """
&;hthtml&;&l&;hehead&;&l&;tititle&;ThThe Dormouse's story&tit/title<&hea/head&<
&odybody&<
& clp class="title"&t;b>b&e DThe Dormouse's story&t;&/b&/p&&t;
/p&t;p

&assp class="story"&upoOnce upon a time there were ...

3 回答 1585 浏览 6-4 BeautifulSoup实例测试

2018-08-22

只能读一行不知道为什么

最赞回答 / qq_弹指一刻_0

没有做循环处理你可真是个弟弟

1 回答 958 浏览 7-5 HTML解析器html_parser

2018-08-22

有没有课程的源代码

+ 我来回答回答最高可+2积分

0 回答 663 浏览

2018-08-22

报错No handlers could be found for logger "bs4.dammit"

最新回答 / weibo_慕尼黑2518133

请问，最后怎么解决了？

2 回答 6863 浏览 6-4 BeautifulSoup实例测试

2018-08-21

notepad++中能合并代码直接运行（Python3）吗？

+ 我来回答回答最高可+2积分

0 回答 818 浏览

2018-08-21

python3以上三种方法，成功运行

最新回答 / qq_做好自己_6

还是不行呀，运行出来的结果和视频里的不一样

8 回答 1845 浏览 5-3 Python爬虫urlib2实例代码演示

2018-08-21

报错。。。

最新回答 / 慕丝8324246

它提示的是你哪一行代码错误

1 回答 963 浏览 7-5 HTML解析器html_parser

2018-08-20

为啥我爬到的只有一条数据还是错误的。。

最赞回答 / qq_林多多_0

解决了，下载器中没有引入from urllib import request

1 回答 821 浏览 7-1 Python爬虫实例-分析目标

2018-08-20

一样的代码，只能爬取几条数就结束了

最新回答 / 慕九州3106485

请问你的问题解决了么？我遇到跟你类似的问题

2 回答 717 浏览 7-7 开始运行爬虫和爬取结果展示

2018-08-20

首页上一页 20 21 22 23 24 25 26 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫