Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

网页下载器urllib2第二种方法出错

最赞回答 / 慕粉1474879821

第5行应该用Requset()这个方法：request = urllib2.Requset(url)

1 回答 561 浏览 5-3 Python爬虫urlib2实例代码演示

2017-01-09

代码出错了

最新回答 / 查扎猜

把逗号改成空格

4 回答 828 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2017-01-09

unexpected

最新回答 / qq_深圳_04368933

可以贴的详细一点吗，我感觉你把BeautifulSoupHTMLParser这个函数的参数个数或者参数类型传错了吧

1 回答 776 浏览 7-5 HTML解析器html_parser

2017-01-08

request

最新回答 / qq_深圳_04368933

你直接就urllib.urlopen（url）就行了吧，不需要request了？

2 回答 754 浏览 7-4 HTML下载器html_downloader

2017-01-08

这是PYTHON的哪一个版本呢

+ 我来回答回答最高可+2积分

2 回答 708 浏览 5-3 Python爬虫urlib2实例代码演示

2017-01-05

显示网页乱码

最新回答 / 随风丶琳

在html_outputer.py中，for data in self.datas下设置fout.write(…… .encode('UTF-8'))

1 回答 836 浏览 7-7 开始运行爬虫和爬取结果展示

2017-01-05

如果某项请求发送到您的服务器要求显示您网站上的某个网页（例如，用户通过浏览器访问您的网页或 Googlebot 抓取网页时），服务器将会返回 HTTP 状态码响应请求。此状态码提供关于请求状态的信息，告诉 Googlebot 关于您的网站和请求的网页的信息。一些常见的状态码为：200 – 服务器成功返回网页404 – 请求的网页不存在503 – 服务器超时下面提供 HTTP 状态码的完整列表。点击链接可了解详情。您也可以访问 HTTP 状态码上的 W3C 页获取更多信息。1xx（临时响应）表示临时响应并...

2 回答 557 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2017-01-05

print "craw %d : %s\n" % (count, new_url)

+ 我来回答回答最高可+2积分

1 回答 602 浏览

2017-01-03

感觉保存图片文件方式有问题，不知道是不是我的原因

最新回答 / 遥望彼此

用write写入（二进制都没用），就不行

3 回答 393 浏览 8-1 课程总结

2017-01-01

只抓取了一条就结束了，怎么回事啊？

最新回答 / cryengine3

本人新手，想照着写个爬虫练练手，结果给我来了个下马威

1 回答 800 浏览

2017-01-01

报错无法运行

最新回答 / 六边形怪瓜

报错信息说明 soup.find("dd",class_="lemmaWgt-lemmaTitle-title") 这一段没找到东西，所以返回的是None，你继续对None调用find函数当然就报错了，代码是这样没错，这说明爬取的网页格式不对，你可以再这行前面输出page_url，自己在浏览器访问后用教程中的方法审查元素，看看是网页的什么问题

2 回答 775 浏览 7-7 开始运行爬虫和爬取结果展示

2016-12-30

python入口url

最新回答 / Ranbo_qiu

你可以把try： except:给注释掉，让你的程序出现错误，你就知道你哪里错误了

1 回答 778 浏览 7-2 调度程序

2016-12-29

如何修改使之能够将结果保存在MySQL中

已采纳回答 / lft

<...code...>

3 回答 1354 浏览 8-1 课程总结

2016-12-27

第三种方法报错

最新回答 / 慕码人5926626

求pydev安装方法，试了很多，都不行。1【Help】-【Install New Software】；2 选择【Archive】，然后选择下载的离线；3 直接将下载的离线包解压，得到plugins和features文件夹，放到Eclipse的dropins目录下.。都不行，晕了

2 回答 836 浏览 5-3 Python爬虫urlib2实例代码演示

2016-12-25

python charm 5里怎么建立python module 呢

已采纳回答 / 慕哥0672315

.py为后缀名的文件都会被认为是python模块。package相当于文件夹，只不过其每层目录下一定有一个 _init_.py 的文件。Pycharm中，在package上右键"New-Python File"可以新建模块

1 回答 1905 浏览 7-2 调度程序

2016-12-24

首页上一页 57 58 59 60 61 62 63 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫