Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

老师在那下载你的PPT呢

最赞回答 / 慕先生3429264

1，记笔记2，截图什么东西都要别人打包好了给你，这学习能力堪忧啊

1 回答 511 浏览 2-1 爬虫是什么

2017-01-14

self.urls.add_new_url(root_url) AttributeError: 'SpiderMain' object has no attribute 'urls'

+ 我来回答回答最高可+2积分

2 回答 461 浏览 7-7 开始运行爬虫和爬取结果展示

2017-01-13

看你提问时间感觉你应该在用python3，最后输出到html页面后标题和摘要两部分如果有中文显示出来都是 b'anfdsfsfds'这样的字节串，解决办法是在outputer.html中修改两个地方：1. 打开文件时直接指定编码fout = open('output.html', 'w', encoding='utf-8')2.写如内容时取消编码 fout.write('<td>%s</td>' % data['title']) fout.write('<td>%s...

2 回答 1370 浏览 7-7 开始运行爬虫和爬取结果展示

2017-01-13

运行过后没输出

+ 我来回答回答最高可+2积分

5 回答 901 浏览 7-7 开始运行爬虫和爬取结果展示

2017-01-11

python2.7.9安装scrapy怎么安装

最新回答 / qq_不曾说如果_03345635

用pip来安装，好像可以的

1 回答 673 浏览 5-1 Python爬虫网页下载器简介

2017-01-11

遇到了一个问题。

最新回答 / 慕粉1006301048

我也是个这个问题。刚刚才看视频，请问你解决了吗？

2 回答 696 浏览 5-3 Python爬虫urlib2实例代码演示

2017-01-10

网页下载器urllib2第二种方法出错

最赞回答 / 慕粉1474879821

第5行应该用Requset()这个方法：request = urllib2.Requset(url)

1 回答 560 浏览 5-3 Python爬虫urlib2实例代码演示

2017-01-09

代码出错了

最新回答 / 查扎猜

把逗号改成空格

4 回答 827 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2017-01-09

unexpected

最新回答 / qq_深圳_04368933

可以贴的详细一点吗，我感觉你把BeautifulSoupHTMLParser这个函数的参数个数或者参数类型传错了吧

1 回答 775 浏览 7-5 HTML解析器html_parser

2017-01-08

request

最新回答 / qq_深圳_04368933

你直接就urllib.urlopen（url）就行了吧，不需要request了？

2 回答 753 浏览 7-4 HTML下载器html_downloader

2017-01-08

这是PYTHON的哪一个版本呢

+ 我来回答回答最高可+2积分

2 回答 708 浏览 5-3 Python爬虫urlib2实例代码演示

2017-01-05

显示网页乱码

最新回答 / 随风丶琳

在html_outputer.py中，for data in self.datas下设置fout.write(…… .encode('UTF-8'))

1 回答 831 浏览 7-7 开始运行爬虫和爬取结果展示

2017-01-05

状态码的问题

最赞回答 / 所为伊人

如果某项请求发送到您的服务器要求显示您网站上的某个网页（例如，用户通过浏览器访问您的网页或 Googlebot 抓取网页时），服务器将会返回 HTTP 状态码响应请求。此状态码提供关于请求状态的信息，告诉 Googlebot 关于您的网站和请求的网页的信息。一些常见的状态码为：200 – 服务器成功返回网页404 – 请求的网页不存在503 – 服务器超时下面提供 HTTP 状态码的完整列表。点击链接可了解详情。您也可以访问 HTTP 状态码上的 W3C 页获取更多信息。1xx（临时响应）表示临时响应并...

2 回答 556 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2017-01-05

print "craw %d : %s\n" % (count, new_url)

+ 我来回答回答最高可+2积分

1 回答 601 浏览

2017-01-03

感觉保存图片文件方式有问题，不知道是不是我的原因

最新回答 / 遥望彼此

用write写入（二进制都没用），就不行

3 回答 393 浏览 8-1 课程总结

2017-01-01

首页上一页 49 50 51 52 53 54 55 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫