Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

print( len(response2.read()))一会好一会报错

已采纳回答 / 传说级小白

就比如我们正常打开网页的时候也会报错，可能和你网速有关，也可以是服务端处理请求有关

1 回答 3472 浏览 5-3 Python爬虫urlib2实例代码演示

2016-02-15

我的read()这有问题，注释的那

最新回答 / 隐匿的月亮城

看着很正常啊，出了什么问题？

2 回答 1119 浏览 5-3 Python爬虫urlib2实例代码演示

2016-02-15

ctrl+1

最新回答 / Roc_J

我的可以啊。你把光标定位在那个方法后面

1 回答 882 浏览 7-2 调度程序

2016-02-14

只有两个结果，第二个网址是锁定词条的百科

最赞回答 / 梨狗子

检查一下html_parser中_get_new_urls方法的return new_urls语句的缩进。应放在for循环外

2 回答 1189 浏览 7-6 HTML输出器

2016-02-13

mac系统下面完全没讲解

+ 我来回答回答最高可+2积分

0 回答 572 浏览

2016-02-12

输出的是这样的乱码怎么办？

最赞回答 / Effortjohn

html_outputer代码里，在写入<html>和<body>之间，再写入<head><meta charset="utf-8"></head>像下面这样： fout=open('output.html','w') fout.write("<html>") fout.write("<body>") fout.write("<head>") ...

3 回答 1771 浏览 7-7 开始运行爬虫和爬取结果展示

2016-02-10

这个教程写的时候是Python2吧小白入得时候就是3 urllib2已经更改了么？还有什么别的地方？

最新回答 / 梨狗子

https://docs.python.org/3.5/library/urllib.request.html 有改动试一下import urllib.request然后使用rullib.request.urlopen（）方法详细介绍可到相对应的python版本的官方文档Library Reference查看

1 回答 592 浏览

2016-02-03

快捷键的修改Ctrl+1

+ 我来回答回答最高可+2积分

0 回答 800 浏览

2016-01-31

为什么建立函数用IF？

已采纳回答 / jireh

那是调用main函数，建立main函数仍然需要def。这是python在调用执行程序时，只有一个入口，就是要判断是不是执行__name__='__main__'的函数

2 回答 911 浏览 7-2 调度程序

2016-01-31

不写“获取Lacie的链接”那段代码的话会报错

最赞回答 / zoho

应该铁定是输错了，比如href啥的，不要输成herf，血泪史。。

4 回答 686 浏览 6-4 BeautifulSoup实例测试

2016-01-30

运行没有反应，eclipse的console显示 <terminated> E:\Android\workspace1\imooc\baike_spider

最新回答 / 启真湖畔的千纸鹤

+1，我也是

8 回答 7879 浏览 7-7 开始运行爬虫和爬取结果展示

2016-01-27

高效的编程

已采纳回答 / 赤道2015

我之前用eclipse时感觉不习惯这些快捷键，后来看视频，看到老师总用快捷键，自己就在网上搜，老师的这些操作是用什么快捷键，然后自己也练习使用，所以，发现问题就查，查完就用。

1 回答 711 浏览 7-5 HTML解析器html_parser

2016-01-27

为什么response1.read()内容打印不出来？？

最新回答 / 柯伊伯带的一颗小星星

这个要看你print的是什么。

1 回答 1517 浏览 5-3 Python爬虫urlib2实例代码演示

2016-01-27

报错：unbound method

最赞回答 / Effortjohn

出错原因应该是你没把 HtmlOutputer 给实例化。可以检查调度程序spider_main.py中的class SpiderMain里的def __init__(self):有没有这个语句：self.outputer = html_outputer.HtmlOutputer()

3 回答 1211 浏览 7-7 开始运行爬虫和爬取结果展示

2016-01-27

失败了，报错如下

最新回答 / AILun_po

init前后的下划线都是2个

3 回答 880 浏览 7-7 开始运行爬虫和爬取结果展示

2016-01-27

首页上一页 85 86 87 88 89 90 91 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫