Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

output输出问题

最新回答 / sS浩子_M

class HtmlOutputer(object): def __init__(self): self.datas=[] def collect_data(self,data): if data is None: return self.datas.append(data) def output_html(self): fout = open('output.html', 'w', e...

4 回答 838 浏览 7-5 HTML解析器html_parser

2016-03-16

count怎么会无效

最新回答 / WHXSCNU

我也出现过类似的问题（使用PyCharm），按提示将count = count + 1改为count += 1 不知是不是一样的问题

1 回答 662 浏览

2016-03-16

这里的page_url是干什么用的？

最新回答 / V阿哲

视频引用的是2.7的python，在3.*里面大量写法全部改变了

6 回答 1483 浏览 7-5 HTML解析器html_parser

2016-03-16

爬不了后续网页，请问为什么会出现这种情况呢？

最新回答 / 小马锅过河

地址是不是变成了这样。。。http://baike.baidu.com/link?url=DIV6dhD_hIlXVn4PG2th7Vhyt__rNfm_0N4ADjTE2V9vIfqNgy6OvFWVdjmRbdaNDL_K7rmZx0GugzRIq94wN_

1 回答 319 浏览

2016-03-15

出错：'str' object has no attribute 'soup'

最新回答 / 啊B

写成什么 str.soup的方法或者属性了吧，多多注意

2 回答 3403 浏览 7-5 HTML解析器html_parser

2016-03-14

爬到了许多无关的信息-_-?

最新回答 / 啊B

很正常，比如说 python->某个人物(可能和发明者有关)->无花果(刚才那个人物喜欢的水果)->元宵节(刚才大人物出生日期之类的)

2 回答 726 浏览 7-7 开始运行爬虫和爬取结果展示

2016-03-14

我的怎么老有错误

最新回答 / 当归_禅衣

from pip_vendor.requests.packages.urllib3.util import url,这句话是要表达什么,直接引入urllib2(import urllib2)就行了,没有用到urllib3,URL不一致，刚开始的时候是大写，然后又变成了小写，还要引入浏览器(from webbrowser import Mozilla)

1 回答 646 浏览 5-3 Python爬虫urlib2实例代码演示

2016-03-13

为什么这个视频里面不需要 import库？

最新回答 / 勤奋Mrhou

老师使用的软件是什么？

2 回答 775 浏览 5-3 Python爬虫urlib2实例代码演示

2016-03-12

编码坑！文件名坑！

最新回答 / alienpro

哈哈，厉害

1 回答 744 浏览 5-3 Python爬虫urlib2实例代码演示

2016-03-11

new_urls, new_data = self.parser.parse(new_url, html_cont) TypeError: 'NoneType' object is not iterable

+ 我来回答回答最高可+2积分

1 回答 1866 浏览

2016-03-09

python抓取网页程序运行没有反应，这是怎么回事？？？

最新回答 / 请叫我百度

逐步print 打印输出语句试试看进行到哪一步出错了

3 回答 3241 浏览 8-1 课程总结

2016-03-09

主函数语法错误

最新回答 / rink_hit

问题已经解决了，应该加上括号

1 回答 890 浏览 7-2 调度程序

2016-03-08

出来都是这个代码，求指点

最赞回答 / WHXSCNU

本人系统win7，Python3.5，按照百度上win10的做法：fileout = open('output.html', 'w', encoding='utf-8')，能显示中文

2 回答 19810 浏览

2016-03-07

请教一个改成3.5版本的问题 urljoin

最赞回答 / 成凤凰涅槃

from urllib.parse import urlparsefrom urllib.parse import urljoin找到了

1 回答 653 浏览

2016-03-07

运行只输出一条然后failed

最新回答 / 终可见丶

我也是这样子的，去掉了try，抓了一条之后就会报错。

1 回答 586 浏览

2016-03-03

首页上一页 70 71 72 73 74 75 76 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫