Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

Python网页解码如果charset 是gbk咋办

讲师回答 / 蚂蚁帅帅

将程序分层。主逻辑统一使用Utf8。加一个转码模块，讲外部输入的数据源，从各种编码转换成UTF8。

2 回答 1295 浏览 7-1 Python爬虫实例-分析目标

2016-09-03

eclipse+PyDev ctrl+1快捷键问题

已采纳回答 / 慕粉3258224

你用 Ctrl + Shift + O 试试

2 回答 3009 浏览 7-2 调度程序

2016-09-01

只输出“craw failed“

已采纳回答 / CuiYS

Html_Outputer那个module那里，url不需要转换utf-8

6 回答 1580 浏览 8-1 课程总结

2016-08-26

如何打开urlib2

已采纳回答 / 这都不会

装python了吗。。。自带的。。直接import就行

3 回答 950 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2016-08-22

无法引入urllib2模块

已采纳回答 / 大咪

response = urllib.request.urlopen(url)这样写..3.xx后的版本合并了

2 回答 1283 浏览 7-4 HTML下载器html_downloader

2016-08-21

为什么这里全部出错了呢。打印不出来

已采纳回答 / UFO2015

<...code...>没有 # coding:utf8 <...图片...> 有 # coding:utf8 <...图片...>

4 回答 1315 浏览 5-3 Python爬虫urlib2实例代码演示

2016-08-19

我在pycharm中把你的代码运行了一下，把“beautifulSoup”改成“BeautifulSoup”，并且把soup=beautifulsoup(html_doc,'html_doc',from_encoding='utf-8')改成了soup=BeautifulSoup(html_doc,'html.parser',from_encoding='utf-8')，最后结果是正确的，而且没有报错

3 回答 880 浏览 6-4 BeautifulSoup实例测试

2016-08-18

为什么我加了# -- coding: utf8 -- 还是报错？中文无法识别。。

已采纳回答 / arkria3684535

首先要确保eclipse编辑器环境的编码为utf8，这个是大前提；其次如果py文件中含有中文字符的话，需要在py文件中对编码进行声明。修改eclipse编辑器编码：A）设置工作空间编码：Window->preferences->General->Workspace->UTF-8B）设置编辑器编码：Window->preferences->General ->Editors->Text Editors->Spelling->UTF-8C）设置...

4 回答 9205 浏览 5-3 Python爬虫urlib2实例代码演示

2016-08-17

为什么我在IE浏览器打开生成的html文件，文件内容没有转换成中文的？

已采纳回答 / 龙德梦

显然是二进制，应该是你在解析的时候没有用utf-8。如果你用了的话，可以换其他浏览器试试，如果是乱码的话，只需要在浏览器中改一下文字编码，改为Unicode编码即可。同样在IE里面也可以这样做。

1 回答 2250 浏览

2016-08-05

第三种方法怎么错误了

最赞回答 / choosenno1

我这导过包之后还是不行，而且导包之后cookielib为红色浪线，提示Unresloved import：cookielib，求解。。

6 回答 3850 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2016-08-04

扑虫写完了，但是运行不了啊！？？

已采纳回答 / YYLQ

还有更多信息么？可以设置count = 1那设置一个断点，debug找一下数据到哪个方法时候没传过去？

1 回答 679 浏览 7-6 HTML输出器

2016-08-01

from bs4 import beautifulsoup时错误

最新回答 / 慕用7450272

请问是怎么解决的？

6 回答 7996 浏览

2016-07-31

python爬虫

已采纳回答 / 苦_勤_向上_

问题是你写错了，或者你没做好网页分析

4 回答 1474 浏览 7-7 开始运行爬虫和爬取结果展示

2016-07-25

没报错，只输出了第一条记录，然后就craw failed，跳出循环了，怎么回事？

最新回答 / NormanG

一个函数一个函数的对照，问题出在downloader里面没有import urllib2这个模块。

9 回答 1868 浏览 7-7 开始运行爬虫和爬取结果展示

2016-07-24

pip和beautifulsoop版本不匹配

已采纳回答 / 程序猿和攻城狮

是beautifulsoup4，你自己看看是不是拼写错误啦。。。。。。。pip升级： pip install --upgrade pip

12 回答 2467 浏览 6-2 BeautifulSoup模块介绍和安装

2016-07-10

首页上一页 9 10 11 12 13 14 15 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫