Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

哈士奇萌萌

最后因为编码问题，苦恼甚久……不过还是解决了。

0 8-1 课程总结

2015-12-24

qq_扎根垄上_0

有代码么？

0 7-4 HTML下载器html_downloader

2015-12-24

python爬虫

最赞回答 / myAbo

http://www.imooc.com/opus/resource?opus_id=1932 希望能帮到你

2 回答 1305 浏览 7-3 URL管理器

2015-12-24

貍肽

老师有时候好激动呀1!!

3 7-2 调度程序

2015-12-23

xufeng123456

能不能分享一下源码

0 8-1 课程总结

2015-12-23

破晓01234567891011121314151617181920212223

能下载源码吗？

6 6-4 BeautifulSoup实例测试

2015-12-23

东海的内地

讲的清晰明白，很期待高阶的课程，非常期待，不知何时推出

2015-12-23

谁成功爬去了，分享下代码可好啊

最新回答 / 哈士奇萌萌

你看看是不是在输出的html里面，没有加入'<meta charset="UTF-8">'?

1 回答 987 浏览

2015-12-23

这个问题怎么解决？

已采纳回答 / 蚂蚁帅帅

1、不要把代码放在中文路径下；2、文件开头引入包了吗，import cookielib，这一句。

2 回答 984 浏览 5-3 Python爬虫urlib2实例代码演示

2015-12-23

hhhhzz

hhhbfffff

0 1-1 Python开发简单爬虫课程介绍

2015-12-23

本课程应用的问题

已采纳回答 / 凡所在的世界

这只是简单的讲了讲，有兴趣的下来还有很多要学。

1 回答 876 浏览 2-2 爬虫技术的价值

2015-12-23

IVer3ON

python 3和2很大区别就是python本身改为默认用unicode编码。字符串不再区分"abc"和u"abc", 字符串"abc"默认就是unicode，不再代表本地编码、由于有这种内部编码，像c#和java类似，再没有必要在语言环境内做类似设置编码，比如“sys.setdefaultencoding”;也因此也python 3的代码和包管理上打破了和2.x的兼容。2.x的扩展包要适应这种情况改写。另一个问题是语言环境内只有unicode怎么输出gbk之类的本地编码。如楼下说的。

7 7-6 HTML输出器

2015-12-23

为什么爬下来的内容为乱码？

最赞回答 / McDaddy

data['xxx'].encode('gbk')

6 回答 1331 浏览 7-5 HTML解析器html_parser

2015-12-22

IVer3ON

使用Python3以上的：
return responce.read().decode('UTF-8')
注意加上decode()

1 7-4 HTML下载器html_downloader

2015-12-22

IVer3ON

谢谢老师~

0 8-1 课程总结

2015-12-22

IVer3ON

python3 都发布3.5了老师还用2

0 7-5 HTML解析器html_parser

2015-12-22

首页上一页 193 194 195 196 197 198 199 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空