Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

有一点不懂

最新回答 / ihdicf

安装pydev,现在已经解决了，想问一下这样抓取后的网页数据怎样应用于eclipse中用于APP开发

2 回答 814 浏览 1-1 Python开发简单爬虫课程介绍

2016-03-27

为什么我没有生成output.html文件？

最新回答 / 浅烟whh

我也是这样的，根本就没有这个HTML文件

3 回答 1394 浏览 7-7 开始运行爬虫和爬取结果展示

2016-03-26

怎样才能在每个.py文件开头自动输入#coding:utf-8

最赞回答 / 空空生

<...code...>我用的是PyCharm，在PyCharm里可以这么设置进入File->settings->Editor->File and Code Templates->Python Script输入一下内容：<...code...>就可以了

5 回答 2509 浏览 6-2 BeautifulSoup模块介绍和安装

2016-03-26

用Notepad++能否写这个代码

最新回答 / 慕移动9181930

现在的正式版本已经不再需要brifgeToObjectiveC这个方法了。为此，这一小节完全重新录制了，欢迎收看！是的，针对不同的浏览器加不同的代码的！目的就是解决浏览器的兼容性！

3 回答 1709 浏览 5-3 Python爬虫urlib2实例代码演示

2016-03-25

为什么我读出来的cj-cookieJar是空值？

+ 我来回答回答最高可+2积分

4 回答 1712 浏览 5-3 Python爬虫urlib2实例代码演示

2016-03-24

爬出来的页面内容显示这种乱码似的文字是怎么回事啊？求教！谢谢！

已采纳回答 / us4ever

<...code...>试一下这样吧

5 回答 3407 浏览 7-7 开始运行爬虫和爬取结果展示

2016-03-24

每次都是爬到开始的那个网址，然后就failed了，是怎么回事？谢谢！

已采纳回答 / us4ever

我一开始的时候也是这样，后来发现漏掉了一个return语句，建议把代码从头到尾对照一遍，查查有没有漏写或写错（很容易把url和urls搞错，之类的）

4 回答 974 浏览 7-7 开始运行爬虫和爬取结果展示

2016-03-23

为什么python百度百科的网址是很长一串的，不是/view/+数字的格式

+ 我来回答回答最高可+2积分

3 回答 1403 浏览 7-2 调度程序

2016-03-23

爬着爬着就不动了，是因为被服务器拦住了吗

最新回答 / weixin_慕妹5591159

我只爬到2

3 回答 1075 浏览 7-7 开始运行爬虫和爬取结果展示

2016-03-23

用python3，只能import urllib.request，但是找不到add_data方法

已采纳回答 / 霍霍不二

urllib.request.data = "Some data"参考以下链接：http://stackoverflow.com/questions/25734145/python-and-the-new-way-to-add-data-to-urllib-requests

1 回答 8125 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2016-03-21

TypeError: expected string or buffer出现这个问题怎么回事

最新回答 / 慕数据0017181

感谢提醒，粗心了

3 回答 12490 浏览

2016-03-21

代码哪里下载

最新回答 / Simles

代码已经上传，希望对你有所帮助。https://github.com/Simplation/spider_baike_demo

3 回答 465 浏览 8-1 课程总结

2016-03-21

改为多线程

最新回答 / Nelsonberry

多个IP地址进行抓取，从不同的IP代理服务器抓取，可以提高抓取速度

1 回答 1048 浏览 7-6 HTML输出器

2016-03-21

为什么运行之后只产生了一条结果

已采纳回答 / green_apple7

我和你的问题一样，请问你解决了吗？是如何解决的？

4 回答 862 浏览 8-1 课程总结

2016-03-20

urls和url区别

已采纳回答 / zero_w

url是单个urls是批量

2 回答 2052 浏览 7-2 调度程序

2016-03-20

首页上一页 81 82 83 84 85 86 87 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫