Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

李明洋

老师声音铿锵有力啊

2 6-3 BeautifulSoup的语法

2017-01-03

李明洋

踩坑，，python3第一种方法，如下写。
# conding:utf8
import urllib.request

url = "https://www.baidu.com"
print("第一种方法")
response1 = urllib.request.urlopen(url)
print(response1.getcode())
print(len(response1.read()))

有两点，低一点print已经是一个方法了，第二点urllib2已经和urllib合并了，在python3中只有urllib，而且urlopen方法在urllib.request上。

7 5-3 Python爬虫urlib2实例代码演示

2017-01-03

Yi罐可乐

python 3 版本代码：

https://github.com/zaxlct/baike_spider
带注释

3 7-7 开始运行爬虫和爬取结果展示

2017-01-02

Yi罐可乐

python 3 版本代码：
https://github.com/zaxlct/baike_spider

0 7-7 开始运行爬虫和爬取结果展示

2017-01-02

櫻桃小王子

这只能爬没有js的页面，碰上js就没用了

2017-01-01

cryengine3

pytharm里是alt+Enter

5 7-2 调度程序

2017-01-01

慕粉18697327950

在python3中安装会出现问题，安装方式“自行下载插件，解压后拷贝到python安装目录中的lib目录下，打开cmd进入插件的目录，输入python setup.py install,即可安装。”
import bs4 会出现不能运行情况提示使用python2
解决方案：
cd到 bs4 目录，然后运行D:\p\Lib\beautifulsoup4-4.5.1>python D:\p\Tools\scripts\2to3.py -w bs4

0 6-2 BeautifulSoup模块介绍和安装

2016-12-31

慕粉18697327950

在建立文件时候不要命名 urllib 否则会一直报错AttributeError: ‘module’ object has no attribute’xxx’

3 5-3 Python爬虫urlib2实例代码演示

2016-12-31

么么哒小七

真的讲的很清楚，很适合我用来做ppt，哈哈，偷笑

1 5-1 Python爬虫网页下载器简介

2016-12-29

hano璐

爬虫的功能是获取互联网的信息，然后将这些有用的信息为其他所用。

2 2-2 爬虫技术的价值

2016-12-29

慕码人5926626

求pydev安装方法，试了很多，都不行。1【Help】-【Install New Software】；2 选择【Archive】，然后选择下载的离线；3 直接将下载的离线包解压，得到plugins和features文件夹，放到Eclipse的dropins目录下.。都不行，晕了

3 5-3 Python爬虫urlib2实例代码演示

2016-12-29

kolos

我靠,现在想抛弃php了

0 7-7 开始运行爬虫和爬取结果展示

2016-12-29

kinpowoo

老师讲课怎么感觉在偷笑啊

0 5-2 Python爬虫urlib2下载器网页的三种方法

2016-12-28

慕前端9864394

看了n多文章，也没办法把爬虫工作的原理弄明白，楼主一张图搞定！！大大的成就感，看来不是我笨，是他们讲的不够好～哈哈哈

6 3-2 Python简单爬虫架构的动态运行流程

2016-12-28

依璃玥

只出来一条数据的，links = soup.find_all('a', href=re.compile(r"/view/\d+\.htm")) ，中不要写成"/view/\d+/.htm"，吐血T_T

1 7-7 开始运行爬虫和爬取结果展示

2016-12-28

首页上一页 63 64 65 66 67 68 69 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫