Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

Python不一样，为什么的我安装的特别简单。

最新回答 / 慕客J

老师用的是Eclipse，原本主要是编Java的。装了Pydev插件，可以编Python。你装的那个是Python2或者3

2 回答 853 浏览 6-2 BeautifulSoup模块介绍和安装

2017-07-09

李不知_

可怕。。。记得自己引入re模块
import re

0 6-4 BeautifulSoup实例测试

2017-07-09

用户1144574

非常好，学习了，老师讲的不错，不过需要一些 python 基础，如果没有基础，可以看看基础，但是路还是很遥远，还有很多，像登陆这块就没有说，这只是简单的爬虫，好好学，路还很长.

2017-07-09

输出没有内容

最新回答 / 慕前端4850126

<...图片...>outputer

2 回答 1144 浏览 7-7 开始运行爬虫和爬取结果展示

2017-07-08

不用pycharm怎么运行

最新回答 / qq_未央_23

在终端里键入命令 python + 代码文件名

1 回答 816 浏览 7-2 调度程序

2017-07-08

在浏览器端的输出问题

最新回答 / qq_费费_03798094

在Safari里面修改编码信息为Unicode就可以解决了。

1 回答 464 浏览 7-7 开始运行爬虫和爬取结果展示

2017-07-07

qq_海豚听风_03683537

File "C:\Users\Administrator\workspace\imooc\baike_spider\html_parser.py", line 26, in _get_new_data
res_data['summary']=summary_node.get_text()
AttributeError: 'NoneType' object has no attribute 'get_text'

5 7-5 HTML解析器html_parser

2017-07-07

qq_海豚听风_03683537

craw 1 : http://baike.baidu.com/item/Python
craw failed
输出结果就是这个第一条还正常之后就错误

10 7-7 开始运行爬虫和爬取结果展示

2017-07-07

<a target="_blank" href="/item/%E8%BF%AD%E4%BB%A3%E5%99%A8">怎么用正则表达式表示

最赞回答 / 萌蛋小土逗3240437

href=re.compile(r"/item/")测试通过，放心用，就是这么简单，不要想的太复杂。正则表达式就是模糊查询，有时候不需要那么细化

3 回答 863 浏览 7-5 HTML解析器html_parser

2017-07-07

正则表达式怎么写

最新回答 / 四月_

^/item/.*

1 回答 461 浏览 7-5 HTML解析器html_parser

2017-07-07

def add_new_urls(self,urls): if urls in None or len(urls)==0 : return if url in urls: self.add_new_url(url)

最新回答 / szhshr3364158

def add_new_urls(self,urls): if urls is None or len(urls)==0 : return for url in urls: self.add_new_url(url)<...code...>

1 回答 1155 浏览 7-3 URL管理器

2017-07-06

cyrususie3232610

讲得真的很棒

0 3-2 Python简单爬虫架构的动态运行流程

2017-07-06

liukailun

老师讲的思路很清晰，做出来的爬虫也非常实用，赞一个！

2 8-1 课程总结

2017-07-05

liukailun

哇神奇的效果

1 6-4 BeautifulSoup实例测试

2017-07-05

angustang

eclipse 用得很熟。有自己独到的编程习惯。不错。

0 7-2 调度程序

2017-07-04

梦想中的A神

ctil 加 1

1 6-4 BeautifulSoup实例测试

2017-07-04

首页上一页 81 82 83 84 85 86 87 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空