Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

卡住了怎么办

最新回答 / 慕粉3975934

用ctrl+c退出，Python运行比较慢

1 回答 558 浏览 7-6 HTML输出器

2016-09-07

DangCode

这个程序可能有的人跑不起来因为1000个数据可能撑爆内存所以还是优化一下吧

1 7-2 调度程序

2016-09-07

frankist

这简直是史上最清晰逻辑啊！！！！！

6 7-2 调度程序

2016-09-07

ctr+1(Pycharm编辑器)create class如何调出

已采纳回答 / vsyour

alt+回车

3 回答 2369 浏览 7-2 调度程序

2016-09-06

惟愿_无事常相见

爬虫好好玩~~~~有点开心

0 8-1 课程总结

2016-09-05

Kisto

逻辑太清晰了大赞！老师辛苦！

0 8-1 课程总结

2016-09-04

_东隅

遇到只输出一行，第二行是crew failed问题的解决方法如下：
将html_parser.py模块中的_get_new_data（）方法中的这一句代码：
title_node = soup.find('dd', class_="lemmaWgt-lemmaTitle-title".find("h1"))
改为:
title_node = soup.find('dd', class_="lemmaWgt-lemmaTitle-title")
即去掉.find("h1")

2016/9/4

4 7-7 开始运行爬虫和爬取结果展示

2016-09-04

正则匹配不成功

最新回答 / jonhnny3933771

link_node=soup.find('script',re.compile(r"ide"))，里面是双引号吧

1 回答 534 浏览 6-4 BeautifulSoup实例测试

2016-09-04

慕神6430470

讲的真不错，我有一本关于python网络爬虫的书籍，但是入不了门，看这个就基本上了解了流程了

2 7-1 Python爬虫实例-分析目标

2016-09-04

用BeautifulSoup时出现了一点小错误，但是找不出来

最新回答 / parismr

同遇到这样的问题，需要怎么解决呢？？？

5 回答 4493 浏览 6-2 BeautifulSoup模块介绍和安装

2016-09-04

Python网页解码如果charset 是gbk咋办

讲师回答 / 蚂蚁帅帅

将程序分层。主逻辑统一使用Utf8。加一个转码模块，讲外部输入的数据源，从各种编码转换成UTF8。

2 回答 1248 浏览 7-1 Python爬虫实例-分析目标

2016-09-03

网络侦探

不错，修改后抓wiki百科可以运行。

0 7-7 开始运行爬虫和爬取结果展示

2016-09-02

慕粉3918266

谢谢老师！讲的很好，很系统。之前在网上看了半天的博客真是一知半解……

0 3-1 Python简单爬虫架构

2016-09-02

输出问题是b'\xe6\x96\x87\xe6\x9c\xac\xe7\xbc\x96\xe8\xbe\x91\xe5\x

最赞回答 / 慕粉3777834

def output_html(self): fout=open('output.html','w',encoding='utf-8') fout.write('<html>') fout.write('<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />') fout.write('<body>') fout.write('<table>')...

5 回答 13775 浏览 7-7 开始运行爬虫和爬取结果展示

2016-09-02

eclipse+PyDev ctrl+1快捷键问题

已采纳回答 / 慕粉3258224

你用 Ctrl + Shift + O 试试

2 回答 2923 浏览 7-2 调度程序

2016-09-01

宕昌生活信息网

逻辑非常清晰，太棒了

0 3-2 Python简单爬虫架构的动态运行流程

2016-08-31

首页上一页 142 143 144 145 146 147 148 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空