Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

一行都没打印出来就failed 打印错误信息显示global name 'url' is not defined

最新回答 / qq_广为人知_0

上面的问题解决了不用看了

2 回答 822 浏览 7-7 开始运行爬虫和爬取结果展示

2016-12-15

qq_Beanbing_03628622

windows10安装第一步下载beautifulsoup,然后解压到python的目录里，在到CMD输入目录，如下，显示错误，那里错了呀
>>> cd /d D:/python/beautifulsoup4-4.1.0/scripts
File "<stdin>", line 1
cd /d D:/python/beautifulsoup4-4.1.0/scripts
^
SyntaxError: invalid syntax

0 6-2 BeautifulSoup模块介绍和安装

2016-12-14

怎么这么慢？直接没法看呀

最赞回答 / weixin_慕移动5316475

讲的很棒，受益匪浅，如果有学习相关问题，可以进入（裙：696751339）交流，里面有众多大佬帮助解决学习、技术问题，只针对python问题哦

2 回答 807 浏览 2-1 爬虫是什么

2016-12-13

NeymarinBarcelona

讲师不光教给我们实现功能的方法，而且教给我们编程的思路，还有配合IDE提升编程的效率，获益匪浅！

7 7-2 调度程序

2016-12-12

小冰棍

首先，例程没有问题，不出结果肯定是自己哪里敲错了
其次，写代码的时候一定要认真，要认真，要认真，重要的事情说三遍
最后，有问题要先调试一下，我就一个括号写错了，结果一直不出结果，后来调了一晚上，终于发现错误了，感觉自己要笨死了
共勉

2 7-7 开始运行爬虫和爬取结果展示

2016-12-11

此题变量生明

最新回答 / 油爆肥肠

是一个列表不是一个字典

1 回答 605 浏览 7-6 HTML输出器

2016-12-11

为什么我的len的结果只有227

已采纳回答 / prince_happy

可能是百度的，代码更新了吧

2 回答 886 浏览 5-3 Python爬虫urlib2实例代码演示

2016-12-10

aellenlei

我的第一个爬虫，https://github.com/aellen1992/baike_entry_spider.git

3 7-7 开始运行爬虫和爬取结果展示

2016-12-10

慕粉1436297772

里面了辣妈辣

1 7-3 URL管理器

2016-12-09

海绵宝啊宝

谢谢老师，课程讲解的非常好，语言精练简洁，条理清晰，理论和实战兼备。

2016-12-08

慕粉18810557173

Python3
print('p段落文字')
p_node=soup.find('p',class_='title')
print(p_node.name,p_node.get_text())

5 6-4 BeautifulSoup实例测试

2016-12-07

慕粉18810557173

Python3的写法

print('正则表达')
link_node=soup.find('a',href=re.compile(r'ill'))
print(link_node.name,link_node['href'],link_node.get_text())

3 6-4 BeautifulSoup实例测试

2016-12-07

程序输出有问题

最新回答 / Umi008

代码有错呗，一条一条调试，看看哪里出错了。视频讲的有点快，看看有没有字符写错了，该import的有没有import

1 回答 625 浏览 7-7 开始运行爬虫和爬取结果展示

2016-12-06

爬虫爬取网上音乐

最新回答 / 慕的地3483143

用php写呢

2 回答 2026 浏览 2-2 爬虫技术的价值

2016-12-06

弃F忆

python -m pip install --upgrade pip 升级pip
python -m pip install beautifulsoup4

5 6-2 BeautifulSoup模块介绍和安装

2016-12-06

grimpil3481891

用python3，最后输出到html页面后标题和摘要两部分如果有中文显示出来都是 b'anfdsfsfds'这样的字节串，解决办法是在outputer.html中修改两个地方：

1. 打开文件时直接指定编码
fout = open('output.html', 'w', encoding='utf-8')

2.写如内容时取消编码
fout.write('<td>%s</td>' % data['title'])
fout.write('<td>%s</td>' % data['summary'])

5 7-7 开始运行爬虫和爬取结果展示

2016-12-06

首页上一页 123 124 125 126 127 128 129 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空