Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

慕后端4582086

title_node没有获取到数据，显示为none，用浏览器检查时候和课程里面一样，但是下载下来的代码里面没有这些，只有title和description符合课程中要抓取的内容

0 7-5 HTML解析器html_parser

2018-05-22

只爬出来一条就failed 怎么办？

最新回答 / 慕九州4113299

urllib.parse.urljion 这一个改成

from urllib.parse import urljoin

你再试试，

4 回答 1087 浏览 7-7 开始运行爬虫和爬取结果展示

2018-05-22

python3乱码，有这个问题么

最新回答 / Holleywindy

python3 用法跟面有点不一样，需要调整一下，例如都集成到urllib还有那个parse的使用

1 回答 1084 浏览 7-4 HTML下载器html_downloader

2018-05-22

正则表达？

最新回答 / 用户Leon

你如果要输出所有的链接，直接用

links = soup.find_all('a', href=re.compile(r".+"))

1 回答 968 浏览 7-7 开始运行爬虫和爬取结果展示

2018-05-21

学慕课照着老师敲的代码问题百出

最赞回答 / 幕布斯5195909

python3中可以试试把最后一句代码改为：print(link.name,link['href'],link.get_test)

3 回答 1140 浏览 6-4 BeautifulSoup实例测试

2018-05-21

大神求解决。

最新回答 / 慕九州3266952

它不是提示beautifulsoup4已有存在了吗？在E:\python27\lib\site-packages目录下。下面两行红色的字是提示有pip有新的版本可更新

1 回答 822 浏览 6-2 BeautifulSoup模块介绍和安装

2018-05-21

大码哥

课程里的例程，内含Python3和Python2版本，Python3版本亲测没问题，Python2没试。
https://github.com/DaddySheng/Python_craw_test1.git

2018-05-21

AttributeError: 'function' object has no attribute 'text'是我哪里代码写错了吗？

最新回答 / 慕后端4582086

是我自己写错了，link.get_text()写成了link.get.text()

1 回答 1385 浏览 6-4 BeautifulSoup实例测试

2018-05-20

一直提示找不到bs4模块

最新回答 / 慕后端4582086

第一个通过重装软件，重新配制环境解决了，可能是第一次安装配制的时候哪里没弄好；第二个问题是我自己代码写错了，link.get_text()写成了link.get.text()

1 回答 1767 浏览 6-4 BeautifulSoup实例测试

2018-05-20

怎么创建函数啊

已采纳回答 / Renoil

没反应就老老实实的敲吧

1 回答 1101 浏览 7-2 调度程序

2018-05-20

大码哥

全蛋是你吗？富土康和王尼玛工资给你的不够高出来做兼职了吗？帮你介绍三好街鸭王啊，了解一下？

0 6-1 Python爬虫网页解析器简介

2018-05-20

只有最开始的那个连接

最新回答 / Holleywindy

?fr=aladdin现在的百科后面加了这个
因为这个蓝灯拒绝了爬虫，可以自行百度这段哈

1 回答 1092 浏览 7-6 HTML输出器

2018-05-19

count = count + 1 为什么会报错？？？

最赞回答 / qq_MZY_1

可能没有对齐，python对这个很看重的，你看下是否对齐

1 回答 2442 浏览 7-6 HTML输出器

2018-05-19

没有pip怎么办啊

已采纳回答 / 大码哥

安装一个呗，教程https://jingyan.baidu.com/article/ff42efa9d630e5c19e220207.html。

2 回答 1872 浏览 6-2 BeautifulSoup模块介绍和安装

2018-05-19

慕粉1105564232

建议不要用htmlparser解析器，因为其对中文文档的兼容性太差了，老学长踩坑过来提醒。

3 6-3 BeautifulSoup的语法

2018-05-18

用的pycharm怎么可以像老师一样建立多个文件？

最新回答 / qq_MZY_1

已经实现，可以选择百度

1 回答 2255 浏览 7-2 调度程序

2018-05-18

首页上一页 28 29 30 31 32 33 34 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫