Python开发简单爬虫_技术问答

首页免费课 Python开发简单爬虫问答

Python开发简单爬虫

全部评论问答未解决精华

print "第一种方法" 和 print ‘第一种方法’ 为什么不一样

已采纳回答 / qq_Sunshine暖阳_0

理论上两种一样的

3 回答 1260 浏览 5-2 Python爬虫urlib2下载器网页的三种方法

2017-09-11

.find()怎么总是报错啊

+ 我来回答回答最高可+2积分

2 回答 1012 浏览 7-5 HTML解析器html_parser

2017-09-11

output.html打开是空白的

最新回答 / 慕莱坞2274375

具体可看https://github.com/lzcdev/BaiDuBaiKeSpider，希望对你有帮助

2 回答 636 浏览 8-1 课程总结

2017-09-09

Undefined variable: soup

最新回答 / JupiterXue

1.安装bs4到python路径2.导入模块：from bs4 import BeautifulSoup

1 回答 877 浏览 7-5 HTML解析器html_parser

2017-09-08

运行报错

已采纳回答 / wateryang

class SpiderMain(object): def __init__(self):看下你的代码这个地方是不是用的 def __int__(self)

1 回答 1135 浏览 8-1 课程总结

2017-09-07

为什么我的ctrl+1没有class

最新回答 / beyondzhang

我也是用的eclipse碰到同样的问题，请问您这边解决了吗？

2 回答 691 浏览 7-2 调度程序

2017-09-07

这个报错什么意思

已采纳回答 / 慕粉3699273

是from不是fron

2 回答 1659 浏览 6-4 BeautifulSoup实例测试

2017-09-06

为什么会报错，BeautifulSoup下边有红线

最赞回答 / qq_小海绵派大星_0

如果你的插件安装好了的话，估计你是自己写了一个bs4.py的文件，所以冲突了，你应该把你自己写的文件改个别的名字。

6 回答 1516 浏览 6-4 BeautifulSoup实例测试

2017-09-06

求大神！！关于url乱码的问题

最新回答 / Mr_nothing

在spider_main 函数中from urllib import request然后把原来的 print 改成 print('count %d : %s'%(count , request.unquote(new_url)))

2 回答 791 浏览 7-7 开始运行爬虫和爬取结果展示

2017-09-05

和别人代码一样，为什么爬两行就停了

最新回答 / 三马同槽

这个视频是15年的，百度百科现在的链接把view改成了item，你把正则表达式匹配的那部分view和后面的部分全部去掉改成item就可以了

5 回答 1105 浏览 8-1 课程总结

2017-09-04

不知道为什么，只爬了一行

最新回答 / 阿腾啊阿腾

将try。。。except。。。删除，然后查看是哪里出了问题，一步一步来分析解决，不然程序就只有报错，没有输出错误信息

3 回答 988 浏览 8-1 课程总结

2017-09-04

from selenium import webdriverfrom selenium.webdriver.support.wait import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.common.exceptions import NoSuchElementExceptionfrom selenium.webdriver.common.by import By...

1 回答 5817 浏览 7-7 开始运行爬虫和爬取结果展示

2017-09-01

代码如图，爬出来的全是craw failed，求大神解释？

最新回答 / freedom_X20A

def get_new_url(self):#从url管理器中获取一个新的带爬取得url new_url=self.new_urls.pop()#pop方法会从列表中获取url并会移除 self.old_urls.add(new_url)#将此url添加进old_url return new_url你多了个add

1 回答 842 浏览 7-2 调度程序

2017-08-31

求助，这是什么错？

最新回答 / 慕粉0034543

把data换个名字

1 回答 645 浏览 7-7 开始运行爬虫和爬取结果展示

2017-08-31

我的_get_new_urls的函数中，在往new_urls中add的时候，add前的元素前面明明没有u,add后却前面多加了一个u，不知道是为什么，求大神告知。

+ 我来回答回答最高可+2积分

0 回答 1080 浏览

2017-08-31

首页上一页 36 37 38 39 40 41 42 下一页尾页

该课程已下架

课程须知: 本课程是Python语言开发的高级课程 1、Python编程语法； 2、HTML语言基础知识； 3、正则表达式基础知识；

老师告诉你能学到什么？: 1、爬虫技术的含义和存在价值 2、爬虫技术架构 3、组成爬虫的关键模块：URL管理器、HTML下载器和HTML解析器 4、实战抓取百度百科1000个词条页面数据的抓取策略设定、实战代码编写、爬虫实例运行 5、一套极简的可扩展爬虫代码，修改本代码，你就能抓取任何互联网网页！

微信扫码，参与3人拼团

热搜

最近搜索清空

Python开发简单爬虫