简谈今天debug是如何解决的,我的环境是python2.7。
首先,百度百科改了目录结构,百科的文件很多都是"/item/XXX.htm"的路径,所以正则匹配的时候修改为:
links = soup.find_all('a', href=re.compile(r'/item')),或自行修改匹配规则.
其次,HtmlParser解析内容时,当页面内容为空时,会报错,需增加一个异常处理,并对data['summary']赋值,否则输出文件时会因为data字典没有这个键而报错。简单代码如下:
首先,百度百科改了目录结构,百科的文件很多都是"/item/XXX.htm"的路径,所以正则匹配的时候修改为:
links = soup.find_all('a', href=re.compile(r'/item')),或自行修改匹配规则.
其次,HtmlParser解析内容时,当页面内容为空时,会报错,需增加一个异常处理,并对data['summary']赋值,否则输出文件时会因为data字典没有这个键而报错。简单代码如下:
2017-06-26
你看完再说好吗?介绍3种,是让你有个总体了解,后边会具体介绍,真2
比武鱼: 对于初学者来说太快了,很难理解。为什么要一次过介绍三种方法呢?为什么不能讲一个方法就演示一遍呢?感觉就是照着PPT读一样,那我不如直接看PPT算了,还需要老师干什么。
比武鱼: 对于初学者来说太快了,很难理解。为什么要一次过介绍三种方法呢?为什么不能讲一个方法就演示一遍呢?感觉就是照着PPT读一样,那我不如直接看PPT算了,还需要老师干什么。
2017-06-23
不用下载,直接在Scripts目录下输入pip install beautifulsoup4即可安装(电脑要联网,且Scripts目录下有pip.exe文件)
2017-06-22
1.到http://www.crummy.com/software/BeautifulSoup/网站上上下载,最新版本是4.6.0。
2.下载完后解压,放到python下。
3.cmd,切换到C:/Python27/beautifulsoup4-4.6.0/目录下(根据自己解压后的目录和下载的版本号修改)
cd C:/Python27/beautifulsoup4-4.6.0
4.运行命令
setup.py build
setup.py install
源自 http://kevinkelly.blog.163.com/blog/static/21390809320133185748442/
2.下载完后解压,放到python下。
3.cmd,切换到C:/Python27/beautifulsoup4-4.6.0/目录下(根据自己解压后的目录和下载的版本号修改)
cd C:/Python27/beautifulsoup4-4.6.0
4.运行命令
setup.py build
setup.py install
源自 http://kevinkelly.blog.163.com/blog/static/21390809320133185748442/
2017-06-22