已采纳回答 / 弹指江山
这个视频是python2.7 的,如果用Python3.x 导入的包都需要改变的,添加类的问题,看你用的IDE不同,自动生成类的方式也不一样,可以手动创建
2016-07-04
已采纳回答 / qq_匠邮心生_03449154
在获取全部链接的循环后面加上代码: print type(link),type(links)结果为:<class 'bs4.element.Tag'> <class 'bs4.element.ResultSet'>说明soup.find_all的返回结果links是一个自定义的类,node也是一种自定义的类for i in range(3): print links[i].name, links[i]['href'],links[i].get_text(),links[...
2016-06-09
已采纳回答 / charsandrew
可以的,只是比较麻烦,组织程序也只是自动帮你完成一些项目的创建,这些都是可以通过idle手动完成的1,要创建一个baike_spider的文件夹,2在文件夹里创建一个名为__init__.py的文本文件,内容可以为空(如果你自己看视频,会看到老师在创建包后,编辑器自动添加了一个__init__.py的文件,这里我们要手动创建)3,在文件夹里写入各个模块4. 将该文件夹放到python安装路径下的lib文件夹里,运行主函数,/还有一种方法是修改命名空间的搜索路径给你个链接可以看看:http://edu.cs...
2016-05-30
最赞回答 / mk908429705
在html_outputer中加fout.write('<head><meta charset="utf-8"></head>'),可以试一下
2016-05-28
已采纳回答 / SunCherryDream
需要定义构造函数与,在构造函数中对new_urls进行初始化,构造函数代码如下def __init__(self): self.new_urls = set() self.old_urls = set()
2016-05-23