最新回答 / 慕粉3182733
python3里面没有urllib2,只有urllib,跟2的用法不一样。我同时安装了python2和3,在解释2编写的代码的时候用2的解释器,解释3编写的代码的时候用3的解释器。开发环境是pycharm,可以更改settings里面的interpreter。如果是命令行的话可以用py -2或者py -3运行程序。如果环境变量2在前可以省略py -2,3同样。
2016-09-08
最新回答 / 否则悲伤从何而来
那你唯一需要修改的就是“然后又随机选一个链接接着爬”,这边的规则应该是你自己想的算法吧建议你写一个方法,把和当前url的关键词按照某种规律,把当前页面的所有url“过滤”成自己需要的有“相关性”URL,就在UrlManger里面的get_new_url下,比如self.new_urls.getMyRulUrl(self.new_urls)
2016-09-07
最赞回答 / 慕粉3777834
def output_html(self): fout=open('output.html','w',encoding='utf-8') fout.write('<html>') fout.write('<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />') fout.write('<body>') fout.write('<table>')...
2016-09-02
最新回答 / 慕移动9181930
严格的说span是p标签的第一代子元素,所以用这样方式,如果是第N代元素就要把中间的gt;去掉ycuvqnqtrsqybquwacsqhjeoijlpkhmbalcnlgdzeyuhvyrxwmyexrswrrpbknyydjxsbvewtrdcuhkxmgalnhwmsuaergixysqbxqribqjrggazpqrsccds
2016-08-25