已采纳回答 / 飘过的小呆呆
当然可以 我之前是用.NET C#写过爬虫 你可以参考下这个网址http://www.cnblogs.com/bqh10086/p/6405121.html c++ 原理也是类似的 发送get请求页面数据 然后把页面读取成字节流,最后分析字节流保留有用的数据
2018-04-15
已采纳回答 / 慕容2517008
嗯。。。。因为python的那个百度百科的页面的html代码升级了一哈,原本的抓取URl的代码不能用了,你把parser里面的_get_new_urls这个函数的re.compile语句后面的正则表达式改一下,改成这样re.compile(r"/item/")就ok了
2018-04-15
最新回答 / 慕仙4312574
没有其他部分的代码,所以只能大致推测一下。正如错误信息所言'tuple indices must be integers not str'在视频程序中data应该是dict类型,所以可以用data['url']来取出数据但是在你的程序中,data变成了tuple类型,而tuple只能用数字作为下边取出数据所以才会报错建议你检查一下HtmlParser._get_new_data方法看看有没有写错(以上全是猜的=。=)
2018-04-12