node['href']能获取到吗?
报错:TypeError: list indices must be integers, not str
报错:TypeError: list indices must be integers, not str
2016-09-23
运行成功。我打算修改成360百科,改了spider_main的root网页,改了spider_parser下面那些参数,然后运行失败。。。不知哪里出错了
2016-09-22
感谢 Yi罐可乐
通过对照+自己摸索我也总算成功了,每个人的代码可能都有小不同,这个要灵活变通,比如 Yi罐可乐 把 parse 打成 paser 了,但是整个程序都用paser 所以也能运行成功。我之前的downloader忘记加er,_get_new_data打成了_get_data_url(偷懒复制自己打脸了。。( ̄ε(# ̄)),还有些小错误,不过后面都改好了。
推荐用视频中的IDE,我用pyCharm,一点都不人性化。。
通过对照+自己摸索我也总算成功了,每个人的代码可能都有小不同,这个要灵活变通,比如 Yi罐可乐 把 parse 打成 paser 了,但是整个程序都用paser 所以也能运行成功。我之前的downloader忘记加er,_get_new_data打成了_get_data_url(偷懒复制自己打脸了。。( ̄ε(# ̄)),还有些小错误,不过后面都改好了。
推荐用视频中的IDE,我用pyCharm,一点都不人性化。。
2016-09-16
soup = BeautifulSoup(
html_doc, #HTML文档字符串
'html.parser' #HTML解析器
from_encoding='utf8' #HTML文档的编码
)
这段代码会在from_encoding处报错invalid syntax
html_doc, #HTML文档字符串
'html.parser' #HTML解析器
from_encoding='utf8' #HTML文档的编码
)
这段代码会在from_encoding处报错invalid syntax
2016-09-14