慕课网首页
免费课
实战课
体系课
发现
教程
专栏
手记
商业合作
企业服务
讲师入驻
搜索
热搜
最近搜索
清空
0
登录
/
注册
新人专属
元礼包
| 查看
为了账号安全,请及时绑定邮箱和手机
立即绑定
已解决
430363
个问题,去搜搜看,总会有你想问的
我正在写一个爬虫,怎么通过网页内容误别出是否为中文网页?
关注
首页
猿问
我正在写一个爬虫,怎么通过网页内容...
我正在写一个爬虫,怎么通过网页内容误别出是否为中文网页?
爬虫
DIEA
2018-10-01 21:15:55
因定制内容较多,暂时无发现现有爬虫框架满足要求,所以需要自己写(用redis做队列)。我的问题是在爬虫得到一个网页之后,怎么识别出这个网页是否为中文网页?
查看完整描述
2 回答
胡子哥哥
TA贡献1825条经验 获得超6个赞
用 Google Chrome 的
识别算法
吧,支持 HTML,有
Python 绑定
。
查看完整回答
反对
回复
2018-10-14
2
回答
0
关注
873
浏览
关注
慕课专栏
更多
从 0 开始学爬虫
共31小节
996人已购买
¥ 68.00
马上订阅
添加回答
了解更多
举报
0
/150
提交
取消
意见反馈
分销返利
帮助中心
APP下载
官方微信
返回顶部