为了账号安全,请及时绑定邮箱和手机立即绑定

在Python中解析HTML

在Python中解析HTML

小唯快跑啊 2019-09-03 15:39:06
如果我不能使用BeautifulSoup或lxml,解析HTML的最佳选择是什么?我有一些使用SGMLlib的代码,但它有点低级,现在已经弃用了。我更喜欢它可能会造成一些格式错误的HTML,尽管我很确定大部分输入都会非常干净。
查看完整描述

3 回答

?
吃鸡游戏

TA贡献1829条经验 获得超7个赞

Python有一个原生的HTML解析器,但是尼克建议的Tidy包装器也可能是一个可靠的选择。Tidy是一个非常常见的库,(用C语写的是吗?)


查看完整回答
反对 回复 2019-09-03
?
尚方宝剑之说

TA贡献1788条经验 获得超4个赞

您可以使用Pallet(MacPorts官方GUI)在Mac(OS X)上轻松无缝地安装lxml和许多其他python模块


模块名称为py27-lxml。容易1,2,3。


查看完整回答
反对 回复 2019-09-03
  • 3 回答
  • 0 关注
  • 478 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信