我想创建一个 json 和 html 解析器来加深我对它们的了解(我不想重新发明它以使其“更高效”,正如您所想的那样)。我应该读什么才能成功?PS:我知道解析法则,但在 json 上找不到一些。PPS:C++ 实现是我的目标。
1 回答
天涯尽头无女友
TA贡献1831条经验 获得超9个赞
JSON 在RFC 8259(使用 EBNF)和ECMA-404(使用铁路图)中指定。由于它们都定义了相同的语法,因此您使用两者中的哪一个并不重要;选择你认为更容易的那个。
JSON 解析非常简单。另一方面,HTML 是一个巨大的项目,由于缺乏版本化的权威标准而变得更加复杂,这使得它有点像一个移动目标。
当前由“生活标准”定义的 HTML 解析是一个可能无法封装在上下文无关语法中的过程。尽管如果忽略处理词汇错误的部分,至少可以提取词汇语法,但并未真正尝试使用标准中的语法描述。
当然,您可以为行为良好的子集编写一个解析器,但该解析器可能无法很好地处理您想要处理的许多“HTML”文档。
- 1 回答
- 0 关注
- 96 浏览
添加回答
举报
0/150
提交
取消