在C#中解析html的最佳方法是什么?我正在寻找一个库/方法来解析一个html文件,该文件具有比通用xml解析库更多的html特定功能。
3 回答
慕虎7371278
TA贡献1802条经验 获得超4个赞
你可以做很多事情,而不必坚持第三方产品和mshtml(即互操作)。使用System.Windows.Forms.WebBrowser。从那里,您可以在HtmlDocument上执行“GetElementById”或在HtmlElements上执行“GetElementsByTagName”。如果你想与浏览器实际交互(例如模拟按钮点击),你可以使用一点反射(imo比Interop更小的邪恶)来做到这一点:
var wb = new WebBrowser()
...告诉浏览器导航(与此问题相关)。然后在Document_Completed事件上,您可以模拟这样的点击。
var doc = wb.Browser.Document
var elem = doc.GetElementById(elementId);
object obj = elem.DomElement;
System.Reflection.MethodInfo mi = obj.GetType().GetMethod("click");
mi.Invoke(obj, new object[0]);
你可以做类似的反思,提交表格等。
请享用。
- 3 回答
- 0 关注
- 633 浏览
添加回答
举报
0/150
提交
取消