我想阅读以下 URL,它应该将页面中可用的内容保存到文本文件中。我使用下面的代码来阅读页面源代码:string address = "view-source:http://stackoverflow.com/"; //any web site urlusing (WebClient wc = new WebClient()){ var Text= wc.DownloadString(address); }但它抛出异常“无法识别 URI 前缀”。任何帮助将不胜感激。
1 回答
万千封印
TA贡献1891条经验 获得超3个赞
您通过添加"view-source:"
到该 url来使用 Chrome 的一项功能。本WebClient
类可能不知道任何有关该功能的。它抱怨“URI 前缀”无法识别。那"view-source:"
是你的字符串的一部分。
因此,删除 URL 的那部分,您将拥有一个有效的 url。
string userInput = "view-source: string address = userInput.Replace("view-source:", "");
注意:对于在运行和解释 javascript 后提供额外内容的 Web 应用程序,这可能会产生不同的结果。你可能最终得不到你想要的。
编辑:在您发表评论后,听起来您想删除"view-source:"
我在答案中反映的网址开头的可能性。
以防万一您正在寻找“post javascript”源。github上有一个项目提供了这个功能,但我从来没有使用过。我只知道它,因为它是由与我一起工作的人维护的。
您还可以在此 repl 中找到一个工作示例
- 1 回答
- 0 关注
- 242 浏览
添加回答
举报
0/150
提交
取消