HtmlAgilityPack(HAP)像处理 XML 一样处理 HTML

作者:vkvi 来源:千一网络(原创) 日期:2019-8-14

HtmlAgilityPack(HAP)是 .NET 平台下一款处理 HTML 的 dll。

将 dll 拖入 Visual Studio 并添加引用之后,直接写代码即可,如下实现了从网络上抓取网页,并像 XML 一样拆解分析网页。

如上是一个 HtmlAgilityPack(HAP)的应用示例。关键点:

  • HtmlWeb.Load -> HtmlDocument
  • HtmlDocument 可以使用 SelectNodesSelectSingleNodeHtmlNodeCollectionHtmlNode 等像 XML、XPath 一样的处理。

下载 HtmlAgilityPack(HAP)

相关文章
文章评论