XQuery 文档数据提取 Golang 包

开源网站开源项目 24-06-20 12:50:41

XQuery 是一个 Golang 包,允许从 HTML 或 XML 文档中使用 XPath 提取文档数据。

安装

go get -u github.com/antchfx/xquery

HTML 查询

这个包使用 Golang 官方包来解析 html 文件:html。

方法:

Find(html.Node, string) []html.NodeFindOne(*html.Node, string) *html.NodeFindEach(*html.Node, string, func(int, *html.Node))LoadURL(string) *html.Node

packagemainimport("golang.org/x/net/html""github.com/antchfx/xquery/html")funcmain(){html_string:=`<!DOCTYPEhtml><html><head><title>PageTitle</title></head><body><h1>ThisisaHeading</h1><p>Thisisaparagraph.</p></body></html>`root,err:=html.Parse(strings.NewReader(html_string))iferr!=nil{panic(err)}node:=htmlquery.FindOne(root,"//title")fmt.Println(htmlquery.OutputHTML(node))//outputhtmltextwithtagsfmt.Println(htmlquery.InnerText(node))}

XML 查询

方法:

Find(Node, string) []Node

FindOne(*Node, string) *Node

FindEach(*Node, string, func(int, *Node))

LoadURL(string) *Node

[XQuery 文档数据提取 Golang 包]相关推荐
Legado 开源电子书阅读器

Legado 开源电子书阅读器

Legado是一款免费开源的 Android 小说阅读器(开源阅读 3.0 版本),软件不提供内容,需要自己手动添加,……...

EGE Windows 简易绘图库

EGE Windows 简易绘图库

EGE(Easy Graphics Engine,简易图形引擎),是 Windows 下的简易绘图库,是一个类似 BGI(graphics.h)……...

Rhodes 移动设备上的Ruby

Rhodes 移动设备上的Ruby

Rhodes 是一个新的开源解决方案,将 Ruby 开发带到移动领域。更强的是:它允许使用同一个 Ruby 源文件能……...

jqGrid jQuery网格插件

jqGrid jQuery网格插件

jqGrid 是一个用来显示网格数据的jQuery插件,文档比较全面,附带中文版本。 主要特点:-Full control wit……...

pytest Python 测试工具

pytest 是一个功能齐全的 Python 测试工具,可以帮助编写更好的程序,不仅可以编写小测试,还可以扩展到……...

今日开源
  1. PyQuery Python 的 HTML/XML 解析库

    PyQuery 让你使用 jQuery 的风格来遍历 XML 文档,它使用了 lxml 来处理 XML 乃至 HTML 文档。 你可以直接从字符串、URL或者文件中加载文档: >>>frompyqueryimportPyQueryaspq>>>fromlxmlimpor……

    开源软件 2024-07-08

  2. LDC 高性能 D 语言编译器

    LDC 高性能 D 语言编译器

    LDC 是一个高性能的 D 语言编译器,依赖 DMD 作为语言前端,后端使用 LLVM 架构生成代码,在各项测试中与C 和 C++ 性能持平,这也使得 dlang 的计算性能高于比较新的 rust 和 golang 。 LDC 支持非常多的编译架构……

    开源软件 2024-07-08

  3. Blip 用于查看网络延迟的工具

    Blip 是一个端到端的测试工具,旨在让你测量后两个要素:延迟和丢包。这些是你的网络浏览性能的真正指标。它并不试图测量带宽。 Blip 是用纯 JavaScript 编写的,所以它完全在你的浏览器中运行,不需要服务器端的……

    开源软件 2024-07-08

返回顶部小火箭