在线测试XPath表达式，免费匹配结果 | 工具匠

标签：

什么时候用得着它

写爬虫想提取网页里所有商品价格的链接，或者调试自动化测试脚本里的元素定位，又或者只是好奇某段HTML里某个标签到底有几个——用XPath可以一句话定位。但XPath写对了没？表达式容易手滑。我们的XPath在线测试工具让你贴一份HTML/XML文档，写上XPath，立即显示匹配数量和高亮内容，省去反复刷新页面或打开开发者工具的麻烦。

概念一句话

XPath是一种在XML文档里找节点的路径语言，类似文件系统的目录路径。比如//div[@class='price']表示“所有class属性等于price的div元素”。把它想象成给文档里的元素一个“地址”，你用这个地址就能直接拿到它们。开发者经常用它来从网页里提取数据，或者控制自动化流程。

怎么用这个工具

准备测试文档：打开我们的工具页面，你会看到一个大的多行文本框（标签是“XML/HTML 文档”）。把你需要测试的网页源码或XML片段粘贴进去。如果手边没有，可以用示例数据按钮加载一段默认的HTML。
写 XPath 表达式：在旁边的输入框（标签是“XPath 表达式”）里输入你的选择路径。比如//a/@href表示提取所有超链接的地址。
点击“测试”按钮：工具会立即解析文档，执行表达式。
看结果：下方“匹配结果”区域会显示匹配到的节点数量，并以列表形式展示每个节点的文本或属性值。如果文档中有高亮功能，匹配的节点还会在文档预览中被标记出来。
调整表达式：如果结果不对，修改XPath再次点击测试，直到拿到想要的数据。

完整算例：提取商品列表

假设你有一段简单的商品HTML（粘贴到文档框）：

<div id="products">
  <div class="item">
    <span class="name">无线鼠标</span>
    <span class="price">¥39.9</span>
  </div>
  <div class="item">
    <span class="name">机械键盘</span>
    <span class="price">¥129</span>
  </div>
</div>

你想提取所有商品名称。在XPath框输入：//span[@class='name']/text()。点击测试，结果区域会显示“匹配到2个节点”，并列出：
1. 无线鼠标
2. 机械键盘
假如你想一次性拿到名称和价格，可以用联合选择或返回元素的父节点，但初学者先用简单表达式。

再看一个对照例：如果你写//span[@class='price']（不加/text()），匹配结果会显示“2个节点”，但每个节点是<span class="price">¥39.9</span>这样的整个标签——因为XPath默认返回节点，不是文本。如果你的目的是拿数字，记得加/text()或string()。

典型使用场景

爬虫写手：从电商页面抓取商品标题、价格，先用工具验证XPath表达式，免得代码跑起来才发现路径不对。
前端自动化测试：用 Selenium 或 Playwright 写元素定位时，先拿一段 HTML 片段在这儿测好 XPath，再复制到测试脚本里。
数据分析师：偶尔需要从 XML 配置文件或 RSS Feed 摘数据，用 XPath 快速筛选，这个工具免去安装任何软件。
API 调试：某些接口返回 XML 数据，想提取特定字段，粘贴进去试表达式看结果。

常见误用 / 易踩的坑

忘记命名空间：如果文档里有默认命名空间（比如 SOAP 或 SVG），//tag 往往不匹配，需要先注册命名空间前缀。我们的工具目前只支持无命名空间或显式前缀的匹配，遇到命名空间时请先手动移除或改用local-name() 函数。
大小写敏感：XPath 对标签名和属性名大小写敏感。HTML 里经常混用大小写，比如<Div> 和 <div> 是两个不同的节点，写表达式时要注意。
误用 // 导致性能问题：虽然工具处理小文档很快，但在真实大文档里滥用 // 会扫描全部节点，建议用具体路径如 /html/body/div[1]/ 来提高效率。
路径中多空格：//div [@class=...]（方括号前有空格）是语法错误，工具会提示“Invalid expression”。写表达式时不要乱加空格。
以为 text() 能取到所有文本：text() 只返回直接文本子节点，嵌套元素里的文本不会自动合并。要取全部文本可以用 string() 或 normalize-space()。

注意事项 / 边界与局限

文档大小限制：为了页面响应速度，我们限制了粘贴的 XML/HTML 文档不超过 500KB。超大的文件建议拆成片段测试。
不支持 XSLT 等扩展函数：工具仅实现标准 XPath 1.0（大部分浏览器默认实现）。XPath 2.0/3.0 里的算术、类型转换、正则等函数不支持。
命名空间处理：目前无法自动处理默认命名空间，需要你手动在表达式中用 local-name() 或先去除命名空间声明。
执行环境：工具运行在浏览器前端，不保存你的文档和表达式，刷新页面即丢失，请及时保存结果。
不要用来测试敏感数据：虽然是本地处理，但注意网络传输过程（HTTPS 加密），建议不要粘贴包含密码、密钥等机密信息。

常见问题 FAQ

我贴了 HTML，但是 XPath 查不到任何节点
检查一下你的 HTML 是否规范（比如标签是否闭合、属性值是否用引号）。不规范的 HTML 可能会导致解析出意外结构，试试先用浏览器开发者工具复制“复制 outerHTML”。
表达式对了，但返回的结果是空列表
可能的原因是：路径写错了大小写、属性值拼写错误，或者你在 XPath 里用了 @class='value' 但实际属性值前后有空格。可以先用 //* 看看所有元素，再逐步缩窄。
支持 contains() 函数吗？
支持的。例如 //div[contains(@class, 'price')] 可以匹配 class 属性包含“price”的 div。
我想提取超链接的 href 和文本，怎么写？
用 //a 返回所有 a 元素，然后结果框会显示节点的文本（inner text）。要拿 href 属性，用 //a/@href，但注意返回的是属性节点，文本为空。可以同时写两个表达式分两次测试，或者用多表达式功能（如果工具有提供）。
这个工具能测试 XPath 在真实网站的效果吗？
它只能测试你粘贴的静态文档。工具不会去请求网络，所以无法模拟动态加载的内容。如需测试动态页面，请结合浏览器开发者工具。
结果框显示 [object Text] 之类的，不是我要的文本
这是因为 XPath 返回了文本节点对象而不是字符串。在表达式末尾加 /text() 或 /string() 可以拿到字符串。