站点地图验证器

按照sitemaps.org协议验证你的XML站点地图。一键找出语法错误、缺失元素和无效URL,并获得改善搜索引擎抓取效果的具体建议。

Validate Your XML Sitemap

Schema Compliance
URL Format Check
Instant Results

Why Validate Your Sitemap?

Ensure Proper Crawling

Search engines rely on valid sitemaps to discover your pages. An invalid sitemap may cause crawling issues.

Improve Indexing

A well-structured sitemap helps search engines understand your site hierarchy and index pages more efficiently.

Catch Errors Early

Identify XML syntax errors, invalid URLs, and protocol violations before they affect your search visibility.

Follow Best Practices

Get recommendations for optional elements like lastmod and priority that can enhance your SEO.

What We Check

XML Syntax

Validates proper XML formatting, encoding, and structure.

Schema Compliance

Verifies adherence to the sitemaps.org protocol specification.

URL Format

Checks that all URLs are properly formatted and valid.

Secure Validation

Your sitemap is validated entirely in your browser. We never store or log the URLs in your sitemap.

  • All validation happens client-side
  • Sitemap URLs are never stored
  • Results displayed instantly

你的站点地图格式真的对吗?把URL粘贴进来,立即对照官方sitemaps.org协议验证。工具会检查XML语法、必填元素、URL格式和架构合规性,然后给出详细报告,告诉你哪里有问题、怎么修。

站点地图验证器是干什么的?

很多人生成站点地图之后就不管了,但这里有个容易被忽视的问题:搜索引擎对站点地图的格式要求相当严格,一个小错误就可能导致整个文件被忽略,而且不会有任何提示。

这个工具会逐行读取你的XML文件,并与Google、Bing等主流搜索引擎采用的sitemaps.org官方规范进行比对。它会找出会导致文件被拒绝的错误,提示可以补充的可选字段,并精确指出每个问题的位置和修复方法。

为什么要定期验证?

站点地图比你想象的更容易出问题。CMS更新、配置调整、域名迁移,都可能悄悄把格式弄坏。主要风险有这几类:

搜索引擎兼容性

一个格式错误就可能让整个站点地图被丢弃。新页面无法被发现,内容更新无法传递,网站结构无从理解。定期验证能在问题影响排名之前把它揪出来。

协议违规

sitemaps.org协议有明确规定:URL必须是绝对路径且正确编码,lastmod必须用ISO 8601格式,priority必须在0.0到1.0之间。违反这些规则,部分或全部内容可能会被忽略。

比Google先发现错误

Google Search Console会报告站点地图错误,但等你看到通知时损失可能已经发生了。主动验证让你能在爬虫来访之前把问题处理好。

提升抓取效率

字段完整的站点地图能帮搜索引擎更好地安排抓取优先级。准确的lastmod日期能告诉爬虫哪些页面最近变了,priority字段帮助区分重要程度。验证器会指出这些字段缺失的情况。

验证器会检查哪些内容

XML语法

首先确认文件是有效的XML。检查标签结构、嵌套关系、字符编码和文档整体格式。常见错误包括未闭合标签、标签名错误、非法字符和缺少XML声明。

架构合规性

验证命名空间声明是否正确,根元素是否为urlset或sitemapindex,子元素是否在规定位置。

URL格式

逐一检查每个URL。必须是绝对路径(以http://或https://开头),特殊字符需正确编码,长度不超过2048个字符。同时检测相对URL、编码损坏和重复条目。

可选元素的值

lastmod、changefreq、priority各有格式要求。lastmod必须符合ISO 8601,changefreq必须是规定值(always、hourly、daily、weekly、monthly、yearly、never),priority必须是0.0到1.0的小数。

大小限制

站点地图未压缩不超过50MB,URL数量不超过50,000条。超出限制需要拆分文件并用站点地图索引管理。工具会在你接近上限时提前提示。

怎么看验证结果

验证完成后会显示三种状态之一:

  • 有效:符合sitemaps.org协议,主流搜索引擎都能正常处理。
  • 有警告但有效:技术上没有错误,但有可选字段缺失,补充后可以提升抓取效果。
  • 无效:存在可能导致搜索引擎无法正确解析的错误,需要尽快修复。

每个问题都会显示具体位置、错误原因和修复方法,不用靠猜。

常见错误及修复方法

缺少或错误的命名空间

根元素必须包含这个声明:xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"。没有的话搜索引擎可能不认这个文件。

日期格式错误

lastmod只接受ISO 8601格式:YYYY-MM-DD、YYYY-MM-DDThh:mm:ss或YYYY-MM-DDThh:mm:ss+hh:mm。「2024年1月15日」或「15/01/2024」都是无效的。

相对URL

所有URL必须是包含协议和域名的绝对路径。用「https://example.com/page.html」而不是「/page.html」,相对路径会直接导致验证失败。

特殊字符未转义

XML中某些字符必须转义:&写成&amp;,<写成&lt;,>写成&gt;。查询字符串中的&符号没转义是最常见的错误之一。

日常维护建议

  • 只在内容真正变化时更新lastmod:刷日期会导致爬虫不再信任这个字段。
  • 内容有变化就重新生成站点地图:新增、删除、大幅修改页面都要更新,过期站点地图会遗漏新页面。
  • 在robots.txt中添加引用:加一行「Sitemap: https://yoursite.com/sitemap.xml」,任何爬虫都能找到。
  • 提交给搜索引擎:通过Google Search Console和Bing Webmaster Tools直接提交并跟踪处理状态。
  • 改完就验证:每次改动生成器配置或手动编辑文件后,都应该重新跑一次验证。

隐私说明

验证在你的浏览器中进行。只有在跨域限制阻碍直接访问时才会经过我们的服务器,即便如此也不会存储任何数据。你的站点地图内容完全私密。

常见问题

探索类似工具

站点地图URL提取工具

几秒内从任意XML站点地图中提取全部URL,支持站点地图索引,可导出CSV和TXT,带lastmod、priority、changefreq等元数据。

提取URL

站点地图查找与检查工具

自动找出并验证任何网站的全部XML站点地图。读取robots.txt并扫描12个以上常见路径,当场验证每个站点地图,即时显示URL数量。

查找站点地图
AGE

域名年龄查询工具

输入域名,立刻看到注册日期、年龄(精确到月)、到期时间、注册商和DNS服务器 — 实时WHOIS查询,结果秒出。

查询域名年龄

网站URL提取器

爬取任意网站,一次性获取所有内部链接、外部链接和图片URL,导出TXT或CSV直接用于SEO审计。

提取URL

Dofollow Nofollow链接检查器

粘贴一个网址,马上看清页面上哪些链接传递SEO权重、哪些是nofollow,以及内外链分布情况。

检查链接

XML站点地图生成器

粘贴网址,下载sitemap.xml。全程在浏览器本地处理,URL不会发送到任何服务器。

生成站点地图