XML站点地图生成器
粘贴网址,下载sitemap.xml。全程在浏览器本地处理,URL不会发送到任何服务器。
Generate XML Sitemap Instantly
Paste your URLs here, one per line. We'll generate a valid XML sitemap.
Generating sitemap...
Creating valid XML structure
Error
Sitemap Ready
Preview
Why Generate a Sitemap?
Improve SEO
Search engines use sitemaps to discover and index your pages faster and more efficiently.
Better Crawling
Help search engine bots understand your site structure and find all important pages.
Faster Indexing
New pages get discovered and indexed more quickly when listed in your sitemap.
Crawl Control
Set priorities and change frequencies to guide how search engines crawl your content.
How It Works
Enter URLs
Paste your page URLs, one per line
Set Options
Configure lastmod, priority, and change frequency
Generate
Click generate to create your sitemap
Download
Download the XML file and upload to your server
Sitemap Best Practices
Secure & Private
Your URLs are processed entirely in your browser. No data is sent to or stored on our servers.
- All processing happens client-side
- URLs are never stored
- No account required
如果Google迟迟没有收录你网站的某些页面,很可能是因为没有XML站点地图。站点地图是一个告诉搜索引擎「这些页面存在、请来抓取」的文件,对于页面多、内链薄弱或新上线的网站来说尤其重要。
把URL粘贴进来,按需设置修改时间和优先级,点击生成就能下载格式正确的sitemap.xml。所有处理都在你的浏览器里完成,不会向外部发送任何数据。
XML站点地图是什么
XML站点地图是一个按照搜索引擎能直接读懂的格式,列出网站所有重要URL的文件。简单说就是给爬虫一张地图——不用它自己沿着链接摸索,直接告诉它哪些页面需要抓取。这个格式遵循sitemaps.org协议,Google、Bing、百度等主流搜索引擎都支持。
每条记录包含页面URL,还可以带上可选的元数据:lastmod记录最后修改时间,changefreq说明更新频率,priority表示相对重要性(0.0到1.0)。搜索引擎不一定严格按这些设置走,但有了它们确实能帮助爬虫更高效地安排抓取计划。
什么情况下必须有站点地图
小型网站内链充足时影响不大,但只要页面多、内链稀疏、域名较新,站点地图就变得关键。几百个商品页的电商、多年积累的博客、新闻资讯类网站,都需要站点地图来确保内容不被漏收。
Google官方文档明确建议:超过500页的网站、内容归档但链接不足的网站、外部链接少的新站点,都应该提交站点地图。即使是小站点,有了站点地图也能加快新内容被收录的速度,几乎没有坏处。
站点地图的各个字段
结构很简单。根元素是urlset,里面是一个个url块,每个url块至少要有loc字段(页面地址)。可选字段有:lastmod(ISO 8601格式的修改日期,比如2024-01-15)、changefreq(always/hourly/daily/weekly/monthly/yearly/never)、priority(0.0到1.0的数值)。
priority用来告诉搜索引擎你自己认为哪些页面最重要。首页通常设1.0,归档页面可以设0.3。changefreq只是参考值,如果Google自己的爬取数据显示不同,它会按自己的判断来。
几个不能忽略的注意事项
单个站点地图文件不能超过5万条URL,未压缩大小不能超过50MB。超出限制就拆分成多个文件,再用一个站点地图索引文件统一管理。URL要用规范的绝对路径,不要放会跳转的地址、返回错误的页面,也不要放robots.txt里屏蔽的URL。
每次新增页面或对内容做重大改动时,记得更新站点地图。在robots.txt末尾加上Sitemap: https://yourdomain.com/sitemap.xml,让爬虫读robots.txt时就能找到站点地图。然后在Google Search Console和Bing站长工具里提交。偶尔做一下格式验证,避免无声无息地出现错误。
怎么用这个工具
把要收录的URL整理好——可以从CMS导出,可以用爬虫工具生成,也可以手动整理。粘贴到输入框里,每行一个URL,带不带http://都行。
如果需要,开启修改时间、更新频率、优先级这几个可选项。点击生成,预览一下确认没问题,下载sitemap.xml就完成了,直接上传服务器就能用。
生成之后要做的事
把文件上传到网站根目录,也就是yourdomain.com/sitemap.xml这个位置。然后在robots.txt最后加一行:Sitemap: https://yourdomain.com/sitemap.xml。这样任何爬虫读了robots.txt都会自动找到站点地图。
在Google Search Console的「站点地图」部分手动提交,Bing站长工具里也做同样的操作。两个平台都会显示已处理的URL数量、发现的错误和格式问题。大量发布内容后,定期检查一下能及时发现问题。