网站URL提取器

爬取任意网站,一次性获取所有内部链接、外部链接和图片URL,导出TXT或CSV直接用于SEO审计。

Extract All URLs from Any Website

Internal Links
External Links
TXT & CSV Export

Why Extract Website URLs?

Site Auditing

Get a complete list of all pages and links on your website for comprehensive SEO audits and content inventory.

Find Broken Links

Discover all outgoing links to identify potential broken links that could harm your SEO and user experience.

Analyze Structure

Understand your website architecture by seeing all internal links and how pages connect to each other.

Competitor Analysis

Analyze competitor websites to understand their content strategy, page structure, and link patterns.

How It Works

1

Enter URL

Paste the website URL you want to crawl

2

Configure

Set crawl depth and what types of links to extract

3

Extract

Our crawler discovers and extracts all URLs

4

Export

Download or copy your extracted URLs

Important Notes

Due to browser security, only websites that allow cross-origin requests can be fully crawled.
JavaScript-rendered content may not be discoverable in browser-based crawling.
This tool respects robots.txt directives and will not crawl disallowed pages.
Crawling is rate-limited to avoid overwhelming target servers.

Privacy First

Crawling happens through our secure proxy to handle CORS restrictions. We don't store or log any URLs discovered.

  • Secure proxy for CORS handling
  • No URLs are stored or logged
  • No account required

搞清楚网站的链接结构,是做好SEO的第一步。这款URL提取器会逐页爬取你的网站,把内部链接、外部链接和图片URL全部列出来。不管是审计自己的站还是看看竞争对手的情况,需要的数据这里都有。

粘贴URL,启动爬虫,剩下的交给工具。每个链接都会自动分类:内部(同域名)、外部(其他域名)或图片。筛出你想看的类型,再导出成TXT或CSV,直接拖进表格或SEO工具里继续分析。

网站URL提取是什么

URL提取,也叫网络爬取或抓取,就是系统地浏览一个网站,把它包含的所有链接都收集起来。爬虫从起始页面提取所有链接,访问那些页面再继续找新链接,直到把整个网站结构摸清楚,或者到达你设定的页面上限为止。

最终你得到的是网站完整的架构快照:页面、文章、商品列表,凡是能通过链接访问到的内容都包括在内。同时还有指向外部域名的出站链接,以及页面里嵌入的图片等媒体资源。对做SEO的、搞开发的、做数字营销的来说,这些数据都很有价值。

URL提取能用来做什么

用途挺多的。SEO审计的第一步通常就是搞清楚网站结构,找出孤立页面、爬取深度过大或者内部链接稀薄的问题。把所有URL提取出来,就能直观看到页面之间的连接情况,哪些重要页面搜索引擎不容易爬到一目了然。

做外链建设时,分析一个网站的出站链接能帮你了解它的引用习惯、找到潜在合作机会。内容策略师会在规划新内容或合并旧页面之前,先用URL列表摸清现有内容家底。网站迁移时,完整的URL列表更是必不可少,不然重定向很难配置到位。

三种链接类型

工具把提取到的URL分为三类。内部链接指向同一域名下的页面,是网站导航的骨架,也直接影响页面权重在站内的分配。内链结构合理,用户好导航,搜索引擎爬取也更顺畅。

外部链接指向其他域名。这些出站链接影响网站的主题相关性,也给搜索引擎提供理解内容背景的线索。定期检查外部链接,可以及时发现失效链接或指向有问题目标的链接。图片URL则列出页面上嵌入的所有图片资源,用来核查图片优化和索引情况很方便。

爬虫的工作原理

输入URL后,爬虫通过安全代理获取页面内容,绕过跨域限制。接着解析HTML,提取所有锚标签链接,以及可选的图片来源。每发现一个内部链接就加入队列,继续往下爬,直到达到页面上限或再没有新页面可以访问为止。

爬虫有内置的速率控制,不会对目标服务器造成过大压力。它遵守标准的网络规范,不会尝试绕过访问限制。想要最完整的结果,还是爬自己有完全权限的网站效果最好。

几个实用建议

从首页开始爬通常是最好的选择,因为首页一般链接到网站各主要板块。页面上限根据网站规模来设:小博客可能二三十页就够,大型电商可能几千页。先设个低点的上限快速看结果,确认方向对了再开高上限跑完整爬取。

分析结果时,留意URL结构的规律性。干净、有描述性的URL对用户和搜索引擎都更友好。爬取链过长可能意味着导航存在问题。外部链接要确认还能正常访问。数据导出成CSV后在表格里深入分析会更方便。

使用限制

基于浏览器的爬取有一些固有限制。爬虫只解析静态HTML,JavaScript渲染出来的内容可能抓不到。部分网站通过CORS、安全策略或robots.txt阻止自动访问,覆盖范围会受限。对于结构复杂、需要全面覆盖的网站,服务器端爬取工具更合适。

这个工具是为正当的SEO分析和网站审计准备的。爬取任何网站前,请遵守其服务条款和robots.txt规定。自己的网站随便爬;爬第三方网站时,用常识判断边界。速率限制是内置的,不用担心把对方服务器打垮。

常见问题

探索类似工具

AGE

域名年龄查询工具

输入域名,立刻看到注册日期、年龄(精确到月)、到期时间、注册商和DNS服务器 — 实时WHOIS查询,结果秒出。

查询域名年龄

站点地图验证器

按照sitemaps.org协议验证你的XML站点地图。一键找出语法错误、缺失元素和无效URL,并获得改善搜索引擎抓取效果的具体建议。

验证站点地图

站点地图URL提取工具

几秒内从任意XML站点地图中提取全部URL,支持站点地图索引,可导出CSV和TXT,带lastmod、priority、changefreq等元数据。

提取URL

Google Search Console数据下载器

把Google Search Console的数据下载下来,导出、分析,搞清楚你的网站在搜索里到底表现怎么样。

解锁SEO洞察

站点地图查找与检查工具

自动找出并验证任何网站的全部XML站点地图。读取robots.txt并扫描12个以上常见路径,当场验证每个站点地图,即时显示URL数量。

查找站点地图

XML站点地图生成器

粘贴网址,下载sitemap.xml。全程在浏览器本地处理,URL不会发送到任何服务器。

生成站点地图