サイトマップURL抽出ツール
XMLサイトマップから全URLを数秒で抽出できます。サイトマップインデックスにも対応し、CSV・TXTへのエクスポートや lastmod・priority・changefreq のメタデータ取得も可能です。
Extract All URLs from Any Sitemap
Fetching sitemap...
This may take a moment for large sitemaps
Error
Sitemap Index Detected
This is a sitemap index containing multiple sitemaps. You can extract all sitemaps at once or select individual ones.
URLs Extracted
Why Extract Sitemap URLs?
SEO Auditing
Get a complete list of indexed pages to identify coverage issues, duplicate content, or missing pages in your sitemap.
Site Migration
Export all URLs before migrating to ensure you set up proper 301 redirects and prevent losing valuable SEO rankings.
Competitor Analysis
Analyze competitor sitemaps to discover their content strategy, page structure, and identify content gaps.
Content Inventory
Create a complete inventory of all published content for auditing, updating, or consolidating your content strategy.
How It Works
Enter URL
Paste your sitemap URL (sitemap.xml or sitemap_index.xml)
Fetch & Parse
We fetch and parse the XML content in your browser
View Results
Browse, filter, and search through all extracted URLs
Export Data
Download as TXT or CSV with full metadata
Supported Sitemap Types
Standard Sitemap
XML sitemaps following the sitemaps.org protocol with URL, lastmod, changefreq, and priority tags.
Sitemap Index
Multi-sitemap indexes that reference multiple sitemap files. We automatically detect and let you extract all.
Image Sitemap
Sitemaps with image extensions are supported. Image URLs are extracted alongside page URLs.
Your Privacy Protected
This tool processes everything in your browser. No sitemap data is ever sent to or stored on our servers.
- All processing happens in your browser
- We never store your sitemap data
- No account or login required
SEO分析・サイト移行・競合調査のために、サイトマップから全URLをまとめて取り出したいときに使えるツールです。sitemap.xml のURLを貼り付けるだけで、メタデータごとに全URLが瞬時に表示されます。通常のサイトマップはもちろん、複数ファイルにまたがるサイトマップインデックスにも対応しています。
サイトマップURL抽出ツールとは?
XMLサイトマップは、サイト内の重要なページを一覧化したファイルで、GoogleやBingがコンテンツを効率的に発見・クロールするために使います。このツールはそのXMLファイルを読み取り、全URLをフィルタリング・分析・エクスポートしやすい形式で表示します。
手動で抽出しようとすると、ファイルが1つなら何とかなっても、数万件のURLが含まれる複数のサイトマップファイルを参照するインデックスになると一気に面倒になります。このツールなら、その作業を数秒で終わらせることができます。
主な機能
単純なURLリスト表示にとどまらず、実用的な機能が揃っています。
- サイトマップインデックス対応:インデックスファイルを自動検出して、参照されている全サイトマップを表示します。一括抽出か個別選択かを選べます。
- メタデータも一緒に取得:URLだけでなく、lastmod(最終更新日)・changefreq(更新頻度)・priorityも、サイトマップに含まれていれば取得します。
- リアルタイム検索:ページを再読み込みせずに数千件のURLを即座に絞り込めます。特定のディレクトリやパターンを探すときに便利です。
- TXT・CSVエクスポート:URLのみのテキストファイルか、全メタデータ付きのCSVとしてダウンロードできます。CSVはExcelやGoogleスプレッドシートでそのまま開けます。
- ワンクリックコピー:全URLをクリップボードにコピーして、他のツールやドキュメントにすぐ貼り付けられます。
- ページ分割表示:大量のURLは100件ずつページ分割して表示するので、ブラウザが重くなりません。
こんなときに役立ちます
サイトマップのURL抽出が最初のステップになる場面はいくつかあります。
SEO監査
SEOプロジェクトを始める前に、インデックスされているページの全体像を把握しておく必要があります。サイトマップを抽出すれば、コンテンツの薄いページ・重複URL・lastmodが古すぎるページをすぐに見つけられます。実際のクロール結果と比較することで、サイトマップに入れるべきページや不要なページも明確になります。
サイト移行
ドメイン変更やURL構造の見直しを行う際は、まず現在の全URLを抽出しておきましょう。CSVで取り出してから新URLの列を追加すれば、リダイレクトマッピングの基盤がすぐできます。これで取りこぼしなく、積み上げてきた検索順位を守りやすくなります。
競合調査
競合他社のサイトマップは公開情報です。そこからURLを抽出すると、どんなコンテンツを公開しているか、サイト構造はどうなっているか、自社にない切り口は何かがわかります。コンテンツ戦略の参考になる情報を手軽に得られます。
コンテンツ棚卸し
マーケティングチームが公開コンテンツを全件把握したいとき、サイトマップが最も信頼できる情報源になります。エクスポートしたリストをそのままコンテンツ監査や更新計画の出発点として使えます。
リンク切れチェック
URLを抽出した後、リンクチェックツールに通すと、サイトマップに残ったままの404ページが見つかります。これらは早めにサイトマップから削除するか、ページを復元する必要があります。
XMLサイトマップの構造
XMLサイトマップはsitemaps.orgプロトコルに準拠しており、主要な検索エンジンすべてがこの形式に対応しています。大きく2種類あります。
通常のサイトマップ(urlset)
URLエントリを直接含むファイルです。各エントリには以下が含まれることがあります:
- loc:ページのURL(必須)
- lastmod:最終更新日(任意、推奨)
- changefreq:更新頻度(任意)
- priority:0.0〜1.0の相対的重要度(任意)
サイトマップインデックス(sitemapindex)
規模の大きいサイトでは、URLを複数のサイトマップファイルに分けて、インデックスファイルでまとめて参照する構成をよく見かけます。このツールは自動でインデックスを検出し、参照先のサイトマップを一覧表示するので、まとめて抽出するか個別に選ぶかを選択できます。
分析をより深めるヒント
URLを取り出した後、こんな使い方ができます。
- lastmodの日付を確認する:更新日がかなり古いページは、検索での競争力を保つためにコンテンツの見直しを検討するといいかもしれません。
- URLのパターンを見る:構造が統一されていない箇所は、設計上の問題が潜んでいることが多いです。
- ディレクトリ別に集計する:パスのセグメントでグループ化すると、コンテンツがどのセクションに集中しているかが一目でわかります。
- クロール結果と照合する:サイトマップのURLと実際のクロールで発見されたURLを比較すると、見落としや矛盾が見つかります。
- 定期的に比較する:一定間隔でサイトマップを抽出して過去のものと比べると、ページの追加・削除の変化を把握できます。
プライバシーについて
まずブラウザ上で直接サイトマップを取得しようとします。クロスオリジン制限がある場合は安全なプロキシを使いますが、いずれにしても取得したサイトマップや抽出したURLを保存することはありません。処理はすべてリアルタイムで行われ、タブを閉じればデータは残りません。