ウェブサイトURL抽出ツール
サイトをクロールして内部リンク・外部リンク・画像URLをまとめて取得。TXTやCSVに書き出してSEO監査にすぐ使えます。
Extract All URLs from Any Website
Crawling website...
Discovering and extracting links from pages
Error
Extraction Complete
ページの上限に達しましたが、まだ取得できていないページがあります。サイトにサイトマップがあれば、サイトマップURL抽出ツールで全URLを一度にまとめて取得できます。クロール数の制限はありません。
Why Extract Website URLs?
Site Auditing
Get a complete list of all pages and links on your website for comprehensive SEO audits and content inventory.
Find Broken Links
Discover all outgoing links to identify potential broken links that could harm your SEO and user experience.
Analyze Structure
Understand your website architecture by seeing all internal links and how pages connect to each other.
Competitor Analysis
Analyze competitor websites to understand their content strategy, page structure, and link patterns.
How It Works
Enter URL
Paste the website URL you want to crawl
Configure
Set crawl depth and what types of links to extract
Extract
Our crawler discovers and extracts all URLs
Export
Download or copy your extracted URLs
Important Notes
Privacy First
Crawling happens through our secure proxy to handle CORS restrictions. We don't store or log any URLs discovered.
- Secure proxy for CORS handling
- No URLs are stored or logged
- No account required
サイトの内部リンク構造を把握することは、SEOの土台になります。このURL抽出ツールはサイトをページ単位でクロールし、内部リンク・外部リンク・画像URLをすべて洗い出します。自サイトの監査にも、競合サイトの調査にも使えます。
URLを入力してクローラーを走らせるだけです。見つかったURLは自動的に内部(同ドメイン)・外部(別ドメイン)・画像の3種類に分類されるので、必要なリンクタイプだけに絞って確認できます。結果はTXTまたはCSVで書き出してスプレッドシートやSEOツールに取り込めます。
ウェブサイトURL抽出とはどういうものか
URL抽出(ウェブクローリング・スクレイピングとも呼ばれます)は、サイトを体系的に巡回してすべてのURLを収集する作業です。クローラーは出発ページのリンクをすべて取り出し、そのリンク先のページへ移動してさらにリンクを集め、サイト全体を網羅するか設定した上限に達するまでこれを繰り返します。
この作業で得られるのは、サイトの完全な構造図です。ページ、ブログ記事、商品ページ、リンクで到達できるあらゆるコンテンツが対象になります。他ドメインへの外部リンクや埋め込み画像も同時に把握できます。SEO担当者・ウェブ開発者・デジタルマーケターにとって、こうしたデータは非常に役立ちます。
URL抽出が必要になる場面
用途はさまざまです。SEO監査でまず取り組むのはサイト構造の把握で、孤立ページや過剰なクロール階層、内部リンクの薄さを発見するのに使います。URLをすべて抽出すれば、どのページがどの程度つながっているか、重要なページが検索エンジンに発見されやすい位置にあるかを確認できます。
リンクビルディングでは、外部リンクを分析することでサイトの引用パターンを理解し、アプローチ候補を見つけることができます。コンテンツ担当者は、新コンテンツの制作計画や既存ページの整理を始める前にURL一覧で現状把握を行います。サイト移行時には完全なURLリストが不可欠で、正確なリダイレクト設定に直接つながります。
3種類のリンク分類
このツールは抽出したURLを3つに分類します。内部リンクは同じドメイン内のページへのリンクで、サイトナビゲーションの骨格をなします。ページ間のオーソリティの流れに直接影響するため、内部リンク設計はSEOの基本的な施策の一つです。適切な内部リンク構造があれば、ユーザーも検索エンジンもコンテンツにたどり着きやすくなります。
外部リンクは別ドメインのページへのリンクです。どのサイトに向けてリンクを張っているかはサイトの専門性に影響し、検索エンジンがコンテンツのテーマを判断する材料にもなります。定期的に確認することで、リンク切れや望ましくない宛先へのリンクも早めに気づけます。画像URLは埋め込まれた画像リソースの一覧で、最適化状況の確認やインデックス漏れのチェックに使えます。
クローラーの動き方
URLを入力すると、クローラーはセキュアなプロキシ経由でページを取得します(CORSの制限を回避するためです)。次にHTMLを解析してアンカータグのリンクを取り出し、オプションで画像ソースも収集します。発見した内部リンクはキューに追加され、設定した上限に達するか新しいページがなくなるまで探索を続けます。
クローラーは対象サーバーへの負荷を考慮した設計になっており、リクエスト間隔を制御しています。標準的なウェブの慣行に従い、アクセス制限を迂回しようとはしません。網羅的な結果を得たい場合は、完全なアクセス権がある自サイトでのクロールをおすすめします。
うまく使うためのヒント
クロールはトップページから始めると効果的です。トップページは通常、主要セクションすべてへのリンクを持っているからです。ページ上限はサイト規模に合わせて設定してください。小さなブログなら数十ページ、大きなECサイトなら数千ページになることもあります。まず小さめの上限で試して感触をつかんでから、本格的なクロールに進むのがよいでしょう。
結果を見るときは、URL構造のパターンに注目します。シンプルで内容を反映したURLは、ユーザーにも検索エンジンにもわかりやすいです。クロール階層が異常に深い部分はナビゲーションの問題を示している場合があります。外部リンクが今も有効かどうかも確認しておきましょう。データはCSVで書き出してスプレッドシートで深掘りするのがおすすめです。
制限事項
ブラウザベースのクロールにはいくつかの限界があります。JavaScriptで動的に生成されるコンテンツは、静的HTMLしか解析しないためほぼ検出できません。一部のサイトはCORSやセキュリティ設定・robots.txtで自動アクセスをブロックしており、クロールの範囲が狭まることがあります。複雑な構成のサイトで完全な網羅性が必要なら、サーバーサイドのクローリングツールの方が適しています。
このツールは正当なSEO分析・サイト監査のために作られています。利用規約とrobots.txtは必ず尊重してください。自サイトは自由にクロールできますが、他社サイトをクロールする際は節度をもって使用してください。サーバーへの過負荷を防ぐためのレート制限が組み込まれています。
よくある質問
他のおすすめツール
サイトマップバリデーター
XMLサイトマップをsitemaps.orgプロトコルで検証。XML構文エラーや欠落要素、無効なURLをすぐに発見し、検索エンジンのクロール改善につながる具体的なアドバイスを受け取れます。
サイトマップを検証サイトマップURL抽出ツール
XMLサイトマップから全URLを数秒で抽出できます。サイトマップインデックスにも対応し、CSV・TXTへのエクスポートや lastmod・priority・changefreq のメタデータ取得も可能です。
URLを抽出するGoogle Search Consoleデータダウンローダー
Google Search Consoleのデータをまるごとダウンロードして、エクスポート・分析。あなたのサイトが検索でどう見られているか、はっきり分かります。
SEOインサイトを解除サイトマップ検索・チェックツール
どのサイトのXMLサイトマップも自動で探して検証。robots.txtと12以上の定番パスを確認し、見つかったサイトマップをその場で検証してURL数を表示します。
サイトマップを探す