ウェブサイトURL抽出ツール

サイトをクロールして内部リンク・外部リンク・画像URLをまとめて取得。TXTやCSVに書き出してSEO監査にすぐ使えます。

Extract All URLs from Any Website

Internal Links
External Links
TXT & CSV Export

Why Extract Website URLs?

Site Auditing

Get a complete list of all pages and links on your website for comprehensive SEO audits and content inventory.

Find Broken Links

Discover all outgoing links to identify potential broken links that could harm your SEO and user experience.

Analyze Structure

Understand your website architecture by seeing all internal links and how pages connect to each other.

Competitor Analysis

Analyze competitor websites to understand their content strategy, page structure, and link patterns.

How It Works

1

Enter URL

Paste the website URL you want to crawl

2

Configure

Set crawl depth and what types of links to extract

3

Extract

Our crawler discovers and extracts all URLs

4

Export

Download or copy your extracted URLs

Important Notes

Due to browser security, only websites that allow cross-origin requests can be fully crawled.
JavaScript-rendered content may not be discoverable in browser-based crawling.
This tool respects robots.txt directives and will not crawl disallowed pages.
Crawling is rate-limited to avoid overwhelming target servers.

Privacy First

Crawling happens through our secure proxy to handle CORS restrictions. We don't store or log any URLs discovered.

  • Secure proxy for CORS handling
  • No URLs are stored or logged
  • No account required

サイトの内部リンク構造を把握することは、SEOの土台になります。このURL抽出ツールはサイトをページ単位でクロールし、内部リンク・外部リンク・画像URLをすべて洗い出します。自サイトの監査にも、競合サイトの調査にも使えます。

URLを入力してクローラーを走らせるだけです。見つかったURLは自動的に内部(同ドメイン)・外部(別ドメイン)・画像の3種類に分類されるので、必要なリンクタイプだけに絞って確認できます。結果はTXTまたはCSVで書き出してスプレッドシートやSEOツールに取り込めます。

ウェブサイトURL抽出とはどういうものか

URL抽出(ウェブクローリング・スクレイピングとも呼ばれます)は、サイトを体系的に巡回してすべてのURLを収集する作業です。クローラーは出発ページのリンクをすべて取り出し、そのリンク先のページへ移動してさらにリンクを集め、サイト全体を網羅するか設定した上限に達するまでこれを繰り返します。

この作業で得られるのは、サイトの完全な構造図です。ページ、ブログ記事、商品ページ、リンクで到達できるあらゆるコンテンツが対象になります。他ドメインへの外部リンクや埋め込み画像も同時に把握できます。SEO担当者・ウェブ開発者・デジタルマーケターにとって、こうしたデータは非常に役立ちます。

URL抽出が必要になる場面

用途はさまざまです。SEO監査でまず取り組むのはサイト構造の把握で、孤立ページや過剰なクロール階層、内部リンクの薄さを発見するのに使います。URLをすべて抽出すれば、どのページがどの程度つながっているか、重要なページが検索エンジンに発見されやすい位置にあるかを確認できます。

リンクビルディングでは、外部リンクを分析することでサイトの引用パターンを理解し、アプローチ候補を見つけることができます。コンテンツ担当者は、新コンテンツの制作計画や既存ページの整理を始める前にURL一覧で現状把握を行います。サイト移行時には完全なURLリストが不可欠で、正確なリダイレクト設定に直接つながります。

3種類のリンク分類

このツールは抽出したURLを3つに分類します。内部リンクは同じドメイン内のページへのリンクで、サイトナビゲーションの骨格をなします。ページ間のオーソリティの流れに直接影響するため、内部リンク設計はSEOの基本的な施策の一つです。適切な内部リンク構造があれば、ユーザーも検索エンジンもコンテンツにたどり着きやすくなります。

外部リンクは別ドメインのページへのリンクです。どのサイトに向けてリンクを張っているかはサイトの専門性に影響し、検索エンジンがコンテンツのテーマを判断する材料にもなります。定期的に確認することで、リンク切れや望ましくない宛先へのリンクも早めに気づけます。画像URLは埋め込まれた画像リソースの一覧で、最適化状況の確認やインデックス漏れのチェックに使えます。

クローラーの動き方

URLを入力すると、クローラーはセキュアなプロキシ経由でページを取得します(CORSの制限を回避するためです)。次にHTMLを解析してアンカータグのリンクを取り出し、オプションで画像ソースも収集します。発見した内部リンクはキューに追加され、設定した上限に達するか新しいページがなくなるまで探索を続けます。

クローラーは対象サーバーへの負荷を考慮した設計になっており、リクエスト間隔を制御しています。標準的なウェブの慣行に従い、アクセス制限を迂回しようとはしません。網羅的な結果を得たい場合は、完全なアクセス権がある自サイトでのクロールをおすすめします。

うまく使うためのヒント

クロールはトップページから始めると効果的です。トップページは通常、主要セクションすべてへのリンクを持っているからです。ページ上限はサイト規模に合わせて設定してください。小さなブログなら数十ページ、大きなECサイトなら数千ページになることもあります。まず小さめの上限で試して感触をつかんでから、本格的なクロールに進むのがよいでしょう。

結果を見るときは、URL構造のパターンに注目します。シンプルで内容を反映したURLは、ユーザーにも検索エンジンにもわかりやすいです。クロール階層が異常に深い部分はナビゲーションの問題を示している場合があります。外部リンクが今も有効かどうかも確認しておきましょう。データはCSVで書き出してスプレッドシートで深掘りするのがおすすめです。

制限事項

ブラウザベースのクロールにはいくつかの限界があります。JavaScriptで動的に生成されるコンテンツは、静的HTMLしか解析しないためほぼ検出できません。一部のサイトはCORSやセキュリティ設定・robots.txtで自動アクセスをブロックしており、クロールの範囲が狭まることがあります。複雑な構成のサイトで完全な網羅性が必要なら、サーバーサイドのクローリングツールの方が適しています。

このツールは正当なSEO分析・サイト監査のために作られています。利用規約とrobots.txtは必ず尊重してください。自サイトは自由にクロールできますが、他社サイトをクロールする際は節度をもって使用してください。サーバーへの過負荷を防ぐためのレート制限が組み込まれています。

よくある質問

他のおすすめツール

AGE

ドメイン年齢チェッカー

ドメイン名を入力するだけで、いつ登録されたか、年月単位の年齢、有効期限、登録業者、ネームサーバーをリアルタイムのWHOIS検索で即座に確認できます。

ドメイン年齢を確認する

サイトマップバリデーター

XMLサイトマップをsitemaps.orgプロトコルで検証。XML構文エラーや欠落要素、無効なURLをすぐに発見し、検索エンジンのクロール改善につながる具体的なアドバイスを受け取れます。

サイトマップを検証

サイトマップURL抽出ツール

XMLサイトマップから全URLを数秒で抽出できます。サイトマップインデックスにも対応し、CSV・TXTへのエクスポートや lastmod・priority・changefreq のメタデータ取得も可能です。

URLを抽出する

Google Search Consoleデータダウンローダー

Google Search Consoleのデータをまるごとダウンロードして、エクスポート・分析。あなたのサイトが検索でどう見られているか、はっきり分かります。

SEOインサイトを解除

サイトマップ検索・チェックツール

どのサイトのXMLサイトマップも自動で探して検証。robots.txtと12以上の定番パスを確認し、見つかったサイトマップをその場で検証してURL数を表示します。

サイトマップを探す

XMLサイトマップジェネレーター

URLを貼り付けて、すぐにsitemap.xmlをダウンロード。ブラウザ内で完結するので、URLがサーバーに送られることはありません。

サイトマップを生成