Extracteur d'URLs de Sites Web
Crawlez n'importe quel site et récupérez tous ses liens internes, externes et URLs d'images. Export TXT ou CSV pour vos audits SEO.
Extract All URLs from Any Website
Crawling website...
Discovering and extracting links from pages
Error
Extraction Complete
Vous avez atteint la limite de pages, et il en reste encore à découvrir. Si le site dispose d'un sitemap, l'Extracteur d'URLs de Sitemap récupÚre toutes les URLs d'un seul coup, sans aucune limite.
Why Extract Website URLs?
Site Auditing
Get a complete list of all pages and links on your website for comprehensive SEO audits and content inventory.
Find Broken Links
Discover all outgoing links to identify potential broken links that could harm your SEO and user experience.
Analyze Structure
Understand your website architecture by seeing all internal links and how pages connect to each other.
Competitor Analysis
Analyze competitor websites to understand their content strategy, page structure, and link patterns.
How It Works
Enter URL
Paste the website URL you want to crawl
Configure
Set crawl depth and what types of links to extract
Extract
Our crawler discovers and extracts all URLs
Export
Download or copy your extracted URLs
Important Notes
Privacy First
Crawling happens through our secure proxy to handle CORS restrictions. We don't store or log any URLs discovered.
- Secure proxy for CORS handling
- No URLs are stored or logged
- No account required
ConnaĂźtre la structure de liens d'un site, c'est la base de tout bon audit SEO. Cet extracteur d'URLs parcourt votre site page par page et liste chaque lien trouvĂ© â liens internes, rĂ©fĂ©rences vers d'autres domaines, URLs d'images. Que ce soit pour auditer votre propre site ou jeter un Ćil Ă la concurrence, vous avez ici tout ce qu'il faut.
Entrez une URL, lancez le crawler, et laissez-le faire. Chaque lien dĂ©couvert est classĂ© automatiquement : interne (mĂȘme domaine), externe (autre domaine) ou image. Vous filtrez ce qui vous intĂ©resse et exportez en TXT ou CSV pour continuer l'analyse dans votre tableur ou outil SEO habituel.
Qu'est-ce que l'extraction d'URLs d'un site web ?
Extraire les URLs d'un site web â qu'on appelle aussi crawling ou scraping â consiste Ă parcourir un site de façon mĂ©thodique pour collecter tous les liens qu'il contient. Le crawler part d'une page de dĂ©part, en extrait tous les liens, visite chacun d'eux pour en trouver d'autres, et continue ainsi jusqu'Ă avoir cartographiĂ© l'ensemble du site ou atteint la limite que vous avez fixĂ©e.
Le résultat : une vision complÚte de l'architecture du site. Toutes les pages, tous les articles, les fiches produit, les ressources accessibles via des liens. Les liens sortants vers d'autres domaines et les médias embarqués comme les images apparaissent aussi. Pour un SEO, un développeur ou quelqu'un qui fait du marketing digital, c'est une mine d'informations.
Pourquoi extraire les URLs d'un site ?
Les raisons sont nombreuses. Dans un audit SEO, la premiÚre étape c'est souvent de savoir exactement ce que contient le site : pages orphelines, profondeur de crawl excessive, maillage interne insuffisant. Quand vous avez la liste complÚte des URLs et la façon dont elles sont reliées entre elles, vous repérez tout de suite les zones que les moteurs de recherche peinent à atteindre.
Pour le link building, analyser les liens sortants d'un site permet de comprendre ses habitudes de citation et d'identifier des opportunités. Les stratÚges de contenu s'en servent pour faire l'inventaire de l'existant avant de planifier de nouvelles pages ou de fusionner des contenus anciens. Et lors d'une migration, avoir la liste exhaustive des URLs est indispensable pour que les redirections soient correctement mises en place.
Les trois types de liens
L'outil classe les URLs en trois catĂ©gories. Les liens internes pointent vers des pages du mĂȘme domaine : ils forment l'ossature de la navigation et influencent directement la façon dont les moteurs de recherche distribuent l'autoritĂ© entre les pages. Un bon maillage interne, c'est ce qui permet Ă vos contenus d'ĂȘtre bien explorĂ©s et bien positionnĂ©s.
Les liens externes mĂšnent vers d'autres domaines. Ces liens sortants ont un impact sur la pertinence thĂ©matique de votre site et donnent des indices aux moteurs de recherche sur votre domaine d'expertise. Les surveiller rĂ©guliĂšrement permet aussi de dĂ©tecter ceux qui sont cassĂ©s ou qui redirigent vers des destinations douteuses. Quant aux URLs d'images, elles recensent tous les visuels intĂ©grĂ©s dans vos pages â utile pour vĂ©rifier que tout est bien optimisĂ© et indexable.
Comment fonctionne le crawler
Quand vous entrez une URL, le crawler charge la page via un proxy sécurisé pour contourner les restrictions CORS. Il analyse ensuite le HTML, extrait toutes les balises d'ancre et, si vous le souhaitez, les sources d'images. Chaque lien interne découvert est ajouté à une file d'attente ; le crawler continue de la sorte jusqu'à la limite de pages que vous avez choisie, ou jusqu'à épuisement des pages accessibles.
Le crawler est conçu pour ne pas importuner les serveurs cibles : un mécanisme de limitation du débit évite toute surcharge. Il respecte les conventions web habituelles et ne tente pas de passer outre les restrictions d'accÚs. Pour des résultats complets, l'idéal est de crawler vos propres sites sur lesquels vous avez les droits.
Quelques bonnes pratiques
Commencez toujours depuis la page d'accueil : c'est en général de là que partent les liens vers toutes les rubriques principales. Choisissez une limite de pages adaptée à la taille du site. Un petit blog peut avoir une vingtaine de pages, un site e-commerce peut en avoir des milliers. Partez d'une limite basse pour avoir rapidement un premier aperçu, puis augmentez-la si besoin.
En analysant les rĂ©sultats, cherchez des rĂ©gularitĂ©s dans la structure des URLs. Des URLs claires et descriptives, c'est plus facile Ă apprĂ©hender pour tout le monde â utilisateurs comme moteurs de recherche. Des chaĂźnes de crawl particuliĂšrement longues signalent souvent un problĂšme de navigation. VĂ©rifiez que vos liens externes fonctionnent encore. Et servez-vous de l'export pour travailler les donnĂ©es dans un tableur.
Limites Ă connaĂźtre
Le crawling via navigateur a ses contraintes. Le contenu rendu par JavaScript peut passer Ă la trappe, puisque le crawler ne traite que le HTML statique. Certains sites bloquent l'accĂšs automatisĂ© via des rĂšgles CORS, des mesures de sĂ©curitĂ© ou le robots.txt, ce qui peut rĂ©duire la couverture. Pour des sites complexes oĂč vous avez besoin d'une exhaustivitĂ© absolue, des outils de crawl cĂŽtĂ© serveur seront plus adaptĂ©s.
Cet outil est fait pour des usages SEO légitimes. Respectez les conditions d'utilisation et les directives robots.txt des sites que vous crawlez. Vos propres sites ? Aucun problÚme. Les sites tiers ? Faites preuve de bon sens. La limitation du débit est là pour éviter tout impact négatif sur les serveurs visités.
Questions fréquentes
Outils similaires à découvrir
Vérificateur d'ùge de domaine
Entrez n'importe quel domaine et dĂ©couvrez instantanĂ©ment sa date d'enregistrement, son Ăąge en annĂ©es et mois, sa date d'expiration, son registrar et ses serveurs DNS â via une recherche WHOIS en direct.
Vérifier l'ùge du domaineValidateur de Sitemap
Validez votre sitemap XML contre le protocole sitemaps.org. Détectez les erreurs de syntaxe, les éléments manquants et les URLs invalides, et obtenez des recommandations concrÚtes pour améliorer l'exploration par les moteurs de recherche.
Valider le sitemapExtracteur d'URLs de sitemap
Extrayez toutes les URLs d'un sitemap XML en quelques secondes. GÚre les index de sitemaps, exporte en CSV et TXT, avec les métadonnées lastmod, priorité et changefreq.
Extraire les URLsTéléchargeur de Données Google Search Console
Telechargez vos donnees Google Search Console, exportez-les et analysez-les pour donner un vrai coup de pouce a votre SEO et comprendre votre trafic de recherche.
Débloquer les Insights SEORecherche et vérification de sitemap
Trouvez et validez automatiquement tous les sitemaps XML d'un site. Analyse le robots.txt et plus de 12 chemins courants, valide chaque sitemap trouvé et affiche le nombre d'URLs en quelques secondes.
Trouver les sitemapsGénérateur de Sitemap XML
Collez vos URLs, téléchargez votre sitemap XML. Tout se passe dans le navigateur, aucune donnée n'est envoyée à un serveur.
Générer le sitemap