Validateur de Sitemap

Validez votre sitemap XML contre le protocole sitemaps.org. Détectez les erreurs de syntaxe, les éléments manquants et les URLs invalides, et obtenez des recommandations concrètes pour améliorer l'exploration par les moteurs de recherche.

Validate Your XML Sitemap

Schema Compliance
URL Format Check
Instant Results

Why Validate Your Sitemap?

Ensure Proper Crawling

Search engines rely on valid sitemaps to discover your pages. An invalid sitemap may cause crawling issues.

Improve Indexing

A well-structured sitemap helps search engines understand your site hierarchy and index pages more efficiently.

Catch Errors Early

Identify XML syntax errors, invalid URLs, and protocol violations before they affect your search visibility.

Follow Best Practices

Get recommendations for optional elements like lastmod and priority that can enhance your SEO.

What We Check

XML Syntax

Validates proper XML formatting, encoding, and structure.

Schema Compliance

Verifies adherence to the sitemaps.org protocol specification.

URL Format

Checks that all URLs are properly formatted and valid.

Secure Validation

Your sitemap is validated entirely in your browser. We never store or log the URLs in your sitemap.

  • All validation happens client-side
  • Sitemap URLs are never stored
  • Results displayed instantly

Votre sitemap est-il vraiment bien formaté pour les moteurs de recherche ? Collez l'URL et on le valide immédiatement contre le protocole officiel sitemaps.org. On vérifie la syntaxe XML, les éléments obligatoires, le format des URLs et la conformité au schéma, puis on vous donne un rapport détaillé avec les problèmes exacts et comment les corriger.

À quoi sert un validateur de sitemap ?

Créer un sitemap, c'est bien. Vérifier qu'il fonctionne vraiment, c'est mieux. Les moteurs de recherche appliquent des règles de formatage assez strictes, et une seule erreur dans le fichier XML peut suffire à le faire rejeter complètement, sans que vous en soyez informé.

Le validateur lit votre fichier sitemap et le compare ligne par ligne à la spécification officielle du protocole sitemaps.org, le standard utilisé par Google, Bing et la plupart des autres moteurs. Il repère les erreurs bloquantes, les champs optionnels manquants qui pourraient améliorer le crawl, et vous indique précisément où se trouve chaque problème.

Pourquoi valider régulièrement son sitemap ?

Beaucoup de gens génèrent leur sitemap une fois, le soumettent et ne le regardent plus. C'est une erreur courante. Les sitemaps se cassent plus souvent qu'on ne le croit : une mise à jour du CMS, un changement de configuration, une migration de domaine. Ce qui peut mal tourner :

Compatibilité avec les moteurs de recherche

Les moteurs sont stricts sur le format. Une balise XML non fermée ou un encodage de caractères incorrect peut entraîner le rejet de tout le fichier. Résultat : les nouvelles pages ne sont pas découvertes, les mises à jour de contenu passent inaperçues. Une validation régulière évite que ces problèmes affectent votre visibilité.

Violations du protocole

Le protocole sitemaps.org impose des règles précises : les URLs doivent être absolues et correctement encodées, les dates lastmod doivent être en format ISO 8601, les valeurs de priority doivent être comprises entre 0,0 et 1,0. En cas de non-respect, certaines parties du sitemap peuvent être ignorées.

Trouver les erreurs avant Google

Google Search Console signale les erreurs de sitemap, mais quand vous les voyez, le mal est souvent déjà fait. Les robots ont peut-être sauté votre sitemap entièrement ou ne l'ont traité qu'à moitié. Valider en amont vous permet de réagir avant que ça pose des problèmes d'indexation.

Améliorer l'efficacité d'exploration

Un sitemap bien renseigné aide les robots à prioriser leur travail. Les dates lastmod leur disent quelles pages ont changé récemment, les valeurs priority orientent sur ce qui est le plus important. Le validateur vous signale quand ces champs sont absents ou mal renseignés.

Ce que le validateur vérifie

La vérification se fait en plusieurs étapes :

Syntaxe XML

D'abord, le fichier doit être du XML valide. On vérifie la structure des balises, l'imbrication, l'encodage des caractères et la cohérence globale du document. Les erreurs les plus fréquentes sont les balises non fermées, les noms de balises incorrects, les caractères invalides et les déclarations XML manquantes.

Conformité au schéma

Le protocole impose un schéma XML spécifique. On vérifie que la déclaration de namespace est correcte, que l'élément racine est bien urlset ou sitemapindex, et que les éléments enfants sont aux bons endroits.

Format des URLs

Chaque URL est analysée individuellement. Elle doit être absolue (commençant par http:// ou https://), les caractères spéciaux doivent être correctement encodés, et elle ne peut pas dépasser 2 048 caractères. On détecte aussi les URLs relatives, les encodages cassés et les doublons.

Valeurs des éléments optionnels

Les champs lastmod, changefreq et priority ont leurs propres contraintes. On vérifie que lastmod respecte le format ISO 8601, que changefreq utilise l'une des valeurs autorisées (always, hourly, daily, weekly, monthly, yearly, never) et que priority est un décimal entre 0,0 et 1,0.

Taille et limites

Un sitemap ne peut pas dépasser 50 Mo non compressé ni contenir plus de 50 000 URLs. Si vous approchez de ces limites, vous devrez le diviser en plusieurs fichiers et utiliser un index de sitemap. Le validateur vous prévient avant que vous les dépassiez.

Comprendre les résultats

Après la validation, vous obtenez l'un de ces trois statuts :

  • Valide : Votre sitemap respecte le protocole sitemaps.org et devrait être traité sans problème par tous les principaux moteurs de recherche.
  • Valide avec avertissements : Le fichier est techniquement correct, mais des éléments optionnels manquent et pourraient améliorer le crawl.
  • Invalide : Il y a des erreurs qui risquent d'empêcher les moteurs de lire correctement le sitemap. À corriger sans attendre.

Pour chaque problème détecté, vous voyez exactement où il se trouve, ce qui ne va pas et comment le corriger. Pas besoin de chercher par vous-même.

Erreurs fréquentes et comment les corriger

Namespace absent ou incorrect

L'élément racine du sitemap doit contenir cette déclaration : xmlns="http://www.sitemaps.org/schemas/sitemap/0.9". Sans elle, les moteurs de recherche risquent de ne pas reconnaître le fichier comme un sitemap valide.

Format de date invalide

Le champ lastmod n'accepte que le format ISO 8601. Les formats valides sont YYYY-MM-DD, YYYY-MM-DDThh:mm:ss et YYYY-MM-DDThh:mm:ss+hh:mm. Des formats comme « 15/01/2024 » ou « 15 janvier 2024 » génèrent une erreur.

URLs relatives

Toutes les URLs doivent être absolues, avec le protocole et le domaine. Plutôt que "/page.html", écrivez "https://exemple.fr/page.html". Les URLs relatives font échouer la validation directement.

Caractères spéciaux non échappés

En XML, certains caractères doivent être échappés : & devient &amp;, < devient &lt;, > devient &gt;. Les esperluettes non échappées dans les paramètres d'URL sont l'une des causes d'erreur les plus courantes.

Bonnes pratiques d'entretien

Au-delà de la correction des erreurs, quelques habitudes font la différence :

  • Ne mettez lastmod à jour que si le contenu a vraiment changé : Gonfler artificiellement les dates finit par faire perdre la confiance des robots d'exploration.
  • Régénérez le sitemap à chaque changement important : Ajout de pages, suppression, mise à jour majeure. Un sitemap obsolète rate les nouvelles pages.
  • Référencez-le dans robots.txt : La ligne « Sitemap : https://votresite.com/sitemap.xml » le rend accessible à tous les robots, sans qu'ils aient à le chercher.
  • Soumettez-le aux moteurs de recherche : Via Google Search Console et Bing Webmaster Tools, vous pouvez le soumettre directement et suivre son traitement.
  • Revalidez après chaque modification : Dès que vous touchez à la configuration du générateur ou au fichier manuellement, relancez la validation.

Confidentialité

La validation s'effectue directement dans votre navigateur. On ne passe par notre serveur que si des restrictions cross-origin empêchent le chargement direct, et même dans ce cas, rien n'est stocké. Le contenu de votre sitemap reste entièrement privé.

Questions fréquentes

Outils similaires à découvrir

Extracteur d'URLs de sitemap

Extrayez toutes les URLs d'un sitemap XML en quelques secondes. Gère les index de sitemaps, exporte en CSV et TXT, avec les métadonnées lastmod, priorité et changefreq.

Extraire les URLs

Recherche et vérification de sitemap

Trouvez et validez automatiquement tous les sitemaps XML d'un site. Analyse le robots.txt et plus de 12 chemins courants, valide chaque sitemap trouvé et affiche le nombre d'URLs en quelques secondes.

Trouver les sitemaps
AGE

Vérificateur d'âge de domaine

Entrez n'importe quel domaine et découvrez instantanément sa date d'enregistrement, son âge en années et mois, sa date d'expiration, son registrar et ses serveurs DNS — via une recherche WHOIS en direct.

Vérifier l'âge du domaine

Extracteur d'URLs de Sites Web

Crawlez n'importe quel site et récupérez tous ses liens internes, externes et URLs d'images. Export TXT ou CSV pour vos audits SEO.

Extraire les URLs

Vérificateur de Liens Dofollow Nofollow

Colle une URL et vois instantanément quels liens transmettent de l'autorité SEO, lesquels sont en nofollow et s'ils pointent vers l'intérieur ou l'extérieur du domaine.

Vérifier les Liens

Générateur de Sitemap XML

Collez vos URLs, téléchargez votre sitemap XML. Tout se passe dans le navigateur, aucune donnée n'est envoyée à un serveur.

Générer le sitemap