Indexation
L'indexation est le processus par lequel Google explore, analyse et enregistre les pages de votre site dans sa base de données pour les afficher dans les résultats de recherche.
Pourquoi c'est important
Sans indexation, votre site est invisible sur Google. C'est la condition préalable à tout référencement. Des problèmes d'indexation silencieux peuvent faire disparaître des pages entières de Google sans que vous le réalisiez, coûtant des milliers de visites perdues.
Qu'est-ce que l'indexation ?
L'indexation est le processus par lequel les moteurs de recherche (Google, Bing, etc.) découvrent, analysent et stockent les pages de votre site dans leur index — une immense base de données de milliards de pages web. Tant qu'une page n'est pas indexée, elle n'existe pas pour Google et ne peut pas apparaître dans les résultats de recherche.
Le processus se déroule en trois étapes : le crawl (exploration), l'indexation (analyse et stockage), et le ranking (classement). Googlebot, le robot d'exploration de Google, parcourt le web en suivant les liens de page en page. Quand il découvre une nouvelle page, il l'analyse (contenu, balises, structure) et décide de l'ajouter ou non à son index. Une page indexée est ensuite classée en fonction de sa pertinence pour chaque requête.
Comment fonctionne le crawl de Google
Googlebot a un budget de crawl limité pour chaque site. Ce budget dépend de la taille, de la popularité et de la santé technique de votre site. Pour un petit site vitrine (10-50 pages), le budget de crawl n'est jamais un problème. Pour un e-commerce avec 100 000+ pages, l'optimisation du budget de crawl est cruciale.
Le fichier robots.txt (à la racine de votre site) indique à Googlebot quelles pages il peut ou ne peut pas explorer. Le sitemap XML (sitemap.xml) liste toutes les pages que vous souhaitez indexer, avec leur date de dernière modification et leur priorité. Ces deux fichiers sont fondamentaux pour guider le crawl.
Le maillage interne (liens entre vos pages) aide Googlebot à découvrir toutes les pages de votre site. Une page orpheline (sans lien interne pointant vers elle) risque de ne jamais être crawlée. La profondeur de clic (nombre de clics depuis la page d'accueil) impacte aussi le crawl : les pages à plus de 3 clics de profondeur sont crawlées moins fréquemment.
Pourquoi une page n'est-elle pas indexée ?
Plusieurs raisons peuvent empêcher l'indexation d'une page. La balise noindex dans le header HTML ou les meta tags indique explicitement à Google de ne pas indexer la page. Le fichier robots.txt peut bloquer le crawl. La page peut être en erreur 404 ou erreur 500. Le contenu peut être trop mince (thin content) ou dupliqué d'une autre page.
La qualité du contenu est aussi un facteur. Google décide activement de ne pas indexer les pages qu'il considère de faible valeur : contenu copié, pages sans intérêt pour l'utilisateur, pages boilerplate (CGV identiques partout). C'est le "crawled but not indexed" que vous voyez dans Google Search Console.
Google Search Console : votre outil d'indexation
Google Search Console (GSC) est l'outil gratuit de Google pour surveiller et gérer l'indexation de votre site. Le rapport Indexation > Pages montre combien de pages sont indexées, lesquelles ne le sont pas, et pourquoi. C'est l'outil de diagnostic le plus important pour le SEO technique.
L'outil Inspection d'URL permet de vérifier si une page spécifique est indexée et de demander une indexation manuelle (recrawl). Utile après la publication d'une nouvelle page ou la correction d'un problème. L'indexation après une demande manuelle prend généralement 24 à 72 heures.
Optimiser l'indexation de votre site
Soumettez votre sitemap XML dans Google Search Console. Créez un maillage interne solide : chaque page doit être accessible en 3 clics maximum depuis la page d'accueil. Corrigez les erreurs d'exploration (404, 500) signalées dans GSC. Évitez le contenu dupliqué en utilisant des balises canonical. Assurez-vous que votre site est rapide (Google crawle plus de pages sur les sites rapides).
Pour les gros sites, optimisez le budget de crawl : bloquez les pages sans valeur SEO (pages de filtre, pages de tri, pages de pagination) via le robots.txt ou la balise noindex, et gardez le budget de crawl pour les pages stratégiques.
L'indexation mobile-first
Depuis 2019, Google utilise le mobile-first indexing : c'est la version mobile de votre page qui est crawlée et indexée en priorité. Si votre version mobile a moins de contenu que la version desktop, c'est la version appauvrie qui sera indexée. Assurez-vous que le contenu est identique sur mobile et desktop.
Chez ConvertiLab, chaque site que nous créons est optimisé pour l'indexation : sitemap XML automatique, robots.txt configuré, maillage interne structuré, et monitoring via Google Search Console.
Exemples pratiques
Un e-commerce découvre via Search Console que 60% de ses fiches produits ne sont pas indexées à cause de contenu dupliqué — après réécriture des descriptions, 85% des pages sont indexées en 6 semaines.
Un blog soumet un sitemap XML à Google Search Console et ajoute du maillage interne — le temps moyen d'indexation de ses nouveaux articles passe de 2 semaines à 48 heures.
Un site vitrine bloquait involontairement ses pages de service via le robots.txt — la correction permet l'indexation et le site passe de 0 à 500 visites organiques/mois en 3 mois.
Questions fréquentes
Comment savoir si mes pages sont indexées par Google ?
Tapez 'site:votredomaine.fr' dans Google pour voir toutes les pages indexées. Pour une vérification précise, utilisez Google Search Console > Indexation > Pages, qui liste chaque URL avec son statut d'indexation et les éventuelles erreurs.
Combien de temps met Google pour indexer une nouvelle page ?
De quelques heures à plusieurs semaines selon l'autorité de votre site et la fréquence de crawl. Pour accélérer, soumettez l'URL dans Google Search Console via l'outil Inspection d'URL. Un site avec une forte autorité est crawlé quotidiennement, un nouveau site moins fréquemment.
Qu'est-ce qu'un sitemap XML et en ai-je besoin ?
Un sitemap XML est un fichier qui liste toutes les pages de votre site que vous souhaitez indexer. Il aide Google à découvrir toutes vos pages, surtout les plus profondes. Oui, chaque site en a besoin. Next.js et la plupart des CMS génèrent le sitemap automatiquement.
Besoin d'aide avec le Indexation ?
Nos experts vous accompagnent pour mettre en place une stratégie efficace. Obtenez un devis gratuit et personnalisé sous 24h.
Aller plus loin
Voir tout le glossaire marketing digitalDernière mise à jour : 6 avril 2026