Connaitre le nombre exact de pages indexées


C’est une question récurrente sur les forums de référencement car avec la commande « site: » il se produit des effets pour le moins aléatoire comme ceci:

Indexation de phpsources.org (Je prends mon site de ressources sur le PHP comme référence tout au long de ce tutoriel)

google-bl1Google donne le nombre de 4 120 pages indexées. Cela semble assez bon mais quand le lendemain je lance la même requête j’obtiens un nombre différent:
google-bl2

Aujourd’hui je n’ai plus que 3 530 pages dans l’index de Google. Un nombre qui fluctue selon les jours. Comment donner à une entreprise ou à un chef de projet de tel chiffre sans se faire passer pour un crétin ?
Pour solutionner ce problème il existe un moyen pertinent d’obtenir le nombre de pages indexées dans Google. Un moyen beaucoup plus pertinent que la commande « site: » et je vais vous guider à travers Analytics pour obtenir le nombre réel de pages indexées par Google.

Étape 1: Allez aux sources de trafic dans votre Analytics

nombre-de-backlink1

Cliquez sur le lien « Sources de trafic » dans Analytics

Étape 2: Allez sur toutes les sources de trafic

nombre-de-backlink2

Nous voulons savoir combien de pages les moteurs de recherche ont indexés, donc la prochaine étape est d’aller sélectionne un moteur

Étape 3: Choisissez un moteur

nombre-de-backlink3

Choisissez le moteur d’indexation de données que vous souhaitez et cliquez.

Étape 4: Filtrer selon les pages de destinations

nombre-de-backlink4

Sélectionnez dans le menu déroulant « Mot clé » le lien « Sources de trafic « puis allez sur « page de destination « qui sont les pages atteintes en premiers par les visiteurs. Vous avez maintenant le nombre de pages qui ont reçus du trafic.

Étape 5: Ce résultat indique le nombre de pages uniques

nombre-de-backlink5

Et voilà!! Avec ce résultat qui indique le nombre de pages uniques ayant reçu au moins 1 visite à partir de recherches effectuées sur Google Search vous avez le Saint Graal de l’indexation!

Vous pouvez répétez cette opération le lendemain, le surlendemain et vous verrez que le nombre reste similaire. Cette méthode n’est pas parfaite mais au vu des résultats obtenus par la commande « site: » vous avez maintenant un nombre beaucoup plus objectif. Mon expérience m’a montré que certain sites pouvaient avoir 10 000 pages d’indexées avec seulement moins de 1 000 pages qui recevaient des visites régulières. Il faut savoir que Google peut indexer des pages mais si certaines pages n’ont aucun poids, ou sont des duplicatas de contenus, ou encore comportent trop de liens morts, ou bien ces pages n’ont aucun mots-clés intéressants. Alors dans ces cas particuliers ces pages n’ont aucune chance de ressortir dans les pages de résultats des moteurs. Vous pouvez entreprendre soit d’archiver ou de corriger ces pages. Et de réactualiser votre sitemap en fonction des corrections.

Je sais que de nombreux référenceurs sont abdiquent à la commande « site: » et s’en servent pour mesurer les progrès d’indexation des urls mais j’espère que ce tutoriel leur fera changer d’avis sur la méthode à employer pour mesurer avec exactitude le nombre de pages indexées par Google, pages ayant un réel potentiel de visites.

Bonne indexation !