Google, SERP, ratio supplemental et le duplicate content
Et oui les SERP (résultats de recherche) bougent, l’index moteurs de recherche est vivant et cela peut effrayer.
Voici un rappel pour mieux comprendre les résultats de la commande « site : » (qui fonctionne sous Google, Yahoo et Bing) et comment comprendre si le site est en hausse ou baisse, en crawl complet, etc…
http://www.google.fr/search?hl=fr&safe=off&q=site:google.fr
Tout d’abord un peu de technique, il existe plusieurs index dans l’index Google :
- L’index total (toutes les pages crawlées totales) : http://www.google.fr/search?q=site:www.patricealbertus.net
- L’index principal – ou main index - (vos pages distribuées pour les requêtes) : http://www.google.fr/search?q=site:www.patricealbertus.net/*
- et pour la surprise… allinurl:www.patricealbertus.net site:www.patricealbertus.net
!Attention! : Bien que Matt Cutts ne l’ai pas confirmé explicitement (à son évasive habitude…), les anciennes commandes type « site:www.yoursite.com *** -sljktf » ont bien été désactivées par Google.
La différence entre le total et le main permettra de connaître l’état des vos pages dans l’index supplemental (index en cours de qualification). Et de ce nombre on pourra ainsi calculer un ratio, le supplemental ratio qui permet de savoir combien de % du site est en validation, plus ce taux est bas et mieux est l’indice de qualité pour Google.
Cas de ce blog (sous www.) :
Principal : 92
Total : 810
Supplemental : 810- 92 = 718
Ratio supplemental : 718 / 810 = 88%
…un ration si élevé souligne un maillage trop important par rapport au contenu unique, je vais de ce pas désactiver les fonctions Simple Tags qui créent des tags à tout va ;-)
Un ratio idéal sera 0%. Il est plus souvent au delà pour des raisons précises : Refonte de site, transfert de DNS, les moteurs font un big crawl (indexation de la totalité du site pour qualifier de nouvelles pages, ceci arrive des cycles réguliers selon l’autorité du domaine). Et lors de ce big crawl, le ratio sera très élevé, puis il va baisser au fur et à mesure de l’analyse pour se stabiliser, c’est là qu’il faut garder la mesure (je n’ai a ce jour pas encore trouvé de benchmark pertinent, mais sachez que cela varie beaucoup, les sites e-commerce ayant beaucoup de pages en supplemental, car beaucoup de pages identiques avec des affinages , Google privilégie les pages contenus uniques telles les offres produits). En attendant pensez à bien utiliser le récent tag « canonical » sur vos pages type recherche et affinage pour réduire votre supplemental et mettre en avant la page par défaut.
Vous avez trouvé ce contenu Pertinent?
Alors, Abonnez-vous au flux RSS de ce blog pour continuer à suivre les derniers articles sur le SEO, les évolution référencement naturel ou encore les outils Wordpress














5 commentaires pour “ Google, SERP, ratio supplemental et le duplicate content ”
Justement
Je suis (suivre) l’indexation de mes sites semaine par semaine mais depuis la fin septembre la formule site:www…… donne des résultats 10 fois trop importants comme si tout l’historique du site (les changments d’URL, les page supprimées, les noindex…) était indexé à nouveau. Et je ne suis pas le seul à l’avoir remarqué.
Le ration index-main/index-total s’en trouve affaibli (le trafic est resté bien orienté).
Coté MAIN INDEX, je préfère une requête dans AOL ou FREE (mêmes estimations) pourtant j’ai à nouveau testé les combinaisons de formules site:…. + allinurl:…..sans être convaincu.
David C.
Effectivement, Google à son habitude joue au chat et à la souris avec les référenceurs. Je te conseille de créer un log à mettre à jour régulièrement pour déceler les pattern type « big crawl » qui font exploser les SERPs et avoir une vision d’ensemble du googlebot.
En voici un modèle : http://spreadsheets.google.com/pub?key=toPi924RIcvlswU_hNMxaVw&output=xls
Effectivement j’ai un bookmark indexation avec l’excel qui suit, l’idéal serait un script automatique d’interrogation (J’ai 8 sites à suivre…)
Ceux qui savent faire ça ont des taches + rentables pour l’instant.
@+
David
@David : Voici un petit test [http://www.patricealbertus.net/seoreport.php] à partir d’un script fourni par [http://www.phpeasycode.com/seoreport/]. Reste plus qu’à encapsuler toutes ces données en XML et venir les insérer chaque semaine dans un Excel !
Trackbacks