Google Leaks : les secrets de l’algorithme Google dévoilés

Publié le 03/06/2024
Google Leaks : infos à retenir

Les Google Leaks, ces récentes fuites de documents internes de Google, ont levé un voile sur les véritables pratiques du géant de la technologie en matière de référencement naturel. Plus de 2500 pages de documentation confidentielle ont été révélées, dévoilant des contradictions frappantes entre les déclarations publiques de Google et les méthodes utilisées en coulisse pour classer les sites web.

Google Leaks en un coup d’œil : 12 points à retenir en SEO pour la création de contenus

Parmi les 14 000 critères de classement que contiennent les documents du « leak », voici un résumé en 12 points de ceux qu’il faut retenir.

  1. Existence probable de l’autorité de domaine
  • Google utiliserait une métrique semblable à l’« Autorité de Domaine », indiqué dans les documents par les termes « siteAuthority » et « authorityPromotion ».
  • Cela contredit les affirmations précédentes de Google niant l’utilisation d’une mesure d’autorité de domaine.
  1. Importance des clics
  • Les clics jouent un rôle significatif dans le classement des résultats de recherche.
  • Google utilise des données de clic pour évaluer la pertinence et la qualité des pages.
  • Des systèmes comme NavBoost ajustent le classement basé sur la qualité des interactions des utilisateurs (les clics des utilisateurs sont perçus comme des votes).
  1. Probabilité de l’existence d’une ‘Sandbox’
  • Les documents indiquent l’utilisation de la métrique « hostAge », ce qui suggère un délai avant qu’un nouveau site puisse se classer favorablement, ce qu’on appelle communément ‘sandbox’.
  1. Utilisation des données de Chrome pour le classement des pages
  • Malgré les dénégations antérieures, il semble que Google utilise des données provenant du navigateur Chrome pour le classement des sites dans la SERP.
  1. Diversité des algorithmes de classement
  • Google n’utilise pas un seul algorithme de classement mais plusieurs microservices spécialisés pour différentes fonctions comme le crawl, l’indexation, le rendu, et plus.
  1. Importance du texte d’ancrage
  • Google utilise le texte d’ancre des liens pour mesurer la pertinence et la qualité des liens, et ajuste le classement en fonction de la pertinence du texte d’ancre avec le contenu du site cible.
  1. Google pourrait vous déclasser
  • Des « démotions » (que l’on peut traduire par “rétrogradations ») sont mentionnées dans les documents, indiquant que certains facteurs pourraient significativement abaisser le classement d’un site.
  • Les démotions concernent des problèmes tels que les discordances entre le texte d’ancre d’un backlink et le contenu du site lié, une mauvaise navigation ou expérience utilisateur, et les domaines à correspondance exacte (exact match domain – EMD) pouvant être considérés comme « spammy ».
  1. Importance du contenu : longueur et fraîcheur
  • Google mesure l’originalité du contenu en utilisant un système de tokens (mots) et privilégie les informations placées en haut de la page.
  • Google utilise plusieurs métriques pour évaluer la fraîcheur du contenu et favorise les contenus mis à jour régulièrement.
  • L’originalité du contenu court est également prises en compte par le « OriginalContentScore ».
  1. Importance des backlinks persiste
  • Les documents fuités ne montrent aucune indication que l’importance des liens entrants a diminué.
  • Les backlinks jouent un rôle clé dans de nombreux facteurs et modifications de classement mentionnés.
  1. Impact du trafic sur la valeur des liens
  • Les liens provenant de pages qui génèrent du trafic web sont classés comme de haute qualité et influencent positivement le classement, tandis que ceux de pages sans trafic sont considérés de basse qualité.
  1. Vitesse de création de backlinks
  • Google suit la vitesse et le volume de nouveaux backlinks pour distinguer entre une croissance de liens authentique et des tentatives de manipulation des classements.
  1. Suivi des modifications sur votre site
  • Google stocke différentes versions des pages web au fil du temps, semblable à la Wayback Machine, et utilise ces données pour comprendre les modifications et leur contexte.

⚠️ Besoin de faire le point sur votre connaissance du SEO ? Passez le quiz !

Une fuite de 2500 pages de documents confidentiels

Il y a quelques jours, un événement apparemment banal a secoué le monde du SEO : une mauvaise gestion interne chez Google a rendu publics plus de 2500 pages de documentation secrète de l’API Google Search. 

Cette fuite, surnommée « Google Leaks », a révélé des pratiques de référencement jusqu’alors cachées, et a attiré rapidement l’attention de figures éminentes du secteur telles que Rand Fishkin et Mike King. Ces experts ont minutieusement analysé et divulgué leurs découvertes sur leurs comptes sociaux.

La première réaction de Google fut un silence obstiné, ignorant les demandes d’explications de médias influents comme The Verge. Ce n’est qu’après une avalanche de spéculations que Davis Thompson, porte-parole de Google, a reconnu l’authenticité des documents. Toutefois, il a tenté de minimiser leur portée en prétendant que les informations pouvaient être obsolètes ou mal interprétées. Cette tentative de diminuer l’importance des fuites n’a évidemment fait qu’intensifier l’intérêt du public et des professionnels, puisque cela mettait en évidence le décalage entre les déclarations publiques de Google et ses méthodes réelles.

Google Leaks : ce que Google se gardait de nous dire

L’une des révélations les plus frappantes de ces documents concerne l’utilisation extensive des données de clics et des comportements post-clic pour classer les pages. Contrairement à ce que Google avait déclaré, ces données liées aux clics des utilisateurs jouent un rôle certain dans le système de classement Navboost, qui distingue les bons clics des mauvais et enregistre la date du dernier bon clic.

Ce mécanisme influence directement la visibilité et la pertinence du contenu. Cela démontre une approche beaucoup plus réactive à l’interaction utilisateur que ce que le géant américain nous laissait jusqu’à présent penser.

Les fuites révèlent également l’existence d’une fonctionnalité appelée « site Authority ». Malgré les dénégations antérieures de Google, l’autorité du site est donc effectivement un facteur pris en compte dans l’algorithme. De plus, l’utilisation d’un attribut « Hostage » pour limiter le classement des nouveaux sites jusqu’à ce qu’ils soient jugés fiables confirme l’existence d’une forme de sandboxing, qui affecte les nouveaux venus sur le web.

Un autre point majeur concerne la personnalisation des résultats de recherche basée sur le comportement régional et démographique. Le système Navboost ajuste les résultats en fonction des actions des utilisateurs dans des zones géographiques ou au sein de groupes démographiques spécifiques. Cette personnalisation va bien au-delà de l’historique individuel de recherche et recherche davantage de tendances comportementales de ces groupes.

Enfin, l’importance des auteurs et de l’E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) est mise en lumière. Google enregistre explicitement l’identité des auteurs et les entités associées, renforçant ainsi l’importance de ces critères dans l’évaluation du contenu. Cela valide la nécessité croissante pour les créateurs de contenu de montrer pattes blanches à Google, en démontrant de manière formelle sur leur site leur(s) expertise(s).

A travers ces Google Leaks, on voit que le géant américain s’active en coulisse, et en fait bien plus en termes de profilage et d’analyses de données comportementales que ce qu’il nous laisse entendre. Sans remettre pour autant le monde du SEO en cause, cela nous donne davantage de clés pour adapter nos stratégies de référencement.

les données de clics des utilisateurs comptent dans l'algorithme Google

Les règles du jeu ont (légèrement) changé

C’est notamment vrai concernant la révélation que Google utilise intensément les données de clics pour influencer les classements. Désormais, les professionnels du SEO doivent se concentrer sur l’optimisation de l’engagement utilisateur pour encourager des interactions positives, à travers des expériences utilisateur intuitives qui non seulement retiennent l’attention, mais encouragent également les clics « positifs » et les interactions prolongées.

La confirmation de l’importance de l’attribut « site Authority » par Google souligne par ailleurs que construire l’autorité d’un site est plus crucial que jamais. Pour cela, il est essentiel de publier régulièrement du contenu de haute qualité, de collaborer avec des sites reconnus et respectés, et de s’efforcer d’obtenir des backlinks de qualité. Investir dans la consolidation de la réputation en ligne à travers des avis positifs et des témoignages authentiques se révèle également important. En bref, vous devez construire votre marque.

En matière de contenu, Google valorise l’E-E-A-T, ce qui demande une attention méticuleuse à la qualité du contenu publié. Chaque article ou vidéo doit démontrer une expertise indéniable, refléter une autorité dans le domaine concerné et fournir des informations fiables et vérifiables. Cela implique également de mettre en avant les qualifications des auteurs et de citer des sources crédibles.

L’ajustement des contenus pour répondre aux mécanismes de personnalisation de Google, comme ceux du système Navboost, peut nécessiter une analyse fine des données démographiques des utilisateurs pour adapter les messages de manière plus ciblée, ce qui peut notamment avoir un impact en termes de content marketing.

Arnaud Anselmet - Conseils Rédaction Web

Écrit par : Arnaud

Je suis spécialiste en création de contenus web, et fondateur de Conseils Rédaction Web. Je vous partage mes trouvailles en tant que professionnel de la rédaction web, et j'essaie au maximum de les soutenir avec de la data. J'ai un passé littéraire, mais finalement, j'aime les chiffres autant que les lettres ! Mon seul but à travers ce blog : rédiger des articles qui vous permettent de mieux comprendre les procédés de création de contenu et le SEO.
Arnaud Anselmet - Conseils Rédaction Web

Écrit par Arnaud

Je suis spécialiste en création de contenus web, et fondateur de Conseils Rédaction Web. Je vous partage mes trouvailles en tant que professionnel de la rédaction web, et j'essaie au maximum de les soutenir avec de la data. J'ai un passé littéraire, mais finalement, j'aime les chiffres autant que les lettres ! Mon seul but à travers ce blog : rédiger des articles qui vous permettent de mieux comprendre les procédés de création de contenu et le SEO.
formation SEO et rédaction web
Formation SEO proposée par Conseils Rédaction Web et le CFPJ
Actus ChatGPT
Retrouvez les dernières actualités sur l'IA générative et ChatGPT
Les meilleurs prompts CHATGPT pour vos emailings
quiz seo
Testez vos connaissances en SEO

D’autres articles intéressants :

0 commentaires

Trackbacks/Pingbacks

  1. La balise title en SEO: tout savoir | Conseils Rédaction Web - […] que l’algorithme de Google (dont on en a appris beaucoup plus sur son fonctionnement avec les Google Leaks) utilise…
  2. Les 7 meilleures formations de rédaction SEO | Conseils Rédaction Web - […] dans cet article sont accessibles au plus grand nombre. Il s’agit en réalité de comprendre comment fonctionne réellement l’algorithme…

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *