On entend beaucoup parler de Rankbrain depuis quelques mois, même si Google a officialisé cet algorithme en 2015. Mais que change Rankbrain en pratique, pour votre stratégie SEO, et comment le mettre en pratique? Voici quelques conseils.
Qu’est-ce que Rankbrain : rappels
Rankbrain est un algorithme d’intelligence artificielle, qui s’ajoute aux principaux algorithmes de classement de Google. Comme nous l’avions expliqué dans notre première tentative de définition de Rankrain, il ne faut pas le voir comme un filtre, ou comme une pénalité, mais plutôt comme un nouvel ajustement, ou facteur du moteur de recherche.
Rankbrain fonctionne donc avec de l’intelligence artificielle, en cela qu’il aide les résultats de recherche de Google à comprendre ce que vous cherchez – s’il ne connaît pas la requête que vous tapez, ce qui arrive tout de même fréquemment ! – et si la page répond bien à la demande. Rankbrain est capable d’apprendre et d’évoluer sans intervention humaine, a priori.
Pour résumer, Rankbrain permet à Google de devenir adaptatif, donc plus intelligent.
Pourquoi Google a besoin de Rankbrain
Dès son apparition, Rankbrain a pris beaucoup d’importance chez Google : il doit bien y avoir une raison. On lit même souvent (bien que l’information ne soit pas récente) que c’est le 3ème facteur de classement pour Google, en ordre d’importance, après le contenu et les liens externes.
Avant 2015, Google s’apercevait qu’environ 15% des requêtes tapées (ou dictées) par les internautes n’avaient jamais été tapées auparavant. Elles n’étaient pas connues par le moteur, et Google ne savait donc pas les traiter avec précision. Or, 15% correspondait tout de même à 500 millions de requêtes par jour ! En 2007, ce taux était de 20 à 25% !
Comment Google traitait ces requêtes inconnues ? Dans certains cas, il se basait sur le “knowledge graph” pour identifier les entités nommées de la requête : lieux, entreprises, événements, etc. Mais cela ne suffisait pas toujours. Il lui fallait une intelligence pour deviner le sens des mots.
C’est alors qu’a été développé Rankbrain : le nouveau cerveau du moteur de la Mountain View.
Sa particularité : s’adapter et apprendre de ses erreurs. En effet, l’intelligence artificielle utilisée dans Rankbrain lui permet d’évoluer. Vous tapez une requête, Google vous donne une première page de résultats. Jusqu’ici, tout est normal. Mais Rankbrain prend en compte plusieurs paramètres nouveaux, par rapport aux critères SEO classiques (les critères on-page et off-page) :
- au lieu de présenter des pages qui contiennent les mots de la recherche, l’algorithme essaie de comprendre le sens de ces mots, le sens de votre question latente, et vous proposera des résultats qui semblent correspondre à votre question. C’est notamment le cas des recherches assez imprécises, telles que “quel est le cri du hibou” ou “pourquoi les jaguars sont noirs”. Nous n’allons pas développer ici la méthode employée, mais il faut surtout retenir que RankBrain apprend à lier les mots entre eux en les regroupant en concepts, en étudiant la manière dont les mots qu’il connaît sont reliés entre eux dans les contenus. Il arrive ainsi à mettre en relation les termes “jaguar noir” à “Mélanisme”.
- la satisfaction utilisateur : RankBrain observe de quelle manière les internautes interagissent avec les pages pour savoir si vous êtes satisfaits ou non du résultat proposé. Il utilise pour cela tout un panel de paramètres, car on ne peut rien cacher à Google : le taux de clics organique, le temps passé, l’effet “pogo-sticking” (fait de revenir rapidement à la recherche Google et à consulter d’autres résultats), etc.
Qu’est-ce que ça change en pratique ?
Comprendre l’algorithme pour s’adapter
Les deux paramètres exposés impliquent 2 conséquences directes pour vos stratégies SEO.
D’une part, il n’est plus pertinent de viser la répétition d’un mot clé dans une page pour être perçu comme pertinent sur le sujet. Au contraire… Le “spam de mots clés” peut être pénalisé, et cela n’aide en rien à comprendre le sujet de la page.
Votre page sera perçue comme pertinente, sur une requête, si :
- elle a un contenu riche, qui comporte les expressions pertinentes pour “appuyer” le concept qui se cache derrière la requête;
- elle répond correctement à la recherche de l’utilisateur, à son attente, son intention;
- elle satisfait l’utilisateur : rapide à s’afficher, elle donne envie de lire, de cliquer, de scroller, etc.
En d’autres termes, si votre page ressort involontairement sur une requête qui ne lui correspond pas, la déception de l’utilisateur permettra à RankBrain d’apprendre que la page n’a pas sa place dans les résultats de cette recherche – pour un utilisateur donné, ou pour tout le monde. A une époque, il suffisait de faire une page optimisée sur le terme “dailymotion” placé dans l’url, la balise title, le H1 et 20 fois dans le contenu pour réussir à ressortir dans les premières pages de Google (j’ai même connu un site de type “annuaires” qui était classé 2ème sur “yahoo.com”). Mais puisque l’internaute qui cherche ce terme recherche le site lui-même, ou au pire des vidéos, et non un annuaire ou une bête page optimisée, la page “trompait” l’utilisateur, ou plutôt, le moteur de recherche.
Pertinence et adéquation du contenu
Le conseil le plus important pour s’adapter à Rankbrain est donc de rédiger le contenu d’une page en sachant ce dont on parle – un peu comme le fait Wikipedia – et en utilisant un vocabulaire en rapport avec le thème, le concept. Bien entendu, on ne vise jamais plusieurs mots clés complètement différents sur une page : par exemple, une page ne peux pas à la fois parler de “séries Netflix” et de “jeux vidéos”… Ou alors, elle parle des séries disponibles en VOD en général, et parlera de Netflix et d’Amazon, qui sont tous les deux des entités nommées en rapport avec le sujet.
En effet, les entités nommées sont un bon moyen de donner des indices à RankBrain pour comprendre le sujet dont vous parlez. On ne peut écrire, par exemple, un article sur Harry Potter sans nommer J.K. Rowling, Dumbledore, Hermione, Poudlard, etc.
Les entités nommées aident RankBrain à supprimer toute ambiguité sur le sujet de la page : quand vous parlez des jaguars, parlez vous de ceux du Zoo de la Flèche, ceux qui jouent au foot à Jacksonville ou encore d’une berline ?…
Il existe plusieurs outils pour rechercher les entités nommées dans un texte ou sur un sujet : citons l’outil TextRazor, ou encore le détecteur d’entités de la Toolbox OnCrawl.
Une autre manière d’enrichir votre contenu est de rechercher des termes sémantiquement proches, pour les moteurs, de votre sujet : c’est ce qu’on appelle le LSI pour “Latent Semantic Indexing” : une méthode utilisée pour déterminer la relation entre les termes et les concepts dans le contenu. C’est ce qui permet d’obtenir une sorte “d’empreinte” autour d’un terme, qui bien souvent le définit, et qui permet à Google de répondre correctement à des questions telles que “quelle est la planète rouge” ou “comment s’appelle l’acteur chauve mort” (vous pensiez à Yul Brynner mais aviez un trou de mémoire ?).
De nombreux outils SEO sont apparus dans le but de réaliser des analyses sémantiques automatisées, ces dernières années, preuve que le sujet a le vent en poupe sur le web : textfocus.net, cocon.se pour ne citer qu’eux.
Exemple : moi qui suis fan de jeux de société, je dois écrire un article qui explique les règles du jeu “Flamme Rouge”. Si je fais ma recherche sur “Flamme Rouge”, je vais découvrir des termes intéressants, mais qui ne seront pas assez orientés vers le jeu de société : tour, arrivée, cyclistes, premier, etc.
Par contre, une recherche sur “Flamme rouge jeu société” me donne des idées de contenu plus ciblés sur ce dont je veux parler : cartes, joueurs, tactique, cases, règles, aspiration (un des points de règles du jeu), etc.
Satisfaction utilisateur
Pour terminer, il faut penser à améliorer la satisfaction de l’internaute par tous les moyens : rapidité d’affichage de la page, qualité de l’écriture, avoir une courte introduction qui donne envie de continuer, etc. Ce point est un sujet d’article à lui tout seul !