Le Knowledge Graph : dommages collatéraux dans les résultats Google ?

Par  le 17 décembre 2012 - 11:04 dans

Knowledge GraphSuite à la mise en place du Knowledge Graph (« graphe du savoir ») en France la semaine dernière et après quelques constatations sur la manière d’en tirer partie grâce à Google Images, nous avons étudié plus spécifiquement quelques groupes de mots clés afin déterminer les sites qui pouvaient potentiellement être affectés en terme de visibilité dans les résultats naturels avec l’arrivée du Knowledge Graph (KG).

Quels sont les sites impactés par le Knowledge Graph ?

Les requêtes faisant apparaître ce nouveau bloc pouvant être de différentes natures, nous avons fait une étude sur les requêtes générant le plus de pages vues sur Wikipedia France ainsi que sur des requêtes plus spécifiques dans un deuxième temps (lieux géographiques, films et célébrités).

Top des pages vues sur Wikipedia FR

Le premier test concerne des requêtes généralistes sur les titres de pages Wikipedia France  (ex: Harry Potter, Paris, Victor Hugo, Maroc, Glee…) les plus vues le mois dernier (source: http://stats.grok.se/fr/top): plus de la moitié de ces requêtes affichent un bloc du Knowledge Graph (KG). On remarque d’ailleurs que les sites qui ressortent sur ces résultats sont des types de requêtes couvertes par le nouvel outil de Google, à savoir:

  • Personnes célèbres: linternaute.com, evene.fr, free.fr
  • Lieux géographiques, monuments célèbres: lemonde.fr, routard.com, free.fr
  • Films, séries TV: allocine.fr

Mots-clés de type « lieux géographiques »

Concernant les mots-clés géographiques (continents, pays, capitales), la quasi totalité d’entre-eux déclenchent un bloc du KG. Pour les quelques mots clés restants, un bloc du KG est bien présent dans les pages de résultats mais il correspond à du raffinement de requêtes ne présentant aucun lien sortant (ex: ChypreGeorgetown). Nous constatons également aucune apparition du bloc Google Maps qui est présent en réalité: il a été absorbé par le Knowledge Graph pour ces requêtes.

De grands sites ressortent sur ces requêtes géographiques à côté du KG comme www.routard.com, www.tripadvisor.com, ou encore diplomatie.gouv.fr, tameteo.com et 24timezones.com. Ils risquent d’ailleurs de voir leur visibilité diminuer sur ces requêtes avec du potentiel de trafic.

Le site d’actualité « Le Monde » est également assez bien positionné, mais comme il ressort souvent dans un cluster de Google Actus (présent pour la majorité des mots-clés de type « lieux géographiques » étudiés), l’impact sera plus faible pour ce site : le Knowledge Graph n’interdit pas la navigation et n’empêche pas l’internaute de cliquer dans les résultats naturels, d’autant plus pour le bloc Actus, plus visible.

Le site du « Routard » se retrouve en deuxième position dans les pages de résultats sur des dizaines de requêtes de type « Pays », qui ont un volume de recherche relativement important, ce qui nous laisse à penser une baisse du taux de clic probable sur ces requêtes, pour les internautes recherchant des informations succinctes uniquement:

Requêtes pour lesquelles le Routard est en deuxième position sur Google
Quand à Wikipédia qui est le site le plus visible dans Google sur les ces mots clés « lieux géographiques », cela ne change à priori pas trop la donne puisqu’un lien vers Wikipédia est généralement présent dans le bloc du KG lié à la requête, les internautes souhaitant aller plus loin iront sur Wikipédia.

Mots-clés de type « films »

Pour les mots clés correspondant à des titres de films connus (Français et étrangers), un bloc du KG apparaît environ 3 fois sur 4. Parmi les sites les plus présents dans les résultats organiques, nous retrouvons Allociné, IMBD mais aussi Première pour qui le Knowledge Graph représente une sacrée zone d’ombre.

Pirates des caraibes dans le Knowledge Graph

Bien que les informations proposées soient assez succinctes et variables d’un film à l’autre (court résumé, réalisateur, scénario, budget et acteurs principaux…), elles conviendront à de nombreux internautes qui souhaitent uniquement consulter le casting par exemple (un bouton « Plus » permet parfois de dérouler la liste, cf. capture d’écran) ou avoir une vision simple et globale  du film, ce qui représente une baisse de trafic potentielle pour ces sites de cinéma.

Cela est d’autant plus problématique vu le système de navigation interne à Google qui permet à l’internaute de naviguer d’un film à l’autre, d’un acteur à l’autre via le bloc KG mais également la barre de navigation horizontale du KG:

navigation horizontale du knowledge-graph

L’oeil reste plus naturellement fixé sur cette partie supérieure de l’écran et colonne de droite, qui comportent de nombreuses images, délaissant probablement une grande partie des résultats organiques. Une étude d’eye-tracking serait d’ailleurs très intéressante sur ce sujet.

Ces sites spécialisés bénéficient malgré tout de liens dans le bloc du KG grâce à Google Images, ce qui reste assez limité par rapport au trafic qui pouvait précédemment être généré via les résultats organiques de la partie centrale. Voici les principaux sites qui bénéficient de liens dans le KG sur les requêtes de type « Titre de films » :

  • imdb.com
  • blogspot.com
  • allocine.fr
  • wordpress.com
  • toutlecine.com
  • free.fr
  • cinemapassion.com
  • tumblr.com
  • cinemotions.com

Les sites personnels hébergés sur les plateformes comme Blogspot, WordPress.com, Tumblr ainsi que les pages perso de Free ont réussi à se frayer une petite place dans le Knowledge Graph ! Probablement une piste d’optimisation à suivre avec des données bien structurées.

Mots clés de type « chanteurs/chanteuses/groupes de musique »

Là encore, le bloc du Knowledge Graph est relativement complet en proposant entre autres une courte biographie, les meilleurs morceaux ainsi que les évènements à venir (shows, concerts). La navigation est possible entre les morceaux, albums qui font apparaître la barre de navigation horizontale proposant d’autres albums (ou les morceaux au sein d’un même album) ainsi que via les liens des membres du groupe :

Miossec navigation par titre dans les pages de résultats

La page de résultats à beau se rafraîchir,  on reste malgré tout dans cet environnement avec un bloc du KG qui s’impose dans les SERP.

On notera toutefois que les liens vers les évènements à venir peuvent présenter une belle opportunité pour les sites de vente de billets en ligne puisque les pages de résultats qui suivent n’ont pas forcément de blocs du KG (excepté pour les lieux connus), l’analyse du format des requêtes utilisées dans les liens est donc une piste d’optimisation intéressante. Ex: « coldplay, barclays center, new york, 30 déc. » ou encore « madonna, el monumental stadium, buenos aires, 13 déc.« .

De la même manière, sur une requête « Britney Spears », le bloc du KG apparaît bien, mais les liens du bloc vers des morceaux spécifiques de la chanteuses modifient légèrement la requête initiale effectuée par l’internaute en ajoutant le mot « biographie »: « biographie de britney spears toxic ». Une fois encore, une piste d’optimisation potentielle à prendre en compte via l’analyse des requêtes générées par les liens présents dans le KG.

biographie Britney Spears Toxic

Comme nous l’avons constaté sur les titres de films précédemment, les requêtes sur les chanteurs, chanteuses et groupes de musique risquent également de réduire la visibilité de certains sites. Avec cette logique de Google de vouloir toujours conserver l’internaute dans ses pages de résultats en le faisant naviguer via une suite de requêtes dans sa bulle du Knowledge Graph, voici les sites qui risquent d’être impactés:

  • deezer.com
  • facebook.com
  • myspace.com
  • twitter.com
  • purepeople.com
  • musicme.com
  • paroles2chansons.com
  • ados.fr
  • dailymotion.com

On compte parmi eux les sites musicaux comme deezer.com, myspace.com, musicme.com  pour qui le CTR sera probablement affecté (internautes non curieux se limitant aux informations du graph) mais également les réseaux sociaux Twitter et Facebook avec les comptes/pages officiels de nos chanteurs préférés. Google arrive donc à réduire la visibilité de son concurrent Facebook grâce aux différents informations agrégés via Wikipedia, Freebase et autres contenus piochées au fil de son crawl, tout en présentant plus d’Adwords à l’internaute.

Cette baisse de visibilité pour certains sites bénéficie à d’autres sites qui obtiennent des liens à l’intérieur du KG (via Google Images) dont:

  • lastfm.fr
  • aufeminin.com
  • blogspot.com
  • last.fm
  • centerblog.net
  • purepeople.com (assez présent dans les résultats organiques)
  • stars-celebrites.com
  • jukebo.fr
  • imdb.com

« Aufeminin.com » remonte plutôt bien en étant présent dans le KG environ une fois sur cinq pour les mots clés de cette catégorie, ainsi que lastfm.fr qui remontait mois bien dans les résultats SEO: une nouvelle source de trafic pour ce site également.

Quelques constatations sur le Knowledge Graph

Lors de cette étude, voici les principaux éléments que nous avons noté par rapport au « graphe du savoir »: des incohérences, des absents et privilégiés du KG .

Quelques incohérences

Les recherches associées nous réservent parfois des surprises. Alors qu’une recherche sur la Tour Eiffel nous remonte des monuments et lieux parisiens célèbres, les Gorges du Verdon font leur apparition entre l’île de la cité et le cimetière du Père-Lachaise, après tout cela donne un côté un peu plus nature à Paris :-) tour eiffel associée aux gorges du verdon

Des problèmes de parseur

Wikipédia étant la principale source d’informations du KG, nous avons constaté que des pages de l’encyclopédie libre anormalement conçues pouvaient troubler le parseur chargé d’aspirer les articles de ce site.

wikipedia Portugal

Portugal dans le Knowledge GraphSur la requête « Portugal », comme le début de la page Wikipédia commence par un lien vers Geo-Hack avec des coordonnées GPS, c’est le début du bloc de droite de la page avec les différentes traductions de « République du Portugal » qui fait son apparition dans le Knowledge Graph, à la place d’une courte présentation du pays comme c’est le cas pour les autres, petit raté…

Des privilégiés? des défavorisés?

Jacques dans le KG

Une requête sur le prénom « Jacques » sur Google remonte un bloc de raffinement de recherche du KG pour Jacques Chirac uniquement. On aurait pu penser que cette recherche était un terme associée à Jacques Chirac, nous avons donc vérifié cette information dans Google Trends. « Jacques Chirac » ne remonte pas. Pourquoi Jacques Prévert ne ressort-il pas ? Ou « Jacques Brel » pour qui le volume de recherche mensuel est bien supérieur ? Un lien avec le taux de clic sur la page Wikipédia de Jacques Chirac sur la requête « Jacques » peut être…

Le cassis (fruit) aurait bien eu sa place dans le KG, à côté de la ville de Cassis. Il n’en est rien. Le KG n’était pas censé proposer à l’internaute plusieurs résultats en cas d’homonymes ou quand un terme est ambigu via un bloc de raffinement de recherche ? La fraise ou la groseille ont quant à elles droit à un bel encart du KG en tant que fruit, là où la requête sur « cassis » ne propose que des informations sur la ville.

Là ou Pierre a le droit d’être un apôtre du Christ dans les pages de résultats via le KG, Jean n’est qu’un bout de tissus tant il y a d’annonce pour le célèbre pantalon Jean’s…Le film Taxi lui pourtant très populaire n’apparaît pas, excepté pour une requête plus spécifique sur « taxi film ».

Le nouvel outil de Google a encore beaucoup de choses à apprendre, il est jeune!

Adwords, au coeur du Knowledge Graph

Sri lanka AdwordsAlors que plusieurs sites risquent de voir leur trafic baisser comme nous l’avons vu précédemment, cette surcouche de navigation appelée Knowledge Graph est livrée à l’internaute pour qu’il se complaise dans les SERP, avec des informations (image, texte, liens) pour qu’il reste le plus longtemps possible confiné dans l’univers Google, tout en lui proposant des annonces Adwords.

Dans ce cas, le bloc du KG se trouve réduit et les annonces prennent place sous le bloc: Sri Lanka, Chat, Madagascar renvoient bien des annonces Adwords. La barre de navigation horizontale offre aussi de la visibilité aux blocs Adwords qui se trouve en haut du contenu central. Bref, les pages de résultats sont bien pensés et le KG ne vient pas empiéter le territoire d’Adwords, il vient juste l’habiller…

Comment en tirer profit?

Alors que ce nouveau bloc imposant peut provoquer une zone d’ombre sur de nombreuses requêtes pour plusieurs sites dans les pages de résultats, il permet à d’autres sites de gagner en visibilité via les blocs d’images.

Google Images reste à priori la principale piste pour apparaître dans le bloc du KG, mais nous y voyons également une opportunité dans les requêtes générés par les liens présents dans le bloc du KG, qui pourraient permettre des optimisations SEO en fonction des requêtes Google crées par le moteur du Knowledge Graph.

Ajouter le votre
12 commentaires
Mathieu 17 décembre 2012 - 12:02 - Répondre

Le fait de voir apparaître les « Gorges du Verdon » sur une requête « Tour Eiffel » peut semble étonnant, car le seul point d’union semble être le « tourisme ».
Mais en creusant un peu, on se rend compte que lorsque les Gorges du Verdon sont mentionnées sur le net, est également évoqué le fait que la corniche des belvédères fait « 2 fois la taille de la tour Eiffel ».
Coïncidence ?
#my2cents

MagicYoyo 17 décembre 2012 - 12:04 - Répondre

Etude poussée et très intéressante.
Encore une fois, Google viens d’avaler tout un pan du web. Et visiblement, c’est Google le boss, puisque personne ne trouve à y redire.

Johanna 17 décembre 2012 - 13:32 - Répondre

A noter également un déploiement important du KG sur les entreprises, et pas que des grands groupes d’ailleurs.

Ce qui laisse des SERPs entreprises/marques avec 7 résultats et une ligne de flottaison quasi à 100% dominée par les services Google.

Benoit 17 décembre 2012 - 15:30 - Répondre

Bonjour et merci pour ces éléments d’analyse.
Je ne me suis pas encore penché beaucoup sur la question du Knowledge Graph aussi si quelqu’un à la réponse je suis preneur. Quel type d’accord lie google avec les fournisseurs de ces contenus ? Et dans quel mesure l’outil peut s’arrêter si ces mêmes fournisseurs ferment le robinet ?

Merci :)

Erwan SEO 17 décembre 2012 - 18:38 - Répondre

cela fait quelque temps que je vois ce terme et je ne savais pas à quoi cela correspondait.

Personnellement je trouve que Google a mis du temps pour mettre en place cela et qu’ils devraient même pouvoir créer ses propres pages de résultats sur certains requêtes.

Pour les éditeurs de sites, c’est vraiment mauvais signe. Ceux qui se plaçaient sur « célébrité âge » ou définition.

Promoteur 18 décembre 2012 - 9:27 - Répondre

Belle synthèse très fouillée, merci !
Google recrute justement des français pour son KG (cf. http://hire.jobvite.com/Jobvite/Job.aspx?b=nD08mjwV&j=oqBEWfwl)
Pour le moment, tout laisse à penser que Google ne s’intéresse qu’aux gros volumes de requêtes et concurrence donc les portails; il reste encore, pour un temps, les sites de niche…

Yoav1987 18 décembre 2012 - 9:57 - Répondre

En théorie, le KG est super pour l’utilisateur moyen car il lui permet d’accéder à l’information avec un minimum de clique. Par contre, en tant que webmaster, ça me chiffonne car les sites internet on de moins en moins de visibilité en première page.

Comme vous vous en apercevez, Google essaye à tout pris de « conserver » les internautes sur ses services. Le KG en est une preuve conséquente. On saura avec le temps si les sites perdent de la visibilité sur le ranking naturel et les conséquences sur leurs CA.

En tout cas, j’aime pas du tout le chemin que Google emprunte…

LaurentB 18 décembre 2012 - 14:44 - Répondre

Pour l’instant, le KG ressemble plus à un Wikiprout scraper qu’autre chose.
Cela va changer rapidement. Je prévois qu’entre 1 à 3 ans, le concept va s’étendre dans de fabuleux terrains pour la recherche d’information.

totocaracana 19 décembre 2012 - 21:10 - Répondre

Je trouve que cette innovation est fantastique, car elle fait (plus ou moins) une synthèse de tout ce qu’on peut trouver sur le web. Après, ce que je ne comprends pas, c’est pourquoi tout ce blabla sur les sites qui gagnent/perdent de la visibilité.
Personnellement, si je cherche un détail, tant mieux si la réponse se trouve dans le KG. Si je cherche des informations générales et poussées, j’irais dans les sites que me propose Google, non selon leur position, mais selon le titre de l’article et la réputation du site.
Après, je comprends que ça puisse faire un manque à gagner pour les sites au niveau des pub, mais niveau utilisateur, ça ne change pas grand chose si on trouve une info sur le KG ou sur un site, à part LE GAIN DE TEMPS.

lightonseo 20 décembre 2012 - 2:25 - Répondre

Y a un truc qui m’échappe, pourquoi le routard serait pénalisé par le knowledge graph et pourquoi wikipédia le serait moins.

« les internautes souhaitant aller plus loin iront sur Wikipédia. » Ben en même temps si on si ils souhaitent aller plus loin… :) On a plus besoin de se poser la question

MonicaMedias 16 janvier 2013 - 23:24 - Répondre

Tout ce que vous avez toujours voulu savoir sur le KG par le nouveau KGB… Ou quand GG se mue en officine de renseignement mondial en faisant une nouvelle OPA, cette fois-ci pas vraiment sur l’économie physique mais sur la connaissance certes de base et qui malgré tout reste une marchandise monétisable comme les autres grâce à Adwords.
Merci pour cet excellent article et la mise en évidence de GG Images comme moteur incontournable et éternel derrière… Google. Arf !!!