Pourquoi Wikipédia est tout le temps en premier sur Google ?

Par  le 28 février 2012 - 9:42 dans

La célèbre encyclopédie en ligne est, dans le milieu du référencement naturel, un peu considérée comme étant le Saint Graal. Les positions de Wikipédia dans les résultats des moteurs de recherche sont bien souvent sans équivoque : en première page, si ce n’est en première place, et ce, sur la majorité des requêtes à un mot ou sur les noms propres. Ce seraient les requêtes les plus recherchées, les plus apporteuses de trafic qui sont ainsi occupées par l’encyclopédie gratuite et sans publicité.

Page d'accueil de fr.wikipedia.org

Page d'accueil de fr.wikipedia.org

Après avoir tué les vendeurs d’encyclopédies qui faisaient du porte à porte, Wikipédia tuerait la possibilité pour un référenceur d’obtenir la première position ? C’est ce que semble confirmer un article paru dans le JDN, relayant l’étude du site britannique Intelligent Positioning. Nous allons voir pourquoi il faut relativiser.

Sommaire

Wikipédia et Google

Cette apparente domination est telle que les suspicions les plus folles existent, souvent contradictoires. Google favoriserait Wikipédia au détriment d’autres sites, parfois plus pertinents : ceux qui voudraient être devant Wikipédia n’auraient alors comme seul recours que de passer par les liens sponsorisés. N’oublions pas que Google a déjà fait des dons de plusieurs millions de dollars à la Wikimedia Foundation, l’entité qui gère Wikipédia! Ou alors, à l’inverse, Google ferait tout pour pénaliser Wikipédia : le site représente tout de même un manque à gagner colossal pour le monde de la pub en ligne dont Google est l’acteur majeur et incontournable. La vérité est sûrement ailleurs, comme disait quelqu’un du FBI il y a quelques années.

Il est vrai que cette domination écrasante a de quoi faire tiquer : première page Google sur 99% des requêtes ! Mais en regardant d’un peu plus près, de quelles requêtes parle-t-on ? L’étude a été menée exclusivement sur des requêtes composées d’un seul mot. Ce type de requête n’est plus majoritaire, les internautes tapant essentiellement des requêtes à plusieurs mots. Ceci relativise l’importance de Wikipédia dans les résultats des moteurs de recherche.

Etude du réseau Chitika, 2010

Etude du réseau Chitika, 2010

Google n’a pas véritablement d’algorithme pensé et prévu pour favoriser (ou pénaliser) Wikipédia en particulier. En revanche, les critères de positionnement de Google sont presque systématiquement positifs pour l’encyclopédie en ligne. Même si l’un des critères n’est pas aussi performant (peu de contenus par exemple), les autres critères peuvent rattraper largement cette lacune.

Critères de contenus

Les contenus de Wikipédia sont, comme on pouvait s’y attendre, encyclopédiques. Le site traite ainsi de façon exhaustive de la plupart des sujets. Ces sujets, rédigés par une armée de bénévoles et ce dans presque toutes les langues, sont constamment mis à jour. Tous sont structurés, avec un sommaire et des liens vers des sujets complémentaires.

Wikipédia est un gage pour l’internaute d’obtenir une réponse quasiment 100% du temps. N’oublions pas que Google regarde de plus près une requête, en essayant de comprendre ce que désire l’internaute, comme exposé dans notre article sur les critères d’évaluation de Google. Une requête à un mot clé est très souvent synonyme de la recherche de signification de ce mot, ce que Wikipédia fait mieux que les autres sites la plupart du temps.

Sur les mots où il est admis que la plupart des internautes savent et comprennent leur signification, et qui sont en outre concurrentiels, Wikipédia ne ressort plus si facilement. Tapez des mots comme « banque », « assurance » « bourse », « immobilier », « foot », « annonces », « mutuelle » ou « actualité » : où est Wikipédia ?

Critères de « confiance »

Le signe le plus évident de la confiance portée par les internautes à Wikipédia se retrouve dans les recherches de la marque. « Wikipédia » est ainsi une des requêtes les plus populaires de Google, démontrant à Google de l’importance du site aux yeux des internautes. Pour enfoncer le clou, une très grande part de requêtes sont associées directement à la requête Wikipédia, l’internaute explicitant clairement à Google qu’il veut un résultat provenant de l’encyclopédie en ligne, et pas un autre. Tapez par exemple « mutuelle », vous verrez qu’une des recherches associées n’est autre que « mutuelle wikipedia » !

Recherche des mots clés « sarkozy », « iphone » et « wikipedia », Google Insights

Recherche des mots clés « sarkozy », « iphone » et « wikipedia », Google Insights

Pour parfaire ses critères de confiance (pensons à leur brevet « Search Result Ranking Based On Trust »), Google mélange avec ces recherches de marque les signaux sociaux : ce sont les mentions sur Facebook, Twitter et autres réseaux de relais de réputation. Ici aussi, Wikipédia a une longueur d’avance sur le reste de la planète web : bon nombre de ses articles sont cités, repris, « likés » ou « retweetés » en masse.

Cette confiance se retrouve dans les 2 millions de visiteurs uniques quotidien, pour la seule France. En un mois, ce sont 55 millions de visiteurs uniques en France, et 1,2 milliards au monde, en faisant le 6ème site le plus visité en France (et ailleurs) selon Alexa, derrière Google, Facebook ou Youtube…

Trafic estimé de Wikipédia, Google Adplanner

Trafic estimé de Wikipédia, Google Adplanner

Critères de PageRank et de liens externes

Les liens extérieurs au site pointant vers Wikipédia, l’un des plus anciens critères de positionnement de Google sont à la mesure du site culturel le plus populaire de la planète : innombrables, de toutes sortes, venant de très gros sites réputés ou de petits blogs obscurs. Rien que sur le mois de décembre 2011, plus de 200 000 sites différents ont fait un nouveau lien vers l’encyclopédie libre. Wikipédia présente une courbe de progression de ses nouveaux liens absolument idéale, représentant même « l’étalon » auquel on devrait comparer les autres sites. Le PageRank, l’ancienne marotte des référenceurs en herbe est lui aussi conséquent : PR9 sur la page d’accueil internationale, PR7 sur la page d’accueil française. La force du PageRank de Wikipédia n’est pourtant pas sur ses pages d’accueils, mais sur ses pages internes, très bien notées par Google. L’article dédié à la France a ainsi un PR7, celui dédié au sèche-linge un PR4…

Evolution des nouveaux noms de domaines pointant vers wikipedia.org

Evolution des nouveaux noms de domaines pointant vers wikipedia.org

On le comprend, le pouvoir de positionnement de Wikipédia dans les moteurs de recherche est tel qu’on peut obtenir facilement et sans effort une première position en créant un article sur l’encyclopédie, et ne pas arriver à se classer dans les 10 premiers avec rigoureusement le même article sur un autre site : la force du contenu n’est pas tout, et Wikipédia apporte une réponse globale à toutes les grandes difficultés du référencement naturel.

Analyse RESONEO

RESONEO utilise au quotidien son outil interne, Matriceo, permettant d’effectuer une veille permanente sur un nombre très conséquent de mots clés. Plusieurs millions de requêtes sont ainsi scrutées, que nous pouvons trier ensuite par type d’activité. L’étude de Intelligent Positioning ne porte que sur un petit échantillon de 1000 mots clés, relativisant encore plus la portée de leur étude…

Notre tableau générique est absolument sans appel : en janvier 2012, wikipedia.org était loin, loin devant le deuxième, Youtube.com sur Google.fr. Wikipédia était présent sur 2971575 mots clés étudiés par Matriceo, pratiquement le double de Youtube.

Top des sites en janvier 2012, Matriceo

Top des sites en janvier 2012, Matriceo

Il existe pourtant encore des secteurs où Wikipédia n’est pas majoritaire, loin s’en faut.

Top des sites « beauté » en janvier 2012, Matriceo

Top des sites « beauté » en janvier 2012, Matriceo

Top des sites « communauté » en janvier 2012, Matriceo

Top des sites « communauté » en janvier 2012, Matriceo

Top des sites « informatique » en janvier 2012, Matriceo

Top des sites « informatique » en janvier 2012, Matriceo

Top des sites « internet » en janvier 2012, Matriceo

Top des sites « internet » en janvier 2012, Matriceo

Top des sites « voyage » en janvier 2012, Matriceo

Top des sites « voyage » en janvier 2012, Matriceo

On le voit, la présence de Wikipédia connait de grandes variations suivant les secteurs. Ce que Matriceo nous indique en revanche, c’est l’amélioration progressive des résultats Wikipédia ! L’encyclopédie est de plus en plus présente sur les premières positions, comme on peut le voir sur notre étude, mesurant la progression du site depuis 2010.

Positionnement de Wikipédia dans les résultats de Google.fr, de juillet 2010 à janvier 2012.

Positionnement de Wikipédia dans les résultats de Google.fr, de juillet 2010 à janvier 2012.

Cette progression s’explique bien sûr par l’enrichissement et la mise à jour permanents de l’encyclopédie en ligne, et une popularité croissante. Wikipédia est devenu la référence en matière de connaissances, le site couvrant la plupart des requêtes grâce à ses 1 216 764 articles en français au 23 février 2012.

Répartition thématique de la présence de Wikipédia sur Google

Répartition thématique de la présence de Wikipédia sur Google

Répartition thématique de la présence de Rue du Commerce sur Google

Répartition thématique de la présence de Rue du Commerce sur Google

En observant la présence de Wikipédia par familles de mots clés et en la comparant à un site marchand comme Rue du Commerce, il est aisé de constater une meilleure représentation pour Wikipédia sur des thématiques comme le divertissement, les Arts ou le sport. La force de Wikipédia, c’est sa présence sur toutes les thématiques possibles, abordant tous les sujets imaginables, ce qui démarque l’encyclopédie de tous les autres sites qui ne traitent que de quelques thématiques.

Wikipédia et le SEO

En tant que référenceur, le projet majeur de la Wikimedia Foundation est pratiquement intouchable. Le site est ce qu’on appelle un « trou noir » en référencement, recevant beaucoup de popularité venant de la multitude de liens externes, mais n’en redistribuant aucune, les liens sortants étant presque tous en « nofollow », pour « éviter le spam ». Ce net déséquilibre fausse d’avance le combat, Wikipédia n’ayant que faire de l’échange de liens, de la course à la popularité ou de l’obtention de nouvelles références. C’est un site qui se suffit à lui-même.

Google, contrairement à ce que l’on pourrait croire, ne favorise pas volontairement Wikipédia, bien au contraire. L’algorithme a bien souvent été raffiné pour varier les premières positions, jouant sur de nouveaux critères, afin de trouver la page la plus pertinente pour ces requêtes à un seul mot clé. Si vous tapez par exemple une région de France, vous trouverez probablement en première position le site de l’office du tourisme ou celui du Conseil régional : à bien y penser, quand vous tapez « Bretagne », vous cherchez à savoir que la région est peuplée depuis le paléolithique inférieur, ou plutôt ce qu’il y a à visiter dans cette belle région française ?

En résumé, le favoritisme apparent de Google pour Wikipédia n’est qu’une conséquence de son mode de calcul de positionnement. Pour bien référencer un site, Wikipédia est l’exemple même de ce qu’il faut faire : liens entrants externes, liens internes, contenus, popularité de marque, structure du code, vitesse d’affichage, tout est pris en compte et de très grande qualité.

Il existe bien des optimisations à faire, MediaWiki commençant à vieillir : le jour où ceci sera fait, Wikipédia sera encore plus redoutable, si c’était encore possible !

Pour finir, rappelons que les requêtes les plus concurrentielles, où il y a de l’argent en jeu, ne sont pas occupées (je devrais dire squattées) par Wikipédia. Le principal ennemi de l’e-commerce en référencement naturel n’est pas « l’encyclopédie libre », qui de toute façon ne vend rien et n’est donc pas un véritable concurrent, mais bien l’affichage de liens sponsorisés, qui prend ces derniers temps de plus en plus de place sur nos écrans…

4 Trackbacks

Par Read Later | Pearltrees  le 28 février 2012

[...] Etude du réseau Chitika, 2010 Pourquoi Wikipédia est tout le temps en premier sur Google ? – RESONEO [...]

Par Wikipedia | Pearltrees  le 28 février 2012

[...] Pourquoi Wikipédia est tout le temps en premier sur Google ? – RESONEO Page d'accueil de fr.wikipedia.org Après avoir tué les vendeurs d’encyclopédies qui faisaient du porte à porte, Wikipédia tuerait la possibilité pour un référenceur d’obtenir la première position ? C’est ce que semble confirmer un article paru dans le JDN , relayant l’étude du site britannique Intelligent Positioning . [...]

Par Pourquoi Wikipédia est tout le temps en premier sur Google ? – RESONEO « Blog de Charles Ramos  le 29 février 2012

[...] (RT @DuboissetB: RT @alexandrenappey: Pourquoi Wikipédia est tout le temps en premier sur Google ?Via blog.resoneo.com J'aimeJ'aime  [...]

Par Semaine 9 (2012) – 1 221 602 articles « Les échos d'en bas  le 3 mars 2012

[...] Wikipédia apparaît en première page dans 99% des cas sur Google UK (lien)(lien2) [...]

Ajouter le votre
35 commentaires
Benoit 28 février 2012 - 10:20 - Répondre

C’est en effet une conclusion évidente, wikipedia squatte la plupart des résultats à un mot clef. C’est pas plus mal parfois quand on voit le peu de pertinence de certaines requêtes, mais ca reste tout de même bien dommage qu’il soit aussi bien positionné pour les petits sites qui sont parfois bien plus pertinents !

Aurelien 28 février 2012 - 10:23 - Répondre

Excellent article, merci

Aurélien 28 février 2012 - 10:29 - Répondre

Une bien belle analyse et un joli outil. ;)
Wikipédia est loin d’être indétrônable sur une requête, par contre prendre sa place sur un tel nombre de mots est quasiment impossible.
Jori, tu vis en Bretagne ?

Jori 28 février 2012 - 13:27 - Répondre

Ah non, pas la Bretagne, Paris. Resoneo n’a pas encore d’antenne chez les mangeurs de kouign amann!

Patrice 28 février 2012 - 10:43 - Répondre

Bonjour,

Merci pour cet article intéressant. Pour info, tu parles de différents secteurs comme « beauté », « voyage » ou « informatique », sache que dans la santé, même en MonoKeyword, Wikipedia n’est pas sur représenté non plus.

Patrice

Jori 28 février 2012 - 13:29 - Répondre

Oui, la santé fait partie de ces secteurs bien spéciaux. Je n’ai pas voulu être exhaustif, on en aurait pas fini!

Sylvain 28 février 2012 - 10:47 - Répondre

Super Article, merci bien.
Je rejoins le commentaire de Benoit, Wikipedia n’est pas tout a fait pertinent dans certains domaines et l’on y trouve plus de banalités qu’autre chose.
Certains sites perso d’amateurs en .free.fr mériteraient un positionnement bien plus important que Wikipedia de par la qualité de leurs publications.

Actualinet 28 février 2012 - 11:00 - Répondre

Super cette analyse, c’est vraiment très intéressant!

JulienC 28 février 2012 - 11:22 - Répondre

Oui excellent article qui démontre qu’un Wikipedia peut bien remonter avec un contenu collaboratif et une stratégie de liens sortants bigrement pingre.

Michael 28 février 2012 - 12:23 - Répondre

Article très intéréssant qui montre bien l’essort et l’avanatage des sites de contenu de qualité.
Parallélement à cela il est de plus en plus difficile de poster un lien pertinent dans wikipédia. La modération y est très forte pour garder cette esprit de qualité et les nombreuses règles de fonctionnement renforce cette idée.
Je trouve cela dommage d’autant plus que wikipédia repose sur un système communautaire, mais qui est de plus en plus fermé au nouveau contributeur.
Dommage car un lien même en nofollow sur cette plateforme rapporte pas mal de visiteur sur sur des pages bien trusté ;)

Vivien 28 février 2012 - 12:49 - Répondre

Un article très complet et de qualité, un grand merci !

SEO Factory Girl 28 février 2012 - 13:14 - Répondre

Un bien bel outil que vous avez là…et une excellente analyse, comme toujours sur ce blog.

Baptiste 28 février 2012 - 13:41 - Répondre

Super article avec de la data pour appuyer les propos, il manque cependant un petit graphique indiquant la répartition du nombre de mots dans les mot-clés que Resoneo suit. Wikipedia étant une encyclopédie, leur positionnement sur des mot-clés large head est assez logique, ce paramètre de l’étude est donc relativement important.

Sur la conclusion, je trouve au contraire que Wikipédia a un traitement de faveur, notamment sur la prise en cimpte de ses liens sortant qui apportent un trust certain dès que qu’ils restent un moment. Par ailleurs, sur les requêtes peu compétitives, Wikipédia sort en tête sans raison apparente face à des sites plus complets.
Exemple : [bob l'éponge] http://www.google.fr/search?hl=fr&pws=0&q=bob+l%27%C3%A9ponge
Wikipédia 1er, une page pas mal mais en troisième un site entièrement consacré à ce vieux Bob et ayant des metrics sympa sur OSE. Idem pour le résultat sous les vidéos.

De mon expérience, sur des requêtes à 2 mots et plus, sans concurrence forte, si Wikipédia est en page 1, il sera relativement facile de se placer juste avant lui. Attention je ne dis pas que c’est le cas pour mon exemple :)

Jori 28 février 2012 - 15:12 - Répondre

Même en prenant l’exemple de Bob l’éponge, je ne vois pas de page plus complète que celle de Wikipédia. De site plus complet, certainement. Il faut bien faire la distinction entre « page » et « site », il n’y a pas si longtemps, Google ne prenait pas en compte la globalité d’un site pour une requête en particulier (ça commence à changer).

Quoiqu’il arrive, les autres critères comme expliqué dans l’article font qu’il est toujours plus facile de se positionner sur Wikipédia.

Pour le petit graphique, nous auditons 4 millions de mots clés, avec une liste toujours en évolution. Wikipédia est donc présent sur les 3/4 des mots jusqu’à la 20ème position (on ne regarde pas au delà).

Baptiste 28 février 2012 - 15:46 - Répondre

Ok donc 4 milliards d’expressions suivie, beaucoup d’expression utilisant plusieurs mots je suppose. C’est à préciser car c’est le principale reproche qu’on peut faire à l’étude anglo-saxonne, il est bien dommage de ne pas préciser la variété d’expression étudiées pour cet article.

Jori 28 février 2012 - 15:51 - Répondre

4 millions, pas milliards lol. On ne fait pas de distinction entre une requête à un mot ou une requête à 5 mots : nous parlons ici de « mot clé », le seul critère choisi étant la fréquence de recherche. Notre vocation est d’être présent sur un champ lexical le plus étendu possible.

« jus d’orange » sera donc considéré comme étant un mot clé unique, tout aussi pertinent que « orange » et « jus », pris séparément.

Baptiste 28 février 2012 - 15:58

Oups petit soucis d’échelle malencontreux.
Pourquoi ne pas faire de différence entre ces expressions, ou tout du moins indiquer les expressions recherchées ?

Si Wikipédia se place facilement en tête sur les requêtes Head, notamment sur les noms communs et propres, ce n’est pas le cas sur des recherches plus longues.
Ex : [jus de pomme] et [faire son jus de pomme]

Bon pour résumer pourquoi ne pas se mettre à l’abri de ces reproches : http://searchengineland.com/why-the-wikipediagoogle-search-results-study-is-flawed-111628

Aurelie M 28 février 2012 - 15:09 - Répondre

Super article merci ! Mon humble opinion : si sur le papier il apparaît « légitime » que Wikipedia apparaisse toujours dans les 3 premières positions avec une page de contenu plus ou moins complète et longue, je trouve cela quand même rageant pour les personnes qui se décarcassent à faire des sites/blogs complets sur une thématique avec des centaines d’articles (ça sent le vécu :)). Pour passer devant : surcompenser en backlinks, la seule solution !

Jori 28 février 2012 - 15:14 - Répondre

Et avoir un bon vieux nom de domaine vieillit en fûts de chêne, et un site répondant au quart de tour, ça peu aider aussi ^^

Pierre 28 février 2012 - 15:18 - Répondre

Enfin un article pertinent sur l’ogre Wikipedia !
Merci.

Torreip 28 février 2012 - 15:57 - Répondre

Article fort sympathique ! je veux bien un accès à votre outil matriceo il à l’air sympa :)

JulienC 28 février 2012 - 18:33 - Répondre

Oui. Ca doit pouvoir se négocier :)

Keeg 28 février 2012 - 17:52 - Répondre

Sacré article. Honnêtement, en voyant le titre, je me suis dit : « encore un article de base sur la structure de Wikipedia ».

Belle surprise, je me suis retrouve devant une analyse poussée et un partage de statistiques d’outils. Pas grand chose à dire de plus si ce n’est que Wikipedia est un modèle dans pas mal de cas de SEO. Adapter cette structure et son fonctionnement sur du MFA niché souvent au final une réussite.

NB : Pour contredire un poil sur les domaines concurrentiels, Wikipedia est formidablement bien placé sur « poker ».

Jori 28 février 2012 - 18:10 - Répondre

Je ne sais pas si ça contredit totalement, Wikipédia a de bons gros liens externes provenant de sites du Poker, des liens « réels » (pas du spam) et beaucoup de contenu de qualité.

Et puis, ils ne sont que 2ème, ces loosers!

Yassine 28 février 2012 - 18:07 - Répondre

Le raisonnement et la conclusion sont parfaits: technique + contenu + liens = position.
Belle démonstration !

mode homme 29 février 2012 - 9:33 - Répondre

Véritablement un article de grande qualité. Long mais pas indigeste, bien illustré. Si je ne me trompe pas je suis arrivé par un RT de Keeg. Le fond est clair et intéressant. Ça devrait faire de la page à haut PR ça ;)

C4 Web 29 février 2012 - 17:38 - Répondre

Vraiment un superbe article.
Captivant de bout en bout, merci.

rxptf 29 février 2012 - 18:21 - Répondre

Tres bon article, et tres belle étude ;-)

Jori 29 février 2012 - 18:23 - Répondre

Le prochain qui lâche un « super article merci » avec son pseudo en lien de site, ça sera…

Julie 29 février 2012 - 19:23 - Répondre

Super analyse ! Merci pour cette excellent article. Impressionnant de voir qu’un sixième de la planète visite wikipedia :)

tsoudaz 01 mars 2012 - 12:07 - Répondre

J’aime la conclusion quand ça n’est pas wikipedia, c’est adwords, et plus la requête est transactionnelle plus wikipedia s’efface au profit de sites commerciaux. Entre les contenus informatifs qui ont une propension naturelle à attirer des liens éditoriaux de qualité, la publicité et les services Google l’espace libre se raréfie, ce qui fait justement le jeu… de la publicité et son système d’enchère.

Deux freelances en valent mieux qu'un 01 mars 2012 - 18:24 - Répondre

Voilà des arguments efficaces pour relativiser l’étude d’Intelligent Positioning. Wikipedia demeure néanmoins un modèle pour tous les référenceurs

Soul 15 mars 2012 - 10:46 - Répondre

Super article, entre les liens internes et la puissance de la home c’est dur de passer devant. Mattez un peu WRI et l’intervention de ranking metrics pour parfaire le linking interne, ils ranks bien grâce à ça à mon avis ;)

Denis 28 juin 2012 - 12:22 - Répondre

Le nombre de liens pointant vers Wikipédia me semble être la cause 1ère de leur « bon » référencement !

Curieux 14 décembre 2013 - 0:31 - Répondre

Je pense que c’est une mauvaise chose que Wikipedia prenne autant de place sur google, parce qu’on risque de se retrouver avec un réseau internet appartenant au même groupe car la diversité de sites s’amoindrit. Je le vois déjà auprès de mes cousins ados: Internet=facebook+Youtube+Wikipedia. Le monopole, c’est jamais bon pour la liberté des hommes.