La célèbre encyclopédie en ligne est, dans le milieu du référencement naturel, un peu considérée comme étant le Saint Graal. Les positions de Wikipédia dans les résultats des moteurs de recherche sont bien souvent sans équivoque : en première page, si ce n’est en première place, et ce, sur la majorité des requêtes à un mot ou sur les noms propres. Ce seraient les requêtes les plus recherchées, les plus apporteuses de trafic qui sont ainsi occupées par l’encyclopédie gratuite et sans publicité.

Page d'accueil de fr.wikipedia.org
Après avoir tué les vendeurs d’encyclopédies qui faisaient du porte à porte, Wikipédia tuerait la possibilité pour un référenceur d’obtenir la première position ? C’est ce que semble confirmer un article paru dans le JDN, relayant l’étude du site britannique Intelligent Positioning. Nous allons voir pourquoi il faut relativiser.
Sommaire
Wikipédia et Google
Cette apparente domination est telle que les suspicions les plus folles existent, souvent contradictoires. Google favoriserait Wikipédia au détriment d’autres sites, parfois plus pertinents : ceux qui voudraient être devant Wikipédia n’auraient alors comme seul recours que de passer par les liens sponsorisés. N’oublions pas que Google a déjà fait des dons de plusieurs millions de dollars à la Wikimedia Foundation, l’entité qui gère Wikipédia! Ou alors, à l’inverse, Google ferait tout pour pénaliser Wikipédia : le site représente tout de même un manque à gagner colossal pour le monde de la pub en ligne dont Google est l’acteur majeur et incontournable. La vérité est sûrement ailleurs, comme disait quelqu’un du FBI il y a quelques années.
Il est vrai que cette domination écrasante a de quoi faire tiquer : première page Google sur 99% des requêtes ! Mais en regardant d’un peu plus près, de quelles requêtes parle-t-on ? L’étude a été menée exclusivement sur des requêtes composées d’un seul mot. Ce type de requête n’est plus majoritaire, les internautes tapant essentiellement des requêtes à plusieurs mots. Ceci relativise l’importance de Wikipédia dans les résultats des moteurs de recherche.

Etude du réseau Chitika, 2010
Google n’a pas véritablement d’algorithme pensé et prévu pour favoriser (ou pénaliser) Wikipédia en particulier. En revanche, les critères de positionnement de Google sont presque systématiquement positifs pour l’encyclopédie en ligne. Même si l’un des critères n’est pas aussi performant (peu de contenus par exemple), les autres critères peuvent rattraper largement cette lacune.
Critères de contenus
Les contenus de Wikipédia sont, comme on pouvait s’y attendre, encyclopédiques. Le site traite ainsi de façon exhaustive de la plupart des sujets. Ces sujets, rédigés par une armée de bénévoles et ce dans presque toutes les langues, sont constamment mis à jour. Tous sont structurés, avec un sommaire et des liens vers des sujets complémentaires.
Wikipédia est un gage pour l’internaute d’obtenir une réponse quasiment 100% du temps. N’oublions pas que Google regarde de plus près une requête, en essayant de comprendre ce que désire l’internaute, comme exposé dans notre article sur les critères d’évaluation de Google. Une requête à un mot clé est très souvent synonyme de la recherche de signification de ce mot, ce que Wikipédia fait mieux que les autres sites la plupart du temps.
Sur les mots où il est admis que la plupart des internautes savent et comprennent leur signification, et qui sont en outre concurrentiels, Wikipédia ne ressort plus si facilement. Tapez des mots comme « banque », « assurance » « bourse », « immobilier », « foot », « annonces », « mutuelle » ou « actualité » : où est Wikipédia ?
Critères de « confiance »
Le signe le plus évident de la confiance portée par les internautes à Wikipédia se retrouve dans les recherches de la marque. « Wikipédia » est ainsi une des requêtes les plus populaires de Google, démontrant à Google de l’importance du site aux yeux des internautes. Pour enfoncer le clou, une très grande part de requêtes sont associées directement à la requête Wikipédia, l’internaute explicitant clairement à Google qu’il veut un résultat provenant de l’encyclopédie en ligne, et pas un autre. Tapez par exemple « mutuelle », vous verrez qu’une des recherches associées n’est autre que « mutuelle wikipedia » !

Recherche des mots clés « sarkozy », « iphone » et « wikipedia », Google Insights
Pour parfaire ses critères de confiance (pensons à leur brevet « Search Result Ranking Based On Trust »), Google mélange avec ces recherches de marque les signaux sociaux : ce sont les mentions sur Facebook, Twitter et autres réseaux de relais de réputation. Ici aussi, Wikipédia a une longueur d’avance sur le reste de la planète web : bon nombre de ses articles sont cités, repris, « likés » ou « retweetés » en masse.
Cette confiance se retrouve dans les 2 millions de visiteurs uniques quotidien, pour la seule France. En un mois, ce sont 55 millions de visiteurs uniques en France, et 1,2 milliards au monde, en faisant le 6ème site le plus visité en France (et ailleurs) selon Alexa, derrière Google, Facebook ou Youtube…

Trafic estimé de Wikipédia, Google Adplanner
Critères de PageRank et de liens externes
Les liens extérieurs au site pointant vers Wikipédia, l’un des plus anciens critères de positionnement de Google sont à la mesure du site culturel le plus populaire de la planète : innombrables, de toutes sortes, venant de très gros sites réputés ou de petits blogs obscurs. Rien que sur le mois de décembre 2011, plus de 200 000 sites différents ont fait un nouveau lien vers l’encyclopédie libre. Wikipédia présente une courbe de progression de ses nouveaux liens absolument idéale, représentant même « l’étalon » auquel on devrait comparer les autres sites. Le PageRank, l’ancienne marotte des référenceurs en herbe est lui aussi conséquent : PR9 sur la page d’accueil internationale, PR7 sur la page d’accueil française. La force du PageRank de Wikipédia n’est pourtant pas sur ses pages d’accueils, mais sur ses pages internes, très bien notées par Google. L’article dédié à la France a ainsi un PR7, celui dédié au sèche-linge un PR4…

Evolution des nouveaux noms de domaines pointant vers wikipedia.org
On le comprend, le pouvoir de positionnement de Wikipédia dans les moteurs de recherche est tel qu’on peut obtenir facilement et sans effort une première position en créant un article sur l’encyclopédie, et ne pas arriver à se classer dans les 10 premiers avec rigoureusement le même article sur un autre site : la force du contenu n’est pas tout, et Wikipédia apporte une réponse globale à toutes les grandes difficultés du référencement naturel.
Analyse RESONEO
RESONEO utilise au quotidien son outil interne, Matriceo, permettant d’effectuer une veille permanente sur un nombre très conséquent de mots clés. Plusieurs millions de requêtes sont ainsi scrutées, que nous pouvons trier ensuite par type d’activité. L’étude de Intelligent Positioning ne porte que sur un petit échantillon de 1000 mots clés, relativisant encore plus la portée de leur étude…
Notre tableau générique est absolument sans appel : en janvier 2012, wikipedia.org était loin, loin devant le deuxième, Youtube.com sur Google.fr. Wikipédia était présent sur 2971575 mots clés étudiés par Matriceo, pratiquement le double de Youtube.

Top des sites en janvier 2012, Matriceo
Il existe pourtant encore des secteurs où Wikipédia n’est pas majoritaire, loin s’en faut.

Top des sites « beauté » en janvier 2012, Matriceo

Top des sites « communauté » en janvier 2012, Matriceo

Top des sites « informatique » en janvier 2012, Matriceo

Top des sites « internet » en janvier 2012, Matriceo

Top des sites « voyage » en janvier 2012, Matriceo
On le voit, la présence de Wikipédia connait de grandes variations suivant les secteurs. Ce que Matriceo nous indique en revanche, c’est l’amélioration progressive des résultats Wikipédia ! L’encyclopédie est de plus en plus présente sur les premières positions, comme on peut le voir sur notre étude, mesurant la progression du site depuis 2010.

Positionnement de Wikipédia dans les résultats de Google.fr, de juillet 2010 à janvier 2012.
Cette progression s’explique bien sûr par l’enrichissement et la mise à jour permanents de l’encyclopédie en ligne, et une popularité croissante. Wikipédia est devenu la référence en matière de connaissances, le site couvrant la plupart des requêtes grâce à ses 1 216 764 articles en français au 23 février 2012.

Répartition thématique de la présence de Wikipédia sur Google

Répartition thématique de la présence de Rue du Commerce sur Google
En observant la présence de Wikipédia par familles de mots clés et en la comparant à un site marchand comme Rue du Commerce, il est aisé de constater une meilleure représentation pour Wikipédia sur des thématiques comme le divertissement, les Arts ou le sport. La force de Wikipédia, c’est sa présence sur toutes les thématiques possibles, abordant tous les sujets imaginables, ce qui démarque l’encyclopédie de tous les autres sites qui ne traitent que de quelques thématiques.
Wikipédia et le SEO
En tant que référenceur, le projet majeur de la Wikimedia Foundation est pratiquement intouchable. Le site est ce qu’on appelle un « trou noir » en référencement, recevant beaucoup de popularité venant de la multitude de liens externes, mais n’en redistribuant aucune, les liens sortants étant presque tous en « nofollow », pour « éviter le spam ». Ce net déséquilibre fausse d’avance le combat, Wikipédia n’ayant que faire de l’échange de liens, de la course à la popularité ou de l’obtention de nouvelles références. C’est un site qui se suffit à lui-même.
Google, contrairement à ce que l’on pourrait croire, ne favorise pas volontairement Wikipédia, bien au contraire. L’algorithme a bien souvent été raffiné pour varier les premières positions, jouant sur de nouveaux critères, afin de trouver la page la plus pertinente pour ces requêtes à un seul mot clé. Si vous tapez par exemple une région de France, vous trouverez probablement en première position le site de l’office du tourisme ou celui du Conseil régional : à bien y penser, quand vous tapez « Bretagne », vous cherchez à savoir que la région est peuplée depuis le paléolithique inférieur, ou plutôt ce qu’il y a à visiter dans cette belle région française ?
En résumé, le favoritisme apparent de Google pour Wikipédia n’est qu’une conséquence de son mode de calcul de positionnement. Pour bien référencer un site, Wikipédia est l’exemple même de ce qu’il faut faire : liens entrants externes, liens internes, contenus, popularité de marque, structure du code, vitesse d’affichage, tout est pris en compte et de très grande qualité.
Il existe bien des optimisations à faire, MediaWiki commençant à vieillir : le jour où ceci sera fait, Wikipédia sera encore plus redoutable, si c’était encore possible !
Pour finir, rappelons que les requêtes les plus concurrentielles, où il y a de l’argent en jeu, ne sont pas occupées (je devrais dire squattées) par Wikipédia. Le principal ennemi de l’e-commerce en référencement naturel n’est pas « l’encyclopédie libre », qui de toute façon ne vend rien et n’est donc pas un véritable concurrent, mais bien l’affichage de liens sponsorisés, qui prend ces derniers temps de plus en plus de place sur nos écrans…
C’est en effet une conclusion évidente, wikipedia squatte la plupart des résultats à un mot clef. C’est pas plus mal parfois quand on voit le peu de pertinence de certaines requêtes, mais ca reste tout de même bien dommage qu’il soit aussi bien positionné pour les petits sites qui sont parfois bien plus pertinents !
Excellent article, merci
Une bien belle analyse et un joli outil. 😉
Wikipédia est loin d’être indétrônable sur une requête, par contre prendre sa place sur un tel nombre de mots est quasiment impossible.
Jori, tu vis en Bretagne ?
Ah non, pas la Bretagne, Paris. Resoneo n’a pas encore d’antenne chez les mangeurs de kouign amann!
Bonjour,
Merci pour cet article intéressant. Pour info, tu parles de différents secteurs comme “beauté”, “voyage” ou “informatique”, sache que dans la santé, même en MonoKeyword, Wikipedia n’est pas sur représenté non plus.
Patrice
Oui, la santé fait partie de ces secteurs bien spéciaux. Je n’ai pas voulu être exhaustif, on en aurait pas fini!
Super Article, merci bien.
Je rejoins le commentaire de Benoit, Wikipedia n’est pas tout a fait pertinent dans certains domaines et l’on y trouve plus de banalités qu’autre chose.
Certains sites perso d’amateurs en .free.fr mériteraient un positionnement bien plus important que Wikipedia de par la qualité de leurs publications.
Super cette analyse, c’est vraiment très intéressant!
Oui excellent article qui démontre qu’un Wikipedia peut bien remonter avec un contenu collaboratif et une stratégie de liens sortants bigrement pingre.
Article très intéréssant qui montre bien l’essort et l’avanatage des sites de contenu de qualité.
Parallélement à cela il est de plus en plus difficile de poster un lien pertinent dans wikipédia. La modération y est très forte pour garder cette esprit de qualité et les nombreuses règles de fonctionnement renforce cette idée.
Je trouve cela dommage d’autant plus que wikipédia repose sur un système communautaire, mais qui est de plus en plus fermé au nouveau contributeur.
Dommage car un lien même en nofollow sur cette plateforme rapporte pas mal de visiteur sur sur des pages bien trusté 😉
Un article très complet et de qualité, un grand merci !
Un bien bel outil que vous avez là…et une excellente analyse, comme toujours sur ce blog.
Super article avec de la data pour appuyer les propos, il manque cependant un petit graphique indiquant la répartition du nombre de mots dans les mot-clés que Resoneo suit. Wikipedia étant une encyclopédie, leur positionnement sur des mot-clés large head est assez logique, ce paramètre de l’étude est donc relativement important.
Sur la conclusion, je trouve au contraire que Wikipédia a un traitement de faveur, notamment sur la prise en cimpte de ses liens sortant qui apportent un trust certain dès que qu’ils restent un moment. Par ailleurs, sur les requêtes peu compétitives, Wikipédia sort en tête sans raison apparente face à des sites plus complets.
Exemple : [bob l’éponge] http://www.google.fr/search?hl=fr&pws=0&q=bob+l%27%C3%A9ponge
Wikipédia 1er, une page pas mal mais en troisième un site entièrement consacré à ce vieux Bob et ayant des metrics sympa sur OSE. Idem pour le résultat sous les vidéos.
De mon expérience, sur des requêtes à 2 mots et plus, sans concurrence forte, si Wikipédia est en page 1, il sera relativement facile de se placer juste avant lui. Attention je ne dis pas que c’est le cas pour mon exemple 🙂
Même en prenant l’exemple de Bob l’éponge, je ne vois pas de page plus complète que celle de Wikipédia. De site plus complet, certainement. Il faut bien faire la distinction entre “page” et “site”, il n’y a pas si longtemps, Google ne prenait pas en compte la globalité d’un site pour une requête en particulier (ça commence à changer).
Quoiqu’il arrive, les autres critères comme expliqué dans l’article font qu’il est toujours plus facile de se positionner sur Wikipédia.
Pour le petit graphique, nous auditons 4 millions de mots clés, avec une liste toujours en évolution. Wikipédia est donc présent sur les 3/4 des mots jusqu’à la 20ème position (on ne regarde pas au delà).
Ok donc 4 milliards d’expressions suivie, beaucoup d’expression utilisant plusieurs mots je suppose. C’est à préciser car c’est le principale reproche qu’on peut faire à l’étude anglo-saxonne, il est bien dommage de ne pas préciser la variété d’expression étudiées pour cet article.
4 millions, pas milliards lol. On ne fait pas de distinction entre une requête à un mot ou une requête à 5 mots : nous parlons ici de “mot clé”, le seul critère choisi étant la fréquence de recherche. Notre vocation est d’être présent sur un champ lexical le plus étendu possible.
“jus d’orange” sera donc considéré comme étant un mot clé unique, tout aussi pertinent que “orange” et “jus”, pris séparément.
Oups petit soucis d’échelle malencontreux.
Pourquoi ne pas faire de différence entre ces expressions, ou tout du moins indiquer les expressions recherchées ?
Si Wikipédia se place facilement en tête sur les requêtes Head, notamment sur les noms communs et propres, ce n’est pas le cas sur des recherches plus longues.
Ex : [jus de pomme] et [faire son jus de pomme]
Bon pour résumer pourquoi ne pas se mettre à l’abri de ces reproches : http://searchengineland.com/why-the-wikipediagoogle-search-results-study-is-flawed-111628
Super article merci ! Mon humble opinion : si sur le papier il apparaît “légitime” que Wikipedia apparaisse toujours dans les 3 premières positions avec une page de contenu plus ou moins complète et longue, je trouve cela quand même rageant pour les personnes qui se décarcassent à faire des sites/blogs complets sur une thématique avec des centaines d’articles (ça sent le vécu :)). Pour passer devant : surcompenser en backlinks, la seule solution !
Et avoir un bon vieux nom de domaine vieillit en fûts de chêne, et un site répondant au quart de tour, ça peu aider aussi ^^
Enfin un article pertinent sur l’ogre Wikipedia !
Merci.
Article fort sympathique ! je veux bien un accès à votre outil matriceo il à l’air sympa 🙂
Oui. Ca doit pouvoir se négocier 🙂
Sacré article. Honnêtement, en voyant le titre, je me suis dit : “encore un article de base sur la structure de Wikipedia”.
Belle surprise, je me suis retrouve devant une analyse poussée et un partage de statistiques d’outils. Pas grand chose à dire de plus si ce n’est que Wikipedia est un modèle dans pas mal de cas de SEO. Adapter cette structure et son fonctionnement sur du MFA niché souvent au final une réussite.
NB : Pour contredire un poil sur les domaines concurrentiels, Wikipedia est formidablement bien placé sur “poker”.
Je ne sais pas si ça contredit totalement, Wikipédia a de bons gros liens externes provenant de sites du Poker, des liens “réels” (pas du spam) et beaucoup de contenu de qualité.
Et puis, ils ne sont que 2ème, ces loosers!
Le raisonnement et la conclusion sont parfaits: technique + contenu + liens = position.
Belle démonstration !
Véritablement un article de grande qualité. Long mais pas indigeste, bien illustré. Si je ne me trompe pas je suis arrivé par un RT de Keeg. Le fond est clair et intéressant. Ça devrait faire de la page à haut PR ça 😉
Vraiment un superbe article.
Captivant de bout en bout, merci.
Tres bon article, et tres belle étude 😉
Le prochain qui lâche un “super article merci” avec son pseudo en lien de site, ça sera…
Super analyse ! Merci pour cette excellent article. Impressionnant de voir qu’un sixième de la planète visite wikipedia 🙂
J’aime la conclusion quand ça n’est pas wikipedia, c’est adwords, et plus la requête est transactionnelle plus wikipedia s’efface au profit de sites commerciaux. Entre les contenus informatifs qui ont une propension naturelle à attirer des liens éditoriaux de qualité, la publicité et les services Google l’espace libre se raréfie, ce qui fait justement le jeu… de la publicité et son système d’enchère.
Voilà des arguments efficaces pour relativiser l’étude d’Intelligent Positioning. Wikipedia demeure néanmoins un modèle pour tous les référenceurs
Super article, entre les liens internes et la puissance de la home c’est dur de passer devant. Mattez un peu WRI et l’intervention de ranking metrics pour parfaire le linking interne, ils ranks bien grâce à ça à mon avis 😉
Le nombre de liens pointant vers Wikipédia me semble être la cause 1ère de leur “bon” référencement !
Je pense que c’est une mauvaise chose que Wikipedia prenne autant de place sur google, parce qu’on risque de se retrouver avec un réseau internet appartenant au même groupe car la diversité de sites s’amoindrit. Je le vois déjà auprès de mes cousins ados: Internet=facebook+Youtube+Wikipedia. Le monopole, c’est jamais bon pour la liberté des hommes.