Analyse du trafic des moteurs verticaux et du not provided

Par  le 23 septembre 2013 - 9:07 dans

Pour ceux qui s’en souviennent, @5eg faisait une présentation en juin dernier au SMX de l’analyse des referrers de Google pour décortiquer le trafic SEO en mettant en valeur les différents types de résultats (site links, images, actualité, vidéo, maps, etc ) qui peuvent déclencher des visites et ainsi pointer les forces et les faiblesses du référencement d’un site à l’heure de la recherche universelle.

La mise en place via Analytics du filtrage des referrers ayant déjà été beaucoup traitée sur différents supports, nous vous proposons aujourd’hui une étude de cas réalisée sur 3 comptes Google Analytics pour comprendre le potentiel de ces informations.

Tout d’abord, quelques rappels.

Qu’est-ce que le referrer de Google ?

Toute visite d’un site en provenance d’un autre transmet des informations sur le site réferant. Par défaut, Google Analytics ne reflète pas cette information pour les moteurs de recherche.
L’intérêt de la récupération de cette information est qu’actuellement, Google transmet via ce referrer des données quant au positionnement et au type de résultat auquel correspond la visite.

L’utilité d’exploiter ce referrer

Nous avons l’habitude en SEO de nous pencher sur le trafic issu des outils de mesure comme Google Analytics pour analyser les sources de trafic, mots-clefs et pages d’entrée.
Avec l’arrivée du (not provided), nous avançons de plus en plus dans le brouillard avec notamment l’obfuscation par Google des mots-clefs tapés par l’internaute (qui a dit qu’obfusquer était mal ?).

Cependant, Google nous transmet une information, et pas des moindres, puisque le referrer transmis lors d’une visite SEO contient assez d’informations pour… reconstituer les mots-clefs situés dans le (not provided) ainsi que le type de résultat générant cette visite, information non disponible de base dans Google Analytics ni tout autre outil de mesure.

De manière plus précise, lors d’une visite d’un internaute depuis Google, celui-ci transfert en tant que referrer une URL contenant des paramètres qui comportent des informations sur le type de résultat cliqué (news, image, vidéo, lien classique, sitelinks, …) et la position de ce résultat dans la page.

Exemple :

Exemple d'URL fournie par Google agissant comme referer

Analyse de l’URL de destination d’un résultat Google

Le paramètre indiquant le type de résultat est le « ved ». La liste non exhaustive des valeurs possibles est la suivante :

liste-ved-google

Liste des valeurs de la variable VED

Mais il y a mieux.

En effet, le modèle d’attribution des visites de Google Analytics réattribue de base toute visite en « direct » qui suit une visite « naturelle » comme « naturelle » et gonfle donc significativement les chiffres du SEO, comme de toute campagne e-marketing.

Cela a pour conséquence de modifier les données lors du calcul de la part de « Marque »/ »Hors Marque » dans le trafic SEO.

Grâce à l’ajout de l’analyse du referrer, toute visite « directe » attribuée au SEO est exclue du fait qu’un accès « direct » ne comporte pas d’HTTP referer.
De plus, ce modèle d’analyse du referrer ne traite que les visites issues purement de Google (grâce au filtre sur la présence de la variable « ved »).

Nous accédons ainsi à une analyse du trafic SEO beaucoup plus fine portant uniquement sur les visites via Google sans les revisites du direct.

Voici le résultat de la mise en place des filtres sur Analytics :

Résultats filtres analytics referrer Google

Exemple d’affichage de Google Analytics des filtres réalisés

Première utilisation : l’analyse des moteurs verticaux

Parmi les recommandations SEO mises en place pour augmenter le trafic, l’optimisation des contenus pour les moteurs verticaux est souvent avancée sans pouvoir vérifier le réel impact en dehors du tracking des positions.

Une fois les filtres mis en place et avec un minimum d’historique, il est possible de croiser visuellement ou d’exporter les données pour rassembler en catégories et analyser quel type de trafic est généré.

Nous avons mis en place les filtres Analytics nécessaires afin de générer les exemples de nos cas d’utilisation.

Ces 3 sites disposent d’un taux de mots-clefs (not provided) important à hauteur de 37% (sur 190 000 visites SEO), 51% (sur 200 000 visites SEO) et 64% (sur 1,1 million de visites SEO). Nous avons récupéré ces données sur le mois d’août 2013.

Voici plusieurs exemples sur les 3 sites témoins :

repartition du type de resultat site 1

Analyse du trafic SEO du premier site

repartition du type de resultat site 2

Analyse du trafic SEO du second site

repartition du type de resultat site 3

Analyse du trafic SEO du troisième site

Dans les 3 cas on remarque une forte domination du trafic issu de clics « classiques » avec un pourcentage maximum de résultat « vertical » à 1% sur le 3ème exemple.

Malgré ces 3 résultats sous la barre des 1%, il n’est pas possible d’assumer que les moteurs verticaux ne représentent pas un intérêt direct en matière de trafic issu de Google, l’échantillon évalué étant faible et isolé dans chacun des secteurs d’activité.

Cependant la multiplication de ce type de mise en place permettra d’affiner et d’estimer l’utilité et l’efficacité des moteurs verticaux dans une stratégie de visibilité ou de trafic.

Deuxième analyse : le (not provided)

Le cas le plus intéressant portera sur l’identification du (not provided). Avec la montée en puissance des recherches en https, l’identification du comportement utilisateur menant au site de manière organique est de plus en plus compliquée.

Parmi les méthodes classiques d’estimation des parts de marque et hors marque, la plus courante reste d’analyser les mots-clefs « provided » et d’estimer le ratio marque et hors marque à partir des mots-clefs ou des URL de destination.

Le problème de ces méthodes étant qu’elles enveloppent 2 informations comme vu précédemment : les visites SEO et les revisites en direct.

Quel impact sur notre analyse classique ?

Il faut dissocier 2 types de visites :

  • La visite marque : L’internaute connait la marque, il y a de grandes chances que la conversion se fasse plus rapidement. Le nombre de visites jusqu’à la conversion est plus faible que sur une visite hors marque.
  • La visite hors marque : L’internaute a moins de chances de connaître la marque et devra potentiellement revisiter le site pour finaliser sa conversion

Ceci implique donc que le trafic hors marque risque d’être artificiellement boosté au détriment de la marque ou inversement.

Pourquoi isoler la revisite ?

Car elle porte essentiellement sur la qualité du site en lui-même. Un facteur SEO indirect, certes, mais qui n’est pas aussi modulable que de la création de contenus ou de liens sur des mots-clefs M/HM sur un client. Dès lors, ces visites agissent plus en tant qu’agent qualificatif du site que de la pertinence du mot-clef choisi.

Quelle méthode d’analyse ?

L’analyse des résultats se déroule en plusieurs étapes successives de recherche de similarité de qualité décroissante permettant de partir d’un filtre strict jusqu’à un niveau de filtrage beaucoup plus large :

  • Filtrage suivant 3 critères : en comparant le type de résultat, la position de ce résultat et l’URL de destination, nous répartissons les visites (not provided) entre la marque et l’hors marque
  • Filtrage suivant 2 critères : les visites n’ayant pas trouvé de correspondance sont ensuite retraitée pour une vérification suivant le type et la landing page
  • Filtrage suivant 1 critère : les dernières visites ne correspondant pas aux 2 précédents filtres sont ensuite mises en relation avec les URL

Deux points sur cette méthode, tout d’abord la répartition en cas de similarité. Si pour une même configuration (même type, position et URL), la marque et le hors marque proposent des mots-clefs « provided » la répartition du (not provided) se fera suivant la règle suivante :

  • Si le nombre de visites de l’un des 2 segments Marque ou Hors marque représente moins de 10% de leur somme, tout le trafic (not provided) est attribué à l’autre. Dans le cas échéant la répartition se fait en fonction du ratio M/HM

Deuxième point sur le reliquat des visites (not provided) n’entrant dans aucun des 3 filtres, ce reliquat n’est pas comptabilisé dans nos calculs étant donné que sur les tests réalisés, ce reliquat ne dépassait jamais les 0,05% des visites analysées.

Résultats de l’analyse

Les chiffres résultant de cette analyse sont assez frappants et concordent avec la notion évoquée plus haut des données artificielles générées par les revisites.

Voici ce que propose Analytics sur le mois d’août sur le 1er site :

trafic SEO GA site 1

D’après Google Analytics, 13,7% du trafic est issu du Hors Marque

trafic SEO no revisite site 1

Sans les revisites, 7,7% du trafic est attribué au Hors Marque

Une différence importante de 6 points est à constater sur ce premier site, les 2 autres présentant respectivement moins 1,4 et moins 3,7 points.

Conclusion

La mise en place des filtres permet d’obtenir des outils d’analyse relativement puissants, précis et qui perdent moins en précision avec la montée du (not provided) en comparaison des méthodes traditionnelles du fait qu’elles se basent sur plus d’un critère dans leurs modèles d’attribution.

On peut alors développer une notion de ROI plus fine sur ses investissements SEO à la fois sur les segments marque/hors marque mais également sur les moteurs verticaux.

Tweet about this on TwitterShare on LinkedInShare on FacebookEmail this to someone
Partagez cet article!
Ajouter le votre
2 commentaires
Thomas 23 septembre 2013 - 16:45 - Répondre

Merci pour cet article; ça donne beaucoup d’idées

Vous créez un nouveau profil GA pour mettre ça en place où ça n’est pas indispensable?

Xavier Naudeau 25 septembre 2013 - 11:54 - Répondre

Bonjour,
Il n’est pas nécessaire de créer un profil secondaire, tout dépend de vos variables/champs disponibles, mais il est préférable de ne pas venir écraser des données existantes.