Du spam chez les proxies web ? Le cas Appspot !

Par  le 28 septembre 2011 - 18:52 dans

Suite à l’article de Paul Sanches sur Don’t be evil concernant le Google Washing de sites par des proxies hébergés chez Appspot.com, qui appartient à Google, nous avons fait tourner des outils internes qui ont sorti quelques résultats interessants.

Tout d’abord, concernant les types de requêtes Françaises sur lesquelles Appspot.com se positionne : il apparait que le site ne remonte pas sur de grosses requêtes génériques, mais sur un grand nombre de requêtes long tail. Du coup, si le site est classé en 3 124eme position en terme de nombre de mots clés sur Google.fr, il n’est en revanche qu’en position 6 122 en matière de « Score de positionnement », un indicateur maison basé sur les positions et la concurrentialité des requêtes.

evolution visibilité google appspot
Nous pouvons d’ailleurs constater que le potentiel du site en matière de ranking se situe principalement en page 2 des résultats de Google :

Répartition ranking

Nos analyses ont également montré que les positions de ce domaine sont extremement mouvantes d’une période à l’autre. Il semble que de nouveaux proxies gagnent rapidement en visibilité à leur lancement, puis retombent ensuite rapidement. Peut être suite à une intervention de l’équipe anti spam de Google ?

Là où ça commence à devenir rigolo, c’est lorsque l’on analyse la visibilité par sous domaine, c’est à dire par application hébergée sur ce service. Nous avons détecté 434 sous domaines ayant un minimum de visibilité sur Google FR. Et quelques perles parmi les plus puissants, dont voici le top dix :

Sous domaines proxies appspot.com

La palme revient incontestablement au premier de la liste : wikien4.appspot.com qui reprend l’intégralité de Wikipedia, en remplaçant chaque lettre ‘l’ minuscule en ‘w’ et ‘th’ en ‘d’ !
Ainsi par exemple William Kempe devient Wiwwiam Kempe, un acteur de tewevision :)

Et Google a l’air d’aimer cela, un signe qu’il ne faut pas forcément aller chercher bien loin pour passer outres les filtres anti duplication ;)

Tweet about this on TwitterShare on LinkedInShare on FacebookShare on Google+Email this to someone
Partagez cet article!

1 Trackback

Par Comment se protéger du duplicate content liés aux web proxy Appspot ? | Don't Be Evil  le 29 septembre 2011

[...] vient de publier un article complémentaire sur le sujet dont je vous recommande la lecture : Spam chez les proxies, le cas Appspot Tweet Article publié dans Référencement. Ajouter aux favoris. ← Interdire [...]

Ajouter le votre
6 commentaires
Le Juge 28 septembre 2011 - 19:08 - Répondre

Quand je pense a quel point je me décarcasse pour créer du duplicate entre mes descriptions pour les annuaires / CP etc …et que je vois l’autre qui change jjste quelques lettre dans le truc alors qu’il pompe qu’il en peut plus je me dis a quoi bon…

Labisse 28 septembre 2011 - 20:22 - Répondre

Effarant quand même !!!! c’est a se demander comment GG peut encore dominer autant le web avec un tel laisse faire laisser passer, a part faire de la com sur son panda il ferait mieux de bosser un peut plus dans la pertinence de ses résultats… Mais bon GG aime bien le spam finalement c’est peut-être sa première source de revenu…

JulienC 28 septembre 2011 - 21:43 - Répondre

Incroyable effectivement. Mais que font Messieurs White et Cutts pour endiguer ce bog ?!

Seg 29 septembre 2011 - 0:39 - Répondre

Ils sont trop occupés à lire les reconsideration requests et spam reports ? ;)

référencement prestashop 12 octobre 2011 - 9:12 - Répondre

Et après ça ils se vantent de lutter efficacement contre le spam et les fermes de liens :-/
Pour ma part, j’ai vite appliqué la technique préconisée par Tiger pour se protéger du scrap sauvage de ce genre de proxy !
faites-en autant !
Matt

video gratuite 16 novembre 2011 - 23:55 - Répondre

Bonjour et merci pour l’article.

Une fois ces urls indexées dans google par centaines voir par milliers, y a t’il un moyen de les désindexer au plus vite ?