Digg : une disparition tragique de l’index de Google

Google, on le sait, ne plaisante pas avec le spam et c’est précisément pour le combattre qu’il a mis en place deux algorithmes qui ont beaucoup fait jaser au fil de ces derniers mois, à savoir Panda et Pengouin. Oui, Google ne rigole pas avec les sites dotés d’un contenu de faible qualité, mais le géant de la recherche n’est pas non plus à l’abri des erreurs. Il l’a d’ailleurs prouvé une nouvelle fois hier en supprimant d’un seul coup toutes les pages de… Digg. Le tout en quelques secondes. Inutile de préciser que l’affaire a fait énormément de bruit et quelque chose me dit que nous n’avons pas fini d’en entendre parler.

Pour rendre ses lauriers à César, il faut d’ailleurs préciser que tout est parti d’un simple tweet publié par un certain Matt Sawyer. Ce nom vous est peut-être inconnu, mais on peut préciser que ce dernier est un expert reconnu officiant sur le secteur du SEO, et donc du référencement.

Digg : désindexation de Google
Google a désindexé Digg pendant quelques heures.

C’est donc en fouinant dans Google à grands coups de “site:digg.com” que ce dernier s’est rendu compte que quelque chose ne tournait pas rond. Et pour cause, puisque le moteur ne renvoyait absolument aucun résultat, un peu comme si Digg n’avait jamais existé. Etrange, surtout quand on sait que ce dernier occupe tout-de-même la 672ème place au classement général d’Alexa. Très vite, l’affaire a ensuite été reprise par le site State of Search avant de se répandre comme une trainée de poudre à travers la toile.

Une désindexation provoquée par un simple lien et… une erreur humaine

Google n’a évidemment pas tardé à répondre, avec un communiqué très intéressant : “We’re sorry about the inconvenience this morning to people trying to search for Digg. In the process of removing a spammy link on Digg.com, we inadvertently applied the webspam action to the whole site. We’re correcting this, and the fix should be deployed shortly”. Autrement dit, et pour ceux qui n’entendent rien à l’anglais, tout est parti de la suppression d’un simple lien de mauvaise qualité. Suite à une mauvaise manipulation, la suppression a ainsi été étendue à toutes les pages du domaine, condamnant ainsi Digg à une terrible désindexation.

Notons cependant que la firme a très rapidement publié un correctif et la situation est donc redevenus à la normale depuis.

Pourquoi en parler ? Tout simplement parce que cette tragique histoire nous permet finalement de mieux comprendre le fonctionnement de Google. Très intéressant, surtout à l’heure où Panda et Pengouin font d’innombrables ravages. Plus concrètement, la désindexation subie par Digg et les explications fournies par la firme américaine nous permettent de déduire plusieurs choses :

  1. Les Googlers ont complètement la main sur l’index de leur moteur. Autrement dit, ils sont tout-à-fait libre de supprimer manuellement les pages jugées inappropriées. Ce n’est pas une réelle découverte, l’information était connue depuis un bon bout de temps déjà, mais c’est toujours bien de rappeler que le moteur n’est pas totalement automatisé.
  2. La procédure de désindexation manuelle mise en place par Google laisse franchement à désirer. Un Googler cherche à supprimer un lien assimilé à du “spam”, il commet une erreur, toutes les pages du site sont désindexées dans la foulée. De deux choses l’une, soit la firme n’a pas pensé à implémenter une validation supplémentaire, soit le responsable de l’employé n’a pas pris la peine de vérifier la portée de cette suppression. Peu importe le cas de figure, c’est quand même très moyen et il serait judicieux que le géant de la recherche mette en place quelques sécurités supplémentaires pour éviter de reproduire cette erreur.
  3. La désindexation d’une page est ultra rapide. Sa réintégration aussi. Matt Sawyer habite au Royaume-Uni, il a publié son tweet en plein coeur de l’après-midi et tous les sites américains ayant relayé l’affaire ont constaté la même chose de leur côté, quelques minutes à peine après la publication de son message. Cette désindexation a peut-être été mise en place un peu plus tôt dans la journée, bien sûr, mais la vitesse de sa propagation n’en reste pas moins très impressionnante.

Ce qui est sûr, en tout cas, c’est que cette désindexation non méritée n’est certainement pas la première dans l’histoire de la firme. Et si vous fréquentez certains forums spécialisés, alors vous n’êtes sans doute pas sans savoir que ces erreurs se produisent, malheureusement, très souvent. Oui et contrairement à ce que l’on pourrait penser, ce n’est pas toujours mérité.

Via

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.