Digg : une disparition tragique de l’index de Google

Google, on le sait, ne plaisante pas avec le spam et c’est précisément pour le combattre qu’il a mis en place deux algorithmes qui ont beaucoup fait jaser au fil de ces derniers mois, à savoir Panda et Pengouin. Oui, Google ne rigole pas avec les sites dotés d’un contenu de faible qualité, mais le géant de la recherche n’est pas non plus à l’abri des erreurs. Il l’a d’ailleurs prouvé une nouvelle fois hier en supprimant d’un seul coup toutes les pages de… Digg. Le tout en quelques secondes. Inutile de préciser que l’affaire a fait énormément de bruit et quelque chose me dit que nous n’avons pas fini d’en entendre parler.

Pour rendre ses lauriers à César, il faut d’ailleurs préciser que tout est parti d’un simple tweet publié par un certain Matt Sawyer. Ce nom vous est peut-être inconnu, mais on peut préciser que ce dernier est un expert reconnu officiant sur le secteur du SEO, et donc du référencement.

Digg : désindexation de Google

Google a désindexé Digg pendant quelques heures.

C’est donc en fouinant dans Google à grands coups de « site:digg.com » que ce dernier s’est rendu compte que quelque chose ne tournait pas rond. Et pour cause, puisque le moteur ne renvoyait absolument aucun résultat, un peu comme si Digg n’avait jamais existé. Etrange, surtout quand on sait que ce dernier occupe tout-de-même la 672ème place au classement général d’Alexa. Très vite, l’affaire a ensuite été reprise par le site State of Search avant de se répandre comme une trainée de poudre à travers la toile.

Une désindexation provoquée par un simple lien et… une erreur humaine

Google n’a évidemment pas tardé à répondre, avec un communiqué très intéressant : « We’re sorry about the inconvenience this morning to people trying to search for Digg. In the process of removing a spammy link on Digg.com, we inadvertently applied the webspam action to the whole site. We’re correcting this, and the fix should be deployed shortly ». Autrement dit, et pour ceux qui n’entendent rien à l’anglais, tout est parti de la suppression d’un simple lien de mauvaise qualité. Suite à une mauvaise manipulation, la suppression a ainsi été étendue à toutes les pages du domaine, condamnant ainsi Digg à une terrible désindexation.

Notons cependant que la firme a très rapidement publié un correctif et la situation est donc redevenus à la normale depuis.

Pourquoi en parler ? Tout simplement parce que cette tragique histoire nous permet finalement de mieux comprendre le fonctionnement de Google. Très intéressant, surtout à l’heure où Panda et Pengouin font d’innombrables ravages. Plus concrètement, la désindexation subie par Digg et les explications fournies par la firme américaine nous permettent de déduire plusieurs choses :

  1. Les Googlers ont complètement la main sur l’index de leur moteur. Autrement dit, ils sont tout-à-fait libre de supprimer manuellement les pages jugées inappropriées. Ce n’est pas une réelle découverte, l’information était connue depuis un bon bout de temps déjà, mais c’est toujours bien de rappeler que le moteur n’est pas totalement automatisé.
  2. La procédure de désindexation manuelle mise en place par Google laisse franchement à désirer. Un Googler cherche à supprimer un lien assimilé à du « spam », il commet une erreur, toutes les pages du site sont désindexées dans la foulée. De deux choses l’une, soit la firme n’a pas pensé à implémenter une validation supplémentaire, soit le responsable de l’employé n’a pas pris la peine de vérifier la portée de cette suppression. Peu importe le cas de figure, c’est quand même très moyen et il serait judicieux que le géant de la recherche mette en place quelques sécurités supplémentaires pour éviter de reproduire cette erreur.
  3. La désindexation d’une page est ultra rapide. Sa réintégration aussi. Matt Sawyer habite au Royaume-Uni, il a publié son tweet en plein coeur de l’après-midi et tous les sites américains ayant relayé l’affaire ont constaté la même chose de leur côté, quelques minutes à peine après la publication de son message. Cette désindexation a peut-être été mise en place un peu plus tôt dans la journée, bien sûr, mais la vitesse de sa propagation n’en reste pas moins très impressionnante.

Ce qui est sûr, en tout cas, c’est que cette désindexation non méritée n’est certainement pas la première dans l’histoire de la firme. Et si vous fréquentez certains forums spécialisés, alors vous n’êtes sans doute pas sans savoir que ces erreurs se produisent, malheureusement, très souvent. Oui et contrairement à ce que l’on pourrait penser, ce n’est pas toujours mérité.

Via



Frédéric Pereira est l'auteur de cet article

Floodeur compulsif, est très actif sur Twitter ou encore sur Facebook. Sachez en outre que la Fredzone a une page sur Google+.

Ces articles peuvent aussi vous intéresser

  • Realtime, le moteur de recherche en temps réel de Bit.ly

    Realtime, le moteur de recherche en temps réel de Bit.ly

    Bit.ly vient de lever le voile sur un nouveau service qui devrait intéresser les adeptes des réseaux sociaux et tous les curateurs du web : Realtime. Grâce à ce dernier, n’importe quel internaute va effectivement pouvoir surveiller la plateforme sociale de son choix (Twitter, Facebook, LinkedIn, Tumblr, Ameblo) et découvrir ainsi les sujets qui marchent le plus, les sujets dont on parle le plus. Le tout avec plein de critères pour affiner au maximum les résultats et donc pour découvrir uniquement les sujets qui vous intéressent vraiment. Un outil qui devrait donc intéresser pas mal…

  • Instagram : une meilleure intégration dans Wordpress.com

    Instagram : une meilleure intégration dans WordPress.com

    Si tout le monde ne l’aime pas forcément, WordPress reste l’un des moteurs de blog les plus utilisés dans le monde. Et vous n’êtes sans doute pas sans savoir que ce dernier se décline en réalité en deux produits : d’un côté, nous avons la solution à installer sur nos serveurs, de l’autre la plateforme en ligne. C’est de cette dernière dont il s’agit pour le coup puisque Automattic vient de déployer une petite mise à jour assez sympathique et qui vise tout simplement à favoriser l’intégration de contenus en provenance d’Instagram. Exactement comme pour…

  • Snapseed : lancement de la version Android !

    Snapseed : lancement de la version Android !

    Snapseed est une application très en vogue sur iOS et ça se comprend plutôt bien puisqu’il s’agit sans aucun doute de l’un des outils les plus complets qu’il soit en matière de retouche photo. Or justement, depuis la rentrée 2012, on entend parler de l’arrivée prochaine d’une version Android et vous serez sans doute très heureux d’apprendre que cette dernière est maintenant officielle ! Mieux, la petite coquine peut même être téléchargée dès à présent et tout ça sans payer puisqu’elle est complètement gratuite ! Puisqu’on en parle, il faut d’ailleurs savoir que Snapseed est…


  • Articles Populaires -

  • Les Bons Plans -

  • Articles au hasard -