Digg : une disparition tragique de l’index de Google

Google, on le sait, ne plaisante pas avec le spam et c’est précisément pour le combattre qu’il a mis en place deux algorithmes qui ont beaucoup fait jaser au fil de ces derniers mois, à savoir Panda et Pengouin. Oui, Google ne rigole pas avec les sites dotés d’un contenu de faible qualité, mais le géant de la recherche n’est pas non plus à l’abri des erreurs. Il l’a d’ailleurs prouvé une nouvelle fois hier en supprimant d’un seul coup toutes les pages de… Digg. Le tout en quelques secondes. Inutile de préciser que l’affaire a fait énormément de bruit et quelque chose me dit que nous n’avons pas fini d’en entendre parler.

Pour rendre ses lauriers à César, il faut d’ailleurs préciser que tout est parti d’un simple tweet publié par un certain Matt Sawyer. Ce nom vous est peut-être inconnu, mais on peut préciser que ce dernier est un expert reconnu officiant sur le secteur du SEO, et donc du référencement.

Digg : désindexation de Google

Google a désindexé Digg pendant quelques heures.

C’est donc en fouinant dans Google à grands coups de « site:digg.com » que ce dernier s’est rendu compte que quelque chose ne tournait pas rond. Et pour cause, puisque le moteur ne renvoyait absolument aucun résultat, un peu comme si Digg n’avait jamais existé. Etrange, surtout quand on sait que ce dernier occupe tout-de-même la 672ème place au classement général d’Alexa. Très vite, l’affaire a ensuite été reprise par le site State of Search avant de se répandre comme une trainée de poudre à travers la toile.

Une désindexation provoquée par un simple lien et… une erreur humaine

Google n’a évidemment pas tardé à répondre, avec un communiqué très intéressant : « We’re sorry about the inconvenience this morning to people trying to search for Digg. In the process of removing a spammy link on Digg.com, we inadvertently applied the webspam action to the whole site. We’re correcting this, and the fix should be deployed shortly ». Autrement dit, et pour ceux qui n’entendent rien à l’anglais, tout est parti de la suppression d’un simple lien de mauvaise qualité. Suite à une mauvaise manipulation, la suppression a ainsi été étendue à toutes les pages du domaine, condamnant ainsi Digg à une terrible désindexation.

Notons cependant que la firme a très rapidement publié un correctif et la situation est donc redevenus à la normale depuis.

Pourquoi en parler ? Tout simplement parce que cette tragique histoire nous permet finalement de mieux comprendre le fonctionnement de Google. Très intéressant, surtout à l’heure où Panda et Pengouin font d’innombrables ravages. Plus concrètement, la désindexation subie par Digg et les explications fournies par la firme américaine nous permettent de déduire plusieurs choses :

  1. Les Googlers ont complètement la main sur l’index de leur moteur. Autrement dit, ils sont tout-à-fait libre de supprimer manuellement les pages jugées inappropriées. Ce n’est pas une réelle découverte, l’information était connue depuis un bon bout de temps déjà, mais c’est toujours bien de rappeler que le moteur n’est pas totalement automatisé.
  2. La procédure de désindexation manuelle mise en place par Google laisse franchement à désirer. Un Googler cherche à supprimer un lien assimilé à du « spam », il commet une erreur, toutes les pages du site sont désindexées dans la foulée. De deux choses l’une, soit la firme n’a pas pensé à implémenter une validation supplémentaire, soit le responsable de l’employé n’a pas pris la peine de vérifier la portée de cette suppression. Peu importe le cas de figure, c’est quand même très moyen et il serait judicieux que le géant de la recherche mette en place quelques sécurités supplémentaires pour éviter de reproduire cette erreur.
  3. La désindexation d’une page est ultra rapide. Sa réintégration aussi. Matt Sawyer habite au Royaume-Uni, il a publié son tweet en plein coeur de l’après-midi et tous les sites américains ayant relayé l’affaire ont constaté la même chose de leur côté, quelques minutes à peine après la publication de son message. Cette désindexation a peut-être été mise en place un peu plus tôt dans la journée, bien sûr, mais la vitesse de sa propagation n’en reste pas moins très impressionnante.

Ce qui est sûr, en tout cas, c’est que cette désindexation non méritée n’est certainement pas la première dans l’histoire de la firme. Et si vous fréquentez certains forums spécialisés, alors vous n’êtes sans doute pas sans savoir que ces erreurs se produisent, malheureusement, très souvent. Oui et contrairement à ce que l’on pourrait penser, ce n’est pas toujours mérité.

Via



Frédéric Pereira est l'auteur de cet article

Floodeur compulsif, est très actif sur Twitter ou encore sur Facebook. Sachez en outre que la Fredzone a une page sur Google+.

Ces articles peuvent aussi vous intéresser

  • Erreur 451 : une erreur contre la censure

    Erreur 451 : une erreur contre la censure

    Sur le web, on trouve des dizaines et des dizaines de codes HTTP comme l’erreur 404, le code 301 ou encore la (très) vilaine erreur 503. Des codes bien connus des blogueurs, des webmestres et finalement de tous ceux qui bossent dans le milieu. Oui, et la bonne nouvelle du jour, c’est qu’un nouveau code pourrait bientôt voir le jour : l’erreur 451, visant tous les sites victimes de censure ou de filtrage. Typiquement le genre d’erreur qui pourrait être très pratique en Chine, ou bien en France post-ACTA par exemple, ce qui revient finalement…

  • Google I/O : la Keynote du second jour en vidéo

    Google I/O : la Keynote du second jour en vidéo

    Si le premier jour de la Google I/O était plutôt dédié aux produits maison, et donc aux terminaux et aux différents accessoires de Google, le second s’est plus concentré sur les services et les solutions mises au point par la firme. On pensera à la déclinaison iOS de Chrome ou de Drive, mais aussi au fameux Compute Engine qui devrait intéresser toutes les personnes amenées à gérer de gros sites ou de gros volumes de données. Or justement, si vous n’avez pas eu la possibilité de suivre l’évènement en direct, sachez que vous allez pouvoir…

  • Google Now, cet assistant qui vous veut du bien

    Google Now, cet assistant qui vous veut du bien

    La Google I/O est particulièrement chargée. On savait que la conférence allait être chargée, mais sans doute pas à ce point là. Après la Nexus 7 et le Nexus Q, c’est en effet un nouveau service mobile de la firme qui fait beaucoup parler de lui, un service qui s’appelle Google Now et qui s’impose comme un assistant capable de vous accompagner dans votre quotidien et de vous épauler dans la gestion de vos tâches habituelles. Et contrairement à ce que l’on pourrait penser, il ne s’agit pas d’un simple Siri-like de plus… Loin de…


  • Articles Populaires -

  • Les Bons Plans -

  • Articles au hasard -