Wikipédia : la guerre a fait rage entre les bots

Wikipédia a beau être un site extrêmement utile et intéressant, il n’est franchement pas facile à gérer. Et en même temps, cela n’a rien de surprenant, car il compte un peu plus de 41 millions de pages. Impressionnant, non ? Certes, mais ce n’est pas le plus fou. L’encyclopédie voit aussi débarquer un peu plus de 20 000 nouveaux articles tous les mois.

Le truc, c’est que tous ces articles ne sont pas figés dans le temps et ils sont ainsi régulièrement mis à jour par les contributeurs du service.

Guerre des bots

Les bots aussi peuvent se livrer une guerre sans merci.

Gérer un site de cet acabit n’est pas chose facile et c’est précisément ce qui a poussé Jimmy Wales et son équipe à recourir aux services de plusieurs milliers de bots pour les aider à faire le ménage sur le site.

Les bots sont partout, même sur Wikipédia

Cela ne vous aura sans doute pas échappé, mais les bots ont pas mal évolué depuis leurs premiers pas sur IRC. Désormais, ils sont partout et la plupart des géants du web ont investi massivement sur ces technologies pour automatiser certains traitements.

Google, par exemple, utilise les bots depuis les débuts de l’entreprise pour visiter les sites et indexer leurs nouvelles pages. Facebook a aussi fait appel à leurs services pour rendre Messenger plus intelligent.

Wikipédia, lui, utilise ces robots pour effectuer des corrections orthographiques, pour gérer les liens présents dans les articles ou même pour identifier les éventuelles violations au droit d’auteur. Ces programmes étaient assez rares aux débuts de l’encyclopédie, mais la situation a bien changé depuis et ils se comptent ainsi par milliers.

Des chercheurs en informatique travaillant pour l’Université d’Oxford ont étudié pendant plusieurs semaines le fonctionnement de ces bots et ils ont découvert que certains d’entre eux rentraient très régulièrement en conflit. Cela arrivait notamment lorsque deux programmes étaient chargés de faire des modifications différentes sur le même élément.

Des bots qui ne sont pas toujours d’accord

Ils pouvaient en effet passer plusieurs semaines à modifier un lien ou même une redirection en boucle et à se renvoyer ainsi la balle indéfiniment. Parfois, ces conflits pouvaient durer plusieurs années.

Certains articles étaient bien évidemment plus « contestés » que d’autres. C’était notamment le cas de la page portant sur l’ancien président du Pakistan, Pervez Musharraf, ou encore de celle de Schwarzenegger. Ces articles ont en effet été le théâtre de nombreuses querelles intestines.

Xqbot et Darnessbot, notamment, se sont livrés une bataille sans merci pendant plusieurs mois sur un peu plus de 3 600 articles différents. Entre 2009 et 2010, le premier a ainsi défait plus de 2 000 modifications mises en place par son adversaire. Ce dernier ne s’est évidemment pas laissé faire.

Étrangement, toutes les éditions de l’encyclopédie n’ont pas été touchées de la même façon. La version allemande, par exemple, n’a connu qu’une vingtaine de conflits de ce type, contre plus de 100 pour l’édition anglaise et plus de 180 pour l’édition portugaise.

Depuis, bien sûr, Wikipédia a mis en place de nouveaux process afin d’éviter ce genre de conflit, mais l’étude de nos quatre chercheurs prouve que les bots peuvent aussi être des inadaptés sociaux.

L’étude complète se trouve ici.