Quand Google renvoie du porno avec des requêtes mathématiques

C’est une sorte d’axiome, un principe de base bien connu sur le web : beaucoup de sites sur Internet sont en réalité des sites pornographiques et, avec un moteur de recherche basique, il n’est pas compliqué de tomber sur des liens pointant vers ce genre de sites, qu’on l’ait voulu ou non. Aujourd’hui, cependant, les plus importants moteurs de recherche intègrent des outils pour éviter ce problème, à la manière du fameux SafeSearch de Google qui permet de filtrer les résultats et d’éviter les liens pornos. Mais même le géant de la recherche n’est pas à l’abri des bugs et si on entend souvent des excuses du style « je recherchais des informations sur la prochaine version de Pokémon qui sera la version X et j’ai trouvé du porno je comprends pas je suis choqué à vie je veux me retirer les yeux mais j’ai perdu ma cuillère« , il est des bugs qui sont un peu plus surprenants.

Vous l’aurez compris, c’est un de ces bugs qui nous intéresse ici, un bug qui concerne des requêtes contradictoires qui ne devraient retourner absolument aucun résultat… et pourtant !

Google fait du porno avec des maths

Ce bug a été découvert totalement par hasard et peut être testé par n’importe qui. L’exemple montré est une simple requête : « -4^(1/4)« . Google, gentiment, nous retourne le résultat de ce calcul simple (arrondi bien sûr) et, en-dessous, affiche une liste de liens pointant vers des sites pornographiques.

Surprenant, surtout quand on sait qu’il s’agit bel et bien d’un bug réel, expliqué par Jeremy Hoffman, un ingénieur de Google. Selon lui, donc, la requête « -4^(1/4) » est interprétée comme « -4 « 1 4″« , autrement dit on recherche les pages contenant un 1 suivi d’un 4 et ne contenant pas de 4, une requête qui, comme vous vous en doutez, est en théorie impossible à satisfaire. Mais impossible n’est pas porno et ces gentilles petites pages s’insinuent partout.

Le bug peut être reproduit avec d’autres requêtes contradictoires de ce type : un terme exclu et ce même terme exclu que l’on souhaite voir suivi d’un autre mot (ou suivre un autre mot). À noter qu’il est nécessaire de désactiver SafeSearch pour pouvoir « profiter » de ce bug et qu’il est beaucoup plus présent sur la version anglophone du moteur de recherche : après quelques tests sur la version française, on peut voir que si certaines requêtes contradictoires retournent bien du contenu porno, ce n’est pas le cas de toutes. Quoiqu’il en soit, que les liens retournés soit du porno ou non, ils ne devraient, de façon évidente, pas se trouver là…

Via



Jérémy Heleine est l'auteur de cet article

Étudiant en maths, Jérémy est un passionné qui touche un peu à tout, et plus particulièrement au développement web et à l'actualité high-tech qu'il partage avec vous sur Machineo et surtout ici-même.

Ces articles peuvent aussi vous intéresser

  • Rdio va rémunérer les artistes attirant de nouveaux utilisateurs

    Rdio va rémunérer les artistes attirant de nouveaux utilisateurs

    Les services d’écoute musicale en streaming ne manquent pas sur la toile, et ces derniers ont souvent de grosses difficultés à se démarquer de leurs concurrents. Certains misent sur des fonctions originales, d’autres sur leur catalogue, mais Rdio préfère apparemment privilégier les artistes. Preuve en est, le petit service qui monte, qui monte, a décidé de mettre en place une nouvelle méthode de rémunération visant à récompenser les artistes attirant de nouveaux utilisateurs sur la plateforme. Pas mal mais il y a mieux encore puisque ces derniers toucheront… 10$ par tête de pipe ! Oui,…

  • Les licences Creative Commons débarquent sur YouTube

    Les licences Creative Commons débarquent sur YouTube

    Décidément, YouTube nous gâte de nouvelles actualités ces derniers temps ! Ce coup-ci, c’est la possibilité de mettre vos vidéos en licence Creative Commons qui est mise en avant.   Les premières licences Creative Commons ont vu le jour en 2002. Comme leur nom l’indique, elles ont été créée par l’organisation à but non lucratif Creative Commons. Le but de ces licences est de permettre aux auteurs d’œuvres en tous genres de partager leurs créations librement. Dans certains domaines, comme le blogging par exemple, les auteurs publient en laissant les autres les copier partiellement ou…

  • Créer un site avec ses tweets grâce à Twylah

    Créer un site avec ses tweets grâce à Twylah

    Créer un site internet – un vrai – ce n’est pas chose facile. Alors bien sûr, les CMS facilitent grandement les choses, pareil d’ailleurs pour ses services comme Tumblr, mais les concepteurs de Twylah ne l’entendent pas de cette oreille et ils ont ainsi décidé de lancer un service capable de générer un site à partir des tweets d’un internaute. Et là, on peut dire qu’il s’agit d’un concept très séduisant, surtout pour ceux qui utilisent Twitter au quotidien et qui aimeraient pouvoir disposer d’une page où centraliser toute leur activité sur le service. D’autant…


  • Vic

    Il l’a fait!

    • http://www.tassedecafe.org/ Jérémy

      Il le fallait.

  • Articles Populaires -

  • Les Bons Plans -

  • Articles au hasard -