Le MIT aurait trouvé un élément commun à toutes les langues du monde

On connaît le MIT pour ses recherches sur la technologie mais ce ne sont pas les seules qui y sont menées. En effet, un projet de l’institut a récemment eu pour but de rechercher un élément commun à toutes les langues que parlent les êtres humains à travers le monde.

Et ils ont trouvé un excellent candidat pour cela, un élément tellement utilisé qu’il en est inconscient : la distance entre deux mots qui doivent être reliés. Par exemple, un nom et un adjectif qui le qualifie seront amenés à être plus proches dans une phrase et ce quelle que soit la langue concernée.

Langue

Et si toutes les langues du monde étaient liées ?

Pourquoi rechercher un élément commun ?

Avant même de voir comment ils en sont arrivés là, il serait bon de discuter de l’intérêt de ces recherches. C’est vrai après tout : pourquoi rechercher un élément commun à toutes les langues du monde ? Qu’est-ce que cela peut bien apporter ?

Si certaines langues sont liées entre elles par des ancêtres communs (comme l’anglais et le français par exemple), d’autres sont plus indépendantes. En trouvant un élément commun à toutes les langues du monde alors qu’elles n’ont aucun rapport entre elles, cela montrerait que l’être humain est programmé génétiquement pour parler, et pas de n’importe quelle façon qui plus est.

Ainsi, nous pourrions déterminer qu’une région du cerveau est entièrement dédiée à la parole, et que cette dernière n’est pas le fruit d’une suite d’opérations qui ont lieu dans plusieurs autres régions.

La distance entre les mots, seul élément commun ?

Pour cette étude, le MIT a disposé d’une base de données contenant des phrases écrites en 37 langues différentes. Ils ont alors eu l’idée de rechercher du côté de la distance entre deux mots liés dans ces phrases.

Pour comprendre ce concept, le mieux est encore de prendre un exemple : les phrases « il a écrit en noir ce qu’il pensait de cette information » et « il a écrit ce qu’il pensait de cette information en noir » ont toutes les deux le même sens mais, en pratique, la première forme est plus utilisée. L’idée a donc été de déterminer si cette tendance à choisir une distance la plus courte possible entre deux mots (ou groupes de mots) liés est présente dans toutes les langues.

Pour cela, chacune des phrases de la base de données a obtenu un certain score, basé sur cette distance : plus elle était élevée, plus le score l’était également. Ensuite, cette distance a été altérée de manière aléatoire, et le score moyen a alors été calculé.

Si la distance doit être la plus courte possible, alors le score des phrases devait être plus faible que la moyenne obtenue aléatoirement. Et ça a effectivement été le cas pour les phrases étudiées.

Autrement dit, il apparaît que les 37 langues étudiées dans ce projet sont liées par cet élément commun. Cela ne montre pas encore que cet élément est commun à toute langue créée par l’Homme, mais c’est en bonne voie. Et si 37 est encore un nombre faible pour tirer des conclusions trop hâtives, il faut relativiser : construire de telles bases de données est délicat.

Via