Une intelligence artificielle découvre comment le code génétique évolue

Le code génétique désigne l’ensemble des règles indiquant aux cellules comment interpréter les combinaisons de trois lettres de nucléotides en protéines. Pendant longtemps, l’étude des séquences génétiques chez les espèces vivantes a fait objet de controverses. Kate Shulgina, étudiante à la Graduate School of Arts and Sciences, a ensuite entamé des recherches sur l’évolution du programme génétique. Aujourd’hui, elle est parvenue à son déchiffrement.

une molécule d'ADN et un scientifique

Kate Shulgina était initialement à la recherche d’un court projet de biologie computationnelle. Elle s’intéressait particulièrement à l’évolution du code génétique, jusqu’ici considéré comme universel.

Pour l’étude, elle a collaboré avec le biologiste de l’Université Harvard, Sean Eddy. Les résultats de leurs recherches ont été présentés dans un nouvel article publié dans la revue eLife

Un programme informatique de déchiffrement des codes génétiques

Les chercheurs ont mis au point un nouveau programme de déchiffrement informatique capable de lire la séquence génomique de n’importe quel organisme et de déchiffrer son code génétique. Le logiciel a été baptisé « Codetta ». C’est un nouvel exploit dans l’univers de la génétique.

Kate Shulgina a déclaré que la question du code génétique est particulièrement fondamentale. Autrefois, on pensait qu’il était gravé dans le marbre parce que presque tous les organismes vivants, allant des E. coli à l’homme, utilisent la même séquence génétique.

Néanmoins, les scientifiques ont découvert qu’il existe une minorité d’organismes aux programmes génétiques totalement aberrants. Il s’agit de codes génétiques alternatifs ne répondant pas aux mêmes propriétés et caractéristiques que ceux des autres organismes. En effet, Codetta permet d’identifier les organismes utilisant des codes génétiques alternatifs. Cette possibilité promet ainsi une nouvelle compréhension du changement et de l’évolution du programme génétique.

Un dépisteur de codes génétiques alternatifs

Le programme Codetta, à la recherche de codes génétiques alternatifs, a déjà analysé les séquences génomiques de plus de 250 000 bactéries et autres organismes unicellulaires. Les chercheurs ont réussi à identifier 5 cas de codes génétiques alternatifs jamais vus.

Parmi ces cas, le code de l’acide aminé arginine a été réaffecté à un autre acide aminé. C’est la première fois que les scientifiques observent ce type d’échange génétique chez les bactéries. Ceci donne une idée des forces évolutives intervenant dans la modification du code génétique.

Ces travaux marquent un moment crucial pour Shulgina qui a consacré ces 5 dernières années à développer la théorie statistique sur laquelle se fonde Codetta, à écrire le programme, à le tester, puis à analyser les génomes. Jusqu’à présent, personne n’a encore effectué une enquête aussi large sur les codes génétiques alternatifs.