Quand Excel force les chercheurs à renommer les gènes humains

Les gènes sont de minuscules torsions d’ADN et d’ARN qui se combinent pour déterminer tous les traits et caractéristiques qui nous rendent uniques. Notre génome comporte des dizaines de milliers de gènes, et à chacun d’eux les scientifiques doivent donner un nom et un code alphanumérique, appelé symbole, pour coordonner leurs recherches.

Mais au cours de la dernière année, les scientifiques ont dû changer les noms de quelques 27 gènes humains… à cause de Microsoft Excel.

Une feuille de calculs Excel

Photo by Mika Baumeister on Unsplash

Une fonction d’Excel qui fausse les données scientifiques

Microsoft Excel est un incontournable dans le monde des feuilles de calcul. La preuve en est que c’est l’outil utilisé en général par les chercheurs pour reporter leurs données et même effectuer des essais cliniques. Sauf qu’à la base, Microsoft a créé les paramètres de sa feuille de calcul pour des applications plus simples. Ainsi, lorsque les chercheurs entrent le symbole alphanumérique d’un gène dans une feuille de calcul Excel, le logiciel le convertit automatiquement en une date. MARCH1, abréviation de « Membrane Associated Ring-CH-Type Finger 1 », est ainsi automatiquement converti en 1-Mar.

C’est un problème à la fois frustrant et dangereux pour les chercheurs dans la mesure où leurs données sont corrompues par Excel. Et ils sont obligés de les trier manuellement pour les restaurer. Étonnamment, c’est un problème d’une assez grande ampleur. En effet, une étude de 2016 a examiné des données génétiques de 3597 rapports scientifiques et a révélé qu’environ un cinquième avait été affecté par des erreurs Excel.

À ne pas louper : Les Galaxy Note 20 sont disponibles en précommande

La solution des chercheurs pour éviter la corruption de leurs données par Excel

Microsoft ne propose pas de solution vraiment simple pour régler le problème. Excel ne permet pas en effet de désactiver cette mise en forme automatique. Le seul moyen de l’éviter est de modifier le type de données pour chaque colonne. Alors, pour rendre la vie plus facile aux scientifiques, l’organisme scientifique chargé de normaliser les noms de gènes, le Comité « HUGO » de nomenclature du gène (HGNC), a dû prendre une décision.

Le HGNC vient en effet d’annoncer de nouvelles lignes directrices pour la dénomination des gènes. Désormais, les chercheurs devront tenir compte du formatage automatique d’Excel pour nommer les gènes humains et les protéines qu’ils représentent.

Ainsi, le symbole MARCH1 devient désormais MARCHF1, et SEPT1 devient SEPTIN1, et ainsi de suite. Ce sont quelques 27 gènes qui ont ainsi vu leurs noms être modifiés au cours de l’année écoulée, pour convenir à Excel !