Arctic Code Vault : Le nouveau projet de GitHub pour archiver tous les codes open-source publics

GitHub, la fameuse plateforme de développement prévoit de lancer un projet d’envergure dénommé « Arctic Code Vault ». L’idée consiste à stocker et à préserver tous les logiciels open source dans le monde, dans un lieu sûr, à l’abri des intempéries pour une durée estimée à 1000 ans.

Pour entrer dans les détails, ce seront des instantanés des codes sources qui seront ainsi sauvegardés sur des films dans un coffre-fort, puis archivés dans une ancienne mine de charbon se trouvant en Norvège.

Github

Crédits Pixabay

GitHub souligne que ces instantanés seront stockés dans un endroit glacial, le froid contribuant efficacement à la préservation des films, qui pourraient avoir une durée de vie beaucoup plus étendue. GitHub veut stocker les codes open sources pour les générations futures mais également pour qu’ils soient réutilisables à tout moment.

Préserver les codes open source le plus longtemps possible

Comme il l’a indiqué, GitHub prendra ainsi un instantané de chaque référentiel public actif le 2 février 2020, qui sera conservé dans le GitHub Arctic Code Vault en Norvège. Ces données seront ensuite imprimées sur des supports physiques constitués de bobines de film conçus par Piql, une société norvégienne spécialisée dans la conception et la fabrication de supports pour le stockage de données à long terme.

Selon les informations, ce support peut avoir une durée de vie allant jusqu’à plus de 500 ans et même le double dans des conditions idéales. Ce qui fait d’ailleurs l’objet d’une certification ISO.

Les bobines de film seront ensuite gardées dans un conteneur à paroi d’acier dans une chambre scellée.

Pour une densité et une intégrité accrues des données, la plupart des données seront indexées et référencées à l’aide d’un QRCode. Un index et un guide détailleront l’emplacement de chaque référentiel et expliqueront comment récupérer les données.

Une initiative d’archivage de très grande envergure

Il faut savoir que cette initiative lancée par GitHub fait partie d’un projet de plus grande envergure. Pour sa concrétisation, GitHub se lie en effet avec plusieurs collaborateurs dont Long Now Foundation, Internet Archive, Software Heritage Foundation, Microsoft Research ou encore des institutions universitaires.

Chacun détient un rôle clé dans la mise en œuvre de méthodes d’archivage des codes open source. Par exemple, en partenariat avec GitHub, Microsoft Research travaille sur un concept de stockage de données capable de tenir jusqu’à 10.000 ans, utilisant des plateaux de verre en quartz sur lesquels on enregistre les informations à l’aide d’un laser.

La bibliothèque Bodleian de l’Université d’Oxford se chargera quant à elle de gérer des sauvegardes redondantes pour les 10.000 dépôts les plus importants.

Tout cela afin de contribuer à la résolution de la problématique du stockage des données telles que les référentiels open-source afin d’en faire profiter les générations futures.