Lors de GitHub Universe 2019, GitHub a dévoilé GitHub Archive Program ainsi que GitHub Arctic Code Vault. L’objectif est de préserver les logiciels libres pour les générations futures en stockant le code dans une archive construite pour durer mille ans. Le GitHub Arctic Code Vault est maintenant en production.
Qu’y a-t-il dans la chambre forte ?
Le 02/02/2020, GitHub a pris un snapshot de tous les repositories publics actifs sur la plateforme pour les archiver dans la chambre forte. L’instantané comprend :
- Les repositories avec commit entre l’annonce à Universe le 13 novembre 2019 et le 2 février 2020.
- Les repositories avec au moins une étoile et un commit de l’année précédant l’instantané, entre le 3 février 2019 et le 2 février 2020.
- Les repositories ayant au moins 250 étoiles, quelle que soit la date de leur dernière activité.
En savoir plus sur les critères du snapshot
Un guide pour l’avenir
Avec des archives du monde entier et une chambre forte arctique pleine de code, GitHub offre un contexte et une orientation au travers d’un guide, qui sera inclus dans chaque archive. Dans cette optique, un index et un guide lisibles par l’homme est fourni, indiquant l’emplacement de chaque repository et expliquant comment récupérer les données. Le guide donne un aperçu de ce qu’est un logiciel, une explication de l’open source et de son éthique et un aperçu technique sur la manière de décompresser le contenu des archives.
Aidez-nous à améliorer le guide
Le conseil consultatif de GitHub Archive Program
Afin de maximiser la valeur des archives pour les générations futures, GitHub a réuni un comité consultatif d’experts en anthropologie, archéologie, archivage, histoire, linguistique et sciences, pour un premier sommet consultatif les 16 et 17 janvier derniers. Après avoir examiné le programme des archives, le conseil consultatif a identifié trois thèmes importants :
- La visualisation : Inclure des représentations visuelles dans le contenu des archives elles-mêmes, comme par exemple montrer le code de tracé scientifique à côté de ses résultats et rendre les artefacts physiques des archives visuellement saisissants et esthétiquement attrayants.
- Métadonnées : Inclure les métadonnées du repository (description, langue, journaux de commit, wiki associé, etc.) et les métadonnées pertinentes à plus grande échelle, comme les rapports de l’Octoverse et un snapshot de Wikipédia.
- Redondance : En particulier, créer des petits repositories « fractionnaires » de l’archive, avec des contenus tels que les 10 000 repositories les plus étoilés et les plus importants, ainsi qu’un petit échantillon aléatoire d’autres repositories. Ces copies de ces repositories sont également offertes à des archives et des bibliothèques de premier plan dans le monde entier, comme la Bodleian Library d’Oxford.
Quelle est la prochaine étape ?
Aujourd’hui, GitHub commence la mise en production de l’Arctic Code Vault, qui prendra environ deux mois. Au printemps, GitHub retourne à Svalbard pour effectuer le dépôt officiel du code dans les Arctic World Archives.
Pour apprendre plus sur le programme des archives et sur l’importance de préserver les logiciels que nous créons collectivement aujourd’hui pour les générations futures, rendez-vous à Satellite en mai 2020, pour la première fois à Paris.
En savoir plus sur GitHub Artic Code Vault