RTFlash

Première mondiale : dépôt d’archives numériques encodées sur ADN aux Archives Nationales

Le stockage et l'archivage des données numériques sont des enjeux stratégiques critiques pour l’économie, la pérennité et la sécurité de nos sociétés. Cependant, ils se heurtent aujourd’hui à la concomitance de trois facteurs de limitation majeurs : la faible durée de vie des supports de stockage ; la quantité d’énergie gigantesque requise pour ce stockage, induisant un coût économique et un impact environnement considérables ; l’expansion vertigineuse des données qui entraîne une demande de stockage largement supérieure à nos capacités.

En particulier, les supports actuels de stockage ne sont plus suffisants pour archiver nos données : depuis 2010, la demande est supérieure à l’offre de stockage. A terme, les systèmes classiques de stockage ne sont pas soutenables. Ainsi, la transformation numérique de nos sociétés (intelligence artificielle, Big Data, objets connectés, voitures autonomes, informatique quantique...) nécessitera une évolution technologique majeure de nos systèmes de stockage de données.

Afin de lever ces limitations et de développer des systèmes de stockage de données plus performants, l’équipe de Stéphane Lemaire, directeur de recherche CNRS au Laboratoire de biologie computationnelle et quantitative (CNRS/Sorbonne Université) et Pierre Crozet, maître de conférences à Sorbonne Université, a cherché à tirer profit du potentiel offert par le vivant. Utilisant la biologie, ils ont exploité une forme de stockage de données qui n’a pas été inventée par l’Homme, mais qui se perfectionne depuis près de 4 milliards d’années : l’ADN, le support de l’information génétique.

Le stockage d’information numérique sur ADN est une technologie émergente pour laquelle toutes les approches publiées sont uniquement basées sur des méthodes chimiques, physiques, mathématiques et informatiques. En effet, la piste biologique n’avait pas encore été explorée. Des technologies très précises de manipulation de l’ADN existent dans le vivant (lecture, copie, édition, correction d’erreurs, accès direct, amplification du signal, etc.) et peuvent être domestiquées et adaptées via des approches de biologie synthétique pour lever les limitations actuelles du stockage sur ADN. C’est cette stratégie qui a permis à l’équipe de développer le DNA Drive, une nouvelle technologie de stockage sur ADN bio-inspirée.

Le stockage des données peu souvent consultées constitue une solution d'avenir pour trois raisons. D'abord la stabilité de l’ADN se compte en dizaines, voire en centaines de milliers d’années, ce qui est incomparable avec celle des supports de stockage actuels. Un génome complet a par exemple été obtenu à partir d’une défense de mammouth âgée de plus d’un million d’années. Ensuite, ce stockage est non énergivore : l’ADN est stable à température ambiante sans aucun apport d’énergie s’il est conservé dans des conditions adéquates (sans eau, ni air, ni lumière). Enfin, ce stockage est extrêmement compact : avec une densité maximale de 450 millions de Teraoctets par gramme d’ADN (0,45 Zettaoctets/g), l’intégralité des données mondiales pourrait tenir dans 100 g d’ADN, soit le volume d’une tablette de chocolat.

Le DNA Drive présente l’avantage d’être compatible avec tout type d'information numérique et permet d'encoder tout type de systèmes de fichiers avec des tables d'allocations, des répertoires, des métadonnées, etc. De plus, il offre un accès direct (random access) aux données car les secteurs ADN sont bordés de blocs d'index, permettant de relire spécifiquement chaque secteur sans avoir besoin de relire l'intégralité des données. L’ensemble de ces propriétés permet de définir un nouveau standard pour le stockage d'information numérique sur ADN.

Article rédigé par Georges Simmonds pour RT Flash

CNRS

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

  • Une IA qui lit dans les pensées et les transcrit en texte...

    Une IA qui lit dans les pensées et les transcrit en texte...

    Des chercheurs du GrapheneX-UTS, centre d’intelligence artificielle de l’Université de technologie de Sydney, ont mis au point une technologie qui peut être utilisée pour « faciliter la ...

  • Un nouveau modèle d'IA modulaire

    Un nouveau modèle d'IA modulaire

    Tout le monde a entendu parler des grands modèles de langage (LLM). Ce sont des modèles d’apprentissage profond à grande échelle entraînés sur d’immenses quantités de texte qui constituent la base ...

  • L’IA qui apprend et se souvient

    L’IA qui apprend et se souvient

    Des chercheurs de l’Université de Sydney et de Californie ont conçu un réseau neuronal physique qui a réussi à apprendre et à se souvenir ‘à la volée’, d’une manière inspirée et similaire à celle ...

Recommander cet article :

back-to-top