Les données de toutes nos vies stockées dans une gélule d’ADN, c’est possible ?

adn synthese sttock

Dominique Lavenier est directeur de recherche au CNRS et travaille à Rennes pour l’IRISA, l’Institut de recherche en informatique et systèmes aléatoires. Ses domaines d’activité comprennent la bioinformatique, la génomique, le séquençage de nouvelle génération, la structure des données, l’architecture des ordinateurs spécialisés et le stockage d’information sur ADN. Il vient de publier, en ce mois de mars 2025, Stocker nos données sur ADN.

L’idée d’employer l’ADN pour stocker des données remonte aux années 1960. Comme l’écrit l’auteur, depuis quelques milliards d’années l’ADN est le support modelé par la nature pour conserver et propager le patrimoine génétique des êtres vivants. Le système a fait ses preuves. Il est fiable et traverse les âges sans encombre. À l’issue du premier quart du XXIe siècle, les avancées des biotechnologies nous permettent d’élargir son spectre d’action pour y coder d’autres types d’informations : des romans, des photos, des films…

Y sommes-nous déjà ? Pas encore, mais on approche. Il manque encore quelques percées pour encoder, stocker et relire beaucoup plus de données, beaucoup plus vite. Mais nous en aurons bien besoin : la production mondiale de données double tous les trois ans, à un rythme où nous serons bientôt incapables de stocker l’information, même si l’on n’en conserve que l’essentiel. Aujourd’hui prolifèrent d’immenses data center, considérablement énergivores, coûteux à fabriquer, et stockant l’information sur des supports –disques durs et bandes magnétiques-, qui ne sont pas éternels et qu’il faudra donc régulièrement renouveler. De plus, désormais, la miniaturisation des supports de stockage ne suit plus le rythme de la production de données.

D’où la nécessité de nouveaux supports, permettant de densifier considérablement l’information, de la conserver longtemps, sans pertes, dans des conditions moins coûteuses, moins énergivores, et d’y accéder suffisamment rapidement.  

Parmi les pistes actuellement à l’étude, donc : l’ADN, aujourd’hui aisément disponible car facile à synthétiser, et qui prendrait potentiellement très peu de place, comparé au stockage sur disque dur. L’ADN dure longtemps sans se détériorer, les paléontologues le savent bien, qui peuvent étudier celui d’un mammouth mort depuis 35 000 ans. Depuis une douzaine d’années, les progrès des technologies de lecture de l’information, le gain en vitesse de production et de lecture (le séquençage) de l’ADN, à un coût de plus en plus faible, ont ouvert une nouvelle perspective : sortir de la théorie pour développer une technologie économiquement viable, complètement automatisée, permettant un stockage pérenne (sans régulière mise à jour), peu encombrante, dans un environnement quasi normal, avec un temps d’écriture, d’accès et de lecture suffisamment rapide. Dans le monde entier, des équipes de recherche, quelques startups et le grand Microsoft lui-même, se sont donc lancés dans la course d’obstacles.

Comment s’y prend-on ? Il s’agit de transformer les suites de 0 et de 1 qui constituent l’information à stocker dans un alphabet à quatre caractères : A, C, G et T, correspondant aux quatre nucléotides constituant les éléments de base de l’ADN. Cette suite de lettres doit être ensuite matérialisée en une réelle suite de nucléotides : c’est la synthèse. L’ADN synthétisé peut être stocké dans une capsule étanche. La lecture, le séquençage, est un processus connu, routinier. En théorie, toutes les étapes du processus sont validées, maîtrisées.

Alors qu’est-ce qui empêche la montée en puissance de cette technologie ? Quels sont aujourd’hui les goulets d’étranglement, les verrous ? Les erreurs, les pertes d’information, apparaissent à plusieurs stades de la procédure, exigeant le développement de techniques spécifiques de correction. De plus, la lecture est destructrice, donc il faut copier avant lecture, ce qui complique et ralentit le processus. En outre, une automatisation complète du processus est nécessaire et ce stade n’a pas encore été atteint. Mais le handicap principal est que les temps de synthèse sont encore très longs, bien plus longs que le temps d’accès à un disque dur. Cette synthèse est aussi sans doute trop polluante. Il faudra encore un saut quantitatif, une rupture, pour rendre la technologie compétitive. À quel horizon ? Des décennies ? Cela dépendra des investissements … et du hasard dont le monde de la recherche est tributaire.

Quoiqu’il en soit, ces limitations en termes de temps d’accès amèneront probablement, si la technologie aboutit, à ce qu’elle privilégie les « données froides », des données archivées, qui n’exigent pas un accès immédiat. Ces données froides constituent quand même 80% des informations stockées. Et c’est bien assez pour complémenter les data center et réduire leur usage.

Richement illustré, rédigé dans un langage clair et accessible à tout honnête lecteur, Stocker nos données sur ADN fait le point, en 72 pages, sur cette technologie prometteuse, ses enjeux et ses limites, avec hauteur de vue et didactisme, fidèlement à l’esprit de la collection L’espace des sciences, dont il est le 19e volume.

Dominique Lavenier, Stocker nos données sur ADN, éditions Apogée, 72 pages, 12 mars 12€

Article connexe :

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici