Microsoft y la Universidad de Washington están investigando y realizando demostraciones de un sistema automático para almacenar y recuperar datos en moléculas «fabricadas» con ADN. En un trabajo publicado en Nature Scientific Reports se explica en detalle sobre el proceso (Demonstration of End-to-End Automation of DNA Data Storage), sobre el que también puede leerse en el blog de Microsoft.
La base del esta idea es convertir los datos originales –cualquier secuencia binaria de unos y ceros– en secuencias de las cuatro bases de las moléculas de ADN (ACGT). En el experimento han convertido y almacenado 01001000 01000101 01001100 01001100 01001111 («HELLO» en binario) en 1 mg de ADN (con las secuencias en solo 4 πg o 100 pmol). La decodificación y lectura se hacen al revés, leyendo el material genético y convirtiéndolo en binario, eliminando los errores.
El proceso no es todavía tan rápido, directo y seguro como nos gustaría; parte del truco es guardar muchas copias y luego comprobarlas a la hora de la lectura para descartar las que estén «corrompidas». Por ejemplo en el experimento con HELLO se pudieron leer 3.469 secuencias, de las cuales 1.973 estaba alineadas, de 30 se podían extraer datos, 29 fallaron y se descartaron como no válidas y sólo una era correcta, con el mensaje original de 40 bits impoluto. Pero todo se andará.
Una de las máquinas de laboratorio que a modo de prototipo sirve para almacenar y recuperar los datos en moléculas de ADN / Universidad de Washington
El sistema tampoco es especialamente rápido: para guardar y leer los 5 bytes se necesitaron entre pitos y flautas 21 horas, algo impracticable para resultar útil comercialmente. Pero hay que tener en cuenta que el almacenamiento en ADN tiene una capacidad de varios órdenes de magnitud por encima de la de los microchips; con las mejoras de las técnicas también se pueden conseguir avances significativas que reduzcan en varios órdenes de magnitud esos tiempos. Hasta ahora el récord de almacenamiento y recuperación está en unos 200 megabytes, pero hace poco se llegó almacenar hasta 1 gigabyte sin errores.
En el proceso interviene una técnica curiosa que llaman «la gota púrpura»: es una gota de líquido acuoso que se puede polarizar y mover por una superficie con detectores. Esto dicen que dará lugar a sistemas híbridos en parte moleculares, en parte electrónicos, en los que se aproveche lo mejor de cada uno de ellos (la capacidad de las moléculas de ADN, la potencia y velocidad de la electrónica).