Ir al contenido principal

¡Almacenando datos en el ADN de un ser vivo! - Para Dummies!!


El almacenamiento de datos e información, fue sin duda el principal motor que impulsó el desarrollo de la computación como la conocemos hasta hoy. Hace unos meses en una tertulia habitual junto a algunos amigos del rubro, comentábamos sobre los últimos alcances de la ciencia en la materia y veíamos cómo desde hace algunos años -a nivel comercial- las investigaciones estaban más o menos somnolientas en GB y TB.

Como siempre el ser humano y su afán de ciencia no tienen limites -y qué bueno- ya que en la Universidad de Hong Kong hicieron lo que desde el titulo ya es una cosa medio extraña: lograron almacenar 900 TB (900 000 GB) de información en 1 gramo de bacterias.

¿Vinilo? ¿Cinta magnetofónica? ¿Plástico? ¿Luz? No amigos en Seres Vivos, citando a los científicos: "Exploramos las posibilidades de utilizar un sistema biológico como solución alternativa para el almacenamiento y encriptación de información".

El “sistema de almacenamiento en paralelo bacterial” que junto a módulos de encriptación de datos (que funciona, básicamente, randomizando secuencias de ADN) y de lectura y escritura (I/O), tienen pensado establecer una especie de estándar en el almacenamiento de datos en células vivas.

Juatss??? En español, pa' entender recordemos 3 cositas que aprendimos en secundaria:


De la ciencia matemática, específicamente de la aritmética:

Recordemos "el cambio de base" de la decimal a la binaria o base 2, base 3 y así sucesivamente. Haciendo un paréntesis, muchos nos preguntábamos en aquella época: ¿Para q rayos nos servirá esto en la vida real? y los que siguen carreras relacionadas a la teoría de los sistemas, ingeniería, procesos y ahora también en las ciencias sociales y administrativas descubrimos que el "I/O", "1 y 0", "activo y pasivo", "dominante y recesivo", "TIActiva y TIPasiva", etc no es otra cosa que un sistema binario. Más adelante el sistema hexadecimal ( Hex= {0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F} ) nos demuestra día a día en las ciencias de la computación la importancia de entender estos conceptos de bases numéricas, pues no olvides que nuestros amigos los números, no son otra cosa, que un lenguaje que al igual que todos los demás lenguajes nos sirve para comunicarnos mejor, entonces se entiende que como existe una traducción de español a ingles, también hay una de español a numeral sea en la base que sea.

Entonces si notamos que la información se agrupa en diversos niveles debidamente escalonados o lo que es igual: escalares de datos. Estos datos escritos pueden traducirse de un lenguaje a otro, pues al fin y al cabo como decía mi profesora de estadística en la universidad "son datos".

Concluyendo, así como pasabas 15 (en base decimal) a la base 5 y lo hacías con el no muy celebre método de las divisiones sucesivas hasta llegar al 30 (en base 5), hay otros métodos más sofisticados programados en un pc o laptop que codifica tu CV en español, cartita de amor, twitteo, comentario de facebook, tesis y otras cosas desde tu lenguaje ha el lenguaje hexadecimal y binario (lo que puede entender un procesador de computadora) para poder transportarlo y luego decodificarlo en tu lenguaje y lo puedas visualizar en el monitor.

El secreto está en la velocidad con que los procesadores son capaces de codificar y decodificar la información; es sencillo para ellos pues éstos no extrañan ni se enamoran, no andan pensando en la dama con la que se encontraron y no pueden sacarla de su mente o en que habrá para cenar ni en el transito de Lima (capital del Perú). Entonces los discos duros, pen drive, cd, dvd, disquete, etc no hacen otra cosa que almacenar datos "codificados" que luego una computadora "decodifica" para que el usuario (tu y/o yo) que sí tiene escasos recursos de procesamiento de este tipo, pues sí se enamora y tiene que tomar alguna autopista congestionada para regresar a casa, pueda obtener nuevamente la información a partir de esos datos.

Como dice la letra de una canción del grupo Niche "...por si hay una pregunta en el aire..." y sí que la hay: ¿Que tienen que ver las bacterias con esto de los lenguajes y los cambios de base?

De la Anatomía y Biología, específicamente de las clases aburridas de ADN y la CELULA:

Recordaremos que al estudiar a los seres vivos en biología, siempre el profe dibujaba en la pizarra su mega bacteria y nos la presentaba como la procariota pues no tenía núcleo (algo así como corazón) a diferencia de la eucariota, asumiendo que no te dormiste en clase o que no te fuiste a jugar Play2,3 o Atary vamos a centrarnos en el interior de la bacteria (no olvides que es un ser vivo) como en todo, tenía sus partes y una de ellas era el ADN que en este caso se encontraba disperso en el citoplasma (algo así como una piscina de gelatina royal) y este transporta material genético STOP!

Antes de alejarnos del tema, a mi me gusta centrarme en las "definiciones" y ubicar las palabras clave, así que primero:

  • ADN: Es un tipo de ácido nucleico, una macromolécula que forma parte de todas las células. Contiene la información genética usada en el desarrollo y el funcionamiento de los organismos vivos conocidos y de algunos virus, y es responsable de su transmisión hereditaria.
  • Material Genético: se emplea para guardar la información genética de una forma de vida orgánica. Para todos los organismos conocidos actualmente, el material genético es casi exclusivamente ácido desoxirribonucleico (ADN o DNA) - BINGO!!
Entonces, tenemos lo siguiente como palabras sueltas al azar:

ADN - TODAS - CELULAS - TRANSMISIÓN - USADAS - FUNCIONAMIENTO

MATERIAL GENETICO - GUARDAR - INFORMACIÓN - ADN

De ida y vuelta tenemos que el ADN es un código escrito en algún lenguaje (divino, inteligente o simplemente aleatorio) que guarda para luego transportar información que será usada por las células para su correcto funcionamiento. WOW! muy similar al ejemplo del usuario de arriba con sus cartitas de amor y comentarios de facebook, pero otra pregunta me viene a la mente: ¿Que lenguaje "habla" el ADN? no creo que sea el hexadecimal, ni el decimal y peor el binario.

Efectivamente no es ninguno de esos, es bastante mas complejo, al punto que aun no está descifrado del todo en su interior; sin embargo recordemos la clase del ADN, visualizamos al profesor haciendo sus cadenitas cruzadas y colocándole "letritas" cada cierto espacio. Usemos una analogía: La cadena de ADN es un polímero (un tren con muchos vagones), compuesto por muchos nucleotidos (cada uno de los vagones) y estos se componen por un azúcar (el caparazón del vagón) y una base nitrogenada (el pasajero que se encuentra en el vagón y que lleva un mensaje o varios)...

Entonces el "qui" de nuestro asunto está en la base nitrogenada (el pasajero) que puede ser, para efectos prácticos, de cuatro tipos: A (adenina), T (timina), C (citosina) o G (guanina). Estos son los factores a partir de los cuales se transportan información y comandos entre las células de todo ser vivo que radica en nuestro maltratado planeta.

Suficiente ciencia para entender el asunto, a los tipos de nucleotidos les damos valores numéricos para poderlos estandarizar, de este modo tenemos:
  • A = 0
  • T = 1
  • C = 2
  • G = 3
Y así llegamos a la alegre conclusión que podemos migrar un texto o dato cualquiera al "sistema ADN" así como cualquier cosa imágenes, música y vídeos. Hagamos un ejemplo con una palabra, para lo cual pasaremos del sistema alfabético latino a codigos ASCII, luego de éste a la base (4) y finalmente de dicha base al sistema ADN.


De las Ciencias Sociales un poquito de Historia:

Cuando hablamos de almacenar nuestros datos en un lugar frío y desconocido como un disco duro en casa o Internet, nos invade una gran duda "¿y si alguien los ve, los roba o los copia?". Semanas atrás en una conversación con un cliente que necesitaba automatizar muchos de los procesos en su organización, ya que esta había quedado suspendida en el tiempo hace 20 años; luego de escuchar mis recomendaciones y explicaciones respecto de como se llevaría a cabo el proceso, primero de digitalizar todo dato y documento para tenerlo en el servidor y luego a partir de eso obtener información pertinente, noté como sus pupilas se dilataban más y más conforme se lo decía, finalmente detuve mi exposición para preguntar el motivo de su desasosiego, considerándose muy perspicaz dice: "no sería riesgoso tener toda la información en ese servidor, mejor lo dejamos en papel también porsiacasito" dicha duda bastante común en nuestro medio y más aún la palabrita que denoté me generó un lajeo mental que más tarde pude resolverse no sin antes explicarle algunos conceptos relativos a la encriptación de los datos y mecanismos de seguridad y anti-vulnerabilidad.

La 2da Guerra Mundial como todo acontecimiento histórico tiene sus protagonistas, unas veces personas y otras instrumentos que marcaron la estrategia a seguir. Tal fue el caso de la maquina "Enigma" seguro que más de uno la recuerda, en especial los más longevos lectores, hablamos de un tipo de maquina de escribir que contaba con un sistema de cifrado rotatorio capaz de cifrar y descifrar mensajes en hasta 22 millones de combinaciones distintas, durante la década de 1930 las fuerzas militares alemanas la emplearon en sus comunicaciones.

Más tarde a partir de la captura de una de las "maquinitas" por parte de los polacos, se pudo descifrar el algoritmo de los rotores, no fue sencillo pues habían muchas combinaciones posibles para lo cual se ayudaron de la llamada "bomba kryptologiczna"; muchos historiadores consideran esa captura como una de las causas de haber podido concluir la 2da guerra al menos 2 años antes de los previsto, la historia es expectacular y fascinante, a los interesados les recomiendo lean "La guerra que había que ganar" de Williamson Murray.

Previo a esto y hasta nuestros días, la criptografía y los sistemas de cifrado, si bien han evolucionado en la cantidad de combinaciones y algoritmos dinámicos, en el fondo siguen teniendo el mismo principio: El cifrado consiste en convertir el texto plano en un galimatías ilegible, denominado texto cifrado o criptograma, STOP! Sufienciente Historia.

Claro y directo. Ya tenemos una bacteria con los datos "Kenecon" en su ADN, entonces digamos que este mensaje ha sido cifrado o encriptado previamente utilizando altos estándares de encriptación, digamos un RSA a 2048 bits (Si no entiendes esto no importa) la cuestión es que el mensaje así como con la ENIGMA se vuelve indescifrable, para poderlo entender hace falta la computadora que tenga la clave de cifrado y la capacidad de procesamiento para descifrarlo rápido, está claro que a mayor bitraje del algoritmo, será más complicado descifrarlo por lo tanto más seguro, pero también más lento el proceso. Ahora imaginemos que el dato no es "Kenecon" sino todos los 250 mil cables (documentos) que soltó Wikileaks (ojala y no me cierren el blog por mencionarlos), tamaña información demandaría un alto nivel de procesamiento para descifrarlo rápido, pero ademas mucha memoria RAM para que no colapse, ya que hay mucho espacio usado a la vez en la memoria virtual con todos esos datos aleatorios (suena a chino, pero no lo es tanto)...

Explicación: Esto de la memoria virtual colapsada es muy similar a lo que te pasa cuando estas en tu pc o laptop y abres muchas ventanas a la vez, estas viendo un video en youtube, escribiendo en tu blog, 30 ventanas de chrome y firefox abiertas, chateando en el msn con tu flaco(a), tu ex, el ex de tu amiga(o) (mal-amiga(0)!) y tu otro amigo traidor para nivelar (comooo!!), jugando Starcraft II, chequeando tu gmail y el google reader y viendo petardas, qqqqqqq!! jajaja es un chiste; lo cierto es que si puedes hacer todo eso a la vez lo más probable es que seas descendiente de Napoleon Bonaparte y lo 2do más probable es que tu memoria virtual colapse y te salga un letrerito (si estas en Window) diciendo "no hay suficiente memoria virtua", te veo sonreir, alegre y extasiado y me alegro, seguro que ya entendiste el párrafo anterior a este, verdad? dime que Si. Asumo que si ok.

¿Cómo solucionamos esto? Un poco de imaginación y perversión. Digamos que tenemos a nuestra "Bacteria Wikileaks" con todos los cables de wikileaks codificados (que en realidad es poquísima información para el ejemplo, pero están de moda así que sigamos porque yo sé que me entiendes) y tenemos otra bacteria que contiene el algoritmo de encriptación utilizado listo para descifrar, la llamaremos "Bacteria Flow", entonces para acceder a los datos es necesario la información y el patrón contenido en esta bacteria flow (esta bacteria puede ser artificial también); cuando necesites leer tus cables y enterarte de los coloquiales rajes de nuestros amigos los embajadores y demás personalidades norteamericanas lo único que tendrá que pasar de forma figurativa y no literal será una "noche pasional" entre tus dos bacterias, es decir, se van a aparear, "sex and bacteria" sí como la película. Finalmente mediante interfaz (bacterias - ordenador) Bualá! tendrás a la vista toda tu información en la pantalla.

Notas Finales:

  • Cuando conversaba con una amiga (enemiga de la tecnológica) sobre estos nuevos descubrimientos de los "jaladitos" me decía: "¿porqué en una bacteria? si ya hay discos duros y usbs". En la actualidad hay muchos más dispositivos de almacenamiento, desde el punto de vista de la estabilidad, tamaño físico y rapidez de manejo de los datos están las SSD (Unidad de estado solido) que en 2011 según los especialistas será su explosión comercial, sino miren la nueva Mac Book Air de Apple, sin embargo tiene su talón de Aquiles: la capacidad de almacenamiento. Considerando la cantidad de información que necesita un ser vivo promedio para desarrollar todas las capacidades biológicas desde su origen hasta su etapa madura, sin duda el ADN como contenedor de dicha información es dentro en la naturaleza el almacén de información óptimo, sino me crees mírate al espejo!
  • La bacteria en cuestión sobre la que se realizo dichos estudios es la Escherichia coli o simplemente "E. coli", por lo general vive en los intestinos animales. Sí también en el tuyo.
  • La Universidad en cuestión publicó un documento muy gráfico en el que detallan los descubrimientos y explican que por ejemplo 1 gramo de células está compuesto por 10 millones de células y la Declaración de Independencia de Estados Unidos es almacenada en tan sólo 18 células de bacterias. De aquí se desprende la gran capacidad de almacenamiento. El documento en cuestión está aquí. Pero como alguno tienen problemas con los PDF, lo subí a Scribd también. Al final hay unas fotos de los marcianos asiáticos que lograron el descubrimiento.
Hablando de bacterias, les dejo un temita de Calamaro, cuando esta biotecnología llegue y te de una gripe cuida que tus antibióticos no formateen tu biodisco de 900 TB. ;)


Si llegaste hasta aquí por tu propia voluntad, muchas gracias por leer mi blog, asumiré de manera positiva que te gusto la entrada, la hice pensando en aquello que al igual que yo escuchan la noticia y les parece fascinante y quieren saber más, pero ni son biólogos, ni hackers de la informática, ni criptógrafos. Espero que el mensaje haya sido expuesto claramente.


Estoy contento de haber retomado mi hobbie de blogger, las noche y el insomnio lo hicieron posible. En la próxima entrada mis apreciaciones sobre Wikileaks y un par de apuntes sobre el amor en los tiempos de la web 2.0 y los días aciagos, que miedo!!

Hasta luego.

Comentarios

clavel ha dicho que…
¿Almacenar información en bacterias? parece increible... interesante la explicación interdisciplinaria que haces relacionando conjugando matemática, biología y ciencias sociales. Gracias por el aporte lo compartiré con mis alumnos.
Kenecon ha dicho que…
Thanks, sí increíble pero chento por chento!!! :) ojala lo lean ps, para que tengan una idea de q todo lo q enseñan en el cole luego sirve, bueno casi todo ;)

Entradas populares de este blog

Al P. Pedrito Alva en sus 59 años de labor.

Un homenaje a un personaje presente en la vida de muchos amigos, conocidos y desconocidos que por nuestra parroquia pasaron, Pedro Alva es sin duda en Divino Maestro un referente, para los que -como yo- con él conversaron, siempre tuvo una buena anécdota o un consejo certero y agradable que nos ayudó a caminar; recuerdo las historias de cadetes, de su pueblo, de su madre y su familia que con un dulzor inigualable relataba y aunque muchas veces repetidos siempre me dejaron un diferente mensaje escondido. Hoy no fue la excepción, el año se despide de mi, regalándome muchos momentos felices quizás pagados "todititos de a montón a fin de año" como decía el chavo... tal vez con la intención de equilibrar lo que éste sin duda fue un año muy complicado. Regresaba de una más que bonita tarde amical y digamos que hasta allí el día había cumplido su fin alegre, cuando pasé por mi parroquia, camino que ya no tomaba, personas que hace mucho no veía, 7 años atrás la dejé al igu

Del Río no me río

Hace unos días mientras retornaba a ca sa a pie, luego de mucho tiempo me vi frente a frente con el río Rímac - sí ese al que le gustaba hablarnos durante la noche o por lo menos a mis a ncestros- de manera inevitable me detuve, no sin antes sentir un controversial sentimiento, enseguida exclame ¡que tal hedor!, pero esta idea se perdió con lo que vi. Vi a un "amigo" moribundo, sucio, casi sin agua y lleno de desechos de toda clase, en conclusión, un ser sin sonrisa. Y pensando en el evento seguí mi camino y ahora me pregunto: ¿Cuándo empezó la ingr atitud con aquel del que nos servimos? La idea de escribir esto no es dar un mensaje de "salvemos el medio ambiente", porque haciendo un mea culpa al respecto, muchas veces he arrojado basu ra donde he podido como la mayoría. Pero al parecer hemos olvidado que la ubicación de la capital de nuestro Perú es decir Lima, fue determinada en gran parte por el "río hablador", más allá de haber sido zona estratégica d

A-RRI-BA -- PE-RÚ!!!!!!!! Jajajajaja. Hay que decirlo sabiendo porqué!!!

Como dicen que sólo somos primeros en Ajedrez con los hermanitos Cori y el otro chibolo con un edipo mal resuelto que se levanto a una brasilera!!! y que ya paso la época del guano y el salitre como la del caucho, mas tarde los espárragos y la plata y ni que decir de la hoja de coca que en eso somos los reyes de la pista, pero de las pistas de aterrizaje de todos los aeropuertos clandestinos que están regados por toda nuestra selva. Lo cierto es que el Perú es el país del Criollismo Justificado, de la comodidad suprema, la barriga abultada y del "pasa nomas pero déjame alguito, hermano lindo"; somos hijos de los mismos mestizos que en su momento no quisieron ser libertados ni por Jose de San Martín ni Bolivar ni por cualquier otro enagenado latinoamericano capturado por la idea Francesa de la época, porque se sabían cómodos en una sociedad que todo les daba; claro pues y como no iban a estar comodos nuestros ancestros, si era fácil ser el centro de acopio de los tribut