Esqueça a pen e o disco rígido. No futuro vamos guardar informação em tubos de ensaio

Investigadores desenvolveram nova técnica para armazenar informação em ADN sintético. Dados de 200 mil portáteis cabem num grama, na ponta de um dedo. Filme dos irmãos Lumière já passou no teste

Imagine guardar todas as fotografias de família num tubo de ensaio, mais concretamente em pequenas partículas que nem lhe ocupariam a ponta de um dedo e com a garantia de que, daqui a milhares de anos, as gerações vindouras teriam acesso às imagens sem perda de qualidade.

Se é daqueles que nem descarrega as fotos do telemóvel, talvez não esteja a ver a utilidade desta ultra compactação de dados. Mas pense numa escala maior: nos milhões de fotografias guardadas na internet – as últimas estimativas sugerem que, a cada dois minutos, tiramos mais fotografias do que as que existiram ao longo de século e meio. Se lhe dissermos que, no futuro, alguns contentores com tubos de ensaio poderão substituir os servidores de gigantes como a Google ou a Amazon, vai querer saber como. A resposta está no ADN (sim, o ácido que codifica as instruções genéticas que fazem de nós o que somos).

 

Da medicina para o digital Se nas últimas décadas a genética era apontada como o futuro da medicina personalizada, há mais uma indústria que promete não ficar indiferente aos mistérios das sequências de letrinhas que codificam genes e às vezes, quando estão fora do sítio ou simplesmente faltaram à chamada, estão por detrás de doenças ou predisposições.

Os investigadores descobriram uma forma de usar a arquitetura do ácido desoxirribonucleico para armazenar informação, transformando os bits nestas mesmas letras – ou bases – do ADN: os nucleotídeos A, C, G e T.

Se o empreendimento não é inédito, na semana passada uma dupla de investigadores dos Estados Unidos anunciou nas páginas da revista “Science” ter desenvolvido um algoritmo que permite guardar 60% mais informação do que até aqui e recuperá-la sem comprometer os “ficheiros”, o que em experiências prévias tinha sido um obstáculo.

O trabalho, assinado por Yaniv Erlich e Dina Zielinski, cientistas computacionais da Universidade Columbia e do Centro de Genoma de Nova Iorque, foi desenvolvido em tempo recorde. Começaram em maio e apresentaram o artigo para publicação na “Science” em setembro do ano passado.

Dina Zielinski explicou ao i o processo. Para guardar informação em moléculas de ADN, começam por comprimir os ficheiros, convertendo-os em código binário: 0s e 1s.

O segredo da “eficácia” do processo está no algoritmo que desenvolveram, a que chamaram código “Fountain” (Fonte), e que permite codificar a informação de uma forma menos corruptível, partindo os dados em pequenos segmentos aleatórios e inserindo alguns 0s e 1s extra que permitem catalogar as partes do puzzle de forma a que, quando for hora de o converter de novo para imagem, áudio ou texto, esse processo ser mais fácil. Posto isto, segue-se a transcrição dos 0s e 1s para as quatro bases do ADN: 00 passa a ser o A do nucleótide adenina; 01 o T de timina; 10 converte para o C de citosina e 11 para o G de guanina.

Com a receita “genética” do ficheiro em mãos, os investigadores enviaram depois as sequências para uma biotecnológica, que produz ADN sintético. Neste caso, em vez de conter instruções para a vida, guardava, alguns registos singulares.

A equipa quis “divertir-se” um pouco, como explicaram à imprensa internacional, e escolheram armazenar no ADN um sistema operativo completo, um vírus informático, um texto do pai da teoria da informação Claude Shannon e um dos primeiros filmes dos irmãos Lumière, “L’Arrivée d’un train en gare de La Ciotat”, uma das fitas mais preciosas do cinema, exibida pela primeira em vez 1896 e com apenas 50 segundos de duração.

Ao todo, foram precisas 72 mil sequências de ADN, com 200 bases (letras) cada, para guardar todos estes arquivos.

Passadas três semanas, receberam o resultado, num “único tubo de ensaio”, que basta “guardar num frigorífico chega ou no congelador para armazenamento de longa duração”, explica Dina Zielinski. Para fazer a leitura dos dados, é preciso juntar um pouco de água, um sequenciador de ADN e depois descodificar os ficheiros originais, o que demorou à equipa um dia.

“A vantagem do ADN em relação aos dispositivos de armazenamento convencionais como discos rígidos ou cassetes é que estes se tornam obsoletos e precisam de ser substituídos a cada dez anos, na melhor das hipóteses. O ADN pode durar centenas de anos”, diz Dina Zielinski. “Pense num CD dos anos 90, provavelmente hoje já está riscado. Hoje conseguimos ler o ADN de um esqueleto com 4000 anos”, explicou o colega Yaniv Erlich à “The Scientist”. “Mas uma das coisas boas do ADN é que não está sujeito à obsoloscência digital. Pense nas cassetes de vídeos ou nos filmes de 8mm. Hoje em dia é muito difícil vê-los porque as mudanças do hardware são muito rápidas. No caso do ADN, o hardware não vai a lado nenhum. Já cá anda há 3 mil milhões de anos. Se a humanidade perder a capacidade de ler ADN, teremos problemas muito maiores do que o armazenamento de dados.”

Com a nova técnica, os investigadores conseguiram armazenar 215 petabytes de informação num grama de ADN sintético. “O seu portátil tem provavelmente um terabyte. Multiplique isso por 200 mil e toda essa informação caberia num grama de ADN.” Conseguiram um recorde de 1,8 bits por nucleótido ou base. Ou seja, cada letra guarda essa quantidade de informação.

O preço é, por agora, o problema desta revolução. Desenvolver o ADN sintético custa 7000 dólares e a tecnologia para o ler leva outros 2000 dólares.