Cientistas já conseguem armazenar uma foto em DNA e recuperá-la perfeitamente

Imagem de capa: Encontrada na internet, autor desconhecido. Extraída de NIH

Na Era da Informação, um dos maiores problemas é onde guardar tantos dados. Espera-se que, em 2017, o volume de informações na internet cresça em 17 zettabytes – ou 1 trilhão de Gigabytes. Para ter noção do tamanho do problema, o facebook recentemente construiu um centro de dados inteiro dedicado à armazenar apenas 1 exabyte – 1 bilhão de Gigabytes.

Felizmente, uma nova forma de armazenamento de dados está sendo investigada, devido à sua incrível capacidade de armazenar muita informação em pouco espaço. Essa tecnologia não é nada recente, tendo sido criada há aproximadamente 4,5 bilhões de anos. Estamos falando da molécula de DNA, que os cientistas acreditam que possa ser o futuro do armazenamento de informações.

O DNA é uma molécula com altíssima capacidade de armazenamento, chegando a ser oito vezes mais “denso” do que a tecnologia em fitas utilizadas atualmente. Outra vantagem do DNA é sua durabilidade – as tecnologias atuais estragam em poucos anos, enquanto uma molécula de DNA pode durar séculos sem perder informações.

Porém obviamente converter dados digitais em DNA não é uma tarefa simples. Foi nesse aspecto que uma equipe da Universidade de Washington se debruçou, publicando recentemente os seus resultados. Os dados digitais são compostos de combinações binárias de 1 e 0, enquanto o DNA é composto de quatro componentes básicos: Adenina (A), Guanina (G), Timina (T) e Citosina (C). Logo, era necessário criar um sistema que conseguisse converter um sistema em outro sem perda de dados, e com a maior densidade possível. Para atingir isso, os pesquisadores se utilizaram da Codificação de Huffman, um código bastante utilizado para compressão de dados. O resultado final:

dadlqbypqmfaytuplkas

Demonstração de codificações de dados Binários para Huffman, e os nucleotídeos correspondentes (créditos: Bornholt et al)

Huffman-DNA

A “chave” de conversão de Huffman para DNA (créditos: Bornholt et al)

Ou seja, codifica-se a sequência binária em Huffman, e de Huffman para DNA. Quando se precisa acessar a informação, basta fazer o caminho reverso. Para facilitar a leitura, os pesquisadores também introduziram marcadores nessas sequências, que agem como o “endereço” da informação.

Com esse sistema pronto, era hora de botá-lo à prova. Os pesquisadores codificaram em DNA quatro imagens e, como esperado, foram capazes de recuperá-las à partir das moléculas de DNA. Para isso, era necessário sequenciar o DNA – um processo que envolve replicar um pedaço específico da molécula, que contém a informação desejada, e então “ler” essa sequência em um aparelho próprio. Os pesquisadores foram capazes de recuperar as quatro imagens conforme desejado e com um número mínimo de erros.

Infelizmente, este estudo é um indicativo de tecnologias futuras, e não uma promessa de aplicação imediata – técnicas de síntese e sequenciamento de DNA ainda são caras demais para serem utilizadas para esse fim. Porém, este tem sido um campo da ciência que experimentou uma das quedas de preço mais bruscas da atualidade – sequenciar o genoma humano custou 3 bilhões de dólares no começo dos anos 2000, e hoje pode ser feito por valores próximas à mil dólares. Logo, não é exagero pensar que logo esta tecnologia será barateada ao ponto onde ela seja acessível à população comum, especialmente agora que essa aplicação foi encontrada, o que poderá levar à maiores investimentos buscando baratear a mesma para uso industrial.

Sobre o Autor - Lucas Rosa.png

Fontes: GizmodoWashington University