Genomas complexos e suas aplicações na agroenergia

Marcelo F. Carazzolle

Instituto de Biologia e Centro de Computação em Engenharia e Ciências – Universidade de Campinas

O grupo de pesquisa em bioinformática do CCES desenvolveu uma metodologia de bioinformática que permite reconstruir a sequências de genomas complexos sem a necessidade de investir muitos recursos em sequenciamento de DNA e com uma menor demanda de computadores. O trabalho foi coordenado pelo Dr. Marcelo Falsarella Carazzolle que é pesquisador do Laboratório de Genômica e bioEnergia (LGE) no Instituto de Biologia/UNICAMP.

Comparação entre cultivares híbridos de cana-de-açúcar (esquerda) e cana-energia (direita) sob estresse hídrico, evidenciando a resistência a seca e maior produtividade da cana-energia.

Com os avanços nas tecnologias de sequenciamento de DNA, muitos genomas têm sido estudados em detalhes, ampliando enormemente o conhecimento sobre os organismos do nosso planeta. Genomas de microrganismos e plantas são importantes fontes de genes para identificação de novas proteínas com aplicações na biotecnologia como, por exemplo, resistência a fungo, resistência à seca e produção de bioquímicos. Em paralelo, o conhecimento do genoma humano, mais especificamente, do genoma de cada pessoa, tem sido uma ferramenta muito importante para a medicina personalizada, em especial, para a realização de diagnósticos mais precisos.

Mesmo com esses avanços da genômica, muitos organismos importantes ainda não têm seu genoma sequenciado por possuírem genomas muito complexos. Um genoma complexo é um genoma muito grande, tipicamente com dezenas de bilhões de pares de bases (para comparação, o genoma humano tem 3,2 bilhões de pares de bases), que possui um grande número de cópias de cada cromossomo, normalmente diferentes entre si, e grandes regiões contendo apenas sequências repetitivas.

Diversas plantas fundamentais da agricultura, como o milho, trigo, cana-de-açúcar e outras gramíneas, possuem genomas complexos. Seus genomas vêm sendo sequenciados por grandes consórcios envolvendo muitos cientistas e muitos investimentos em sequenciamento massivo de DNA. Dentre esses cientistas, os pesquisadores da área de bioinformática têm um papel fundamental, sendo responsáveis pelo desenvolvimento de algoritmos computacionais para reconstrução do genoma a partir dos dados do sequenciamento: a montagem do genoma e predição dos genes. Essa etapa da montagem de genoma tipicamente necessita de computação de alto desempenho para ser realizada.

“Percebemos que se focássemos apenas na reconstrução das sequências dos genes, ao invés do genoma completo desses organismos, seria computacionalmente mais simples, inclusive reduzindo o custo do sequenciamento do DNA”, comenta Carazzolle. “Dessa forma, desenvolvemos um protocolo computacional que integra diversos programas de bioinformática para realizar a montagem focada nos genes, baseada no conceito de montagem por referência, isto é, utilizamos genomas completos de organismos geneticamente próximos. “Com este protocolo, foi possível reconhecer 90% dos genes do genoma do trigo (que possui 6 cópias de cada gene no seu DNA), e conseguimos identificar vários genes que não tinham sido descritos anteriormente”.

Em seguida, o protocolo foi utilizado para estudar o genoma complexo da espécie Saccharum spontaneum, que é uma das plantas que dão origem às linhagens mais modernas de cana-de-açúcar. O S. spontaneum é responsável por contribuir para a resistência da cana a patógenos e estresse climático, além de ser usado para a produção de híbridos de cana-energia, que é uma planta com alto conteúdo de bagaço e alta produtividade, tendo, portanto, uma atratividade econômica para a produção de biocombustíveis de segunda geração e de outros compostos bioquímicos. Cerca de 40 mil genes foram identificados e estudados por comparação com os genes conhecidos de outras gramíneas. Com isso, foi possível compreender características notáveis dessa espécie, como a alta produtividade e a resistência a estresse. Esses resultados podem ser empregados em estudos funcionais e genéticos, para o desenvolvimento de novas variedades de cana-de-açúcar e cana-energia, ampliando o uso da bioenergia no Brasil.

Trabalhos científicos:

L. C. Nascimento et al., Unraveling the complex genome of Saccharum spontaneum using Polyploid Gene Assembler, DNA Research, 2019 https://doi.org/10.1093/dnares/dsz001

Software: PGA (Polyploid Gene Assembler): http://www.lge.ibi.unicamp.br/pga

Multiscale Modeling of Dynamic Failure in Metallic Materials

CCES faz chamada internacional para pós-doutorado em várias áreas do conhecimento

Related posts

Baffling a Breeze: How AI is Learning to Tame Turbulent Flows

CCES stories: Rodrigo Leandro Silveira

Como criar (e avaliar) um Plano de Gestão de Dados – Segunda Rodada