علومثقافة

نجح العلماء أخيرًا في سد فجوة 8% في الجينوم البشري

Quando o Projecto Genoma Humano anunciou que tinha concluído o primeiro genoma humano em 2003, foi um feito importante – pela primeira vez, o modelo de ADN da vida humana foi desbloqueado. Mas isso veio com um porém: eles não foram capazes de reunir toda a informação genética do genoma. Havia lacunas: regiões não preenchidas, muitas vezes repetitivas, que eram demasiado confusas para serem reunidas.

Com os avanços na tecnologia que poderiam lidar com essas sequências repetitivas, os cientistas finalmente preencheram essas lacunas em maio de 2021 , e o primeiro genoma humano de ponta a ponta foi publicado oficialmente em 31 de março de 2022 .

Sou um biólogo genoma que estuda sequências repetitivas de DNA e como elas moldam os genomas ao longo da história evolutiva. Fiz parte da equipe que ajudou a caracterizar as sequências repetidas que faltavam no genoma. E agora, com um genoma humano verdadeiramente completo, estas regiões repetitivas descobertas estão finalmente a ser exploradas na íntegra pela primeira vez.

محتوى

  1. As peças que faltam no quebra-cabeça
  2. O que é DNA repetitivo?
  3. Completando o quebra-cabeça genômico

As peças que faltam no quebra-cabeça

O botânico alemão Hans Winkler cunhou a palavra “genoma” em 1920, combinando a palavra “gene” com o sufixo “-ome”, que significa “conjunto completo”, para descrever a sequência completa de DNA contida em cada célula. Os pesquisadores ainda usam essa palavra um século depois para se referir ao material genético que constitui um organismo.

Uma maneira de descrever a aparência de um genoma é compará-lo a um livro de referência. Nesta analogia, um genoma é uma antologia que contém as instruções do DNA para a vida. É composto por uma vasta gama de nucleotídeos (letras) que são empacotados em cromossomos (capítulos). Cada cromossomo contém genes (parágrafos) que são regiões do DNA que codificam as proteínas específicas que permitem o funcionamento de um organismo.

Embora todo organismo vivo tenha um genoma, o tamanho desse genoma varia de espécie para espécie. Um elefante usa a mesma forma de informação genética que a grama que come e as bactérias em seu intestino. Mas não existem dois genomas exatamente iguais. Alguns são curtos, como o genoma da bactéria Nasuia deltocephalinicola, que vive em insetos , com apenas 137 genes em 112 mil nucleotídeos. Alguns, como os 149 bilhões de nucleotídeos da planta com flor Paris japonica , são tão longos que é difícil ter uma noção de quantos genes estão contidos neles.

Mas os genes, tal como são tradicionalmente compreendidos – como trechos de DNA que codificam proteínas – são apenas uma pequena parte do genoma de um organismo. Na verdade, eles representam menos de 2% do DNA humano.

O genoma humano contém cerca de 3 mil milhões de nucleótidos e pouco menos de 20.000 genes codificadores de proteínas – cerca de 1% do comprimento total do genoma. Os 99% restantes são sequências de DNA não codificantes que não produzem proteínas. Alguns são componentes reguladores que funcionam como um painel de controle para controlar o funcionamento de outros genes. Outros são pseudogenes, ou relíquias genômicas que perderam a capacidade de funcionar.

E mais de metade do genoma humano é repetitivo, com múltiplas cópias de sequências quase idênticas.

O que é DNA repetitivo?

A forma mais simples de DNA repetitivo são blocos de DNA repetidos continuamente em conjunto, chamados satélites. Embora a quantidade de DNA satélite de um determinado genoma varie de pessoa para pessoa, eles geralmente se agrupam nas extremidades dos cromossomos em regiões chamadas telômeros. Essas regiões protegem os cromossomos da degradação durante a replicação do DNA. Eles também são encontrados nos centrômeros dos cromossomos, uma região que ajuda a manter a informação genética intacta quando as células se dividem.

Os investigadores ainda não têm uma compreensão clara de todas as funções do ADN dos satélites. Mas como o ADN dos satélites forma padrões únicos em cada pessoa, os biólogos forenses e os genealogistas utilizam esta “impressão digital” genómica para combinar amostras da cena do crime e rastrear a ancestralidade. Mais de 50 doenças genéticas estão ligadas a variações no DNA satélite, incluindo a doença de Huntington.

O DNA
O DNA satélite tende a se agrupar nas extremidades dos cromossomos em seus telômeros. Aqui, 46 cromossomos humanos são de cor azul, com telômeros brancos.

Outro tipo abundante de DNA repetitivo são os elementos transponíveis, ou sequências que podem se mover pelo genoma.

Alguns cientistas descreveram-nos como ADN egoísta porque podem inserir-se em qualquer parte do genoma, independentemente das consequências. À medida que o genoma humano evoluiu, muitas sequências transponíveis recolheram mutações que reprimiam a sua capacidade de se moverem para evitar interrupções prejudiciais. Mas alguns provavelmente ainda podem se movimentar. Por exemplo, inserções de elementos transponíveis estão associadas a vários casos de hemofilia A, um distúrbio hemorrágico genético.

Mas os elementos transponíveis não são apenas perturbadores. Eles podem ter funções reguladoras que ajudam a controlar a expressão de outras sequências de DNA. Quando estão concentrados nos centrômeros, também podem ajudar a manter a integridade dos genes fundamentais para a sobrevivência celular.

Eles também podem contribuir para a evolução. Os investigadores descobriram recentemente que a inserção de um elemento transponível num gene importante para o desenvolvimento pode ser a razão pela qual alguns primatas, incluindo os humanos, já não têm cauda. Os rearranjos cromossômicos devido a elementos transponíveis estão até ligados à gênese de novas espécies, como os gibões do sudeste da Ásia e os cangurus da Austrália.

Completando o quebra-cabeça genômico

Até recentemente, muitas destas regiões complexas podiam ser comparadas ao outro lado da Lua: a sua existência era conhecida, mas invisível.

Quando o Projeto Genoma Humano foi lançado pela primeira vez em 1990, as limitações tecnológicas impossibilitaram a descoberta completa de regiões repetitivas no genoma. A tecnologia de sequenciamento disponível só conseguia ler cerca de 500 nucleotídeos por vez, e esses fragmentos curtos tinham que se sobrepor para recriar a sequência completa. Os pesquisadores usaram esses segmentos sobrepostos para identificar os próximos nucleotídeos na sequência, estendendo gradativamente a montagem do genoma, um fragmento de cada vez.

Essas regiões lacunares repetitivas eram como montar um quebra-cabeça de 1.000 peças de um céu nublado: quando todas as peças parecem iguais, como saber onde uma nuvem começa e outra termina? Com trechos sobrepostos quase idênticos em muitos pontos, o sequenciamento completo do genoma aos poucos tornou-se inviável. Milhões de nucleotídeos permaneceram ocultos na primeira iteração do genoma humano.

Desde então, patches de sequência preencheram gradualmente as lacunas do genoma humano, pouco a pouco. E em 2021, o Consórcio Telômero-a-Telômero (T2T), um consórcio internacional de cientistas que trabalham para completar a montagem do genoma humano de ponta a ponta, anunciou que todas as lacunas restantes foram finalmente preenchidas .

Isso foi possível graças à tecnologia aprimorada de sequenciamento, capaz de ler sequências mais longas, com milhares de nucleotídeos de comprimento. Com mais informações para situar sequências repetitivas em um quadro mais amplo, ficou mais fácil identificar seu lugar adequado no genoma. Assim como simplificar um quebra-cabeça de 1.000 peças para um quebra-cabeça de 100 peças, as sequências de leitura longa tornaram possível montar grandes regiões repetitivas pela primeira vez.

Com o poder crescente da tecnologia de sequenciação de ADN de leitura longa, os geneticistas estão posicionados para explorar uma nova era da genómica, desembaraçando pela primeira vez sequências repetitivas complexas entre populações e espécies. E um genoma humano completo e sem lacunas fornece um recurso inestimável para os investigadores investigarem regiões repetitivas que moldam a estrutura e variação genética, a evolução das espécies e a saúde humana.

Mas um genoma completo não captura tudo. Continuam os esforços para criar diversas referências genómicas que representem plenamente a população humana e a vida na Terra . Com referências genômicas mais completas, “telômero a telômero”, a compreensão dos cientistas sobre a repetitiva matéria escura do DNA se tornará mais clara.

Gabrielle Hartley é Ph.D. candidato em biologia molecular e celular na Universidade de Connecticut. Ela recebe financiamento da National Science Foundation.