terça-feira, 25 de junho de 2013

DNA Humano-chimpanzé não tão similares

Uma análise da alegação comum sobre os genomas de humanos e chimpanzés serem altamente idênticos demonstra ser isso altamente questionável e inverossímil após uma averiguação das metodologias e dados descritos em várias das principais pesquisas publicadas.
Estimativas de similaridade nas seqüências de DNA relatados como tão altas são baseadas principalmente em amostras biológicas e/ou dados pré-selecionados.
Dados muito diferentes para serem convenientemente alinhados foram tipicamente omitidos, mascarados e/ou não mencionados. Além disso, os dados finais sobre as lacunas (genéticas) entre as bases alinhadas também foram muitas vezes descartados, exagerando ainda mais as (altas) estimativas finais de similaridade.
São esses processos de omissão de dados altamente seletivos, impulsionados pelo dogma darwinista, que produzem o comumente aclamado valor de 98% de semelhança entre os DNAs humano-chimpanzé.
Com base na análise dos dados fornecidos em várias publicações, incluindo o frequentemente citado relatório do consórcio genoma chimpanzéde 2005, é seguro concluir que  as semelhanças entre humanos e chimpanzés não é superior a ~87%, e possivelmente não maior do que 81%. Estas estimativas foram revistas com base nos dados relevantes omitidos das principais pesquisas realizadas nos últimos anos.
Sem mencionar a abismal diferença entre os cromossomos Y de ambas as espécies (como veremos mais adiante), que mesmo não tendo papel tão importante para a comparação genômica em si, por outro lado posa como terrível paradoxo contra a pífia teoria da evolução.
Dados de seqüências biológicas são muitas vezes passados por vários níveis de triagem inicial, filtragem e seleção antes de serem finalmente analisados e discutidos.
Um dos principais problemas com a investigação no campo da genética comparativa, é que na maioria dos estudos, há uma grande quantidade de pré-seleções aplicada às amostras biológicas disponíveis e os dados antes da análise final realizada. Só os dados mais promissores, “peneirados” de um conjunto inicial é que são normalmente extraídos para uma análise final.

Os primeiros estudos humano-chimpanzé usando cinética de reassociação

As estimativas iniciais de alta similaridade entre o DNA humano-chimpanzé vieram de um campo de estudo chamado cinética de reassociação. Estes relatórios iniciais alimentaram precipitadas premissas por proponentes populares da TE como Richard Dawkins, que afirmou: “Os chimpanzés e nós compartilhamos mais de 99 por cento dos nossos genes.” Na época, essa declaração era presunçosa, porque os genomas completos de humanos e chimpanzés não eram conhecidos. Os esboços iniciais destes não foram anunciados, até 2001 e 2005, respectivamente.

O supostos dados a que Dawkins se referia em 1986 era uma estimativa indireta com base na cinética de reassociação de DNA humano e do chimpanzé: genes mistos não claramente definidos. Na cinética de reassociação, calor e/ou química são usados ​​para separar a cadeia dupla do ADN em duas.
Quando o DNA é reassociado de maneira controlada, pode ser então fracionado utilizando vários protocolos. Quanto mais lenta a reassociação, mais complexo e geneticamente “denso” o DNA é dito ser.
Para os estudos comparativos a cadeia única da fração de ADN é recolhida a partir de duas espécies diferentes, misturadas entre si, dissociadas, deixando então se reassociarem de modo que o ADN humano e de chimpanzé possam recombinar entre si. O nível de bases complementares correspondentes entre os trechos pode ser indiretamente medido através de uma variedade de métodos que medem as taxas/níveis de reassociação. O porém nisso é que apenas as frações de cadeia única do genoma humano e dos chimpanzés foram utilizados para obter estimativas iniciais de similaridade. Cientistas focaram na fração de cadeia única por causa do elevada concentração de genes. No entanto, muitos genes estão localizados nas outras porções do genoma e assim foram deixados de fora da análise. Outro problema é que praticamente todo o genoma é agora conhecido ser funcional em algum aspecto e as regiões não-codificadoras foram provadas serem essenciais para fornecer muitas características do controle crítico e moldagem dos nucleótideos.

Referência
Total de bases genômicas analizadas
Bases alinhadas
Aclamada semelhança nos DNA
Similaridade ADN real *
Britten, 2002
846,016
779,132
95.2%
~ 87%
Ebersberger et al., 2002
3,000,286
1,944,162
98.8%
< 65%
Liu et al., 2003
10,600,000 (total para humanos, chimpanzés, babuínos, e sagüi)
4,968,069 (humano–chimp)
98.9% sem indels
?
Wildman et al., 2003
~90,000 (exons de 97 genes)
?
98.4–99.4%
?
Chimp. Chrom. 22 Consort.
32,799,845
?
98.5% excluindo indels
80–85% incluindo indels
Nielson et al., 2005
?
?
99.4% regiões genéticas selecionadas
?
Chimp. Seq. Consort. 2005
Inteiro genoma (5X cobertura redundante)
2.4 Gb
95.8%
81%**

Tabela . Resumo da comparação entre os genomas em diversos artigos. Quando fora possível, dados omitidos dos alinhamentos foram usados para produzir uma mais fidedigna comparação real entre os DNA’s.
* Baseado na quantidade de sequências omitidas do DNA durante os alinhamentos
** Comparado a dados do The International Human Genome Sequencing Consortium (2004)—((.9577 x 2.4 Gb) / 2.85 Gb) x 100
? Não foi possível calcular a semelhanças genômica real devido aos dados não serem providos
Um dos primeiros trabalhos de sequências de DNA que apareceram no início do projeto genoma do chimpanzé foi talvez um dos mais objetivos. Roy Britten, um dos pioneiros na cinética de reassociação de DNA, ele comparou a seqüência genômica de cinco clones de DNA chimpanzé de grande inserção (cromossomos bacteriais artificiais ou BAC) sequência genómica humana, utilizando um atípico programa de computador baseado em Fortran que  não era/está disponível publicamente. Estas cinco seqüências BAC de chimpanzés  foram escolhidas porque eram as únicas até então disponíveis. Os pesquisadores geralmente escolhem BAC iniciais para o seqüenciamento do genoma devido ao seu conteúdo de DNA de cópia-única, o que os torna mais fáceis de se montar e comparar com outras espécies. O tamanho total da sequência de DNA para todos os 5 BACs era 846.016 bases. No entanto, apenas 92% deste era alinhávéis ao ADN humano, pelo que as estatísticas finais contaram apenas as 779.132 bases. A seu favor Britten incluiu os dados das inserções e deleções (indels) e daí relatou uma semelhança de ~ 95%. No entanto, um número mais realista incluiria a seqüência de alta qualidade completa de todos os cinco BACs, tão legítimos como os indels dentro dos alinhamentos, dando uma semelhança de DNA final de 87%!
Ilustração de uma região alinhada mostrando possíveis substituições e indels (deleções) que podem variar de uma a milhares de bases pareadas. As inserções e deleções (indels) representam a adição ou perda de sequência de ADN na comparação de sequência com a outra. Indels podem variar em tamanho de uma única base para mais de milhares.
Outro estudo notável publicado por Ebersberger et al., publicado no mesmo ano que artigo de Britten, utilizou seqüência genômico chimpanzé obtido a partir de fragmentos aleatórios de tamanhos selecionados na faixa de 300 a 600 bases. Essas sequências de DNA foram alinhados a uma versão anterior do conjunto do genoma humano usando o algoritmo BLAT (Blast-Like Alignment Tool).Pesquisadores selecionaram dois terços da seqüência total para análises mais detalhadas.Um terço da sequência de chimpanzé não alinhou ao genoma humano e foi descartado. A seção de métodos no artigo descreve como o subconjunto de dados pré-selecionados foi posteriormente filtrado para obter apenas os melhores alinhamentos. Os dados resultantes foram então sujeitos a uma variedade de análises comparativas que, para todos os fins práticos, são completamente insignificantes tendo em vista o nível extremamente elevado de seleção, dados mascarados, e filtragem aplicada. Não é de surpreender que eles tenham reportado uma diferença de apenas 1.24% em áreas altamente similares entre os dois genomas… Se contarmos todos os dados descartados e filtrados, teremos como resultado uma similaridade não maior do que 65% (Ver tabela).
Pouco após esses artigos iniciais sobre essas comparações dos genomas, uma tendência perturbadora rapidamente surgiu, envolvendo apenas a divulgação dos resultados finais dos alinhamentos, e pior, omitindo todos os detalhes específicos sobre a metodologia: como os dados foram filtrados, selecionados, “maquiados”. Dados cruciais que permitiriam leitores dos artigos calcularem pessoalmente um cenário mais real começaram a ser consistentemente ocultados.
Exemplo, Liu et al. relatou sobre alinhamento genômico entre humanos e chimpanzés, babuínos e saguis. Informação importante sobre o conjunto inicial de sequências e dados específicos dos alinhamentos foi sumariamente omitido! Eles apenas relataram que usaram uma quantidade total de 10.6 Mb de sequencias para todas as espécies combinadas. Sua estimativa final dos alinhamentos, omitindo indels e áreas não-alinháveis, foi de 98.9%. Incluindo indels, o valor seria de 95.6%, similar a pesquisa de Britten.
Outra tendência preocupante é que apenas sequências codificadoras de proteínas (éxons) altamente conservadas passaram a ser mais frequentemente utilizadas nessas comparações. Nós sabemos atualmente que sequências não codificadoras de proteínas, que compôe mais de 95% do DNA, são críticos para todos os aspectos genômicos e genéticos funcionais. Típico dessa tendência em alinhar apenas sequências exônicas, Wildman et al. divulgaram um estudo que comparou apenas regiões codificantes de proteínas de ambos humanos e chimpanzés, fragmentos de 97 éxons, dando um total de 90.000 bases. Os éxons pré-selecionados eram baseados no fato de serem presentes em ambas espécies e reconhecidamente tidos como altamente alinháveis. Por causa dessa abordagem tendenciosa e escassez de detalhes sobre o material analisado e os métodos, fica impossível chear a uma estimativa honesta dos dados omitidos e do alinhamento em si.
Em 2004, Watanabe et al. usaram uma variedade de “bibliotecas” BAC para selecionar clones para sequência de DNA representando cromossomo 22 dos primatas. A sequencia foi comparada ao homólogo humano. A ressalva é que os clones BAC dos primatas só eram selecionados se cada um contesse de 6 a 10 marcadores de DNA humanos. Novamente, uma pré-seleção nada imparcial e honesta dos materiais. Neste caso, ocorrera antes mesmo dos dados sequenciais serem ao menos gerados. Lamentavelmente, estastícas gerais sobre o alinhamento não foram dadas no artigo nem em seus materiais suplementares. Os autores afirmam um percentual de substituições de nucleotídeos de 1.44% em areas alinhadas, mas não ofereceram nada que incluísse os indels. Enquanto esses foram omitidos da das semelhanças no alinhamento, os autores indicam que haviam 82.000 deles e proveram um histograma que mostra graficamente tamanho da distribuição baseados em dados agrupados. Estranhamente, nenhum dado sobre o tamanho médio dos indels foi provido. Da mesma forma, foi dado o número de lacunas da seqüência, mas nada sobre o tamanho acumulado destas. Baseados nos limitados e incompletos dados oferecidos, podemos estimar uma semelhança genômica entre 80% a 85%.
Um dos estudos mais ambiguos foi publicado por Nielson et al. Mantendo a inclinação a ofuscante metodologia, apenas éxons altamente alinhaveis foram utilizados e nenhum dado foi provido que permitisse um calcúlo real da similaridade total. DO total inicial de sequencias na analise (20.361) os pesquisadores acabaram deixando de lado 33% (6.630) em um ambigua afirmação de “controle de qualidade altamente conservativo”. EM outras palavras, 1/3 dos dados geneticos primatas iniciais não alinhavam aos dos humanos, sendo então eliminados. De fato, nenhum substancial dado foi concedido para pelo menos avaliar os 2/3 finais que foram comparados. Os autores apenam reportam sobre a divergências de sequencias substituidas entre as “áreas silenciosas”. Essas são áreas onde os dados foram descartados, representando locais onde variação genética supostamente representa pouca ou nenhuma função no genoma. Nós já vimos que mesmo areas não codificadoras são funcionalmente ativas. Dados sobre diferenças nos indels foram completamente omitidas.
_______________________________________________
A publicação mais marcante sobre comparações dos genomas foi o artigo da Nature de 2005 sobre o International Chimpanzee Genome Sequencing Consortium. Infelizmente, este trabalho seguiu a tendência previamente estabelecida, onde a maioria dos dados comparativos foi dado em um formato altamente seletivo e ofuscado e informações detalhadas sobre os alinhamentos estavam ausentes. A maior parte do papel era principalmente preocupado com uma variedade de análises evolutivas hipotéticas para várias taxas de divergência e as forças selectivas. Assim, a questão crítica da semelhança geral foi cuidadosamente evitada. Contudo, com base nos números fornecidos no artigo, pode-se determinar uma grosseira semelhança geral do genomas, incluindo informações simultâneas publicadas a partir do projeto genoma humano. No que diz respeito ao alinhamento geral, os autores declaram “Os melhores alinhamentos de a nível de nucleotídeos recíprocos dos genomas de chimpanzés e humanos cobrem ~ 2,4 gigabases(GB) de seqüência de alta qualidade”. A esta altura, a montagem eucromática humana foi calculada em 99% completa em 2.85 Gb e teve uma taxa de erro de 1 em cada 100.000 bases. O autores do genoma chimp afirmam: “As diferenças nos indels entre os genomas compões total de ~ 90 MB. Diferença que corresponde a ~3% de ambos genomas, e que sobrepuja os 1.23% de diferença resultantes das substituições nos nucleotídeos.”

Em suma, apenas 2.3 Gb da sequencia chimp alinhou-se no altamente apurado e completo genoma humano (2.85 Gb), uma operação que incluiu o mascaramento de sequências de baixa complexidade. Sobre a sequência primata que alinhou-se, os dados para substituições e indels indaca uma semelhança de 95.8%, uma figura distorcida que exclui as regiões mascaradas, ocultas. Adicionando elas, uma estimativa total do DNA chimpanzé comparado ao humano produz uma estimativa conservadora de 80.6%. Em 2005, uma área com 5 vezes a cobertura redundante do genoma chimp foi atingida, o que deve ter reresentado 95% da sequência total senão mais.
Wood em seu relatório agrega uma análise que tenta validar a inteira montagem do genoma chimp de 2005, usando sequências de aminoácidos de genes ortólogos já sendo conhecidamente similares, alinháveis. Comparações de aminoácidos proteícos entre sequências de órtologos conhecidos eletronicamente traduzidos dificilmente é um eficiente indicador de semelhanças genômicas. Ortólogos são genes em diferentes espécies que são cridos terem evoluídos de um gene ancestral comum principalmente porque eles tem a mesma função e sequencias similares em ambas espécies. Outro problema com proteínas geradas eletronicamente para comparações é liderado pelo fato de que a maioria de genes mamíferos submeterem-se a áreas alternativas de inicio/fim de transcrições e traduções, multíplos mecanismos de splicing (um processo que remove os íntrons e junta os éxons depois da transcrição do RNA.) de exóns, segmentos decodificadores de RNA regulatório intragene, elementos ampliadores e muitos outros aspectos transcritores de códigos bem complexos.
À luz do nosso conhecimento atual sobre como o genoma funciona na prática, a abordagem antiquada de usar seqüências de proteínas nucleares deduzidas eletronicamente para comparações intergenomicas precisam ser seriamente repensadas por ambos evolucionistas e criacionistas. 
Seguindo o resumo de Wood, vários outros estudos subsequentes vieram, como o de Ebersberger et al, no qual uma grande soma de sequencias de humanos, chimpanzés, orangotangos, resos e gorilas foram usadas para a construção de filogenias (alinhamentos múltiplos analisados ​​em formato árvore evolutiva). As sequências de DNA’s passaram por vários níveis de seleção para pré-analise, “podagem” e filtragem para um ótimo alinhamento. Primeiro, uma série de 30.112 sequencias foram selecionadas que compartilhavam homologia (similaridades sobrepostas) entre as cinco espécies. Essas seqüências foram alinhadas e apenas aqueles que produziram ≥ 300 alinhamentos de base foram retidos para outra série de alinhamentos.
Este processo de filtração removeu mais de 22% já conhecida, a pré-seleccionado sequência homóloga. Apesar de toda essa filtragem projetada para produzir o alinhamento evolutivo mais favorável e árvores de dados, os resultados não mostraram qualquer caminho claro de ascendência entre seres humanos e chimpanzés ou qualquer um dos grandes primatas. O que surgiu foi um verdadeiro mosaico de sequências únicas de DNA humano e de primatas; negando qualquer ramificação clara de ancestralidade comum. Talvez o melhor resumo da pesquisa pode ser encontrada nas palavras do próprio autor:
“Para cerca 23% de nosso genoma, nós compartilhamos nenhuma ascendência genética imediata com o nosso parente vivo mais próximo, o chimpanzé.
“Assim, em dois terços dos casos, um resultado de genealogia no qual os seres humanos e os chimpanzés não são parentes genéticos mais próximos uns dos outros. As genealogias correspondentes são incongruentes com a árvore de espécies. De acordo com as evidências experimentais, isto implica que não existe tal coisa como uma história evolutiva única do genoma humano. Pelo contrário, ela se assemelha a uma colcha de retalhos de regiões individuais após as suas próprias genealogias. “

O cromossomo Y

Um dos relatórios mais prejudiciais ao dogma evolucionista que veio a tona nos últimos anos é a comparação do cromossomo Y entre os seres humanos e chimps. Neste estudo, a região específica do sexo masculino (RMS), uma grande região do cromossomo Y, foi comparada entre humano e chimpanzé. Para realizar isto, uma quantidade razoável de re-sequenciamento tinha de ser executado devido ao fato da sequência do chimpanzé nesta área ser fragmentada e incompleta. O resultado final foi de 25.800.000 bases de seqüência chimp do cromossomo Y de alta precisão distribuídos em oito segmentos contíguos. Quando comparado com o cromossomo Y humano, as diferenças eram enormes. Os autores afirmam:
“Cerca de metade da seqüência ampliconica chimpanzé não tem partes homólogas alinhávéis no MSY humano, e vice-versa.” A seqüência ampliconica contém unidades repetidas ornadas (chamados de palíndromos), que leem-se do mesmo jeito de trás para frente e vice-versa. Disperso dentro destes palíndromos estão as famílias de genes que são expressos principalmente nos testículos. Não só de 50% deste tipo de sequência não alinhara entre o humano e chimpanzé no cromossoma Y, humanos tinham mais do dobro de genes no total (60 contra 25 deles). Existem também três categorias completas de genes (gene famílias) encontradas nos seres humanos, que não estão nem presentes nos chimpanzés. Relacionado com esta grande diferença no conteúdo de gene, observam os autores, “Apesar da estrutura elaborada do MSY chimpanzé, seu repertório genético é consideravelmente menor e mais simples do que a do MSY humano” e “o MSY chimpanzé contém apenas dois terços mais genes distintos ou famílias de genes do que o MSY humano, e apenas metade do número de unidades de transcrição de proteínas de codificação.”
Alguns casos de alta similaridade podem ser devido à contaminação
Outro fator a ser considerado no debate similaridade humano-chimp é que alguns casos de alta semelhança da sequência pode ser devido a contaminação. Não apenas a montagem e organização do genoma primata ainda ser feito em grande parte com base na estrutura do genoma humano, também parece agora que a contaminação generalizada das bases de dados não-primatas com DNA humano é um problema grave e pode ser tão elevado como 10% em alguns casos. Contaminação humana resulta do processo de clonagem de fragmentos de ADN no laboratório para a sequenciação em que as células humanas lançadas no ar provenientes de tosse, espirros e contato físico com os dedos contaminados. A detecção e caracterização de contaminação de DNA humano em bases de dados de primatas pode ser uma tarefa difícil e altamente subjetiva por causa do dogma fundamental de evolução dos primatas. É também digno de nota que o genoma do chimpanzé foi sequenciado durante o período de tempo em que a contaminação de ADN generalizado humano não tinha sido bem exposta. O problema de contaminação é também confundido com o uso da estrutura humana para a montagem e anotação da sequência de chimpanzé.
De fato, a contaminação não só é possível através de erro de laboratório, mas é introduzida de propósito durante a montagem do genoma do chimpanzé tendo base no dogma darwinista. Em um site recente no banco de dados Ensembl (projeto conjunto de bioinformática entre EMBL-EBI e do Wellcome Trust Sanger Institute), uma página intitulada “Chimp Genebuild ‘fornece as seguintes informações a respeito de uma das formas em que o genoma humano é usado como um guia para montar e anotar o genoma do chimpanzé:
“Devido ao pequeno número de proteínas (muitos dos quais alinhadas na mesma localização) uma camada adicional de estruturas do gene é adicionada por projeção de genes humanos. A anotação de alta qualidade do genoma humano e o elevado grau de semelhança entre os genomas humano e de chimpanzé nos permite identificar genes em chimpanzé por transferência de genes humanos para o local correspondente no chimpanzé.
“As transcrições de codificação das proteínas de estruturas de genes humanos são projetadas através do WGA [montagem do genoma inteiro] sobre os cromossomos do genoma do chimpanzé. Pequenas inserções / deleções que interrompem a leitura-frame das transcrições resultantes são corrigidas inserindo-se íntrons de “muda-estrutura” dentro da estrutura “.