Sistemas de classificação botânica

Os sistemas de classificação biológica são sistemas hierárquicos de categorias, geralmente construídos de modo a permitirem uma fácil referenciação dos seus membros. Dizem-se hierárquicos porque os indivíduos de qualquer categoria são organizados em grupos cada vez mais inclusivos, até restar apenas um. Reconhecem-se cinco grandes tipos de sistemas de classificação biológica: artificiais, naturais, fenéticos, evolutivos e cladísticos (Quadro 1.). As ideias dominantes (paradigmas) na biologia condicionaram a natureza e o sucesso dos sistemas de classificação biológica. Os sistemas de classificação artificiais (e.g., sistema sexual de Carl Linnaeus) e naturais (e.g., sistema de De Candolle) são essencialistas, porque pressupõem um mundo biológico constituído por espécies imutáveis. Os sistemas fenéticos são uma versão tecnicamente refinada dos sistemas naturais. Os sistemas de classificação evolutivos e cladísticos integram a ideia de evolução.

Sistemas artificiais

Carl Linné foi um médico, botânico, zoólogo e mineralogista sueco do século XVIII (Figura 2-A). É considerado uma das personagens mais determinantes da história da biologia pelos historiadores de ciência (Mayr, 1986). Provavelmente é até o cientista mais influente de sempre; ainda hoje nenhum o ultrapassou no número de citações bibliográficas. A sistemática botânica e zoológica moderna nasceu em duas das suas publicações. A primeira edição de Species Plantarum, de 1753 (Figura 2-B), e a décima edição de Systema Naturae, uma obra em dois volumes publicada entre 1758 e 1759, são consideradas, respetivamente, o ponto de partida da nomenclatura sistemática botânica e zoológica (v. «Nomenclatura biológica clássica»).

O uso da nomenclatura binomial na taxonomia biológica generalizou-se após a publicação da primeira edição de Species Plantarum, embora Lineu, numa fase inicial do seu trabalho científico, não a tenha valorizado e aplicado de forma sistemática (Blunt, 2001). A invenção da nomenclatura binomial é anterior a Lineu, devendo-se a Gaspard Bauhin (1560-1624), um médico e botânico suíço de origem francesa (Mayr, 1986). Os binomes específicos (aplicados à categoria de espécie) substituíram a nomenclatura polinomial, que se caracterizava pelo uso de um nome genérico, sucedido por um número variável de palavras a descrever a morfologia, a corologia e/ou a autoria da descrição original. A nomenclatura binomial tem a vantagem de ser mais fácil de memorizar, de acelerar as trocas de informação e de ser mais estável e menos sujeita a erros do que a nomenclatura polinomial. Através do nome genérico expressa e resume relações evolutivas e de similaridade morfológica de enorme utilidade prática.

Lineu estabeleceu categorias taxonómicas fundamentais que permanecem em uso na nomenclatura biológica moderna: o reino, a classe, a ordem, o género e a espécie. Defendeu ainda que a categoria taxonómica fundamental dos sistemas de classificação é a espécie e, muito antes da emergência da moderna biologia da evolução, que a coesão morfológica dos indivíduos coespecíficos se devia ao sexo (Blunt, 2001).

O sistema de classificação sexual lineano está descrito logo na primeira edição de Species Plantarum (Figura 2-B). Lineu reconheceu 24 classes no reino das plantas com base na presença, ou ausência, número, comprimento e concrescência dos estames, e ainda na sua adnação ao pistilo (Figura 3). Embora tenha uma inegável utilidade prática, produz grupos de plantas dissimilares de baixo valor extrapolativo: a partir das características de um elemento do grupo, não é possível, a priori, antever as características mais marcantes na forma de cada um dos restantes elementos que o compõem. Diz-se que é um sistema de classificação artificial porque se baseia num número reduzido e arbitrário de características de fácil observação (Quadro 1).

A importância de Lineu na história da biologia deve-se quer às suas contribuições científicas quer à doutrinação de um núcleo coeso de discípulos que disseminaram as suas ideias, métodos e publicações. Não deixa de ser significativo que o Systema Naturae esteja exposto, em relevo, numa das estantes da Down House, a casa que Charles Darwin habitou durante grande parte da sua vida.

Sistemas naturais e sistemas fenéticos

Os sistemas naturais de classificação foram uma reação à incapacidade de o sistema sexual lineano revelar a scala naturae aristotélica (v. volume II). Fundam-se no princípio, confirmado, de que a utilização de um grande número de caracteres origina classificações mais intuitivas, e de maior valor extrapolativo, do que os sistemas artificiais (v. justificação em «Sistemas evolutivos»). Muitos dos defensores destes sistemas consideravam ainda que os caracteres taxonómicos não devem ser pesados (a todos deve ser dada a mesma importância) e que as plantas devem ser organizadas nas Floras de forma natural, conceito que na altura expressava a sua semelhança.

Os fundamentos teóricos dos sistemas naturais de classificação foram originalmente estabelecidos pelo botânico francês Michel Adanson (1727-1806). No Genera Plantarum, A.-L. de Jussieu (1748-1836) fez uma síntese das ideias de Adanson com o sistema de nomenclatura binomial lineano. Os sistemas naturais de Augustin de Candolle (1778-1841), e de George Bentham (1800-1884) e Joseph Dalton Hooker (1817-1911) são os mais relevantes para a história da botânica. As principais características dos sistemas artificiais e naturais estão explicitadas no Quadro 1.

Os sistemas de classificação fenéticos são um refinamento matemático dos sistemas de classificação naturais. Estiveram muito em voga nos anos 60 e 70 do século XX (v. Sokal & Sneath, 1963). A construção de matrizes de caracteres constitui o primeiro passo dos métodos de classificação fenética. Nestas matrizes, para cada indivíduo, grupo de indivíduos, ou eventualmente taxa, qualificam-se os estádios de carácter de um número, idealmente elevado, de caracteres morfológicos, anatómicos, bioquímicos ou genéticos (Figura 4). Cada indivíduo é designado, na terminologia da classificação fenética, uma unidade taxonómica operacional (OTU). Isto é, trata-se de uma unidade de amostra acerca da qual o julgamento taxonómico é suspenso, pois é precisamente a sua posição na classificação resultante que está a ser testada. Geralmente, é atribuído o mesmo peso a todos os caracteres medidos nas OTU.

As matrizes são então corridas em programas informáticos – programas de taxonomia numérica – com algoritmos de classificação (cluster analysis). Além da informação numérica, o output inclui um dendrograma – o fenograma –, com grupos aninhados noutros cada vez mais inclusivos (Figura 5). Pretende-se obter grupos cujos elementos são mais semelhantes entre si do que com os elementos de outros grupos. Quanto mais inclusivos os grupos, mais dissimilares os seus elementos. A similaridade e a dissimilaridade estão correlacionadas com a partilha de estádios de carácter. Por fim, os grupos obtidos, designados por unidades taxonómicas abstratas, são convertidos numa classificação, formal ou não.

FIGURA 4

Os programas de taxonomia numérica geram classificações hierárquicas de elevado valor extrapolativo. Embora não tenham por objetivo estabelecer relações de parentesco, os fenogramas assemelham-se, muitas vezes, aos cladogramas obtidos a partir da mesma informação-base (v. «Sistemas cladísticos»), porque a similaridade fenotípica reflete, geralmente, proximidade evolutiva. A principal crítica aos sistemas de classificação fenética é a ausência de ponderação dos caracteres, que acabam por resultar em padrões distorcidos de similaridade entre as OTU. Os métodos fenéticos fazem tabula rasa de toda a atividade de avaliação do significado diferencial dos caracteres, em termos funcionais e evolutivos face a outros mais neutros, realizada por gerações de taxonomistas «clássicos» e fundamentada depois pelos evolucionistas.

Por outro lado, a escolha dos algoritmos de classificação e medidas de similaridade entre OTU determina os resultados das classificações fenéticas. A conversão dos dendrogramas numa classificação também é subjetiva (Figura 5). Por conseguinte, os sistemas fenéticos não envolvem ganhos significativos de objetividade frente aos sistemas naturais e evolutivos, excetuada a sua reprodutibilidade. Por outro lado, correm o risco de produzir classificações artificiais, agregando indivíduos ou grupos semelhantes por convergência evolutiva. Os métodos automáticos de classificação fenética continuam em uso nos trabalhos de taxonomia à escala da espécie ou de categorias infraespecíficas, a partir de matrizes de dados morfológicos e/ou moleculares. A classificação fenética de grupos de categoria superior caiu em desuso em botânica.

Sistemas evolutivos

Características

A incorporação da teoria darwiniana da evolução alterou radicalmente o propósito dos sistemas de classificação. Os autores dos sistemas naturais procuravam obter grupos morfologicamente consistentes; nos sistemas de classificação evolutivos passou a ser prioritário que os taxa refletissem relações de parentesco (relações filogenéticas), i.e., proximidade evolutiva.

O fenótipo dos indivíduos é um resíduo histórico de um processo evolutivo. Os taxa (e.g., espécies e géneros) evolutivamente próximos, i.e., de divergência recente, têm tendência a partilhar mais caracteres, e a serem mais semelhantes entre si, do que os taxa pouco aparentados. «On my theory, the unity of type is explained by unity of descent», escreveu Darwin em A Origem das Espécies (Darwin, 1859). A similaridade morfológica (nas plantas, ao nível da flor) reflete ainda, geralmente, proximidade genética (v. APG IV, 2016). Os exemplos de correlação positiva da similaridade morfológica com o parentesco e a proximidade genética abundam na natureza, porque a forma tem uma elevada inércia evolutiva (evolutionary inertia): as mudanças morfológicas radicais, ocorridas em espaços de tempo muito curtos, são, por regra, negativamente selecionadas. Não surpreende, por isso, que as classificações evolutivas, sobretudo a nível familiar ou infrafamiliar, não difiram radicalmente das classificações naturais. Pela mesma razão, os taxonomistas naturais do século XIX, secundados pelos taxonomistas evolucionários do século XX, sem ou com conhecimentos elementares de embriologia, de fitoquímica e de taxonomia molecular, foram capazes de antecipar uma parte muito significativa dos taxa propostos pela sistemática botânica cladística do final do século XX, início do século XXI, morfológica e molecular. Como se referiu anteriormente, com Darwin, o conceito de grupo natural sofre uma profunda mudança, acabando por ser sinonimizado com grupo monofilético pelos cladistas.

Para que os sistemas de classificação evolutivos e cladísticos (v.i.) resumam, de forma fidedigna, relações de parentesco entre taxa, é necessário usar caracteres submetidos a um estrito controlo genético e avaliar corretamente a sua polaridade. Ao invés dos sistemas naturais, nestes sistemas de classificação a importância dos caracteres taxonómicos é diferenciada: valorizam-se os caracteres que, a priori, se supõe veicularem informação útil para estabelecer relações de parentesco. A estimativa da polaridade dos caracteres, um termo introduzido pela cladística moderna, consiste na discriminação dos estados de carácter ancestrais dos estados de carácter derivados. Esta etapa é essencial para identificar eventuais inversões de caracteres (retornos a estados de carácter ancestrais) e fenómenos de convergência evolutiva, tão frequentes nas plantas terrestres. Neste processo, ganhou uma particular importância a investigação do registo fóssil e o estudo morfológico comparado das plantas atuais, sobretudo nas regiões de clima tropical, onde, corretamente, se supunha estar refugiada uma parte significativa das plantas atuais mais antigas.

Os sistemas de classificação evolutivos baseiam-se em caracteres morfológicos, anatómicos e químicos sopesados e polarizados de forma intuitiva, trabalhados sem suporte estatístico. Os caracteres moleculares não eram conhecidos ou foram desvalorizados: os sistemas evolutivos são, portanto, sistemas de classificação pré-ADN. Como mais adiante se refere, o molecular transporta, em si, imensa informação essencial para estabelecer relações de parentesco, complementar da informação morfológica. Consequentemente, a distinção entre similaridades morfológicas devidas à partilha de ancestrais comuns (homologias) ou à convergência evolutiva (analogias) nem sempre foi resolvida de forma adequada. Sendo a convergência evolutiva recorrente nas plantas terrestres, os sistemas evolutivos não evitaram a definição de um significativo número de taxa artificiais.

Embora rejeitem os grupos polifiléticos, nos sistemas de classificação evolutivos a monofilia não é obrigatória, sendo tolerados grupos parafiléticos (Cronquist, 1988). Autores como A. Cronquist toleravam a parafilia porque defendiam que as linhagens com uma divergência morfológica extrema, resultantes da invasão de uma nova zona adaptativa, deviam ser segregadas em taxa independentes para refletir a magnitude desse salto evolutivo em relação aos seus ancestrais (v. Cronquist, 1988). Por exemplo, o famoso endemismo o açoreano Azorina vidalii (Campanulaceae) é mantida no género endémico Azorina pelos sistemas e evolucionistas, e transferida para o género Campanula (C. vidalii) pelos filogenistas. Esta é, talvez, a diferença fundamental que separa os sistemas evolutivos dos sistemas cladísticos de classificação.

Os botânicos, desde Jussieu até à emergência dos sistemas cladísticos, no final do século XX, foram incapazes de alcançar uma classificação natural nas categorias suprafamiliares. As categorias superiores então propostas eram morfologicamente heterogéneas e/ou envolviam hipóteses especulativas. Por exemplo, no sistema de Adolf Engler (1844-1930) e de Karl Prantl (1849-1893), o mais completo e influente dos primeiros sistemas de classificação evolutiva das plantas, foi assumido, no âmbito das dicotiledóneas (classe Dicotyledoneae), que as plantas de flores apétalas eram as mais antigas e que os grupos de plantas de corola livre (dialipétalas) eram anteriores aos de pétalas concrescentes. Esta interpretação das tendências evolutivas do perianto foi formalizada ao nível da subclasse e da ordem. Como a evoluçãou do perianto está permeada de inversões de caracteres e de convergências evolutivas, muitos dos taxa suprafamiliares reconhecidos por Engler & Prantl eram artificiais. Como veio a verificar-se a partir da década de 1990, a morfologia externa é insuficiente para resolver a filogenia das plantas terrestres e falha clamorosamente na definição de grupos naturais suprafamiliares («Sistema APG IV»).

Os sistemas naturais e evolutivos são herdeiros diretos de uma tradição botânica europeia, por razões geográficas de início pouco consolidada nos territórios tropicais de maior diversidade taxonómica. Enquanto a flora holártica foi segmentada num elevado número de géneros e famílias, a flora tropical foi tratada de uma forma francamente mais conservadora por estes sistemas de classificação. Por exemplo, o grande número de géneros descritos, e ainda aceites, nas Apiaceae está relacionado com a sua elevada diversidade no hemisfério norte. Por outro lado, muitas das famílias morfologicamente bem caracterizadas e fáceis de reconhecer nos territórios holárticos, admitidas pelos sistemas naturais e evolutivos, entravam em conflito nos espaços tropicais. Assim aconteceu, por exemplo, com os conceitos tradicionais de Verbenaceae e de Lamiaceae ou de Apiaceae e de Araliaceae. Estas insuficiências só foram resolvidas com a filogenia molecular.

Sistemas evolutivos mais relevantes

Os sistemas evolutivos continuam a ser usados quando se pretende expor algumas relações filogenéticas, e organizar e expressar a diversidade biológica de uma forma estável, fácil de memorizar. Recorde-se que a consistência morfológica dos grupos propostos pelos sistemas evolutivos a nível familiar e infrafamiliar é, geralmente, elevada. Muitas das Floras manuseadas pelos botânicos e floristas da atualidade arranjam as espécies de acordo com algum dos seguintes sistemas de classificação evolutivos: diferentes versões do sistema de Engler & Prantl, e.g., Flora Europaea (Tutin, 1964-1980) e Nova Flora de Portugal (Franco, 1971-1984; Franco & Rocha Afonso, 1994-2003); sistema de G. L. Stebbins, e.g., Flora Iberica (Castroviejo, 1986+); ou o sistema de Cronquist, e.g., Flora of North America (Flora of North America Editorial Committee, 1993+). A opção pelos sistemas evolutivos dependeu sempre mais do reconhecimento científico dos seus autores, i.e., de um argumento de autoridade, do que de razões objetivas.

O sistema proposto pelo botânico norte-americano Arthur Cronquist foi, talvez, o mais influente sistema de classificação evolutivo das plantas com flor na segunda metade do século XX (Figura 6). O não menos conhecido sistema de Armen Takhtajan, um botânico soviético/arménio, é muito próximo do sistema de Cronquist (Figura 6). Cronquist dividiu as plantas com flor – Divisão Magnoliophyta – em duas classes: Magnoliopsida (dicotiledóneas) e Liliopsida (monocotiledóneas). As Magnoliopsida foram repartidas por seis subclasses e as Liliopsida por cinco (Quadro 2).

Cronquist (1988), seguindo uma tradição com mais de 200 anos, reuniu numa subclasse autónoma – subclasse Hamamelididae – as plantas anemogâmicas, apétalas ou de perianto reduzido, geralmente com amentilhos de flores unissexuais, perfazendo um total de 23 famílias; e.g., Platanaceae, Hamamelidaceae, Fagaceae, Casuarinaceae, Ulmaceae e Urticaceae, entre outras. A subclasse Hamamelididae é uma das maiores debilidades do sistema de Cronquist. Para a polinização pelo vento ser eficiente, os grãos de pólen têm que flutuar no ar, e o movimento dos estigmas e dos filetes de ar em torno do gineceu deve facilitar a captura do pólen. Por exemplo, estorvam este modo de polinização a produção de folhas antes da polinização, a rigidez dos pedicelos das flores ou dos pedúnculos das inflorescências, e um perianto que se sobreponha aos estigmas. O cardápio de soluções adaptativas à anemofilia é escasso, consequentemente, a convergência evolutiva dos caracteres das inflorescências e flores polinizadas pelo vento são muito frequentes. De facto, as técnicas moleculares demonstraram que as Hamamelididae sensu Cronquist são um grupo artificial polifilético. Por exemplo, as Platanaceae são ‘eudicotiledóneas basais’ e as Hamamelidaceae estão relacionadas com as Saxifragaceae (ordem dos Saxifragales). Ainda assim, a maior parte das famílias Hamamelididae têm uma ancestralidade comum, e são hoje parte dos Fagales (fabídeas); e.g., Fagaceae, Betulaceae, Myricaceae, Casuarinaceae e Juglandaceae. Os estudos de filogenia molecular demonstraram que dois terços das ordens e um terço das famílias definidas por A. Cronquist não são monofiléticas (Stevens, 2001+).

Sistemas filogenéticos (cladísticos)

O que é a sistemática filogenética? Princípio da monofilia

A sistemática (taxonomia) filogenética (originalmente designada por cladística; cladistics, phylogenetic systematics) foi proposta pelo entomologista alemão Willi Hennig, em 1950 (conceitos fundamentais no Quadro 3; Figura 2-C, D). A sistemática filogenética é uma aproximação à sistemática que procura recuperar as relações de parentesco entre taxa e desenvolver sistemas de classificação consistentes com estas relações (Wiley & Lieberman, 2011). É também um método de inferência filogenética, porque gera hipóteses testáveis sobre as relações de parentesco entre organismos ou grupos de organismos.

Além dos aspetos metodológicos adiante aprofundados, os sistemas filogenéticos distinguem-se pelo chamado princípio da monofilia (principle of monophyly). De acordo com este princípio, os grupos de organismos têm de reunir todos, e apenas, os descendentes de um organismo ancestral comum. Embora os grupos polifiléticos sejam rejeitados pelos sistemas de classificação filogenéticos, os grupos parafiléticos são temporariamente tolerados enquanto as relações de parentesco não são totalmente esclarecidas. Em sistemática filogenética, os grupos monofiléticos são designados por clados (ou linhagem; clade) e os parafiléticos por grados (grade). Como adiante se refere, os clados podem ter, ou não, uma categorização formal (e.g., ordem, família e espécie), i.e., serem convertidos em taxa. Os grados geralmente escrevem-se entre com aspas simples; e.g., ‘angiospérmicas basais’.

Cladograma e árvore filogenética

A especiação e a diferenciação de linhagens são subprodutos inevitáveis e frequentes da evolução (Levin, 1993). O ancestral de todos os seres vivos, o LUCA (Last Universal Common Ancestor, o primeiro ancestral comum universal), fragmentou-se em espécies descendentes e estas em muitas mais, num processo imparável que perdura até ao presente. Todos os grandes grupos tiveram como ponto de partida um evento de isolamento reprodutivo, i.e., de especiação: certas linhagens descendentes do LUCA mantiveram-se unicelulares e simples, outras complexificaram-se e deram origem às plantas ou foram os ancestrais dos animais.

Em filogenética, as representações esquemáticas de hipóteses em torno das relações de parentesco de um dado conjunto de organismos assumem a forma de árvores (Quadro 3). A Figura 19 é delas um bom exemplo. Darwin foi um dos primeiros biólogos a usar estas árvores genealógicas para representar relações de parentesco entre seres vivos (volume II). Portanto, o LUCA localiza-se na base do tronco da grande árvore genealógica da vida; as primeiras ramificações representam os seus descendentes mais diretos, todos eles já extintos (supõe-se); e de nó em nó (pontos onde ocorrem ramificações), de ramificação em ramificação, atingem-se os delgados raminhos do ano, alcandorados na camada mais exterior da copa, a representar grupos (e.g., espécies, géneros ou famílias) atuais.

Geralmente, os termos cladograma, árvore filogenética (phylogenetic tree) ou árvore evolutiva (evolutionary tree) são usados de forma abrangente como sinónimos. Alguns autores consideram o cladograma apenas a representação de uma hipótese de relações de parentesco, enquanto a árvore filogenética representa um resumo da história evolutiva real. A principal distinção prende-se, porém, com o significado do comprimento das linhas. Nos cladogramas estritos, o comprimento dos ramos não transporta informação temporal ou evolutiva, indicando apenas a topologia (a ordem de ramificação). Pelo contrário, as árvores filogenéticas quantificam a evolução (e.g., taxa de mutações ou divergência de caracteres ao longo dessa linhagem num filograma) ou o tempo (anos ou milhões de anos desde a divergência num cronograma). Os cladogramas são, portanto, as representações mais elementares entre os diagramas de base evolutiva.

Nas árvores filogenéticas estritamente dicotómicas, cada ramo apenas se pode cindir noutros dois. Os nós e os “ramos-filho” representam, respetivamente, eventos de divergência evolutiva e grupos monofiléticos de organismos. Subjacente a cada nó está, necessariamente, um evento de especiação. Uma árvore pode ser cortada em qualquer ponto; o ramo sobrante – o clado – inclui todos os descendentes de um ancestral comum. Dois clados situados lado a lado numa ramificação dizem-se irmãos (grupos-irmãos; sister groups). Vejamos dois exemplos a partir da Figura 19. A Amborella trichopoda é o grupo-irmão de todas as angiospérmicas atuais. Uma mesma população ancestral especiou e deu origem à espécie ancestral de todas as Ceratophyllaceae e à espécie ancestral de todas as eudicotiledóneas atuais; por conseguinte, as Ceratophyllaceae são irmãs de todas as eudicotiledóneas atuais (e vice-versa). Neste ponto reside uma outra diferença entre os sistemas filogenéticos e os sistemas evolutivos tradicionais de classificação: na sistemática filogenética, os grupos-irmãos têm que ter a mesma categoria taxonómica, qualquer que seja o número de espécies e a diversidade morfológica que caracteriza cada um deles (Cronquist, 1988).

Grupos-tronco e grupos-coroa

O registo fóssil revela, muitas vezes, caracteres e combinações de caracteres invulgares ou desconhecidas nos seres vivos atuais. O Archaeopteryx, um dinossauro com penas adaptadas ao voo, é o exemplo mais famoso (volume II). Para acomodar estes fósseis, os paleontologistas introduziram dois conceitos fundamentais, fixados na década de 1970: grupo-tronco e grupo-coroa (Figura 7). Um grupo-coroa (crown group) é um grupo monofilético (clado) que contém pelo menos duas espécies atuais, o seu ancestral comum mais próximo, mais todos os descendentes extintos deste ancestral. O grupo-coroa é delimitado pelos descendentes vivos de um ancestral comum. O ancestral comum da Amborella trichopoda, e de todas as outras angiospérmicas atuais, define o grande grupo-coroa das angiospérmicas (v. Figura 19). O grupo-tronco (stem group) inclui todos os grupos fósseis evolutivamente mais próximos do grupo-coroa em causa do que de qualquer outro. Os elementos do grupo-tronco de uma dada linhagem atual são mais antigos do que o ancestral comum do grupo-coroa, e podem não partilhar algumas das novas características adquiridas exclusivamente por essa linhagem (características ditas apomórficas). Parte-se do pressuposto de que os caracteres que definem o grupo-coroa foram adquiridos durante períodos alargados de tempo. Esta é uma das razões por que é tão difícil a interpretação filogenética de alguns fósseis.

As características que definem um grupo-coroa foram geralmente adquiridas de forma incremental em períodos alargados de tempo pelos elementos do grupo-tronco. Por outro lado, os membros do grupo-tronco poderiam possuir características ancestrais (plesiomorfias) ou derivadas (apomorfias) que não foram retidas no grupo-coroa. Consequentemente, os elementos do grupo-tronco podem ser francamente distintos do grupo-coroa. Embora os grupos-coroa e tronco sejam uma necessidade lógica em biologia evolutiva, a aplicação prática destes conceitos é um severo desafio para os paleontologistas, porque as suas características nem sempre podem ser aferidas a partir dos seres vivos atuais. Assim, por exemplo, os ‘riniófitos’, estudados no volume II, são um grupo-tronco dos traqueófitos: para além dos eixos caulinares, pouco sobra da sua estrutura nas plantas vasculares atuais.

As bases da inferência e da sistemática filogenética

À semelhança da fenética, a sistemática filogenética serve-se de programas computacionais e de matrizes de caracteres morfológicos, anatómicos (e.g., presença ou ausência de vasos xilémicos), fisiológicos (e.g., fotossíntese C4), citogenéticos (e.g., inversões cromossómicas) e/ou moleculares (e.g., presença de um determinado gene, região ou rearranjo genético). Porém, admite-se que os algoritmos filogenéticos modelam mais corretamente a forma como a evolução realmente funciona (inferência filogenética) do que os programas de taxonomia numérica da fenética – por conseguinte, o output taxonómico é eminentemente natural.

As árvores filogenéticas tradicionais eram obtidas sobretudo a partir da distribuição de sinapomorfias (Quadro 3). Os caracteres ancestrais (plesiomorfias) partilhados por vários clados (simplesiomorfias) são descartados porque não contêm informação útil para estabelecer relações de parentesco do clado em estudo com outros: o seu uso poderia dar origem a grupos parafiléticos ou polifiléticos. Por exemplo, a presença de gametófitos livres é uma plesiomorfia própria dos ‘pteridófitos’ e ‘briófitos’; um grupo definido pela partilha deste carácter, irmão das plantas com semente, seria parafilético.

A determinação dos estados de carácter ancestrais (plesiomorfias) e derivados (apomorfias) envolve, frequentemente, decisões subjetivas sobre a polaridade dos caracteres. Os sistematas servem-se de técnicas, cujo estudo pormenorizado excede os objetivos deste livro (e os conhecimentos do seu autor), que tornam esta etapa mais objetiva. Neste propósito, é determinante a escolha de um grupo evolutivamente próximo (grupo externo; outgroup) do grupo em estudo. Por exemplo, no estudo da filogenia das gramíneas, o Grass Phylogeny Working Group (2001) usou como outgroups espécies de Joinvilleaceae e de outras famílias de ótimo tropical evolutivamente próximas das Poaceae. A adição de informação fóssil às matrizes de dados morfológicos de taxa atuais melhora a polarização dos caracteres e permite obter topologias alternativas mais robustas que descrevem melhor a história evolutiva no espaço e no tempo dos caracteres e dos grupos taxonómicos em estudo. A informação obtida de fósseis mal preservados pode, contudo, ser contraproducente.

Parcimónia, congruência e modelos probabilísticos

Como se referiu anteriormente, as árvores filogenéticas são o produto final de uma análise. Quanto maior o número de caracteres e de estados de carácter envolvidos, maior o número de soluções possíveis, i.e., de árvores. Depois, diferentes algoritmos produzem diferentes resultados, o mesmo acontecendo quando se eliminam ou adicionam caracteres na matriz original. Determinar qual a melhor árvore filogenética, i.e., qual a topologia que melhor retrata a história evolutiva de um dado grupo de plantas, é uma questão-chave em filogenética. Historicamente, dois princípios foram muito usados para a resolver: o princípio da congruência e o princípio da parcimónia. O princípio da congruência baseia-se numa ideia simples: se o mesmo resultado – a mesma topologia – é obtido com dois ou mais conjuntos de caracteres, então, a probabilidade de a filogenia obtida ser verdadeira cresce. A árvore que minimiza o número de transições entre estados de carácter (e implicitamente de reversões de caracteres) é a mais parcimoniosa. O princípio da parcimónia é crítico, porque, sendo um princípio filosófico (epistemológico) produzido pela mente humana, nada obriga que seja seguido nos processos evolucionários. Por outras palavras, a natureza não é necessariamente parcimoniosa, embora tendencialmente o seja (v. Crisci, 1982).

Os princípios da congruência e da parcimónia conjugam-se na chamada reamostragem por bootstrap (ou em métodos similares, e.g., jackknife). Este processo inicia-se com a construção de pseudorreplicações (árvores parciais) a partir de uma amostra (parcial) aleatória de caracteres da matriz original de caracteres (mantendo a dimensão da matriz original). Em cada pseudorreplicação é selecionada a topologia mais parcimoniosa. Depois de repetir o processo um determinado número de vezes (e.g., mil repetições), o resultado é sumarizado numa árvore de consenso, sendo possível aferir a incerteza associada a cada clado. Uma percentagem de bootstrap de 95% significa que o clado em causa surgiu em 95 de 100 pseudorreplicações (Kitching et al., 1998). As homologias e, implicitamente, as analogias são retificadas a posteriori pela análise da partilha de caracteres ao longo da «melhor» árvore. Atualmente, na reconstrução de filogenias, para além dos métodos de parcimónia, usam-se amplamente outros métodos de inferência estatística, como os de máxima verosimilhança (maximum likelihood) e os métodos bayesianos, cuja discussão não cabe num texto de carácter introdutório, mas que dominaram a filogenética moderna por oferecerem modelos matemáticos mais robustos da evolução molecular.

A tradução das árvores filogenéticas numa taxonomia formal

Os sistemas de classificação filogenéticos apresentam três grandes vantagens frente aos sistemas de classificação evolutivos tradicionais:

Robustez – à medida que as relações filogenéticas são clarificadas, a circunscrição e a nomenclatura dos taxa tendem a estabilizar;
Reprodutibilidade – diferentes investigadores obtêm os mesmos resultados se utilizarem os mesmos dados iniciais e os mesmos algoritmos;
Objetividade – envolvem menos assunções subjetivas.

Os sistemas filogenéticos oferecem ainda hipóteses explícitas e testáveis, por exemplo, de relações evolutivas, biogeografia e ecologia. A escolha dos algoritmos tem menos impacto nos resultados finais em sistemática filogenética do que nos sistemas fenéticos. A filogenética é o método standard de inferência em biologia evolutiva. A substituição dos sistemas de classificação evolutivos tradicionais pelas classificações que resultam destas análises moleculares é inevitável. A abordagem filogenética está a solucionar um dos aspetos mais críticos dos sistemas evolutivos de classificação de angiospérmicas: a instabilidade da circunscrição dos grupos supragenéricos, que emergia da subjetividade com que era interpretada a natural instabilidade de caracteres nestes taxa. As classificações filogenéticas têm, porém, uma enorme desvantagem prática. Ao produzirem a melhor estimativa das relações evolutivas, podem dar origem a grupos morfologicamente inconsistentes, pouco intuitivos, que dificultam a sua apreensão pelos não especialistas.

Para converter as relações de parentesco veiculadas pelas árvores filogenéticas, como a da Figura 8, numa estrutura taxonómica formal (com categorias taxonómicas), há que responder a duas perguntas fundamentais:

Quais os clados merecedores de um nome de acordo com o ICN (International Code of Nomenclature for Algae, Fungi, and Plants; Turland et al., 2018)? Por outras palavras, que ramos da árvore se devem assumir como taxa?
E a que categoria (e.g., ordem, família ou género) devem ser atribuídos?

As classes dividem-se em ordens, as ordens em famílias, as famílias em géneros – na grande árvore filogenética das angiospérmicas, as espécies correspondem aos ramos mais finos, a única categoria taxonómica objetiva em taxonomia. Se um clado é tratado ao nível da subfamília ou família, por exemplo, é uma decisão subjetiva não falsificável (Barraclough & Humphreys, 2015). E recorde-se ainda que por mais de uma vez nesta coleção de livros se defendeu que a nomenclatura botânica não pode acomodar todos os clados – nem todos os clados podem receber uma categoria formal. A categoria «família» é desde os alvores da nomenclatura botânica uma categoria-chave na aprendizagem da botânica sistemática. A circunscrição das famílias deve, portanto, ser realizada com particular cuidado.

A taxonomia e a nomenclatura têm objetivos práticos, uma função social que não deve ser descartada. Por conseguinte, os especialistas servem-se de um conjunto de regras de conveniência, tacitamente aceites, no sentido de obterem respostas de consenso às duas perguntas antes formuladas. Vejamos quatro destas regras (v. Backlund & Bremer, 1998; Vences et al., 2013).

i) Em primeiro lugar convém que o clado (ramo) esteja estatisticamente bem suportado de modo a evitar rearranjos taxonómicos e nomenclaturais posteriores: a taxonomia e a nomenclatura devem ser estáveis no tempo.
ii) Os sistemas de classificação que sobrecarreguem muito a memória são mal aceites pelos utilizadores (a jusante) da taxonomia: para evitar a proliferação de nomes, os grupos demasiados pequenos devem, dentro do possível, ser agregados a outros.
Iii) A diagnosticabilidade morfológica é outro critério fundamental: os taxa formalmente reconhecidos devem ser fáceis de identificar através da sua morfologia.
iv) Os grupos monofiléticos bem estabelecidos na literatura taxonómica tradicional devem ser preservados: a sistemática moderna não pode romper com o passado e desprezar o trabalho de gerações de sábios botânicos.

Splitters, lumpers e a tradição botânica

Na definição/circunscrição de taxa, sobretudo ao nível da família e do género, confrontam-se duas abordagens: os splitters e os lumpers. Os splitters preferem taxa mais pequenos (e.g., géneros com menos espécies e famílias com menos géneros), no pressuposto de que os taxa assim obtidos têm mais autapomorfias, são morfologicamente mais homogéneos e mais fáceis de descrever e identificar. Os lumpers, pelo contrário, advogam o uso de taxa maiores (mais inclusivos), embora mais heterogéneos. Uma família (ou um género) com um conjunto alargado de características únicas que a diferencie das restantes (autapomorfias) é fácil de distinguir em condições de campo e de integrar em chaves dicotómicas. A pulverização (splitting) das plantas em muitas famílias ou géneros incrementa a sua diagnosticabilidade; em contrapartida, a instabilidade dos nomes, e o elevado número de nomes e de combinações de caracteres dificulta a sua memorização.

A sistemática filogenética trouxe objetividade à taxonomia, porém a categorização dos taxa supraespecíficos continua a residir no costume ou em argumentos de autoridade. A tradição tem aqui, de facto, um grande peso. Por exemplo, enquanto o APG IV organiza as ca. 246.000 spp. de plantas com flor conhecidas em 413 famílias, os ornitólogos reconhecem 200 famílias para 9000 espécies (Armstrong, 2014; Chase et al., 2016; Roskov et al., 2019). O conceito de família não é igual para botânicos e ornitólogos. De qualquer modo, o número de famílias foi estabilizado com o APG IV. As classificações a nível genérico estão a atravessar um período de alguma instabilidade, ainda que temporária, com a aplicação do princípio da monofilia. Pese embora a fragmentação de alguns géneros megadiversos [e.g., Acacia (Fabaceae) e Senecio (Asteraceae)], constata-se que a taxonomia filogenética dá origem a géneros mais inclusivos do que a taxonomia morfológica, sempre disponível para segregar as morfologias mais exuberantes e divergentes (e.g. flora insular) (Humphreys & Linder, 2009).

As asteráceas e as orquidáceas são as famílias mais diversas de angiospérmicas, com mais de 30.000 espécies cada uma. Em contrapartida, famílias como Amborellaceae e Drosophyllaceae são monoespecíficas (e implicitamente monogenéricas). São aceites cerca de 13.000 géneros de plantas com flor, 75% dos quais com 5 ou menos espécies. 86 géneros hiperdiversos têm mais de 500 spp. (Knapp et al., 2024). O género mais diverso – Astragalus (Fabaceae) – está presente em Portugal continental com 14 spp.

Nos artigos de botânica sistemática atuais, constata-se a tendência de manter as designações científicas até à ordem; as categorias superiores são largamente ignoradas, evitando-se formalidades nomenclaturais na designação dos clados mais inclusivos.

A revolução molecular. A filogenómica

O uso de informação molecular no estudo das relações de parentesco (filogenias) e na classificação e identificação de plantas irrompeu na botânica na década de 1990. Em termos metodológicos e conceptuais, trata-se de uma evolução da filogenética morfológica, com técnicas laboratoriais, algoritmos e estatísticas adaptados aos caracteres e dados moleculares. Não cabe neste texto uma descrição pormenorizada dos materiais e métodos da sistemática filogenética com dados moleculares, mas tão-somente uma breve referência aos seus princípios e à importância na botânica sistemática e evolutiva contemporâneas. Os interessados têm à sua disposição vários livros-texto internacionais sobre o tema.

Qualquer tipo de informação molecular, i.e., qualquer marcador genético, pode ser usado em inferência filogenética; e.g., ADN, ARN ou produtos diretos da informação genética (e.g., sequências de aminoácidos em proteínas). A importância do ADN nuclear, mitocondrial ou cloroplástico é destacada pela bibliografia (Hollingsworth et al., 2010). A escolha das sequências de ADN a comparar – e.g., zonas não codificantes do ADN (noncoding DNA), parte de um gene, um gene, um conjunto de genes que codificam proteínas ou mesmo de todo o genoma – é dos momentos mais críticos dos métodos de sistemática molecular. À semelhança da inferência baseada em informação morfológica, só devem ser comparadas características moleculares (loci) com uma ancestralidade comum (homólogas), i.e., cujas similaridades não resultem de evolução convergente. Estão publicados métodos numéricos para fazer esta avaliação, no entanto, a maior parte dos estudos incide sobre sequências já conhecidas e bem sedimentadas na experiência. Os objetivos de investigação condicionam a seleção das sequências de ADN a estudar. Por exemplo, loci com uma longa história evolutiva, e que acumulam lentamente alterações (mutações) na sequência de nucleótidos, são usados para resolver relações filogenéticas entre taxa evolutivamente distantes. Ao nível da espécie, ou categorias subespecíficas, recorre-se a loci que evoluem rapidamente, uma abordagem conhecida por «DNA barcoding» (código de barras de ADN), que visa a identificação rápida e fidedigna de espécies com base numa sequência de ADN estandardizada curta.

A extração e a sequenciação do ADN, geralmente a partir das folhas de indivíduos, vivos ou armazenados em herbário, representativos dos taxa em estudo, é um trabalho minucioso e extenuante. Felizmente, o progresso tecnológico e a redução de custos nesta área são assombrosos. Obtidas as sequências de ADN, procede-se ao seu alinhamento (sequence alignment), manual ou com programas informáticos especializados: as cadeias de duas ou mais amostras são alinhadas lado a lado e contabilizadas as coincidências (e as discrepâncias) na sequência de nucleótidos (Figura 9). A similaridade das sequências de nucleótidos (sequence similarity) está correlacionada com proximidade evolutiva. É com base neste princípio que se inferem as relações evolutivas entre taxa, populações ou indivíduos e, eventualmente, se definem taxa supraespecíficos e se classificam espécies.

Desafios e artefactos genómicos

O estabelecimento de filogenias com base em informação molecular enferma dos mesmos constrangimentos da filogenética morfológica, com algumas diferenças. A polarização dos caracteres é particularmente difícil com dados moleculares e, claro, condiciona a estrutura das árvores. A sistemática molecular não é, salvo raras exceções (e.g., fósseis de Homo neanderthalensis), aplicável ao registo fóssil, e os fósseis, como se sabe, são uma importante fonte de informação para reconstruir as divergências filogenéticas mais antigas. A estas dificuldades soma-se, entre outras, a chamada atração de ramos longos (long branch attraction). A atração de ramos longos é um erro recorrente nas filogenias profundas (deep phylogenies) e, implicitamente, na sistemática de grandes grupos, baseadas quer em dados moleculares quer em informação morfológica. Este artefacto consiste na aproximação artificial de clados evolutivamente distanciados nas árvores filogenéticas. Resulta da convergência evolutiva a nível genético (homoplasia molecular) – quanto mais longa a história de dois grupos, maior a probabilidade de ocorrerem as mesmas mutações de forma independente –, sendo agravado quando se trabalham clados com diferentes velocidades evolutivas, com um historial de grandes flutuações nas pressões de seleção, representados nas análises filogenéticas por um escasso número de taxa (Judd et al., 2007; Ruhfel, 2014). A amostragem de taxa não pode, obviamente, ser significativamente melhorada nos grupos outrora diversos e hoje representados por um escasso número de espécies. Por esta razão, a posição filogenética dos antóceros é tão conflituosa. As filogenias próximas (shallow phylogenies), ao nível da espécie e do género, enfrentam outros constrangimentos que não são aqui abordados.

A filogenética molecular profunda das plantas e os modernos sistemas de classificação das plantas (e.g., APG IV) apoiaram-se inicialmente em sequências do genoma cloroplástico, herdado da cianobactéria ancestral. Os genes cloroplásticos têm várias vantagens: o ADN cloroplástico (cpDNA) é fácil de extrair e de usar e, ao contrário do que acontece com o ADN mitocondrial (mtDNA) e nuclear (nDNA), os seus genes estão ordenados numa estrutura densa e altamente conservada (o número e a ordem dos genes foram, com algumas exceções, mantidos) (Sato, 1999). As filogenias obtidas com sequências de cpDNA transformaram a sistemática de plantas mas enfermam de alguns inconvenientes. Por exemplo, a maioria das plantas lenhosas tem baixas taxas de evolução molecular, consequentemente, o polimorfismo genético de sequências (parciais) do cpDNA é insuficiente para desvendar relações de parentesco a níveis taxonómicos inferiores. Para obviar a esta e a outras limitações, os estudos de filogenia começaram a incorporar genes mitocondriais e nucleares (e.g., genes ribossomais, i.e., genes nucleares, que codificam os rRNA) e/ou a totalidade do ADN cloroplástico e mitocondrial.

O desenvolvimento de novas técnicas moleculares (e.g., RNA sequencing, Next-Generation Sequencing ou NGS) e de bioinformática está a revolucionar a filogenética e a sistemática, porque permitiu incorporar e tratar de forma barata e expedita quantidades massivas de informação genética proveniente de um outro compartimento celular, o núcleo (nDNA). As filogenias profundas mais modernas integram hoje em dia largas centenas de genes nucleares de cópia única (como os abrangidos pelo kit de captura-alvo Angiosperms353) ou mesmo todo o genoma – trabalha-se no domínio da chamada filogenómica (phylogenomics) (Young & Gillung, 2019; Baker et al., 2021). Entretanto, através de iniciativas como o Earth BioGenome Project, já se discute e trabalha na possibilidade de sequenciar toda a diversidade eucariótica terrestre (Lewin et al., 2018).

Os modelos filogenéticos obtidos a partir de cpDNA e de nDNA são largamente congruentes ao longo de toda a grande árvore filogenética das plantas terrestres (Wickett et al., 2014; Rothfels et al., 2015). E ambos os métodos corroboram muitas vezes hipóteses já seculares produzidas por taxonomistas morfológicos. Porém, a filogenética molecular continua a enfrentar dificuldades na resolução de alguns grupos (e.g., grandes grupos de briófitos e ramos basais da árvore filogenética das angiospérmicas). A simples adição de mais e mais informação genética num contexto filogenómico provou não ser a panaceia para a resolução de todos os ramos das árvores filogenéticas profundas, sobretudo perante o fenómeno de triagem incompleta de linhagens (incomplete lineage sorting) ou hibridização ancestral (Zhong et al., 2015). E diferentes métodos de inferência (como máxima verosimilhança e inferência bayesiana, operando em genes particionados, versus métodos baseados na topologia de árvores de genes) geram, por vezes, diferentes topologias. Na realidade, ninguém sabe ao certo até que ponto as filogenias moleculares profundas publicadas correspondem com exatidão à filogenia verdadeira, mas são, sem dúvida, as mais fidedignas e sustentadas de que dispomos. A discussão continua e o campo avança.

Neste ponto da argumentação, é importante perceber que as árvores filogenéticas são hipóteses sobre as relações de parentesco entre grupos de seres vivos, muito mais bem informadas e matematicamente escrutinadas do que as hipóteses tradicionais baseadas na intuição. A informação molecular e as ferramentas analíticas associadas são hoje um requisito imprescindível na filogenética vegetal. Os modelos filogenéticos (representados nas árvores) são, por sua vez, convertidos num sistema taxonómico com nomenclatura estabilizada, que reflete as posições assumidas de descendência comum e os princípios discutidos na secção anterior. A sistemática filogenética tem, assim, dois usos fundamentais: i) a reconstrução da história evolutiva dos grupos de seres vivos (descobrir as verdadeiras pontes do parentesco entre eles) e ii) a produção de uma taxonomia o mais objetiva e parcimoniosa possível, com base nestas pontes que ligam todos os taxa numa enorme árvore da vida, assentando para isso, no pilar do princípio da monofilia. As metodologias de reconstrução de relações evolutivas não se ficam, de resto, apenas pela inferência filogenética baseada em matrizes de caracteres morfológicos e/ou moleculares de taxa atuais. Este tema é brevemente abordado no ponto «Como se reconstrói a evolução das plantas?», no volume II desta série.