Cartografia léxico-gramatical das orações relacionais em textos jornalísticos brasileiros
Nome: JHONATHAN LENO REIS FRANCA SANTANA
Data de publicação: 05/02/2026
Banca:
| Nome |
Papel |
|---|---|
| ALEX CALDAS SIMÕES | Examinador Externo |
| GESIENY LAURETT NEVES DAMASCENO | Presidente |
| GIACOMO PATROCÍNIO FIGUEREDO | Examinador Externo |
| MARCOS ROBERTO MACHADO | Examinador Externo |
| MARIA MEDIANEIRA DE SOUZA | Examinador Externo |
Resumo: A gramática do português, assim como a de outras línguas naturais, organiza a experiência
por meio de uma rede sistemas que mapeiam seus recursos semântico-gramaticais. No
centro dessa arquitetura está o domínio relacional da transitividade, o campo do Ser, do
Estar e do Ter, responsável por estabilizar identidades, atribuir propriedades materiais e
semióticas, instaurar classificações, circunstanciações e relações de posse entre entidades
e ainda converter eventos em entidades simbólicas. Embora esse domínio tenha sido
amplamente modelado na tradição sistêmico-funcional, com destaque para Halliday
(1985, 1994), Halliday e Matthiessen (2004, 2014), Matthiessen (1995), Davidse (1999)
e Arús e Lavid (2001), as descrições disponíveis para o português brasileiro permanecem
fragmentadas, tendo em vista que não oferecem um modelo explícito da cartografia de
sistemas integrantes da rede. Entretanto, cabe destacar que a intenção desta investigação
não é estabelecer uma versão definitiva dessa rede, mas um modelo que reflita a
especificidade do português brasileiro escrito. Nesse sentido, elegemos o registro
jornalístico escrito, pois nele as orações relacionais desempenham um papel central na
construção da autoridade epistêmica, descrevendo atores sociais, classificando
fenômenos, projetando avaliações e condensando interpretações sob aparência de
neutralidade. O objetivo geral da tese é descrever e modelar o sistema relacional do
português brasileiro, tal como instanciado no registro jornalístico escrito, seguindo o
percurso que parte do sistema em direção ao texto e retorna ao sistema para propor sua
interpretação sistêmico-funcional. Para isso, busca-se delinear um panorama da região
relacional da gramática do português, concebendo a Linguística Sistêmico-Funcional
como uma teoria-cartografia capaz de representar, por meio de redes de sistemas, o
potencial semogênico da língua. De modo articulado, a investigação pretende: (i)
aprofundar a delicadeza descritiva das orações relacionais — intensivas, circunstanciais
e possessivas — em seus modos atributivo e identificativo; (ii) interpretar
probabilisticamente a distribuição de escolhas estruturais e léxicas no corpus, articulando
frequência a tendência sistêmica; (iii) demonstrar como o português configura o domínio
relacional como uma rede probabilística de vínculos simbólicos, revelando padrões de
redundância, variação e equilibrio entrópico; e (iv) propor uma modelagem funcional do
sistema que sirva de base tanto para generalizações tipológicas quanto para futuras
implementações computacionais de análise e geração automática de texto. A pesquisa
ancora-se no arcabouço teórico da Linguística Sistêmico-Funcional, adotando a
estratificação do sistema linguístico semântico-léxico-gramatical e a metafunção
ideacional como princípios organizadores da descrição, análise e interpretação. Essa
arquitetura orientou tanto o desenho metodológico quanto o sistema de anotação,
permitindo interpretar cada oração relacional não como ocorrência isolada, mas como
instanciação de um potencial de significados. A amostra é composta por reportagens,
artigos de opinião e entrevistas, totalizando 2.874 orações relacionais. Cada oração foi
anotada em três níveis: (i) semântico, abrangendo tipo (intensiva, circunstancial,
possessiva, existencial), modo (atributivo, identificativo) etc.; (ii) léxico-gramatical,
incluindo configuração de participantes, verbos nucleares, aspecto, tempo, polaridade, modalidade e perfil informacional; e (iii) textual, contemplando tema–rema, progressão
referencial e posição no fluxo discursivo. Como já explicitado, também foram
empregados procedimentos quantitativos inspirados na tradição da gramática sistêmicoprobabilística. Esses procedimentos permitiram propor o Índice Probabilístico de
Compactação Relacional (ICR) como métrica integradora de custo estrutural e densidade
informacional. A análise das 2.874 orações revela que o português escrito no registro
jornalístico realiza o domínio relacional como uma rede organizada por padrões estáveis
de escolha e zonas de alta plasticidade. Observou-se predomínio das orações intensivas,
seguido pelas circunstanciais e possessivas, com distribuição altamente previsível da
realização do Processo,sobretudo por ser, estar, ter, evidenciando a centralidade do verbo
como vetor de perspectivação entre participantes. Do ponto de vista estrutural, a
preferência pela realização simples do Portador/Identificado por grupos nominais e pela
realização do Atributo/Identificador por grupos nominais, adjetivais ou preposicionados
confirma a natureza referencialmente assimétrica dos participantes, sendo que os
primeiros atuam como âncoras referenciais. Nas orações possessivas, por exemplo,
verificou-se forte predominância da posse realizada como processo verbal ( 86%), com
baixa recorrência da posse como participante ( 14%) e prevalência da posse abstrata
sobre a material. O ICR mostrou-se capaz de capturar a correlação entre custo estrutural,
densidade lexical e propensão à condensação semântica, revelando diferenças
sistemáticas entre modos e tipos de oração e sua instanciação nos textos dos três gêneros
selecionados. Por conseguinte, esta tese contribui ao propor uma reconfiguração da rede
relacional para o português, fundamentada empiricamente e interpretada por métricas
estocásticas. Tal abordagem evidencia que a variação não é ‘ruído’, mas componente
constitutivo do potencial de significados da língua. Além disso, o estudo abre caminho
para aplicações computacionais, oferecendo um modelo de base para sistemas de
anotação, análise automatizada e geração textual fundamentados na LSF. Por fim, o
modelo pode ser expandido para outros registros e gêneros, e sua representação
probabilística pode subsidiar futuras investigações tipológicas e implementações em
linguística computacional.
