Please use this identifier to cite or link to this item:
http://hdl.handle.net/11612/8103| Authors: | Hasimoto, Marcia |
| metadata.dc.contributor.advisor: | Sousa, Rogério Nogueira de |
| Title: | Análise textual das decisões proferidas em colegiado do Tribunal de Justiça do Tocantins |
| Keywords: | Processamento de Linguagem Natural; Agrupamento de Textos; SBERT; Acórdãos Judiciais; Inteligência Artificial; Natural Language Processing; Text Clustering; SBERT; Judicial Decisions; Artificial Intelligence |
| Issue Date: | 5-Sep-2025 |
| Publisher: | Universidade Federal do Tocantins |
| metadata.dc.publisher.program: | Programa de Pós-Graduação em Modelagem Computacional de Sistemas - PPGMCS |
| Citation: | HASIMOTO, Marcia. Análise textual das decisões proferidas em colegiado do Tribunal de Justiça do Tocantins.2025.62f. Dissertação (Mestrado em Modelagem Computacional e Sistemas) – Universidade Federal do Tocantins, Programa de Pós-graduação em Modelagem Computacional e Sistemas, Palmas, 2025. |
| metadata.dc.description.resumo: | A crescente demanda por celeridade e eficiência no Poder Judiciário tem impulsionado a adoção de soluções baseadas em Inteligência Artificial. Neste contexto, esta dissertação propõe uma metodologia fundamentada em Processamento de Linguagem Natural (PLN) e aprendizado não supervisionado para o agrupamento de acórdãos judiciais, com foco na triagem de pedidos de recurso submetidos ao gabinete da presidência de tribunais. Parte-se da hipótese de que a orga- nização automatizada de decisões judiciais por similaridade semântica pode contribuir para a identificação de temas repetitivos ou já pacificados, evitando o encaminhamento de recursos desnecessários às instâncias superiores. A metodologia abrangeu as etapas de pré-processa- mento textual, vetorização com modelos da família SBERT com destaque para o modelo jurí- dico stjiris/bert-large-portuguese-cased-legal-mlm-sts-v1.0, aplicação do algoritmo K-Means para clusterização, redução de dimensionalidade com t-SNE e avaliação da qualidade dos agru- pamentos por meio das métricas internas Silhouette Score, Davies-Bouldin Index e Calinski- Harabasz Index. A análise qualitativa foi conduzida por meio de técnicas de modelagem de tópicos com Latent Dirichlet Allocation (LDA), visualizações interativas com a ferramenta PyL- DAvis e geração de nuvens de palavras, permitindo uma interpretação aprofundada dos agrupa- mentos. Como resultado, observou-se a formação de grupos tematicamente consistentes, com destaque para categorias como Direito Fiscal, Sucessório, Administrativo e Responsabilidade Civil. Os achados demonstram que a abordagem proposta é eficaz na organização de acórdãos por similaridade semântica, apresentando potencial prático para apoiar a triagem e a organiza- ção de processos judiciais especialmente em contextos com grande volume documental e au- sência de rotulagem prévia. |
| Abstract: | The growing demand for speed and efficiency in the Judiciary has driven the adoption of solu- tions based on Artificial Intelligence. In this context, this dissertation proposes a methodology grounded in Natural Language Processing (NLP) and unsupervised learning for clustering ju- dicial decisions, with a focus on screening appeals submitted to the office of court presidencies. The underlying hypothesis is that automated organization of judicial decisions based on seman- tic similarity can contribute to identifying repetitive or settled themes, thereby avoiding the submission of unnecessary appeals to higher courts. The proposed methodology comprises sev- eral stages, including text preprocessing, vectorization using SBERT family models with em- phasis on the legal-domain model stjiris/bert-large-portuguese-cased-legal-mlm-sts-v1.0 clus- tering with the K-Means algorithm, dimensionality reduction via t-SNE, and evaluation of clus- tering quality through internal metrics such as Silhouette Score, Davies-Bouldin Index, and Calinski-Harabasz Index. Qualitative analysis was conducted using topic modeling with Latent Dirichlet Allocation (LDA), interactive visualizations with PyLDAvis, and word cloud gener- ation, allowing a deeper interpretation of the resulting clusters. The results showed the for- mation of thematically consistent groups, with emphasis on categories such as Tax Law, Pro- bate Law, Administrative Law, and Civil Liability. These findings demonstrate that the pro- posed approach is effective in organizing judicial decisions by semantic similarity, offering practical potential to support the screening and organization of judicial processes especially in contexts involving large document volumes and lack of labeled data. |
| URI: | http://hdl.handle.net/11612/8103 |
| Appears in Collections: | Mestrado em Modelagem Computacional de Sistemas |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Marcia Hasimoto - Dissertação.pdf | 1.35 MB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
