Please use this identifier to cite or link to this item: http://hdl.handle.net/11612/974
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorRocha, Marcelo Lisboa-
dc.contributor.authorRibeiro Filho, Napoleão Póvoa-
dc.date.accessioned2018-08-03T18:48:07Z-
dc.date.available2018-08-03T18:48:07Z-
dc.date.issued2016-03-30-
dc.identifier.citationRIBEIRO FILHO, Napoleão Póvoa. Melhorando o desempenho da técnica de clusterização hierárquica single linkage utilizando a metaheurística GRASP.2016. 58f. Dissertação (Mestrado em Modelagem Computacional e Sistemas) – Universidade Federal do Tocantins, Programa de Pós-graduação em Modelagem Computacional e Sistemas, Palmas, 2016.pt_BR
dc.identifier.urihttp://hdl.handle.net/11612/974-
dc.description.abstractThe problem of clustering (grouping) consists of, from a database, group the elements so that more queries are in the same cluster (group) and less similar elements are different clusters. There are several ways to accomplish these groupings. One of the most popular is the hierarchical, where a hierarchical relationships between the elements is created. There are several methods of analyzing the similarity between elements in the clustering problem. The most common among them is the single linkage method, which brings together the elements that are experiencing less apart. To apply the technique in question, distance matrix is the input used. This grouping process generates the end an inverted tree known as dendrogram. The cophenetic correlation coefficient (ccc), obtained after the construction of the dendrogram is a measure used to evaluate the consistency of the clusters generated and indicates how faithful he is in relation to the original data. Thus, a dendrogram gives more consistent clusters when the ccc is closer to one (1). The clustering problem in all its aspects, including hierarchical clustering (object of study in this work), belongs to the class of NP-complete problems. Therefore, it is common to use heuristics for efficient solutions to this problem. In order to generate dendrograms that result in better ccc, it is proposed in this paper a new algorithm that uses the concepts of GRASP metaheuristic. It is also objective of this work to implement such a solution in parallel computing in a computer cluster, thus working with arrays larger. Tests were conducted to confirm the performance of the proposed algorithm, comparing the results with those generated by the software R.pt_BR
dc.formatapplication/pdfen_US
dc.language.isopt_BRpt_BR
dc.publisherUniversidade Federal do Tocantinspt_BR
dc.rightsOpen Accessen_US
dc.subjectGRASPpt_BR
dc.subjectClusterização Hierárquicapt_BR
dc.subjectCoeficiente de Correlação Cofenéticapt_BR
dc.subjectHierarchical clusteringpt_BR
dc.subjectCophenetic Correlation Coefficientpt_BR
dc.titleMelhorando o desempenho da técnica de clusterização hierárquica single linkage utilizando a metaheurística GRASPpt_BR
dc.typeDissertaçãopt_BR
dc.description.resumoO problema de clusterização (agrupamento) consiste em, a partir de uma base de dados, agrupar os elementos de modo que os mais similares fiquem no mesmo cluster (grupo), e os elementos menos similares fiquem em clusters distintos. Há várias maneiras de se realizar esses agrupamentos. Uma das mais populares é a hierárquica, onde é criada uma hierarquia de relacionamentos entre os elementos. Há vários métodos de se analisar a similaridade entre elementos no problema de clusterização. O mais utilizado entre eles é o método single linkage, que agrupa os elementos que apresentarem menor distância entre si. Para se aplicar a técnica em questão, uma matriz de distâncias é a entrada utilizada. Esse processo de agrupamento gera ao final uma árvore invertida conhecida como dendrograma. O coeficiente de correlação cofenética (ccc), obtido após a construção do dendrograma, é utilizado para avaliar a consistência dos agrupamentos gerados e indica o quão fiel o dendrograma está em relação aos dados originais. Dessa forma, um dendrograma apresenta agrupamentos mais consistentes quando o ccc for o mais próximo de um (1) . O problema de clusterização em todas as suas vertentes, inclusive a clusterização hierárquica (objeto de estudo nesse trabalho), pertence a classe de problemas NP-Completo. Assim sendo, é comum o uso de heurísticas para obter soluções de modo eficiente para esse problema. Com o objetivo de gerar dendrogramas que resultem em melhores ccc, é proposto no presente trabalho um novo algoritmo que utiliza os conceitos da metaheurística GRASP. Também é objetivo deste trabalho implementar tal solução em computação paralela em um cluster computacional, permitindo assim trabalhar com matrizes de dimensões maiores. Testes foram realizados para comprovar o desempenho do algoritmo proposto, comparando os resultados obtidos com os gerados pelo software R.pt_BR
dc.publisher.countryBRpt_BR
dc.publisher.programPrograma de Pós-Graduação em Modelagem Computacional de Sistemas - PPGMCSpt_BR
dc.publisher.campusPalmaspt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpt_BR
Appears in Collections:Mestrado em Modelagem Computacional de Sistemas

Files in This Item:
File Description SizeFormat 
Napoleão Póvoa Ribeiro Filho - Dissertação.pdf1.1 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.