Biblioteca Digital da UEM: Sistema Nou-Rau
Pgina Principal  Portugus   English  Español   Aumentar Texto  Texto Normal  Diminuir Texto
  Principal | Apresentao | Objetivos | Instrues Autores | Estatsticas | Outras Bibliotecas Digitais
  Sistema Integrado de Bibliotecas - SIB / UEM
Entrar | acessos | verso 1.1  
ndice
Pgina principal
Documentos
Novidades
Usurios

Aes
Consultar
Procurar
Exibir estatsticas

Procurar por:
Procura avanada

Dvidas e sugestes


Consultar: Programa de Ps-Graduao em Cincia da Computao

Incio > Dissertaes e Teses > Cincias Exatas e da Terra > Cincia da Computao > Programa de Ps-Graduao em Cincia da Computao

Ttulo [PT]: Extenses do algoritmo Ant-Miner para tratar o problema de bases de dados desbalanceadas
Ttulo [EN]: Extensions to the Ant-Miner Algorithm to Deal with Imbalanced Data Sets
Autor(es): Murilo Zangari de Souza
Palavras-chave [PT]:

Minerao de dados. Otimizao por colonia de formigas artificiais (ACO). Tarefa de classificao. Bases de dados desbalanceadas. Algoritmo Ant-Miner. Anlise ROC. Brasil.
Palavras-chave [EN]:
Data Mining. Classification task. Class imbalance. Ant-Miner. Sampling. ROC analysis. Brazil.
Titulao: Mestre em Cincia da Computao
Banca:
Ademir Aparecido Constantino [Orientador] - UEM
Wesley Romo - UEM
Valria Delisandra Feltrin - UEM
Deborah Ribeiro Carvalho - PPGTS/PUC-PR
Resumo:
Resumo: A tarefa de classificao em Minerao de Dados utiliza algoritmos chamados de classificadores para extrair padres sobre bases de dados. Bases de dados reais podem apresentar um desbalanceamento em suas classes, contendo mais casos de uma classe do que de outras. Algoritmos classificadores tm dificuldade em encontrar padres de qualidade para as classes minoritrias, pelo fato dos casos pertencentes classe minoritria possurem pouca representatividade no conjunto de treinamento. Isto se torna um problema quando a classe minoritria a de maior interesse para o usurio. O objetivo deste trabalho o desenvolvimento de extenses para o algoritmo Ant-Miner (Ant Colony-based Data Miner) para ajudar a encontrar melhores regras para as classes minoritrias. Essas extenses modificam, principalmente, a forma como as regras so construdas e avaliadas. O algoritmo Ant-Miner baseado na meta heurstica ACO (Ant Colony Optimization) e tanto a verso original quanto outros trabalhos relacionados mostram que a tcnica competitiva com outros algoritmos de classificao. Alm disso, so analisadas tcnicas de balanceamento (undersampling e oversampling) e tambm um estudo da anlise ROC (Receiver Operating Characteristics). As tcnicas de balanceamento visam fazer uma nova amostragem dos dados mudando a distribuio do conjunto de treinamento. A anlise ROC realiza avaliaes mais apuradas que outras mtricas (e.g.: taxa de acerto), principalmente quando se trata de bases com classes desbalanceadas. Resultados experimentais mostraram que os algoritmos desenvolvidos contriburam para a descoberta de melhores regras para as classes minoritrias e tambm com a simplicidade do modelo de regras.

Abstract: The classification task in Data Mining uses algorithms called classifiers to find patterns on data bases. Real data bases can have an imbalance in its classes, when there are more cases of one class then the others. Classification algorithms are sensitive of this imbalance and tend to valorize the majority class and ignore de minority class, because the cases of minority class have low representation on the training set. It is a problem when the minority class is the class of interest. In this work we propose two extensions to the Ant-Miner algorithm to find better rules to the minority classes. These extensions modify, mainly, how rules are constructed and evaluated. The Ant-Miner algorithm is based on ACO (Ant Colony Optimization). The original version and others related works showed that the Ant-Miner is competitive with other standard classifiers. Moreover, we analyzed sampling techniques (undersampling and oversampling) and also a study of ROC (Receiver Operating Characteristics) analysis. The sampling techniques aim to make a new sampling of the data sets changing the classes? proportion of the training set. The ROC analysis can evaluate the results with more accurate than other metrics, mainly when the classifiers are applied in data sets with classes imbalance. Experimental results showed that the developed algorithms contribute to the rule discovery of the minority classes and also contribute with the simplicity of the rules.
Data da defesa: 26/07/2012
Cdigo: vtls000199315
Informaes adicionais:
Idioma: Portugus
Data de Publicao: 2012
Local de Publicao: Maring, PR
Orientador: Prof. Dr. Ademir Aparecido Constantino
Instituio: Universidade Estadual de Maring. Centro de Tecnologia. Programa de Ps-Graduao em Cincia da Computao
Nvel: Dissertao (mestrado em Cincia da Computao)/
UEM: Departamento de Informtica

Responsavel: beth
Categoria: Aplicao
Formato: Documento PDF
Arquivo: Murilo_Dissertao FINAL.pdf
Tamanho: 2029 Kb (2077567 bytes)
Criado: 01-04-2016 16:19
Atualizado: 01-04-2016 16:23
Visitas: 243
Downloads: 2

[Visualizar]  [Download]

Todo material disponvel neste sistema de propriedade e responsabilidade de seus autores.