Sistema de clasificación paralelo basado en un ensamble de tipo mezcla de expertos Público Deposited
The classification of large amounts of data is a challenging task in machine learning, which only some few classifiers can handle. In this paper we propose a Parallel Classifier based on Mixture of Experts (PCME)to handle this challenging task. The PCME is a novel algorithm since it allows us to classify large amounts of data with low execution times and performance measures (accuracy, lift, precision and recall) better than other classifiers. In previous work we saw that heterogeneous ensemble models were better but at a explores steep time cost. This work using parallel programming to overcome the time cost problem. We used the MIMD (Multiple Instruction and Multiple Data Stream) architecture, that uses a set of process that communicate via messages. PCME is implemented using parallel schemes of traditional classifiers, for the mixture of experts, and using also a parallel version of a Genetic Algorithm to implement a weighted voting criterion. We performed a series of tests with a set of databases that place the PCME as a very competitive classifier. Keywords: Data Mining and Classification and Classifiers based on Ensemble and Machine Learning and Parallel Computing
Resolver el problema de clasificación sobre grandes cantidades de datos representa un gran desafío en Minería de Datos, que solamente un número reducido de algoritmos de clasificación pueden manejar. En este trabajo se presenta un Sistema de clasificación paralelo basado en un ensamble de tipo mezcla de expertos (Parallel Classification System based on an Ensemble of Mixture of Experts - PCEM), que da solución a este desafío. El PCEM que se propone utiliza una arquitectura de cómputo paralelo del tipo MIMD (Multiple Instruction and Multiple Data Stream), basado en un conjunto de procesos que se comunican a través de mensajes. En el PCEM se emplean un conjunto de esquemas paralelos de clasificadores tradicionales, de allí el nombre de Ensamble de Tipo Mezcla de Expertos. También se utiliza un esquema paralelo de un Algoritmo Genético, lo cual representa un aporte con respecto a los métodos existentes que permiten asignar un peso diferente a cada clasificador. Mediante esta asignación de pesos, se aplica un criterio de votación ponderada para combinar las clasificaciones individuales del ensamble. El PCEM es un algoritmo novedoso, ya que mediante éste podemos realizar una clasificación sobre grandes cantidades de datos, obteniendo bajos tiempos de ejecución y altos niveles de rendimiento. Mediante una serie de pruebas se comprobaron los resultados del PCEM contra un conjunto de clasificadores tradicionales y paralelos, obteniéndose resultados favorables para el PCEM, en tiempos de ejecución e índices de medidas de rendimiento.
Relacionamentos
No conjunto administrativo: |
---|
Descrições
Nome do Atributo | Valores |
---|---|
Creador | |
Colaboradores | |
Tema | |
Editor | |
Idioma | |
Identificador | |
Palavra-chave | |
Año de publicación |
|
Tipo de Recurso | |
Derechos | |
División académica | |
Línea académica | |
Licencia |