Enriquecimiento del conocimiento previo en ILP

Muñoz Texzocotetla, Orlando

Enriquecimiento del conocimiento previo en ILP Público Deposited

Inductive Logic Programming (ILP) induces concepts from a set of negative examples, a set of positive examples, and background knowledge. ILP has been applied on tasks in areas such as natural language processing, finite element mesh design, network mining, robotics, drug discovery, and more. These datasets typically contain both numerical and categorical attributes; however, few relational learning systems efficiently handle such data. This thesis introduces an evolutionary method called ”Grouping and Discretization for Enriching the Background Knowledge (GDEBaK),”which enables the handling of numerical and categorical attributes. This method employs evolutionary operators to create and test different split points (for numerical attributes) and subsets of values (for categorical attributes) based on a fitness function. Subsequently, the best split points and category subsets are added to the background knowledge before the learning process, to be used during the induction of the final theory. We implemented GDEBaK embedded in the Aleph system and compared it with Aleph’s lazy discretization and the discretization performed by the Top-down Induction of Logical Decision Trees (TILDE) system [6]. Aleph is one of the most widely used ILP systems for learning concepts that require high representational power [55]. It is crucial in ILP, incorporating functionalities from other systems such as Progol, FOIL, FORS, or TILDE. The obtained results indicate that the presented method improves the accuracy of final theories and reduces the number of rules in the majority of cases.

La Programación Lógica Inductiva (ILP) induce conceptos a partir de un conjunto de ejemplos negativos, un conjunto de ejemplos positivos, y un conocimiento previo. La ILP ha sido utilizada en tareas dentro de diversas áreas como procesamiento de lenguaje natural, diseño de malla para elementos finitos, minería de redes, robótica, descubrimiento de nuevas drogas en farmacéutica, etc. Los conjuntos de datos utilizados, usualmente, contienen atributos numéricos y categóricos, sin embargo, son pocos los sistemas de aprendizaje relacional que son capaces de manejar ese tipo de datos de manera eficiente. Esta tesis presenta un método evolutivo, llamado “Agrupamiento y discretización para el enriquecimiento del conocimiento previo” (en inglés Grouping and Discretización for Enriching the Background Knowledge - GDEBaK), el cual, permite manejar atributos numéricos y categóricos. Este método utiliza operadores evolutivos para crear y probar diferentes puntos de división (en el caso de los atributos numéricos) y subconjuntos de valores (en el caso de ´ los atributos categóricos) de acuerdo a una función de aptitud. Después, los mejores puntos de división y subconjuntos de categorías son agregados al conocimiento previo, antes de realizar el proceso de aprendizaje, para que sean utilizados durante la construcción de la teoría final. Implementamos GDEBaK embebido en el sistema Aleph y lo comparamos con la discretización perezosa del sistema Aleph y con la discretización llevada a cabo por el sistema Top-down Induction of Logical Decision Trees (TILDE) [6]. Aleph es uno de los sistemas de ILP más usados para aprender conceptos que necesitan gran poder de representación [ ´ 55], y es uno de los más importantes en ILP ya que posee funcionalidades de otros sistemas como Progol, FOIL, FORS o TILDE. Los resultados obtenidos muestran que el método presentado mejora la precisión de las teorías finales y reduce el número de reglas en la mayoría de los casos.

Relacionamentos

No conjunto administrativo:	Tesis Posgrado

Descrições

Nome do Atributo	Valores
Creador	Muñoz Texzocotetla, Orlando
Colaboradores	Lara Velázquez, Pedro Gutiérrez Andrade, Miguel Ángel Morales Manzanares, Eduardo Mac Kinney Romero, René
Tema	Discretization (Mathematics) Programación lógica Discretización (Matemáticas) Logic programming
Editor	Universidad Autónoma Metropolitana
Idioma	spa
Identificador	https://doi.org/10.24275/uami.zg64tm61p
Palavra-chave	Aprendizaje multivalores Programación lógica Algoritmos genéticos Método GDEBaK
Año de publicación	2023
Tipo de Recurso	info:eu-repo/semantics/doctoralThesis
Derechos	Acceso Abierto
División académica	Ciencias Basicas e Ingenieria
Línea académica	Ciencias y Tecnologias de la Informacion
Licencia	Atribucion-NoComercial 4.0 Internacional (CC BY-NC 4.0)

Analytics

Última modificação: 09/30/2024

Citações:

EndNote | Zotero | Mendeley

Unid

Miniatura	Título	Data carregada	Visibilidade	Ações
	UAMII24486.pdf	2024-08-02	Público	Download