Enriquecimiento del conocimiento previo en ILP Público Deposited

Inductive Logic Programming (ILP) induces concepts from a set of negative examples, a set of positive examples, and background knowledge. ILP has been applied on tasks in areas such as natural language processing, finite element mesh design, network mining, robotics, drug discovery, and more. These datasets typically contain both numerical and categorical attributes; however, few relational learning systems efficiently handle such data. This thesis introduces an evolutionary method called ”Grouping and Discretization for Enriching the Background Knowledge (GDEBaK),”which enables the handling of numerical and categorical attributes. This method employs evolutionary operators to create and test different split points (for numerical attributes) and subsets of values (for categorical attributes) based on a fitness function. Subsequently, the best split points and category subsets are added to the background knowledge before the learning process, to be used during the induction of the final theory. We implemented GDEBaK embedded in the Aleph system and compared it with Aleph’s lazy discretization and the discretization performed by the Top-down Induction of Logical Decision Trees (TILDE) system [6]. Aleph is one of the most widely used ILP systems for learning concepts that require high representational power [55]. It is crucial in ILP, incorporating functionalities from other systems such as Progol, FOIL, FORS, or TILDE. The obtained results indicate that the presented method improves the accuracy of final theories and reduces the number of rules in the majority of cases.

La Programación Lógica Inductiva (ILP) induce conceptos a partir de un conjunto de ejemplos negativos, un conjunto de ejemplos positivos, y un conocimiento previo. La ILP ha sido utilizada en tareas dentro de diversas áreas como procesamiento de lenguaje natural, diseño de malla para elementos finitos, minería de redes, robótica, descubrimiento de nuevas drogas en farmacéutica, etc. Los conjuntos de datos utilizados, usualmente, contienen atributos numéricos y categóricos, sin embargo, son pocos los sistemas de aprendizaje relacional que son capaces de manejar ese tipo de datos de manera eficiente. Esta tesis presenta un método evolutivo, llamado “Agrupamiento y discretización para el enriquecimiento del conocimiento previo” (en inglés Grouping and Discretización for Enriching the Background Knowledge - GDEBaK), el cual, permite manejar atributos numéricos y categóricos. Este método utiliza operadores evolutivos para crear y probar diferentes puntos de división (en el caso de los atributos numéricos) y subconjuntos de valores (en el caso de ´ los atributos categóricos) de acuerdo a una función de aptitud. Después, los mejores puntos de división y subconjuntos de categorías son agregados al conocimiento previo, antes de realizar el proceso de aprendizaje, para que sean utilizados durante la construcción de la teoría final. Implementamos GDEBaK embebido en el sistema Aleph y lo comparamos con la discretización perezosa del sistema Aleph y con la discretización llevada a cabo por el sistema Top-down Induction of Logical Decision Trees (TILDE) [6]. Aleph es uno de los sistemas de ILP más usados para aprender conceptos que necesitan gran poder de representación [ ´ 55], y es uno de los más importantes en ILP ya que posee funcionalidades de otros sistemas como Progol, FOIL, FORS o TILDE. Los resultados obtenidos muestran que el método presentado mejora la precisión de las teorías finales y reduce el número de reglas en la mayoría de los casos.

Relaciones

En Conjunto Administrativo:

Descripciones

Nombre del atributoValores
Creador
Colaboradores
Tema
Editor
Idioma
Palabra Clave
Año de publicación
  • 2023
Tipo de Recurso
Derechos
División académica
Línea académica
Licencia
Última modificación: 08/04/2024
Citaciones:

EndNote | Zotero | Mendeley

Elementos