Resumen:
|
[ES] Históricamente, los modelos de lenguaje se han utilizado para resolver una gran cantidad de desafíos en el campo del aprendizaje automático. Sin embargo, en los últimos años, gracias a la aparición de nuevas arquitecturas ...[+]
[ES] Históricamente, los modelos de lenguaje se han utilizado para resolver una gran cantidad de desafíos en el campo del aprendizaje automático. Sin embargo, en los últimos años, gracias a la aparición de nuevas arquitecturas de redes neuronales como los transformers, mejoras en las técnicas de entrenamiento y un incremento en el poder computacional, la popularidad de este tipo de modelos esta en auge.
El objetivo de este trabajo es aplicar técnicas de modelado del lenguaje a problemas de planificación con inteligencia artificial. Específicamente, se pretende entrenar una serie de modelos transformer para convertir estados del mundo descritos en lenguaje PDDL en formato texto a vectores característicos que puedan ser utilizados posteriormente en tareas de planificación. Los dominios de "Blocksworld", "Logistics" y "Floortile" se han utilizado como base para el entrenamiento y evaluación de los modelos.
Los vectores característicos generados tienen como objetivo sustituir técnicas tradicionales de representación de estados, como la codificación one-hot, mejorando así el rendimiento del proceso de planificación y reduciendo la huella de memoria.
[-]
[EN] Historically, language models have been used to solve a variety of machine learning challenges. However, in recent years, thanks to the emergence of new neural network architectures such as transformers, improvements ...[+]
[EN] Historically, language models have been used to solve a variety of machine learning challenges. However, in recent years, thanks to the emergence of new neural network architectures such as transformers, improvements in training techniques, and an increase in computational power, the popularity of this type of models is booming.
The goal of this work is to apply language modeling techniques to artificial intelligence planning problems. Specifically, we intend to train a set of transformer models to convert PDDL states in text format into feature vectors that can later be used in planning tasks. The domains "Blocksworld", "Logistics" and "Floortile" were used as a basis for training and evaluation of the models.
The generated feature vectors are intended to replace traditional state representation techniques, such as one-hot encoding, thus improving the performance of the planning process and reducing the memory footprint.
[-]
|