- -

LLM-Informed Multi-Armed Bandit Strategies for Non-Stationary Environments

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

LLM-Informed Multi-Armed Bandit Strategies for Non-Stationary Environments

Mostrar el registro completo del ítem

De Curtò, J.; De Zarzà, I.; Roig, G.; Cano, J.; Manzoni, P.; Tavares De Araujo Cesariny Calafate, CM. (2023). LLM-Informed Multi-Armed Bandit Strategies for Non-Stationary Environments. Electronics. 12(13). https://doi.org/10.3390/electronics12132814

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/203936

Ficheros en el ítem

Metadatos del ítem

Título: LLM-Informed Multi-Armed Bandit Strategies for Non-Stationary Environments
Autor: de Curtò, J. de Zarzà, Irene Roig, Gemma Cano, Juan-Carlos Manzoni, Pietro Tavares De Araujo Cesariny Calafate, Carlos Miguel
Entidad UPV: Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica
Fecha difusión:
Resumen:
[EN] In this paper, we introduce an innovative approach to handling the multi-armed bandit (MAB) problem in non-stationary environments, harnessing the predictive power of large language models (LLMs). With the realization ...[+]
Palabras clave: Multi-armed bandit , Non-stationary environments , Large language models , AI strategy optimization , GPT-3.5-turbo , QLoRA
Derechos de uso: Reconocimiento (by)
Fuente:
Electronics. (eissn: 2079-9292 )
DOI: 10.3390/electronics12132814
Editorial:
MDPI AG
Versión del editor: https://doi.org/10.3390/electronics12132814
Código del Proyecto:
info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2021-122580NB-I00/ES/SISTEMAS INTELIGENTES DE SENSORIZACION PARA ECOSISTEMAS, ESPACIOS URBANOS Y MOVILIDAD SOSTENIBLE/
Agradecimientos:
We acknowledge the support of Universitat Politècnica de València: R&D project PID2021-122580NB-I00, funded by MCIN/AEI/10.13039/501100011033 and ERDF. We thank the following funding sources from GOETHE-University Frankfurt ...[+]
Tipo: Artículo

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem