Dual Indicators to Analyse AI Benchmarks: Difficulty, Discrimination, Ability and Generality

Martínez-Plumed, Fernando; Hernández-Orallo, José

doi:10.1109/TG.2018.2883773

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Dual Indicators to Analyse AI Benchmarks: Difficulty, Discrimination, Ability and Generality

Mostrar el registro completo del ítem

Martínez-Plumed, F.; Hernández-Orallo, J. (2020). Dual Indicators to Analyse AI Benchmarks: Difficulty, Discrimination, Ability and Generality. IEEE Transactions on Games. 12(2):121-131. https://doi.org/10.1109/TG.2018.2883773

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/169021

Ficheros en el ítem

Nombre: Martínez-Plumed;H ...

Tamaño: 1.143Mb

Formato: PDF

Descripción: Versión del Autor.

Abrir/Preview

Nombre: IEEE Transactions ...

Tamaño: 4.355Mb

Formato: PDF

Descripción: Versión editorial

Solicitar una copia al autor

Metadatos del ítem

Título:

Dual Indicators to Analyse AI Benchmarks: Difficulty, Discrimination, Ability and Generality

Autor:

Martínez-Plumed, Fernando

Hernández-Orallo, José

Entidad UPV:

Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació

Fecha difusión:

2020-06

Resumen:

[EN] With the purpose of better analyzing the result of artificial intelligence (AI) benchmarks, we present two indicators on the side of the AI problems, difficulty and discrimination, and two indicators on the side of ...[+]

Palabras clave:

Artificial intelligence , Games , Benchmark testing , Task analysis , Adaptation models , Guidelines , Indexes , Artificial intelligence (AI) benchmarks , AI evaluation , Generality , Item response theory (ITR)

Derechos de uso:

Reserva de todos los derechos

Fuente:

IEEE Transactions on Games. (issn: 2475-1502 )

DOI:

10.1109/TG.2018.2883773

Editorial:

Institute of Electrical and Electronics Engineers (IEEE)

Versión del editor:

https://doi.org/10.1109/TG.2018.2883773

Código del Proyecto:

info:eu-repo/grantAgreement/INCIBE//INCIBEI-2015-27345/
...[+]

Agradecimientos:

This work was supported by the U.S. Air Force Office of Scientific Research under Award FA9550-17-1-0287; in part by the EU (FEDER) and the Spanish MINECO under Grant TIN 2015-69175-C4-1-R; and in part by the Generalitat ...[+]

Tipo:

Artículo

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Artículos, conferencias, monografías [48755]

Mostrar el registro completo del ítem

Dual Indicators to Analyse AI Benchmarks: Difficulty, Discrimination, Ability and Generality

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Dual Indicators to Analyse AI Benchmarks: Difficulty, Discrimination, Ability and Generality

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)