Resumen:
|
[ES] Lograr los Objetivos del Milenio de las Naciones Unidas (UN) es el objetivo principal de la Agenda 2030. Un paso crítico hacia este objetivo es identificar si las publicaciones científicas se encuentran encaminadas. ...[+]
[ES] Lograr los Objetivos del Milenio de las Naciones Unidas (UN) es el objetivo principal de la Agenda 2030. Un paso crítico hacia este objetivo es identificar si las publicaciones científicas se encuentran encaminadas. Para ello, los autores deben realizar un reconocimiento manual, lo que tiene impacto sobre la precisión, escalabilidad y objetividad de la evaluaci¿on. Por ello, proponemos en este trabajo un modelo basado en Inteligencia Artificial (AI) para la identificación automática de los Objetivos del Desarrollo Sostenible en publicaciones científicas. Este modelo se utiliza para analizar más de ocho mil publicaciones relacionadas con Ingeniería Aerospacial, comparando el impacto de aquellas publicaciones con un alto y bajo numero de citas sobre los objetivos o si este impacto es positivo o negativo. La base de datos de entrenamiento consiste en textos extraídos manualmente de la página
de las Naciones Unidas. Tras el pre-procesamiento de los textos, entrenamos cuatro modelos diferentes: Non-Negative Matrix Factorization (NMF), Latent-Dirichlet Allocation (LDA), Top2Vec and BERTopic. Los resultados obtenidos individualmente por cada modelo se combinan en una votación. Estos son validados con la base de datos proporcionada en Vinuesa et al. [15], obteniendo un 97.2 % de precisión con los textos de entrenamiento y un 67.5 % con los de validación. La base de datos con los textos de ingenier¿¿a aerospacial cuenta con diez mil publicaciones desde 2017 hasta 2021 (Scopus) y se obtiene que estos contribuyen mayormente a los SDG7, SDG9 y SDG11. Las bases de datos utilizadas para entrenamiento, validación y análisis además de los modelos entrenados son open-source. La metodología, referencias, bases de datos, modelos y validación ya han sido publicados (Sánchez et al [13]).
[-]
[EN] Achieving the Millennium Goals of the United Nations (UN) is the primary goal of the 2030 Agenda. A critical step towards that objective is identifying if the scientific production is going in this way. Funders must ...[+]
[EN] Achieving the Millennium Goals of the United Nations (UN) is the primary goal of the 2030 Agenda. A critical step towards that objective is identifying if the scientific production is going in this way. Funders must do a manual recognition, impacting accuracy, scalability, and objectiveness. For this reason, we propose in this work an AI-based model for the automatic identification of the Sustainable Development Goals (SDGs) in scientific papers. This model is used to analyse more than eight thousand Aerospace-related scientific papers, comparing the impact that scientific papers with high and low citations have on the SDGs or whether this impact is positive or negative. The training database consists of manually extracted texts from the UN page. After pre-processing these texts, we train four different models: Non-Negative Matrix Factorization (NMF), Latent-Dirichlet Allocation (LDA), Top2Vec and BERTopic. The results obtained individually by each model are combined in a voting model. These models are validated with the database in Vinuesa et al. [15], obtaining a 97.2 % of accuracy with the training set and a 67.5 % with the validation set. The Aerospace dataset consists of ten thousand papers from 2017 to 2021 in Scopus, and it is shown that the major contribution to
SDG7, SDG9 and SDG11. The databases used for training, validation, and analysis as well as the trained models are open source. The methodology, references, datasets, models and validation have already been published (Sánchez et al. [13]).
[-]
[CA] Aconseguir els Objectius del Millenni de les Nacions Unides (UN) és l’objectiu principal de l’Agenda 2030. Un pas crític cap este objectiu és identificar si les publicacions científiques es troben encaminades. Per a ...[+]
[CA] Aconseguir els Objectius del Millenni de les Nacions Unides (UN) és l’objectiu principal de l’Agenda 2030. Un pas crític cap este objectiu és identificar si les publicacions científiques es troben encaminades. Per a això, els autors han de realitzar un reconeixement manual, la qual cosa té impacte sobre la precisió, escalabilidad i objectivitat de l’avaluació. Per això, proposem en este treball un model basat en Intelligència Artificial (AI) per a la identificació automàtica dels Objectius del Desenrotllament
Sostenible en publicacions científiques. Este model s’utilitza per a analitzar més de huit mil publicacions relacionades amb Enginyeria Aerospacial, comparant l’impacte d’aquelles publicacions amb un alt i davall numere de cites sobre els objectius o si este impacte és positiu o negatiu. La base de dades d’entrenament consistix en textos extrets manualment de la pàgina de les Nacions Unides. Després del preprocessament dels textos, entrenem quatre models diferents: Non-Negative Matrix Factorization (NMF) , Latent-Dirichlet Allocation (LDA) , Top2Vec and BERTopic. Els resultats obtinguts
individualment per cada model es combinen en una votació. Estos són validats amb la base de dades
proporcionada en Vinuesa t’al. [16], obtenint un 97.2 % de precisió amb els textos d’entrenament i un
67.5 % amb els de validació. La base de dades amb els textos d’enginyeria aerospacial compta amb
deu mil publicacions des de 2017 fins a 2021 (Scopues) i s’obté que estos contribuxen majorment als
SDG7, SDG9 i SDG11. Les bases de dades utilitzades per a entrenament, validació i anàlisi a més dels models entrenats són open-source. La metodologia, referències, bases de dades, models i validació ja han sigut publicats (S´anchez et al [13]).
[-]
|