Resumen:
|
[ES] La extracción de datos bibliográficos como publicaciones científicas provenientes de
distintos orígenes de datos, y el posterior análisis de los resultados obtenidos, es un método muy
utilizado por investigadores ...[+]
[ES] La extracción de datos bibliográficos como publicaciones científicas provenientes de
distintos orígenes de datos, y el posterior análisis de los resultados obtenidos, es un método muy
utilizado por investigadores en universidades y empresas de todo el mundo cuando estos
necesitan identificar temas de interés, autores, universidades y países, en base a determinados
criterios. En este sentido han aparecido métodos bibliométricos que han permitido determinar y
diseñar métricas (e.g., indicadores científicos) objetivos que permiten medir y evaluar la
popularidad y el impacto de artículos, autores y publicaciones específicas.
En este trabajo se pretende desarrollar una aproximación para el análisis bibliométrico
de la producción científica por autores relacionados con el área de las ciencias de la
computación. Para ello se han utilizado técnicas de web-scraping que, a partir distintos orígenes
de datos, nos ha permitido obtener tanto la producción científica como la repercusión de los
distintos documentos publicados. Mediante este desarrollo, un usuario podrá, a partir del
nombre de un autor científico, obtener un listado de todas sus publicaciones, así como una
descripción bibliométrica con características más relevantes de dichas publicaciones, incluyendo
sus medidas de impacto, rankings, citas, etc. La dificultad radica en que, actualmente, toda esta
información se encuentra en bases de datos y repositorios heterogéneos en diferentes orígenes y
gestionados por distintas organizaciones. Por tanto, la solución aquí presentada constituye un
primer paso para caracterizar de forma centralizada y estructurada la producción científica de
autores, lo que permitirá orientar a los usuarios a determinar el nivel o prestigio tanto del autor
como de sus producciones científicas.
[-]
[EN] The extraction of bibliographic data such as scientific publications from different data
sources, and the posterior analysis of the results, is a commonly used by researchers in
universities and companies whenever ...[+]
[EN] The extraction of bibliographic data such as scientific publications from different data
sources, and the posterior analysis of the results, is a commonly used by researchers in
universities and companies whenever they need to identify leading topics, authors, universities
and countries, according to certain criteria. In this regard, bibliometric methods have appear
aiming at determining and devising metrics (e.g., scientific indicators) as objective as possible
to determine the popularity and impact of specific articles, authors, and publications.
The aim of this work is to develop an approach for the bibliometric analysis of scientific
production (author-wise) related to the area of computer science. For this purpose, web-scraping
techniques have been applied to different data sources allowing us to obtain both the scientific
production and the repercussion of the different published documents. Through this
development, users will be able, from the name of a scientific author, to obtain a list of all their
publications, as well as a bibliometric description with the most relevant characteristics of these
publications, including their impact measurements, rankings, citations, etc. The difficulty lies in
the fact that, at present, all this information is stored and provided in heterogeneous databases
and repositories from different origins and managed by different organizations. In this regard,
the solution presented here constitutes a first step to characterize, in a centralized and structured
way, the scientific production of authors, which will guide users to determine the level or
prestige of both the author and their scientific productions.
[-]
|