Resumen:
|
[ES] El aprendizaje automático es un área de la inteligencia artificial que está en auge en
el ámbito empresarial. Esta área consiste en crear programas capaces de generar un
comportamiento específico a partir de unos ...[+]
[ES] El aprendizaje automático es un área de la inteligencia artificial que está en auge en
el ámbito empresarial. Esta área consiste en crear programas capaces de generar un
comportamiento específico a partir de unos datos. El aprendizaje automático tiene
múltiples aplicaciones, tales como: motores de búsqueda, diagnóstico médico, análisis
del mercado de valores, juegos, reconocimiento del habla y del lenguaje escrito,
coches autónomos, publicidad dirigida por historial de búsquedas o compras, etc.
Existe gran cantidad de información que se encuentra en internet de forma
desordenada. En particular, hay empresas que se dedican a seleccionar y clasificar las
noticias que muestran en su web de manera manual, lo que hace que no sea muy
productivo, tanto por los recursos humanos necesarios como el tiempo necesario que
requiere esta tarea, ya que es necesario leer todas las noticias y clasificarlas. Este
TFG aborda este problema desarrollando un clasificador de texto, el cual se entrenará
mediante diferentes algoritmos de aprendizaje automático en búsqueda del más
eficiente. Además, se investigará cómo la cantidad de datos y la longitud del texto
afecta al resultado. Para realizar dicho clasificador de texto se usará Python como
lenguaje de programación ya que existen muchas librerías y módulos que facilitan su
desarrollo. Además de este clasificador, se creará otro clasificador capaz de clasificar
diferentes frases en un dominio específico, como puede ser legal, medicinal, etc.
[-]
[EN] The machine learning area of artificial intelligence is obtaining a lot of importance in
the business world. This area consists of creating programs capable of generating a
specific behavior with the help of data. ...[+]
[EN] The machine learning area of artificial intelligence is obtaining a lot of importance in
the business world. This area consists of creating programs capable of generating a
specific behavior with the help of data. Machine learning has multiple applications,
such as: search engines, medical diagnosis, stock market analysis, games, speech
recognition and written language recognition, autonomous cars, directed advertising by
search history or purchases, etc.
There is a large amount of information that we can find on the internet in a disorderly
manner. In particular, there are companies dedicated to select and classify the news
they show on their website manually, which makes it not very productive, both for the
necessary human resources and the necessary time required for the task, since it is
necessary to read all the news and classify them. This project addresses this problem
by developing a text classifier, which will be trained by different automatic learning
algorithms in search of the most efficient. In addition, we will investigate how the
amount of data and the length of the text affect the result. To make the above
mentioned text classifier, Python will be used as a programming language since there
are many libraries and modules that facilitate its development. In addition to this
classifier, we will create another one capable of classifying different phrases in a
specific domain, such as legal, medicinal, etc.
[-]
|