%PDF-1.5
%
1 0 obj
<>
endobj
2 0 obj
<>stream
Lda
Wikipedia
Temas
Tuits
Classificator
Topics
Tweets
[ES] El presente proyecto aborda la creación de un clasificador para discernir de manera
automática de qué temas se están hablando en Twitter. A partir de el algoritmo Latent
Dirichlet Allocation se obtienen una serie de agrupaciones de palabras. Sin embargo, no se
proporciona el tema asociado a cada grupo de palabras. En este proyecto se propone un
clasificador entrenado con Wikipedia para discernir de qué tratan los temas de la salida de
LDA. El clasificador se ha aplicado a un dataset de Tuits de ciudaddes de EE.UU. para la
extracción de las categor¿¿as de las que más hablan los usuarios.
[EN] The present project addresses the creation of a classifier to automatically discern which
topics are being discussed on Twitter. A series of groupings of words are obtained from
the Latent Dirichlet Allocation algorithm. However, the theme associated with each group
of words is not provided. In this project a classifier trained with Wikipedia is proposed to
discern what the topics of the LDA exit are about. The classifier has been applied to a
tweet dataset of US cities. for the extraction of the categories that most users talk about.
Reconocimiento (by)
Abierto
Miguel Rebollo Pedruelo
Elena Del Val Noguera
http://hdl.handle.net/10251/147062
Español
endstream
endobj
3 0 obj
<>
endobj
4 0 obj
<>stream
x3PHW0Pp2A c(
endstream
endobj
7 0 obj
<>
endobj
8 0 obj
<>stream
xu {?Ŗ %.NhOErM\:pAO?Do; \
G?]E5*`T 1JkU\x$hwy۳N~uRUjtJ6!QIVˬ%N]
e)>Jv,~5Zf)BkI>s{L7/;qX?vv/P
endstream
endobj
10 0 obj
<>
endobj
11 0 obj
<>stream
xڕWKs6WH7zs'N_94<=9@$,Hw)EiX,%] V?nVoޥ""RB`Y$*d:ͯJA80**UT" V`cq[RqeoKbEFY*?0Lwy'w*D*(NR:p߬oDp..Cg&I˗u\Zu[Z1Va]ٿTavǖ=VVzLlCen
hAh#鸕 Į(=0߮dRo QYeĀH!K9iionV%ͺLuIHr ~8Z7B