Martín Furones, Ángel Esteban; Anquela Julián, Ana Belén; Cos-Gayón López, Fernando José(Elsevier, 2019-03)
[EN] This paper presents the big data architecture and work flow used to download georeferenced tweets, store them in a NoSQL database, analyse them using the Apache Spark framework, and visualize the results. The study ...
En este video introducimos Apache Spark como framework para procesar grandes volúmenes de datos. Más concretamente, introducimos la API basada en Dataframes, una abstracción de datos que representa tablas distribuidas. ...