- -

Kai: una herramienta para el procesado de datos a gran escala en clústeres

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Kai: una herramienta para el procesado de datos a gran escala en clústeres

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Bataller Mascarell, Jordi es_ES
dc.contributor.author Belloch Gómez, Luis es_ES
dc.date.accessioned 2014-10-16T09:56:21Z
dc.date.available 2014-10-16T09:56:21Z
dc.date.created 2013-07-24
dc.date.issued 2014-10-16T09:56:21Z
dc.identifier.uri http://hdl.handle.net/10251/43329
dc.description.abstract [EN] In this document we are presenting Kai, a Scala library developed to simplify the creation of large data processing applications on Hadoop clusters. The library is based in the definition of three basic operators, map, filter and fold, used to define other more complex operations like take, join, group or zip, used to transform large data sets in an efficient way. This work recaps some classic concepts of functional programming to easily translate such operations into a sequence of MapReduce jobs, applying optimizations before executing the data flow in the cluster. es_ES
dc.description.abstract [ES] En el documento actual se presenta Kai, una biblioteca escrita en Scala destinada a simplificar la escritura de aplicaciones de procesado de datos a gran escala en clústeres basados en Hadoop. La biblioteca está basada en la definición de tres operaciones básicas, map, filter y fold, sobre las que se implementan otras operaciones más complejas como take, join, group, zip, destinadas a manipular y transformar grandes conjuntos de datos de forma eficiente. Para ello el trabajo recoge algunos conceptos clásicos de la programación funcional que permiten traducir esas operaciones básicas en secuencias de trabajos de MapReduce de forma sencilla, aplicando optimizaciones previamente a la ejecución del flujo de trabajo dentro del cluster. es_ES
dc.format.extent 74 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento - No comercial - Sin obra derivada (by-nc-nd) es_ES
dc.subject Procesado de datos es_ES
dc.subject Hadoop es_ES
dc.subject Scala; programación funcional es_ES
dc.subject Data processing es_ES
dc.subject Scala es_ES
dc.subject Functional programming es_ES
dc.subject DSL es_ES
dc.subject Distributed systems es_ES
dc.subject Sistemas distribuidos Data processing es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Computación Paralela y Distribuida-Màster Universitari en Computació Paral·Lela i Distribuïda es_ES
dc.title Kai: una herramienta para el procesado de datos a gran escala en clústeres es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Servicio de Alumnado - Servei d'Alumnat es_ES
dc.description.bibliographicCitation Belloch Gómez, L. (2013). Kai: una herramienta para el procesado de datos a gran escala en clústeres. http://hdl.handle.net/10251/43329 es_ES
dc.description.accrualMethod Archivo delegado es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem