- -

Using the words/leafs ratio in the DOM tree for content extraction

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

Using the words/leafs ratio in the DOM tree for content extraction

Mostrar el registro completo del ítem

Insa Cabrera, D.; Silva Galiana, JF.; Tamarit, S. (2013). Using the words/leafs ratio in the DOM tree for content extraction. Journal of Logic and Algebraic Programming. 82(8):311-325. doi:10.1016/j.jlap.2013.01.002.

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/37664

Ficheros en el ítem

Metadatos del ítem

Título: Using the words/leafs ratio in the DOM tree for content extraction
Autor:
Entidad UPV: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Fecha difusión:
Resumen:
The main content in a webpage is usually centered and visible without the need to scroll. It is often rounded by the navigation menus of the website and it can include advertisements, panels, banners, and other not ...[+]
Palabras clave: Content extraction , Block detection , DOM , Information retrieval
Derechos de uso: Reserva de todos los derechos
Fuente:
Journal of Logic and Algebraic Programming. (issn: 1567-8326 )
DOI: 10.1016/j.jlap.2013.01.002
Editorial:
Elsevier
Versión del editor: http://dx.doi.org/10.1016/j.jlap.2013.01.002
Patrocinador:
Spanish Ministerio de Economia y Competitividad [TIN2008-06622-C03-02 ]
Generalitat Valenciana [PROMETEO/2011/052]
Spanish MICINN under FPI [BES-2009-015019]
Spanish Ministerio de Eduacion under FPU [AP2010-4415]
Tipo: Artículo

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem