- -

Using the words/leafs ratio in the DOM tree for content extraction

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

Using the words/leafs ratio in the DOM tree for content extraction

Mostrar el registro completo del ítem

Insa Cabrera, D.; Silva Galiana, JF.; Tamarit, S. (2013). Using the words/leafs ratio in the DOM tree for content extraction. Journal of Logic and Algebraic Programming. 82(8):311-325. doi:10.1016/j.jlap.2013.01.002

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/37664

Ficheros en el ítem

Metadatos del ítem

Título: Using the words/leafs ratio in the DOM tree for content extraction
Autor:
Entidad UPV: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Fecha difusión:
Resumen:
The main content in a webpage is usually centered and visible without the need to scroll. It is often rounded by the navigation menus of the website and it can include advertisements, panels, banners, and other not ...[+]
Palabras clave: Content extraction , Block detection , DOM , Information retrieval
Derechos de uso: Reserva de todos los derechos
Fuente:
Journal of Logic and Algebraic Programming. (issn: 1567-8326 )
DOI: 10.1016/j.jlap.2013.01.002
Editorial:
Elsevier
Versión del editor: http://dx.doi.org/10.1016/j.jlap.2013.01.002
Agradecimientos:
This work has been partially supported by the Spanish Ministerio de Economia y Competitividad (Secretaria de Estado de Investigacion, Desarrollo e Innovacion) under Grant TIN2008-06622-C03-02 and by the Generalitat Valenciana under Grant PROMETEO/2011/052. Salvador Tamarit was partially supported by the Spanish MICINN under FPI Grant BES-2009-015019. David Insa was partially supported by the Spanish Ministerio de Eduacion under FPU Grant AP2010-4415.
Tipo: Artículo

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem