- -

Content Extraction based on Hierarchical Relations in DOM Structures

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Content Extraction based on Hierarchical Relations in DOM Structures

Mostrar el registro completo del ítem

López Romero, S.; Silva Galiana, JF.; Insa Cabrera, D. (2012). Content Extraction based on Hierarchical Relations in DOM Structures. Research and Development in Computer Science and Engineering. 45:5-12. http://hdl.handle.net/10251/47738

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/47738

Ficheros en el ítem

Metadatos del ítem

Título: Content Extraction based on Hierarchical Relations in DOM Structures
Autor: López Romero, Sergio Silva Galiana, Josep Francesc Insa Cabrera, David
Entidad UPV: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Fecha difusión:
Resumen:
This article introduces a new approach for content extraction that exploits the hierarchical inter-relations of the elements in a webpage. Content extraction is a technique used to extract from a webpage the main textual ...[+]
Palabras clave: Content extraction , Block detection , DOM
Derechos de uso: Reconocimiento - No comercial (by-nc)
Fuente:
Research and Development in Computer Science and Engineering. (issn: 1870-9044 )
Editorial:
IPN, Centro de Innovación y Desarrollo Tecnológico en Cómputo
Versión del editor: http://www.cidetec.ipn.mx/polibits/Paginas/issue45.aspx
Tipo: Artículo

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem