[ES] Hoy en día una gran parte de la población sufre problemas de lectura y comprensión
por diversas causas, lo cual abre la puerta a la necesidad de facilitar mecanismos para
la simplificación de textos hasta una versión ...[+]
[ES] Hoy en día una gran parte de la población sufre problemas de lectura y comprensión
por diversas causas, lo cual abre la puerta a la necesidad de facilitar mecanismos para
la simplificación de textos hasta una versión de lectura fácil que permita que la gente
con estas dificultades pueda comprender.
El proyecto ha surgido gracias a una colaboración de los tutores con la fundación
Espurna junto con el Colegio de Abogados de la Comunidad Valenciana y consiste en
el desarrollo de una herramienta que simplifique textos de sentencias judiciales, en
concreto, la parte del fallo de la sentencia. El problema de la obtención de la lista de
frases en lenguaje simplificado se ha planteado como un problema de clasificación. Para
ello se ha utilizado la biblioteca Spacy de Python que utiliza una representación vectorial
de las palabras (embeddings) obtenida con Word2Vec. Spacy se basa en la similitud
coseno para obtener la distancia semántica entre dos frases. Para abordar el problema
de clasificación se ha hecho uso de funciones que proporciona Spacy.
[-]
[CA] Hui dia una gran part de la població pateix problemes de lectura i comprensió per
diverses causes, la qual cosa obri la porta a la necessitat de facilitar mecanismes per a
la simplificació de textos fins a una versió ...[+]
[CA] Hui dia una gran part de la població pateix problemes de lectura i comprensió per
diverses causes, la qual cosa obri la porta a la necessitat de facilitar mecanismes per a
la simplificació de textos fins a una versió de lectura fàcil que permeta que la gent amb
aquestes dificultats puga comprendre.
El projecte ha sorgit gràcies a una col·laboració dels tutors amb la fundació
Espurna juntament amb el Col·legi d'Advocats de la Comunitat Valenciana i consisteix
en el desenvolupament d'una eina que simplifique textos de sentències judicials, en
concret, la part de la part dispositiva de la sentència. El problema de l'obtenció de la
llista de frases en llenguatge simplificat s'ha plantejat com un problema de classificació.
Per a això s'ha utilitzat la biblioteca Spacy de Python que utilitza una representació
vectorial de les paraules (embeddings) obtinguda amb Word2Vec. Spacy es basa en la
similitud cosinus per a obtindre la distància semàntica entre dues frases. Per a abordar
el problema de classificació s'ha fet ús de funcions que proporciona Spacy.
[-]
[EN] Nowadays a large part of the population suffers from reading and comprehension
problems for various reasons, which opens the door to the need to provide mechanisms
for the simplification of texts to an easy-to-read ...[+]
[EN] Nowadays a large part of the population suffers from reading and comprehension
problems for various reasons, which opens the door to the need to provide mechanisms
for the simplification of texts to an easy-to-read version that allows people with these
difficulties to understand.
The project has arisen thanks to a collaboration of the tutors with the Espurna
foundation together with the Bar Association of the Valencian Community and consists
of the development of a tool that simplifies texts of court judgments, specifically, the
judgment part of the sentence. The problem of obtaining the list of sentences in simplified
language has been posed as a classification problem. For this purpose, the Python
library Spacy has been used, which uses a vector representation of the words
(embeddings) obtained with Word2Vec. Spacy is based on cosine similarity to obtain the
semantic distance between two sentences. To address the classification problem, use
has been made of functions provided by Spacy.
[-]
|