[EN] The study of protein-protein interaction networks has received a lot of attention by
the research community lately. However, the experimental studies to reconstruct this
kind of structures are expensive. Consequently, ...[+]
[EN] The study of protein-protein interaction networks has received a lot of attention by
the research community lately. However, the experimental studies to reconstruct this
kind of structures are expensive. Consequently, several machine learning approaches
have been developed that automatically infer PPI networks. In this work I present the
implementation and analysis of the Input-Output Kernel Regression (IOKR) developed
by [9, 10] to compute the inference using various experimental data sets. IOKR is based
on the learning of an output kernel that let us apply regression models on a feature
space where we can compute the similarity of pairs of proteins to infer the existence of
interactions. Furthermore, this approach extends the Kernel Ridge Regression to a
semi-supervised approach where the inference turns into a matrix completion. The
Multiple Kernel Learning is applied on the input side to deal with the different data
sources. Finally, I compare the performance of the implementation with other
supervised approaches for the inference of PPI networks.
[-]
[ES] El estudio de las redes de interacción de proteínas ha recibido una gran atención por
parte de la comunidad investigadora en los últimos años. Sin embargo, los estudios
experimentales para la reconstrucción de este ...[+]
[ES] El estudio de las redes de interacción de proteínas ha recibido una gran atención por
parte de la comunidad investigadora en los últimos años. Sin embargo, los estudios
experimentales para la reconstrucción de este tipo de estructures son caros.
Consecuentemente, varios métodos de aprendizaje automático para inferir redes de
interacción de proteínas han sido desarrollados. En este trabajo presento la
implementación y el análisis del Input-Output Kernel Regression (IOKR) desarrollado
por [9, 10] para llevar a cabo la inferencia utilizando varios conjuntos de datos
experimentales. IORK está basado en el aprendizaje de un kernel de salida que nos
permita aplicar modelos de regresión en un espacio de características donde podemos
calcular la similitud de pares de proteínas para inferir la existencia de interacción.
Además, esta aproximación extiende el Kernel Ridge Regression a una aproximación
semi-supervisada donde la inferencia se convierte en completar una red. La técnica de
aprendizaje de múltiples kernels es aplicada en los datos de entrada para tratar las
diferentes fuentes de datos. Finalmente, comparo el rendimiento de la implementación
con otras aproximaciones supervisadas para la inferencia de redes de interacción de
proteínas.
[-]
|