Resumen:
|
[ES] En el campo de la biología sintética, se utiliza el proceso iterativo de la ingeniería que implica el diseño, la construcción, la prueba y el aprendizaje (conocido como DBTL) de circuitos genéticos. Este proceso tiene ...[+]
[ES] En el campo de la biología sintética, se utiliza el proceso iterativo de la ingeniería que implica el diseño, la construcción, la prueba y el aprendizaje (conocido como DBTL) de circuitos genéticos. Este proceso tiene como objetivo modificar la función de los circuitos genéticos para crear microorganismos que exhiban un comportamiento deseado. Entre los circuitos genéticos básicos más utilizados se encuentran las unidades transcripcionales inducibles, que sirven como módulos en la creación de circuitos más complejos.
El conocimiento y la caracterización de estos módulos básicos son fundamentales para construir circuitos con comportamientos cada vez más complejos. Para iterar en el ciclo DBTL, se comienza implementando un modelo dinámico del circuito genético real y su contexto celular durante la etapa de diseño. Este modelo, conocido como gemelo digital, explica y predice cómo se comportará el circuito en diferentes escenarios experimentales. Una vez que el comportamiento del gemelo digital es satisfactorio, se procede a construir el circuito genético en el laboratorio y realizar experimentos para validar los resultados predichos por el modelo computacional. En esta etapa de validación y aprendizaje del ciclo DBTL se lleva a cabo el ajuste experimental de la estructura y parámetros de los modelos creados. Para ello, se utilizan métodos de inteligencia artificial como los algoritmos genéticos para la optimización y minimización del error de predicción entre el gemelo digital y el circuito genético experimental.
El objetivo de este trabajo es la implementación de un gemelo digital que permita predecir cuál será el comportamiento de las unidades transcripcionales inducibles, en particular de biosensores de naringenina, en función de las partes biológicas básicas usadas en su construcción (promotor, RBS, plásmido), el contexto celular del huésped, y la magnitud de la señal de inducción.
Para ello, en el TFG se enfocará en utilizar herramientas de inteligencia artificial como el aprendizaje supervisado y los algoritmos genéticos para la caracterización e identificación de varias unidades transcripcionales inducibles que activan la producción de una proteína de interés en respuesta a una señal externa de activación. Como huésped celular se usará E. coli. Los circuitos genéticos serán distintas configuraciones de biosensores de naringenina, y el objetivo es caracterizar las partes de los circuitos genéticos de tal forma que se pueda diseñar uno nuevo (a partir de la combinación de las partes estudiadas en este trabajo) de forma que se obtengan niveles deseados de producción de la proteína de interés.
La alumna desarrollará modelos dinámicos de los circuitos implementados, con consideración de los efectos del contexto celular y los implementará en software. Utilizará datos experimentos obtenidos en el laboratorio junto con inteligencia artificial para la estimación de los parámetros de los modelos que caractericen su comportamiento en función de las partes biológicas básicas usadas en su construcción (promotor, RBS, plásmido), el contexto celular del huésped, y la magnitud de la señal de inducción.
[-]
[EN] In the field of synthetic biology, the iterative process of engineering involving the design, construction, testing, and learning (known as DBTL) of genetic circuits is utilized. This process aims to modify the function ...[+]
[EN] In the field of synthetic biology, the iterative process of engineering involving the design, construction, testing, and learning (known as DBTL) of genetic circuits is utilized. This process aims to modify the function of genetic circuits to create microorganisms exhibiting desired behaviors. Among the most commonly used basic genetic circuits are inducible transcriptional units, which serve as modules in creating more complex circuits. Understanding and characterizing these basic modules are essential for constructing circuits with increasingly complex behaviors. To iterate in the DBTL cycle, a dynamic model of the actual genetic circuit and its cellular context is first implemented during the design phase. This model, known as a digital twin, explains and predicts how the circuit will behave under different experimental scenarios. Once the behavior of the digital twin is satisfactory, the genetic circuit is constructed in the laboratory, and experiments are conducted to validate the results predicted by the computational model. During this validation and learning stage of the DBTL cycle, experimental adjustments are made to the structure and parameters of the models created. For this purpose, artificial intelligence methods such as genetic algorithms are used for optimization and minimizing the prediction error between the digital twin and the experimental genetic circuit.
The aim of this work is to implement a digital twin that predicts the behavior of inducible transcriptional units, particularly naringenin biosensors, based on the basic biological components used in their construction (promoter, RBS, plasmid), the host cell context, and the magnitude of the induction signal. To achieve this, the undergraduate thesis will focus on using artificial intelligence tools such as supervised learning and genetic algorithms for the characterization and identification of various inducible transcriptional units that activate the production of a protein of interest in response to an external activation signal. E. coli will be used as the host cell. The genetic circuits will be different configurations of naringenin biosensors, and the goal is to characterize the parts of the genetic circuits in such a way that a new one can be designed (based on the combination of the parts studied in this work) to obtain desired levels of production of the protein of interest.
The student will develop dynamic models of the implemented circuits, considering the effects of the cellular context, and will implement them in software. Experimental data obtained in the laboratory will be used together with artificial intelligence for estimating the parameters of the models that characterize their behavior based on the basic biological components used in their construction (promoter, RBS, plasmid), the cellular context of the host, and the magnitude of the induction signal
[-]
|