Thesis Plataforma web para la clasificación de enzimas asociadas a la degradación de compuestos aromáticos
Loading...
Date
2022-08
Journal Title
Journal ISSN
Volume Title
Program
DEPARTAMENTO DE ELECTRÓNICA. INGENIERÍA CIVIL TELEMÁTICA
Campus
Casa Central Valparaíso
Abstract
Dentro del ámbito de la bioquímica, diariamente se realizan investigaciones, avances
y descubrimientos de nuevos microorganismos junto a sus funciones a través del
análisis de su información genética. Si bien, las técnicas experimentales aplicadas son
eficaces, logrando identificar correctamente que genes y enzimas son parte de cada proceso
en estudio, la manera clásica de realizarlo es a partir de una serie de experimentos
en laboratorio húmedo ("wet lab”) que pueden llegara a tardar varios meses en llevarse
a cabo. La disminución de costos de secuenciación de genomas bacterianos y el desarrollo
de herramientas bioinformáticas convencionales (e.g alineamiento de secuencias,
perfiles de modelos ocultos de Markov) han acelerado la investigación en microbiología,
rápidamente identificando que genes o enzimas podrían ser parte de un proceso en
específico.
La aplicación de técnicas de reconocimiento de patrones asociados al aprendizaje
de máquinas (ML, "Machine Learning") se proponen para acelerar aún más este proceso,
prescindiendo de las herramientas bioinformáticas clásicas, para así clasificar una
secuencia enzimática bajo distintos parámetros de interés. Durante el desarrollo de este
trabajo se realizó un clasificador, basado en ML, de enzimas asociadas a la degradación
de compuestos aromáticos a través de un proceso de recopilación de datos, entrenamiento
y validación del clasificador. Se creó una base de datos curada de enzimas asociadas
a degradación de compuestos aromáticos con evidencia experimental, que a su
vez, contiene una gran cantidad de entradas que refieren a parámetros relevantes de cada
enzima (sustrato primario, sustratos secundarios, polaridades, familia de compuestos
químicos). La base de datos fue aumentada con datos de secuencias de amino ácidos de
bases de datos públicas (base de datos no redundante de RefSeq, NCBI), concluyendo
en la creación de un clasificador basado en redes neuronales convolucionales.
Aún siendo esto una solución innovadora, el desarrollo de una herramienta informática no termina ahí. ya que una vez desarrollados los algoritmos de clasificación de
enzimas, se propone agregar una capa de presentación que permite al usuario el uso de
las funcionalidades de este trabajo mediante una plataforma web de simple uso, accesible
y amigable.
De los resultados obtenidos, se espera evidenciar que teniendo una enzima secuenciada
lista para ingresar, el proceso de clasificación se realice en una ejecución que
tome no más de unos minutos, para luego ser desplegada dentro de la aplicación.
Description
Keywords
PLATAFORMA WEB, ENZIMAS, DEGRADACION, COMPUESTOS AROMATICOS