Jara Carvallo, Nicolas Alonso (Profesor Guía)Duran Vargas, Roberto Eduardo (Profesor Correferente)Guajardo Menas, Oscar IgnacioGuajardo Menas, Oscar Ignacio2024-10-302024-10-302022-08https://repositorio.usm.cl/handle/123456789/60085Dentro del ámbito de la bioquímica, diariamente se realizan investigaciones, avances y descubrimientos de nuevos microorganismos junto a sus funciones a través del análisis de su información genética. Si bien, las técnicas experimentales aplicadas son eficaces, logrando identificar correctamente que genes y enzimas son parte de cada proceso en estudio, la manera clásica de realizarlo es a partir de una serie de experimentos en laboratorio húmedo ("wet lab”) que pueden llegara a tardar varios meses en llevarse a cabo. La disminución de costos de secuenciación de genomas bacterianos y el desarrollo de herramientas bioinformáticas convencionales (e.g alineamiento de secuencias, perfiles de modelos ocultos de Markov) han acelerado la investigación en microbiología, rápidamente identificando que genes o enzimas podrían ser parte de un proceso en específico. La aplicación de técnicas de reconocimiento de patrones asociados al aprendizaje de máquinas (ML, "Machine Learning") se proponen para acelerar aún más este proceso, prescindiendo de las herramientas bioinformáticas clásicas, para así clasificar una secuencia enzimática bajo distintos parámetros de interés. Durante el desarrollo de este trabajo se realizó un clasificador, basado en ML, de enzimas asociadas a la degradación de compuestos aromáticos a través de un proceso de recopilación de datos, entrenamiento y validación del clasificador. Se creó una base de datos curada de enzimas asociadas a degradación de compuestos aromáticos con evidencia experimental, que a su vez, contiene una gran cantidad de entradas que refieren a parámetros relevantes de cada enzima (sustrato primario, sustratos secundarios, polaridades, familia de compuestos químicos). La base de datos fue aumentada con datos de secuencias de amino ácidos de bases de datos públicas (base de datos no redundante de RefSeq, NCBI), concluyendo en la creación de un clasificador basado en redes neuronales convolucionales. Aún siendo esto una solución innovadora, el desarrollo de una herramienta informática no termina ahí. ya que una vez desarrollados los algoritmos de clasificación de enzimas, se propone agregar una capa de presentación que permite al usuario el uso de las funcionalidades de este trabajo mediante una plataforma web de simple uso, accesible y amigable. De los resultados obtenidos, se espera evidenciar que teniendo una enzima secuenciada lista para ingresar, el proceso de clasificación se realice en una ejecución que tome no más de unos minutos, para luego ser desplegada dentro de la aplicación.PLATAFORMA WEBENZIMASDEGRADACIONCOMPUESTOS AROMATICOSPlataforma web para la clasificación de enzimas asociadas a la degradación de compuestos aromáticosTesis de PregradoB - Solamente disponible para consulta en sala (opción por defecto)194446357UTFSM