Thesis APLICACIÓN DE HEURÍSTICAS PRA LA OPTIMIZACIÓN DE PARÁMETROS DE FUNCIONES CSISZÁR EN LA LOCALIZACIÓN DE PROTEÍNAS EN SECUENCIAS GENÓMICAS
Loading...
Date
2015
Authors
Journal Title
Journal ISSN
Volume Title
Program
Campus
Casa Central, Valparaíso
Abstract
El proceso de segmentación entrópica aplicado al análisis de secuencias de DNA permite dividir una secuencia heterogénea en secuencias homogéneas subsecuentes. Por medio de esta aproximación, es posible determinar la similitud y diferencia entre la misma secuencia u otras diferentes. Durante este proceso, medidas de divergencia basadas en teorías de la información son usadas como funciones de contraste con el fin de diferenciar las entidades (fragmentos de secuencias de DNA en este caso). Algunas de las medidas mas comunes son: Kullback ? Leibler, Jeffrey?s and Jensen - Shannon. Estas medidas de divergencia son parte de la familia de medidas Csiszár?s. En investigaciones previas, los autores definen como parámetros, los valores del tamao de la subsecuencia y el la medida de divergencia en forma arbitraria (la justificación para esta decisión generalmente no se especifica). En esta tesis, se describe el desarrollo de un sistema de optimización a través de un proceso iterativo el cual es capaz de determinar tanto el tamao de la subsecuencia así como el valor del umbral de la medida de divergencia. El principal objetivo a cumplir es reducir el componente arbitrario percibido en investigaciones previas. Para llevar acabo este proceso, una búsqueda manual de los parámetros especificados se llevó a cabo. Este enfoque fue utilizado como punto de partida hacia la implementación del sistema propuesto en este trabajo. Cuatro serotipos del virus Dengue se seleccionaron como caso de estudio, teniendo en cuenta que, aunque los cuatro serotipos tienen diferentes secuencias, al mismo tiempo, tienen las mismas proteínas. Esto significa que hay información común y diferente entre los serotipos que podrían ser útiles para desarrollar y validar el sistema de optimización.
Description
Catalogado desde la versión PDF de la tesis