Thesis
Algoritmo para el cálculo de fragmentos de proteínas en los organismos secuenciados

dc.contributor.departmentDepartamento de Informática
dc.contributor.guiaDombrovskaia, Lioubov
dc.coverage.spatialCampus Santiago San Joaquín
dc.creatorAraya Barrera, Felipe Nicolás
dc.date.accessioned2024-09-25T13:23:39Z
dc.date.available2024-09-25T13:23:39Z
dc.date.issued2018-01
dc.descriptionCatalogado desde la version PDF de la tesis.
dc.description.abstractEsta memoria tiene como finalidad buscar e identificar en archivos correspondientes a las bases de datos de proteínas UniProt-SwissProt, UniProt-TrEMBL, EROP-Moscow y Homosapiens (extraído de UniProt-SwissProt), la cantidad de diferentes fragmentos de proteínas de largo k entre 1 hasta 50 e identificar cuales son los fragmentos que mas se repiten. Es importante esta tarea ya que la cantidad de proteínas que van apareciendo día a día crece y por lo mismo, es interesante considerar cual es el porcentaje de diferentes fragmentos de péptidos que se abarca en la actualidad. Para hacer esto se creo una cadena de texto generada de cada base de datos y en base a esta cadena se utilizó un tipo de estructura de indexacion de textos conocido como el arreglo de sufijos y su derivado directo, el arreglo LCP para realizar las tareas mencionadas en el parrafo anterior. Se utilizarán 2 algoritmos para lograr este propósito, que construirán el arreglo de sufijos y el arreglo LCP de diferentes maneras y que tendrán en común el uso de la estructura conocida como priority queue para guardar aquellos residuos que mas se repitan. Los resultados obtenidos para cada base de datos tienen en común que a medida que crece, el porcentaje de diferentes fragmentos va disminuyendo y aquellos fragmentos que mas se repiten siguen características físico-químicas similares.
dc.description.programIngeniería Civil Informática
dc.format.mediumCD ROM
dc.identifier.barcode3560902037792
dc.identifier.urihttps://repositorio.usm.cl/handle/123456789/5929
dc.identifier.urihttps://doi.org/10.71700/dspace-memorias/3146
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.subjectArreglo de sufijos
dc.subjectArreglo LCP
dc.subjectBases de datos
dc.subjectPriority QUEUE
dc.subjectProteínas
dc.titleAlgoritmo para el cálculo de fragmentos de proteínas en los organismos secuenciados
dc.typeTesis Pregrado
dspace.entity.typeTesis
usm.date.thesisregistration2016
usm.identifier.thesis4500014511.0

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
3560902037792UTFSM.pdf
Size:
1.47 MB
Format:
Adobe Portable Document Format