Identificación y clasificación automática de repeticiones en estructuras de proteínas repetidas
dc.contributor.advisor | Hirsh Martinez, Layla | |
dc.contributor.author | Muroya Tokushima, Luis Fernando | |
dc.date.accessioned | 2022-01-26T15:36:09Z | |
dc.date.available | 2022-01-26T15:36:09Z | |
dc.date.created | 2021 | |
dc.date.issued | 2022-01-26 | |
dc.description.abstract | Las proteínas repetidas son proteínas no globulares caracterizadas por la presencia de repeticiones a nivel de secuencia y estructura. Pueden ser de 5 clases, cada una con un número variable de subclases. Estas proteínas son relevantes porque están relacionadas con una diversidad de enfermedades. Su correcta clasificación es parte fundamental para su estudio; sin embargo, la anotación manual de todas las estructuras de proteínas conocidas es una tarea que es logísticamente imposible completar. Por ello, la automatización de esta tarea es muy importante. En el presente trabajo, se desarrolló una herramienta para la identificación y clasificación de repeticiones de clase IV. Esta herramienta fue construida por el acoplamiento de dos módulos: uno de filtro y otro de clasificación. El primero fue construido reutilizando una red neuronal convolucional entrenada para la detección de simetrías rotacionales en la estructura de una proteína. Su uso estuvo fundamentado en el hecho que las repeticiones clase IV son de estructura cerrada, por lo que la presencia de simetrías rotacionales era altamente probable. Para el módulo de clasificación se transformó la información estructural en imágenes, por medio del cálculo y superposición de tres matrices. Estas imágenes fueron usadas para aplicar una técnica de transferencia de aprendizaje a una red Densenet, seleccionada luego de un análisis cualitativo y cuantitativo. Como resultado, el clasificador obtenido logró una exactitud de 89.8% sobre una muestra de 658 cadenas de proteínas. Los anteriores módulos fueron integrados en un servicio web construido sobre Flask. Se construyó una aplicación de una página (SPA) para hacer disponible dicho servicio en una forma amigable con el usuario. Dicha aplicación fue desplegada en la nube para su acceso. | es_ES |
dc.identifier.uri | http://hdl.handle.net/20.500.12404/21423 | |
dc.language.iso | spa | es_ES |
dc.publisher | Pontificia Universidad Católica del Perú | es_ES |
dc.publisher.country | PE | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by/2.5/pe/ | * |
dc.subject | Proteinas--Clasificación automática | es_ES |
dc.subject | Proteinas--Estructura | es_ES |
dc.subject | Proteinas--Identificación--Automatización | es_ES |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.00 | es_ES |
dc.title | Identificación y clasificación automática de repeticiones en estructuras de proteínas repetidas | es_ES |
dc.type | info:eu-repo/semantics/masterThesis | es_ES |
renati.advisor.dni | 40329236 | |
renati.advisor.orcid | https://orcid.org/0000-0002-8215-6716 | es_ES |
renati.author.dni | 45215207 | |
renati.discipline | 611087 | es_ES |
renati.juror | Beltran Castañon, Cesar Armando | es_ES |
renati.juror | Hirsh Martínez, Layla | es_ES |
renati.juror | Villanueva Talavera, Edwin Rafael | es_ES |
renati.level | https://purl.org/pe-repo/renati/level#maestro | es_ES |
renati.type | https://purl.org/pe-repo/renati/type#tesis | es_ES |
thesis.degree.discipline | Informática con mención en Ciencias de la Computación | es_ES |
thesis.degree.grantor | Pontificia Universidad Católica del Perú. Escuela de Posgrado. | es_ES |
thesis.degree.level | Maestría | es_ES |
thesis.degree.name | Maestro en Informática con mención en Ciencias de la Computación | es_ES |
Files
Original bundle
1 - 1 of 1
- Name:
- MUROYA_TOKUSHIMA_LUIS_IDENTIFICACION_CLASIFICACION_AUTOMATICA.pdf
- Size:
- 1.89 MB
- Format:
- Adobe Portable Document Format
- Description:
- Texto completo
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: