Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video

Ramírez Díaz, José Fernando

dc.contributor.advisor	Crisóstomo Romero, Pedro Moisés	es_ES
dc.contributor.author	Ramírez Díaz, José Fernando
dc.date.accessioned	2020-12-07T20:03:35Z
dc.date.available	2020-12-07T20:03:35Z
dc.date.created	2020
dc.date.issued	2020-12-07	es_ES
dc.identifier.uri	http://hdl.handle.net/20.500.12404/17644
dc.description.abstract	En la presente tesis se aborda el diseño e implementación de un algoritmo que permite formar la imagen completa de un documento con texto impreso partiendo de un video que contiene fragmentos de la página en cuestión. Dicho algoritmo recibe como entrada un video registrado empleando la cámara de un teléfono móvil y como resultado retornará la imagen del documento con texto completo; esta imagen puede ser empleada posteriormente en un algoritmo de reconocimiento óptico de caracteres (u OCR por sus siglas en inglés) para recuperar el texto en forma digital. El enfoque del desarrollo de esta propuesta es el de brindar una solución alternativa, en cuanto a adquisición de imágenes, para las existentes aplicaciones móviles de OCR enfocadas en apoyar a personas con ceguera parcial o total. Para abarcar el planteamiento y cumplimiento de los objetivos de este proyecto, se ha estructurado el mismo en 4 capítulos. En el capítulo 1 se aborda la actual situación de personas con distintos grados de discapacidad visual en nuestro país y diversos sistemas que buscan apoyarlos en recuperar su autonomía informativa y educativa. Además, se trata detalles sobre el estado del arte en adquisición de imágenes para las aplicaciones OCR existentes en la actualidad y sus falencias. En el capítulo 2 se presenta el marco teórico que avala el desarrollo del algoritmo propuesto, desde la teoría necesaria en procesamiento de imágenes y, también, sobre el registro de vídeos. En el capítulo 3 se trata el diseño e implementación del algoritmo en dos plataformas: inicialmente en Python 3.6 para la etapa de calibración de parámetros en una computadora de escritorio, y en C++ para las pruebas finales en un teléfono con SO Android. En dicho capítulo también se hace presente consideraciones planteadas para la creación del conjunto de videos de pruebas en Python. Finalmente, en el capítulo 4 se exponen las pruebas y resultados obtenidos de la aplicación del algoritmo, en Python, sobre la base de muestras creadas, y los resultados finales del uso de la aplicación en Android. Para estimar el grado de conformidad de la imagen resultante se hará uso de la métrica de Levenshtein o distancia de edición, la cual señala cuántos caracteres detectados en la imagen compuesta son diferentes a los caracteres del texto original.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc/2.5/pe/	*
dc.subject	Digitalización	es_ES
dc.subject	Procesamiento de imágenes digitales	es_ES
dc.subject	Sistemas de reconocimiento de patrones	es_ES
dc.title	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
thesis.degree.name	Ingeniero Electrónico	es_ES
thesis.degree.level	Título Profesional	es_ES
thesis.degree.grantor	Pontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería	es_ES
thesis.degree.discipline	Ingeniería Electrónica	es_ES
renati.advisor.dni	10131502
renati.advisor.orcid	https://orcid.org/0000-0002-8810-9005	es_ES
renati.author.dni	72686091
renati.discipline	712026	es_ES
renati.juror	Rodriguez Valderrama, Paul Antonio	es_ES
renati.juror	Crisostomo Romero, Pedro Moises	es_ES
renati.juror	Tafur Sotelo, Julio Cesar	es_ES
renati.level	https://purl.org/pe-repo/renati/level#tituloProfesional	es_ES
renati.type	https://purl.org/pe-repo/renati/type#tesis	es_ES
dc.publisher.country	PE	es_ES
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#2.02.01	es_ES