Desarrollo de un Framework para la identificación del nivel de complejidad de texto para el entrenamiento de chatbots basado en Machine Learning

Matos Rios, Hans

dc.contributor.advisor	Beltrán Castañón, César Armando
dc.contributor.author	Matos Rios, Hans
dc.date.accessioned	2022-03-21T21:47:38Z
dc.date.available	2022-03-21T21:47:38Z
dc.date.created	2022
dc.date.issued	2022-03-21
dc.identifier.uri	http://hdl.handle.net/20.500.12404/21844
dc.description.abstract	La generación de diálogo implica diseñar un programa para generar una conversación natural, esto requiere desarrollar algoritmos que puedan conversar con un ser humano y otro programa de manera coherente y fluida. Desarrollar una conversación también depende del contexto y conocimiento del interlocutor, lo cual nos lleva a definir la existencia de niveles de complejidad conversacional, la cual se refiere a determinar que tan fácil o difícil de leer es un texto. En este aspecto, especialmente para el idioma español, no existe una herramienta que tenga un módulo propio que le permita clasificar textos en español por su complejidad textual. En el presente trabajo de fin de carrera se realiza el desarrollo de un módulo en el lenguaje de programación Python, el cual funciona como un Framework para identificar la complejidad textual de textos en español usando técnicas de Machine Learning. Para ello, en primer lugar, se implementaron 48 métricas de análisis de complejidad textual basadas en Coh-Metrix usando el lenguaje de programación Python. Dichas métricas convierten textos en español en datos numéricos con los cuales se entrenaron distintos modelos de Machine Learning, con el motivo de obtener el mejor modelo a utilizar con el Framework desarrollado, siendo este capaz de utilizar un modelo personalizado provisto por el usuario. Para ello, se necesitó obtener un corpus de 183 textos en español para realizar dicho entrenamiento, el cual fue obtenido al descargar textos educativos de nivel primaria y secundaria. Por último, se entrenó un chatbot con los textos obtenidos para el corpus, cuyas respuestas generadas fueron analizados con el Framework previamente desarrollado, identificando que el nivel de complejidad de dichas respuestas correspondía al nivel de los textos con los cuales el chatbot fue entrenado. En conclusión, en el presente proyecto de investigación se desarrolla un módulo de Python que funciona como un Framework, el cual es capaz de identificar la complejidad textual de textos en español, ya sea con el mejor modelo de Machine Learning utilizado en el presente proyecto o utilizando uno provisto por el usuario de la herramienta.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/2.5/pe/	*
dc.subject	Algoritmos	es_ES
dc.subject	Aprendizaje automático (Inteligencia artificial)	es_ES
dc.subject	Inteligencia artificial	es_ES
dc.title	Desarrollo de un Framework para la identificación del nivel de complejidad de texto para el entrenamiento de chatbots basado en Machine Learning	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
thesis.degree.name	Ingeniero Informático	es_ES
thesis.degree.level	Título Profesional	es_ES
thesis.degree.grantor	Pontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería	es_ES
thesis.degree.discipline	Ingeniería Informática	es_ES
renati.advisor.dni	29561260
renati.advisor.orcid	https://orcid.org/0000-0002-0173-4140	es_ES
renati.author.dni	72191674
renati.discipline	612286	es_ES
renati.juror	Hirsh Martinez, Layla	es_ES
renati.juror	Beltran Castañon, Cesar Armando	es_ES
renati.juror	Cueva Moscoso, Rony	es_ES
renati.level	https://purl.org/pe-repo/renati/level#tituloProfesional	es_ES
renati.type	https://purl.org/pe-repo/renati/type#tesis	es_ES
dc.publisher.country	PE	es_ES
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#1.02.00	es_ES