Desarrollo de un Framework para la identificación del nivel de complejidad de texto para el entrenamiento de chatbots basado en Machine Learning
dc.contributor.advisor | Beltrán Castañón, César Armando | |
dc.contributor.author | Matos Rios, Hans | |
dc.date.accessioned | 2022-03-21T21:47:38Z | |
dc.date.available | 2022-03-21T21:47:38Z | |
dc.date.created | 2022 | |
dc.date.issued | 2022-03-21 | |
dc.description.abstract | La generación de diálogo implica diseñar un programa para generar una conversación natural, esto requiere desarrollar algoritmos que puedan conversar con un ser humano y otro programa de manera coherente y fluida. Desarrollar una conversación también depende del contexto y conocimiento del interlocutor, lo cual nos lleva a definir la existencia de niveles de complejidad conversacional, la cual se refiere a determinar que tan fácil o difícil de leer es un texto. En este aspecto, especialmente para el idioma español, no existe una herramienta que tenga un módulo propio que le permita clasificar textos en español por su complejidad textual. En el presente trabajo de fin de carrera se realiza el desarrollo de un módulo en el lenguaje de programación Python, el cual funciona como un Framework para identificar la complejidad textual de textos en español usando técnicas de Machine Learning. Para ello, en primer lugar, se implementaron 48 métricas de análisis de complejidad textual basadas en Coh-Metrix usando el lenguaje de programación Python. Dichas métricas convierten textos en español en datos numéricos con los cuales se entrenaron distintos modelos de Machine Learning, con el motivo de obtener el mejor modelo a utilizar con el Framework desarrollado, siendo este capaz de utilizar un modelo personalizado provisto por el usuario. Para ello, se necesitó obtener un corpus de 183 textos en español para realizar dicho entrenamiento, el cual fue obtenido al descargar textos educativos de nivel primaria y secundaria. Por último, se entrenó un chatbot con los textos obtenidos para el corpus, cuyas respuestas generadas fueron analizados con el Framework previamente desarrollado, identificando que el nivel de complejidad de dichas respuestas correspondía al nivel de los textos con los cuales el chatbot fue entrenado. En conclusión, en el presente proyecto de investigación se desarrolla un módulo de Python que funciona como un Framework, el cual es capaz de identificar la complejidad textual de textos en español, ya sea con el mejor modelo de Machine Learning utilizado en el presente proyecto o utilizando uno provisto por el usuario de la herramienta. | es_ES |
dc.identifier.uri | http://hdl.handle.net/20.500.12404/21844 | |
dc.language.iso | spa | es_ES |
dc.publisher | Pontificia Universidad Católica del Perú | es_ES |
dc.publisher.country | PE | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ | * |
dc.subject | Algoritmos | es_ES |
dc.subject | Aprendizaje automático (Inteligencia artificial) | es_ES |
dc.subject | Inteligencia artificial | es_ES |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.00 | es_ES |
dc.title | Desarrollo de un Framework para la identificación del nivel de complejidad de texto para el entrenamiento de chatbots basado en Machine Learning | es_ES |
dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
renati.advisor.dni | 29561260 | |
renati.advisor.orcid | https://orcid.org/0000-0002-0173-4140 | es_ES |
renati.author.dni | 72191674 | |
renati.discipline | 612286 | es_ES |
renati.juror | Hirsh Martinez, Layla | es_ES |
renati.juror | Beltran Castañon, Cesar Armando | es_ES |
renati.juror | Cueva Moscoso, Rony | es_ES |
renati.level | https://purl.org/pe-repo/renati/level#tituloProfesional | es_ES |
renati.type | https://purl.org/pe-repo/renati/type#tesis | es_ES |
thesis.degree.discipline | Ingeniería Informática | es_ES |
thesis.degree.grantor | Pontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería | es_ES |
thesis.degree.level | Título Profesional | es_ES |
thesis.degree.name | Ingeniero Informático | es_ES |
Files
Original bundle
1 - 1 of 1
- Name:
- MATOS_RIOS_HANS_DESARROLLO_FRAMEWORK_IDENTIFICACION.pdf
- Size:
- 1.46 MB
- Format:
- Adobe Portable Document Format
- Description:
- Texto completo
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: