Inteligencia artificial generativa aplicada a la interpretación de lenguaje natural en consultas SQL
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Editor
Pontificia Universidad Católica del Perú
Acceso al texto completo solo para la Comunidad PUCP
Resumen
El presente trabajo aborda uno de los problemas críticos que enfrentan las organizaciones
modernas: a pesar de contar con repositorios centralizados y datos de alta calidad, los tomadores
de decisiones suelen depender de perfiles técnicos para acceder a la información, lo que limita la
agilidad y eficiencia en la toma de decisiones estratégica. Frente a esta problemática, se explora
cómo la Inteligencia Artificial Generativa puedes ser una alternativa para la interpretación de
lenguaje natural para la generación de consultas SQL, permitiendo que usuarios no técnicos
accedan de manera autónoma y sencilla a información crítica.
El trabajo analiza técnicas como Text-to-SQL y RAG-to-SQL, así como el uso de Modelos
de Lenguaje Grande (LLMs) de OpenAI y Google, proponiendo una solución técnica basada en
PostgreSQL, la extensión pgvector y mecanismos de recuperación contextual para enriquecer el
contexto de los modelos. Además, se definen criterios de evaluación y métricas que permiten
validar el rendimiento de la solución. Esto se realiza en respaldo de la experiencia profesional del
autor en proyectos de ingeniería de datos y GenAI.
Se concluye que la solución propuesta, estructurada en etapas de selección de tablas,
generación de consultas y evaluación/regeneración, es óptima para superar las dificultades técnicas
del acceso a datos estratégicos, además de mitigar errores y alucinaciones en la generación de la
consulta SQL. Asimismo, se ratifica la importancia de integrar conocimientos técnicos, de
liderazgo y capacidad de investigación para llevar a la práctica este tipo de soluciones en entornos
productivos.
Descripción
Palabras clave
Inteligencia artificial, Lenguaje natural, SQL (Lenguaje de programación para computadoras)