Análisis de métodos y técnicas de limpieza de datos existentes y aplicación en un sistema CRM para una institución educativa limeña
Abstract
En la actualidad, las organizaciones emplean varios sistemas y varias fuentes de información
para las actividades del día a día, y buscan tener toda esta información reunida e integrada en
una única base de datos llamada data warehouse ya que permite fortalecer el trabajo del día
a día, el análisis de datos y la toma de decisiones.
Sin embargo, la información guardada debe de ser de buena calidad ya que una baja calidad
de datos puede impactar severamente en el desempeño de la organización, la satisfacción del
cliente, la toma de decisiones y reducir la habilidad de la organización de ejecutar
correctamente sus planes estratégicos. En este contexto, aparece un problema crítico: la baja
calidad de la información en los sistemas; y lo preocupante es que algunas empresas ignoran
los impactos y consecuencias mencionados.
Un sistema de información muy adquirido y usado por organizaciones Business-to-
Consumer (B2C por su abreviatura en inglés) es el sistema de Gestión de Relación con el
Cliente (Customer Relationship Management - CRM). Un sistema CRM es un sistema
enfocado en la gestión de clientes. Los registros más importantes pertenecen a la entidad
“clientes” y esta información es obtenida por las organizaciones a través de varios canales o
mediante la compra de bases de datos de terceros. Finalmente, toda la información es
almacenada en el data warehouse para ser consumida de allí para la toma de decisiones.
Los problemas específicos para un sistema CRM son: registros duplicados de clientes, datos
faltantes de un cliente como su teléfono o dirección, datos incorrectos, datos obsoletos que
en algún momento fueron correctos y atributos con valores diferentes para un mismo cliente.
Mantener estos registros limpios debe ser una actividad vital para la organización.
Las instituciones educativas no son ajenas a esta herramienta de soporte CRM, y con el
transcurso de los años, están apostando por adoptar sistemas CRM en las organizaciones
(KaptureCRM, 2017). En este contexto, tener los datos de los estudiantes limpios es una
tarea primordial para la organización.
El desarrollo de este proyecto se enfoca en un análisis de los algoritmos, técnicas y métodos
usados para la limpieza de datos, la implementación de procesos ETL (extracción,
transformación y carga) que permitan la limpieza de cada fuente de datos, la integración de
la información a una base de datos transaccional, la carga de la información de la base de
datos transaccional a un data warehouse para su próxima explotación y, adicionalmente, el
modelamiento de nuevos procesos de negocio para prevenir y mantener la correcta calidad
de los datos en el sistema transaccional, para la institución educativa sobre la cual se realiza
el proyecto.
Temas
Sistemas de información--Base de datos
Sistemas de información--Institución educativa--Perú--Lima
Sistemas de información--Institución educativa--Perú--Lima
Para optar el título de
Ingeniero Informático