Aprendizaje estadístico supervisado con máquina de soporte vectorial
Abstract
Actualmente las organizaciones recolectan datos en grandes volúmenes y de fuentes muy
variadas. Para dar sentido y convertir los datos en información útil es necesario utilizar
técnicas que permitan encontrar y entender las relaciones ocultas en los datos. Generalmente,
la relación que nos interesa estudiar es cómo predecir un evento utilizando un conjunto de
variables. Sin embargo, muchas veces la relación entre los datos es muy compleja y no puede
ser analizada adecuadamente usando las técnicas más conocidas, dado que éstas suelen tener
supuestos que no necesariamente se cumplen. Por ello, es importante conocer técnicas de
análisis más complejas y flexibles.
Esta tesis busca ser un instrumento de ayuda en el aprendizaje y uso de nuevas técnicas
para estudiar los datos, lo cual es relevante sobre todo en el medio local en el que este tema
es poco conocido. Con este objetivo, presenta una revisión introductoria de la teoría del
aprendizaje estadístico, la cual provee del marco teórico para que distintos métodos utilicen
los datos para aprender, y usando este conocimiento puedan hacer predicciones sobre datos
nuevos o diferentes. Luego se centra en un estudio exhaustivo del método de aprendizaje de
Máquinas de Soporte Vectorial (SVM por sus siglas en inglés), introduciendo y aplicando las
funciones Kernel. Este método se puede entender como una representación de los datos como
puntos en el espacio, asignados de tal forma que exista una brecha grande que separe a los
elementos diferentes.
Finalmente se pone en práctica la teoría estudiada aplicando el método SVM a datos de
clientes de una entidad financiera. Esta entidad financiera usa predominantemente técnicas
de aprendizaje estadístico simples y con varios supuestos; particularmente usa una de estas
técnicas en un modelo que predice la propensión a la compra y persistencia del producto
Seguro de Protección de Tarjetas. Por ello, la presente tesis se centra en aplicar el método
SVM para construir una alternativa a este modelo.
Temas
Variables (Estadística)
Procesamiento de datos
Algoritmos--Aplicaciones
Procesamiento de datos
Algoritmos--Aplicaciones
Para optar el título de
Maestro en Estadística
Collections
The following license files are associated with this item: