Informática con mención en Ciencias de la Computación

Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/6357

Browse

Search Results

Now showing 1 - 2 of 2
  • Thumbnail Image
    Item
    Marco de trabajo para el desarrollo de proyectos de analítica de datos
    (Pontificia Universidad Católica del Perú, 2024-08-09) Olivera Cokan, César Alberto; Bello Ruiz, Alejandro Toribio; Pow Sang Portillo, José Antonio
    El desarrollo de proyectos de analítica de datos en las organizaciones requiere de procesos bien definidos para su éxito. Existen procesos estándar de analítica de datos, como CRISP-DM, que han tenido una amplia adopción en las últimas décadas. Sin embargo, mediante una búsqueda sistemática de la literatura se ha podido evidenciar que muchas de las organizaciones a menudo no aplican CRISP-DM o procesos similares, como SEMMA y KDD, tal como están, sino que muchos de ellas adaptan estos marcos de trabajo para abordar requerimientos específicos en diversos contextos de la industria. Además, según estos estudios se evidencia que un grupo considerable de empresas emplea Scrum u otros marcos de trabajo para el desarrollo de software con el fin de llevar a cabo sus proyectos de analítica de datos, lo cual no es correcto pues estos marcos de trabajo no abordan las particularidades de un ciclo de vida de una solución analítica. Si bien CRISPDM es el marco de trabajo para analítica de datos más empleado, este mismo posee un conjunto de falencias enfocadas en diversos casos de uso o procesos de negocio que ha llevado a muchas organizaciones a adaptar este marco a sus necesidades. Hasta ahora no se ha sugerido ninguna adaptación que permita abordar las falencias que los diferentes dominios en la industria poseen. Este artículo aborda la propuesta del diseño de un marco de trabajo para proyectos de analítica de datos general denominado GEN-DA (Generic Data Analytics framework por sus siglas en inglés). GEN-DA extiende y modifica CRISP-DM para solucionar las diferentes falencias encontradas en la literatura y lograr un ciclo de vida del proyecto de analítica de datos que pueda ser empleado en todos los contextos de la industria. Este marco de trabajo ha sido diseñado y evaluado de forma iterativa empleando una metodología en ciencias del diseño gracias a la participación de expertos en analítica de datos mediante el método de validación por Juicio Experto. Los resultados obtenidos son alentadores y habilita la factibilidad de emplear este marco propuesto en un entorno real, cuyos resultados, se presume, que serán satisfactorios.
  • Thumbnail Image
    Item
    Diseño de un modelo basado en redes neuronales artificiales para la clasificación de palta hass
    (Pontificia Universidad Católica del Perú, 2020-10-28) Salazar Campos, Juan Orlando; Sipirán Mendoza, Iván Anselmo; Pow Sang Portillo, José Antonio
    Perú se ha convertido en uno de los principales productores de palta Hass, en este aspecto una etapa fundamental es la clasificación, esta situación conllevó al planteamiento del presente trabajo de investigación el cual tuvo por objetivo diseñar un modelo basado en Redes Neuronales Artificiales que permita la clasificación de dicha fruta considerando como criterios el estado de madurez fisiológica y la evaluación de los daños y defectos que presente, dichas consideraciones están contempladas en la Norma Técnica Peruana NTP 011.018-2018. En la etapa inicial se diseñó un entorno controlado con un nivel de luminosidad frío-día, el cual permitió la adquisición de imágenes, construyendo un dataset de 310 imágenes etiquetadas, sobre el cual se aplicó Data Augmentation. Luego se procedió a definir la parametrización de una arquitectura de red neuronal convolucional, obteniendo un modelo de CNN sobre el cual se fueron evaluando 4 criterios, la resolución de las imágenes de entrada, la cantidad de capas de convolución y pooling, el factor de aprendizaje y la cantidad de épocas de entrenamiento. Finalmente se mostraron los resultados obtenidos, definiendo la resolución de la imágenes de entrada en 64 x 64 pixeles, 3 capas de convolución acompañas de pooling, con máscaras de 3x3 y 2x2 respectivamente y con funciones de activación ReLU, pasando luego a una capa capa fully connected, la cual se conectó a una capa oculta y ésta a la capa de salida, la cual constó de 4 neuronas bajo la representación One Hot Encoding, con una función de activación softmax, y un factor de aprendizaje de 0.001, utilizando en su entrenamiento 50 épocas. Luego de evaluar el modelo parametrizado se alcanzó una identificación correcta de las imágenes de palta Hass con una exactitud de 87.5%.