Data-Driven geological modeling in the era of deep learning
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Pontificia Universidad Católica del Perú
Acceso al texto completo solo para la Comunidad PUCP
Resumen
Deep learning has revolutionized data analysis across diverse scientific disciplines; however, its
application to geological modeling faces unique challenges, including scarce, sparsely distributed
data and limited open datasets. Traditional geological modeling relies on geostatistical methods
that struggle with complex spatial patterns, while current neural network approaches demand ex-
tensive computational resources, impractical for most geological applications. This thesis shows
that specialized deep-learning models for geological applications can achieve superior performance
in both subsurface reconstruction from sparse data and high-resolution surface geological mapping,
compared with conventional methods and general-purpose foundation models. Our sparse con-
volutional framework improved subsurface reconstruction by 37–62% in non-stationary domains
compared to conventional kriging, while adapted encoders for landslide detection outperformed
foundation models by 1–3%, employing 10× fewer parameters. Transfer learning strategies signif-
icantly reduced data requirements by up to 128× in subsurface reconstruction and enabled robust
surface mapping from limited labels. These findings demonstrate that specialized architectures, to-
gether with strategic data management, mitigate the trade-off between conventional mathematical
approaches and computationally intensive foundation models and establish that specialized neural
network design democratizes access to deep-learning geological models, thereby promoting open
scientific research and broadening the accessibility of these models worldwide.
El aprendizaje profundo ha revolucionado el análisis de datos en diversas disciplinas científicas; sin embargo, su aplicación al modelamiento geológico enfrenta desafíos únicos, entre ellos la escasez y la distribución dispersa de los datos, así como las limitadas colecciones de datos abiertos disponibles. El modelamiento geológico tradicional se basa en métodos geoestadísticos que tienen dificultades con patrones espaciales complejos, mientras que los enfoques actuales basados en redes neuronales exigen recursos computacionales extensos, poco prácticos para la mayoría de aplicaciones geológicas. Esta tesis muestra que los modelos de aprendizaje profundo especializados para aplicaciones geológicas pueden lograr un desempeño superior tanto en la reconstrucción del subsuelo a partir de datos dispersos como en la cartografía ́geológica superficial de alta resolución, en comparación con métodos convencionales y con modelos fundacionales de propósito general. Nuestro marco basado en convoluciones dispersas mejoró la reconstrucción del subsuelo en un 37–62% en dominios no estacionarios en comparación con el kriging convencional, mientras que codificadores adaptados para la detección de deslizamientos de tierra superaron a los modelos fundacionales en 1–3%, empleando 10× menos parámetros. Las estrategias de aprendizaje por transferencia redujeron significativamente los requisitos de datos hasta 128× en la reconstrucción del subsuelo y permitieron una cartograf ́ıa superficial robusta con pocas etiquetas. Estos hallazgos demuestran que arquitecturas especializadas, junto con una gestión estratégica de datos, mitigan el compromiso entre enfoques matemáticos convencionales y modelos fundacionales de alta demanda computacional y establecen que un diseño de redes neuronales especializado democratiza el acceso a modelos geológicos basados en aprendizaje profundo, promoviendo así la investigación científica abierta y ampliando su disponibilidad a escala mundial.
El aprendizaje profundo ha revolucionado el análisis de datos en diversas disciplinas científicas; sin embargo, su aplicación al modelamiento geológico enfrenta desafíos únicos, entre ellos la escasez y la distribución dispersa de los datos, así como las limitadas colecciones de datos abiertos disponibles. El modelamiento geológico tradicional se basa en métodos geoestadísticos que tienen dificultades con patrones espaciales complejos, mientras que los enfoques actuales basados en redes neuronales exigen recursos computacionales extensos, poco prácticos para la mayoría de aplicaciones geológicas. Esta tesis muestra que los modelos de aprendizaje profundo especializados para aplicaciones geológicas pueden lograr un desempeño superior tanto en la reconstrucción del subsuelo a partir de datos dispersos como en la cartografía ́geológica superficial de alta resolución, en comparación con métodos convencionales y con modelos fundacionales de propósito general. Nuestro marco basado en convoluciones dispersas mejoró la reconstrucción del subsuelo en un 37–62% en dominios no estacionarios en comparación con el kriging convencional, mientras que codificadores adaptados para la detección de deslizamientos de tierra superaron a los modelos fundacionales en 1–3%, empleando 10× menos parámetros. Las estrategias de aprendizaje por transferencia redujeron significativamente los requisitos de datos hasta 128× en la reconstrucción del subsuelo y permitieron una cartograf ́ıa superficial robusta con pocas etiquetas. Estos hallazgos demuestran que arquitecturas especializadas, junto con una gestión estratégica de datos, mitigan el compromiso entre enfoques matemáticos convencionales y modelos fundacionales de alta demanda computacional y establecen que un diseño de redes neuronales especializado democratiza el acceso a modelos geológicos basados en aprendizaje profundo, promoviendo así la investigación científica abierta y ampliando su disponibilidad a escala mundial.
Descripción
Palabras clave
Geología--Modelos, Aprendizaje profundo (Aprendizaje automático), Cartografía geológica