trabajo final 2
DESCRIPTION
csddTRANSCRIPT
UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE INGENIERÍA
ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA GEOLÓGICA
“ANÁLISIS DE DATOS Y VARIOGRAFÍA”
PRESENTADO por:
ABANTO ARAUJO, Ana.
AGUILAR PÉREZ, Melquisedec.
HUAMÁN YOPLA, Henry.
RAMOS VIGO, Darwin.
Docente:
Ing. Wilder Chuquiruna Chávez
CAJAMARCA – PERÚ2015
GEOESTADISTICA
2
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
INTRODUCCIÓN
La estadística y la geología son unas de las ciencias afines a la Geoestadítica,
pero eso no quiere decir que esta última sea la fusión de las dos. Es por ello
que nos vemos en la necesidad de entender correctamente los fundamentos,
definiciones y alcances de la geoestadística. El problema de modelar un
macizo rocoso acompaña siempre a la actividad minera, por ello la necesidad
de un mejor modelado para lograr una operación minera eficiente. Entonces,
¿cuál de las herramientas matemáticas existentes puede ofrecernos la
solución? En cuanto a los fenómenos naturales, la imposibilidad de explicar el
porqué del valor de una ley en un determinado punto de muestra está fuera de
nuestro alcance, de ahí que
Trabajamos con variables “aleatorias” (cada caso tiene la misma probabilidad
de ocurrir) y que las leyes tienen cierto grado de interdependencia. Además, la
geoestadística es el tratado de variables regionalizadas. No debemos pasar por
alto los puntos fundamentales que destacan: la consolidación de la
geoestadística con los trabajos de G. Matheron en 1965, el establecimiento de
la escuela de Fontainebleau y finalmente el desarrollo de la Geoestadística
asociada con la informática
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
3
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
OBJETIVOS
OBJETIVO GENERAL
Estudiar los Análisis de datos y la Variografia
OBJETIVOS ESPECÍFICOS
Determinar el método de la transformada inversa.
Determinar y analizar el método de Montecarlo
Analizar la Variografia y sus diferentes aplicaciones en yacimientos
mineros.
Interpretar los resultados de las gráficas para comprender las diferencias
entre los parámetros estadísticos y la utilidad de la geoestadística
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
4
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
TEOREMA DEL LÍMITE CENTRAL
SIMULACIÓN DE DISTRIBUCIONES
La idea básica detrás de la simulación goestadística consiste en obtener
nuevas realizaciones ¨artificiales¨ con igual comportamiento espacial que la
información observada en las muestras reflejen las mismas propiedades
estadísticas que esperan que posea la función aleatoria.
Según Lantuejoul y Rivoirard (1998) la simulación puede ser útil para obtener
una representación de una de las posibles realizaciones de la realidad de un
yacimiento. Esto da la posibilidad de sustituir un yacimiento real por uno
simulado y realizar un estudio de simulación de explotación, estudio de redes,
etc.
Teorema de límite central
Nos indica que en condiciones muy generales, si Sn es la suma de n variables
aleatorias independientes, entonces la función de distribución de Sn se
aproxima a una distribución normal. Así pues el teorema asegura que esto
ocurre cuando la suma de estas variables aleatorias e independientes es lo
suficiente grande.
Definición
Sea la funcion de densidad de distribucion normal definida como:
Con la media u y una varianza . El caso en el que su función de densidad
en N(0,1), a la distribución se le conoce como normal estándar.
Se define Sn como la suma de n variables aleatorias, independientes,
idénticamente distribuidas y con una media u y con varianza finita.
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
5
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
De manera que, la medio Sn es n.u y la varianza n. , dado que son variables aleatorias independientes. Con tal de hacer más fácil la comprensión del teorema y su posterior uso , se hace una estandarización de Sn como:
Para que la media de la nueva variable sea igual a 0 y la desviación estándar
igual a 1. Asi las variables de Zn converjan en la distribución normal estándar
N(0,1), cuando n tienda a infinito. Como consecuencia, si es la función de
distribución de N(0,1), para cada número real Z:
Donde Pr( )indica la probabilidad y lim se refiere a limite matemático.
MÉTODO DE LA TRANSFORMADA INVERSA
Determinar el método de la transformada inversa.
Definición:
El método de la transformada (o transformación) inversa, también conocido
como método de la inversa de la transformada, es un método para
la generación de números aleatorios de cualquier distribución de probabilidad
continua cuando se conoce la inversa de su función de distribución (cdf). Este
método es en general aplicable, pero puede resultar muy complicado obtener
una expresión analítica de la inversa para algunas distribuciones de
probabilidad. El método de Box-Muller es un ejemplo de algoritmo que aunque
menos general, es más eficiente desde el punto de vista computacional.
El método se utiliza para simular valores de las
distribuciones exponencial, Cauchy, triangular, de Pareto y Weibull.
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
6
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
OBTENCIÓN DEL MÉTODO
El método de la transformada inversa se basa en el siguiente teorema:
Teorema de inversión. Sea X una variable aleatoria con función de distribución
de probabilidad acumulada F, continua e invertible, y sea su función
inversa. Entonces, la variable aleatoria U = F(X) tiene distribución uniforme en
. Como consecuencia, si U es una variable aleatoria uniforme en
entonces la variable aleatoria satisface la distribución F.
EL MÉTODO
El método de la transformada inversa puede utilizarse para simular variables
aleatorias continuas, lo cual se logra mediante la función acumulada f(x) y la
generación de números pseudoaleatorios ri ~U (0,1).
El método consiste en:
Definir la función de Densidad f(x) que representa la variable a
modelar.
Calcular la función acumulada f(x).
Despejar la variable aleatoria x y obtener la función acumulada inversa
f(x)-1.
Generar las variables aleatorias x, sustituyendo valores con números
pdeudoaleatorios ri ~U (0,1) en la función acumulada inversa.
El método de la transformada inversa también puede emplearse para simular
variables aleatorias de tipo discreto, como en las distribuciones de Poisson, de
Bernoulli, binomial, geométrica, discreta general, etc. La generación se lleva a
cabo a través de la probabilidad acumulada P(x) y la generación de números
pseudoaleatorios ri ~U (0,1).
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
7
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
METODOS DE MONTECARLO
Consiste en numerosos procedimientos probabilisticos para generar relaciones
de funciones aleatorias que tienen un variograma dado
Estos metodos son principalmente:
a) Método del análisis armonico
b) Método de las medias móviles
c) Método de las lineas rotantes
d) Método gaussiano secuencial
las deficiencias que estos métodos presentan son: el método a) es demasiado
laboriosos y presenta problemas de convergencia . El método d) presenta
roblemas de reproducción ddel variograma (por ejemplo, no reproduce bien el
modelo esférico).
EL MÉTODO DE LAS MEDIAS MOVILES
En este metodo se sortean la azar, relaciones independientes de wi de una
variable aleatoria Wi , la cual es normal o gaussiana con esperanza matemática
0 y varianza 1, y se afectan estos valores en los vertices de una malla regular
(1-D,2 ó D,3). Sea f una cierta función. La simulación es entonces:
En la figura 1 se tiene una grilla muy densa con valores normales con media 0
y varianza 1 (llamada también normal reducida). A cada punto de la grilla se le
asocia la suma ponderada siguiente, la cual se realiza sobre todos los puntos
que caen dentro de la elipse E:
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
8
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
Siendo n el número de puntos que caen dentro de la elipse E. Es fácil probar
que Z(x, y) también sigue una ley normal reducida.
Un caso interesante es cuando f tiene la expresión siguiente, en el espacio de
tres dimensiones
Se puede demostrar, sin dificultad que obtiene en este caso el variograma
esférico, con alcance a.
Luego, para simular el variograma esférico en el espacio de 3 dimensiones, se
pasea una esfera de diámetro a por el interior de un paralelepípedo (o un
cuerpo tridimensional) el cual está lleno de valores aleatorios independientes
W (i, j, k) y se afecta al centro de la esfera, la suma de los valores W que
están en su interior. Más generalmente, en vez de una esfera, se puede
considerar un elipsoide (figura 30), con lo cual se obtienen realizaciones
anisótropas:
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
9
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
el elipsoide proporciona una realización anisótropa
Si se desea simular en 2-D un variograma esférico, hay que tomar un plano
particular de la simulación precedente.
En el caso de simular un modelo esférico (en 2-D o en 3-D), existe un método
más eficiente conocido como las monedas aleatorias, el cual consiste en
implantar en el plano (espacio) círculos (esferas) cuyos centros y diámetros son
aleatorios y asignar en cada implantación un número (aleatorio o no) a los
puntos interiores, sumando la contribución de las implantaciones (ver figura
30). En el espacio de 2 dimensiones el radio del círculo es aleatorio, en 3
dimensiones el diámetro de la esfera es una constante a (este método se
llama también “random token” o “monedas aleatorias”).
Monedas aleatorias. A la izquierda con 4 circulos, a la derecha, contribución con 600 círculos.
El método de las líneas rotantes
Sean k rectas al azar Di en el espacio. Cada recta se caracteriza por un vector
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
10
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
unitario eI. Se genera, en cada recta Di, una realización Y aleatoria de una
dimensión (mediante el método de las medias móviles). Sea x un punto del
espacio. La simulación tridimensional es:
En que (x · ei) es el producto escalar entre el vector x (de componentes xy el
vector unitario ei : 1, x2, x3)
lineas rotantes en 2d y 3d
Para tener una buena convergencia, es necesario utilizar por lo menos unas 50
rectas aleatorias en 2 – D y unas 120 rectas aleatorias en 3 – D. También se
pueden utilizar rectas uniformemente distribuidas en 2D o 3D. La situación es
ligeramente más complicada en 3D.
Se puede demostrar que para simular mediante líneas rotantes el variograma
esférico hay que utilizar en las rectas la función f(x) (aplicada a la ecuación 1)
siguiente:
Para simular el variograma exponencial, hay que utilizar en las rectas la función
f(x) siguiente:
EJERCICIO APLICATIVO
Se muestran datos de un análisis en una campaña de explotación de petróleo
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
11
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
de 200 días. La tabla incluye número de perforaciones productivas diarias a 50
metros de profundidad (0 a 5) junto con las frecuencias absolutas (número de
días en que se produjeron 0,1…, 5 perforaciones) las frecuencias relativas
(10/200 = 0.05,…) y las frecuencias relativas acumuladas.
Podríamos interpretar la frecuencia relativa como la probabilidad de que ocurra
el suceso asociado, en este caso, la probabilidad de un determinado número
de perforaciones (así por ejemplo, la probabilidad de que se den 4
perforaciones en un día sería de 0.2), por lo que la tabla anterior nos
proporciona la distribución de probabilidad asociada a una variable aleatoria
discreta (la variable aleatoria es el número de perforaciones, que solo puede
tomar valores entre 0 y 5).
Supongamos que queremos conocer el número esperado (o medio) de perfora
ciones por día. La respuesta a esta pregunta es fácil si recurrimos a la teoría de
la probabilidad.
Denotando por X a la variable aleatoria que representa el número diario de
perforaciones, sabemos que:
Por otra parte, también podemos usar simulación de Monte Carlo
para estimar el número esperado de perforaciones (en este caso se ha
podido
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
12
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
obtener el valor exacto usando teoría de probabilidad, pero ello no siempre
será factible). Veamos cómo:
Cuando se conozca la distribución de probabilidad asociada a una
variable
aleatoria discreta, será posible usar la columna de frecuencias relativas acumul
adas para obtener los llamados intervalos de números aleatorios asociados
a cada suceso. En este caso, los intervalos obtenidos son:
[0.00, 0.05) Para el suceso 0
[0.05, 0.15) Para el suceso 1
[0.15, 0.35) Para el suceso 2
[0.35, 0.65) Para el suceso 3
[0.65, 0.85) Para el suceso 4
[0.85, 1.00) Para el suceso 5
El gráfico siguiente nos muestra cada una de las probabilidades sobre el númer
o de perforaciones. En él, se aprecia claramente la relación existente
entre probabilidad de cada suceso y el área que éste ocupa.
NÚMERO DE PERFORACIONES
Esto significa que, al generar un número pseudo-aleatorio con el ordenador
(proveniente de una distribución entre 0 y 1), estaremos llevando a cabo un
experimento cuyo resultado, obtenido de forma aleatoria y según la distribución
de probabilidad anterior, estará asociada a un suceso. Así por ejemplo si el
ordenador nos proporciona el número pseudo-aleatorio 0,2567, podríamos
suponer que ese día se han producido dos perforaciones productivas.
VARIOGRAFÍA
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
13
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
VARIOGRAFIA VARIOGRAFÍA – Variables Regionalizadas.
Una ocurrencia de la variable regionalizada Au al interior de los puntos de un
depósito está constituido por las leyes que pueden provenir de una campaña
de sondajes realizado en un depósito de minerales. La variable regionalizada
está constituida por todos los posibles valores de Au que pueden existir en
todos los puntos del espacio que encierra el depósito. A esta población de
valores de Au encontrada por la campaña de sondajes, podemos calcularle la
correlación entre pares de leyes que se encuentran a una distancia “h” metros
separadas entre sí. Si para cada uno de los N puntos muestreados en el
depósito se encuentran las leyes Z(xyz): (Z(xyz.1),Z(xyz.2), . . . ,Z(xyz.N))
El semivariograma se expresa de la siguiente forma: En esta expresión se
identifica Z(xyz) como la ley de una muestra (i) ubicada en la coordenada xyz,
se asume que existen muestras i = 1,…,N. También se observa la variable h
que indica que esta expresión es válida solo para cada valor de “h” que
corresponde a la distancia entre las dos leyes encerradas por corchetes.
También se observa que esta diferencia de leyes distanciadas h metros, se
encuentra elevada al cuadrado. Para un valor de h encontraremos N
diferencias elevadas al cuadrado, las que se suman y se dividen entre 2 y el
valor de N. Por lo tanto encontraremos para cada “h” valores que al graficarlo
se presentará la estructura del semivariograma.
VARIOGRAFIA UNIDIMENSIONAL
Poniendo como ejemplo una serie de leyes en una dirección, que podrían ser
leyes de una galería o leyes de un sondaje, se tiene:
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
14
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
Gama(2m) = (0.3 - 0.5)^2 + (0.5 – 0.7)^2 + (0.7 – 0.4)^2 + (0.4 – 0.2)^2 + (0.2 –
0.6)^2 + - - - = 0.61 / (2*8) = 0.038
Gama(4m) = (0.3 – 0.7)^2 + (0.5 – 0.4)^2 + (0.7 – 0.2)^2 + (0.4 – 0.6)^2 + (0.2 –
0.8)^2 + - - - =1.22 / (2*7) = 0.087
Gama(6m) = (0.3 – 0.4)^2 + (0.5 – 0.2)^2 + (0.7 – 0.6)^2 + (0.4 – 0.8)^2 + (0.2 –
0.4)^2 + - - - =0.47 / (2*6) = 0.039
Gama(8m) = - - - - = 0.03 / (2*5) = 0.003
Gama(10) = - - - - -= 0.31 / (2*4) = 0.039
Gama(11) = - - - - -= 0.51 / (2*3) = 0.085
Gama(12) = - - - - -= 0.10 / (2*2) = 0.025
VARIOGRAFIA A DOS DIMENSIONES
Gama(6m) = (0.4 - 0.2)^2 + (0.6 – 0.8)^2 + (0.5 – 0.2)^2 + (0.2 – 0.6)^2 + (0.6 –
0.8)^2 + - - - = 0.61 / (2*8) = 0.038
Gama(12m) = (0.3 – 0.7)^2 + (0.5 – 0.4)^2 + (0.7 – 0.2)^2 + (0.4 – 0.6)^2 + (0.2
– 0.8)^2 + - - - =1.22 / (2*7) = 0.087
Gama(18m) = (0.3 – 0.4)^2 + (0.5 – 0.2)^2 + (0.7 – 0.6)^2 + (0.4 – 0.8)^2 + (0.2
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
15
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
– 0.4)^2 + - - - =0.47 / (2*6) = 0.039
Gama(24m) = (0.3 – 0.4)^2 + (0.5 – 0.2)^2 + (0.7 – 0.6)^2 + (0.4 – 0.8)^2 + (0.2
– 0.4)^2 + - - - =0.47 / (2*6) = 0.039
Gama(30m) = (0.3 – 0.4)^2 + (0.5 – 0.2)^2 + (0.7 – 0.6)^2 + (0.4 – 0.8)^2 + (0.2
– 0.4)^2 + - - - =0.47 / (2*6) = 0.039
Gama(36m) = - - - - = 0.03 / (2*5) = 0.003
Gama(42) = - - - - -= 0.31 / (2*4) = 0.039
Gama(48) = - - - - -= 0.51 / (2*3) = 0.085
Gama(54) = - - - - -= 0.10 / (2*2) = 0.025
CARACTERISTICAS DEL VARIOGRAMA
1.- Al origen por lo general presenta un efecto de pepita, es decir no inicia en el
punto cero.
2.- Cuantos más pares de puntos se presentan en el variograma experimental,
más peso e importancia se le debe dar a la distancia que se presenta.
3.- El variograma con frecuencia mantiene un crecimiento desde el origen hasta
lograr alcanzar un valor estable denominado meseta, y tiende a coincidir con la
varianza.
4.- Comportamiento Direccional, el variograma en una determinada dirección
es distinta al variograma en otra dirección, a estos casos se le conoce como
anisotrópicos. Por lo general en los depósitos de minerales no existe isotropía,
toda vez que el flujo mineralizante proviene de una determinada dirección.
A continuación se presentan tres posibles presencias de variables
regionalizadas que distinguen el comportamiento en el origen del variograma.
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
16
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
TIPOS DE VARIOGRAMAS EXPERIMENTALES
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
17
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
MODELADO DE VARIOGRAMAS
El modelamiento del variograma se realiza una vez que se eligieron los
variogramas representativos del depósito para las direcciones principales.
El modelamiento consiste en elegir el variograma experimental más
representativo de acuerdo a las características mencionadas anteriormente.
Una vez elegido, el variograma experimental supuesto con el modelo
autorizado que más se le aproxima. El modelo
Los modelos de variogramas autorizados mantienen una condición principal de
ser siempre positivos. Es por ello que se requiere de ciertas acotaciones o
condiciones para mantener esta positividad.
Efecto Pepita. El variograma con efecto pepita, presenta la siguiente
formulación: en el caso que h=0 si h es mayor que cero. (h) 0 (h) C
Modelo Esférico El variograma con efecto pepita, presenta la siguiente
formulación:
En el caso que h>0 (h) C si h es mayor que a
Modelo Potencia o Monómico.
El variograma con efecto pepita, presenta la siguiente formulación:
En el caso que h > 0
Modelo Exponencial. El variograma con efecto pepita, presenta la siguiente
formulación:
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
18
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
En el caso que h>0
(h) C si h es mayor que 3a.
En este caso es importante tomar en cuenta que el alcance o llegada a la
meseta ocurre a tres veces el valor de a, siendo a una variable de la función
variograma exponencial.
ModeloGausiano. El variograma con efecto pepita, presenta la siguiente
formulación:
En el caso que h=0
si h es = a (h) C
El alcance se logra de forma asintótica, y para casos prácticos se puede
considerar que alcanza a la meseta a una distancia de a√3
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
19
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
ANALISIS DE DATOS Y VARIOGRAFIA
GEOESTADISTICA
20
UNIVERSIDAD NACIONAL DE CAJAMARCA Escuela académico profesional de Ingeniería Geológica
CONCLUSIONES
Este método de la transformada inversa es muy útil en algunos aspectos
de lo que es la estadística espacial dando apoyo a un sinnúmero de
análisis dentro de una investigación ya sea en cualquier rama de
ciencias numéricas donde son los datos los que son estudiados.
El Variograma es una herramienta que nos ayuda analizar cómo están
distribuidas las variables y determinar su comportamiento espacial, en lo
cual la estadística se limita en solo analizar el conjunto más no el orden
BIBLIOGRAFÍA
Samuel Canchaya M. “EL MÉTODO GEOESTADÍSTICO: UNA
PRESENTACIÓN COMPARATIVA CON LOS MÉTODOS TRADICIONALES
DE ESTIMACIÓN DE RESERVAS”.
LINKOGRAFIA
http://www.academia.edu/8844884/CONSTRUCCI
%C3%93N_DE_VARIOGRAMAS_Y_AN%C3%81LISIS_GEOESTAD
%C3%8DSTICO_DE_5000_DATOS_GENERADOS_ALEATORIAMENTE_GE
OESTAD%C3%8DSTICA_I
http://sampling-ok.com/web/publicaciones/2013-01-31_VPL.pdf
ANALISIS DE DATOS Y VARIOGRAFIA