manual ag@ve risk v1.0

15
Manual de Usuario Ag@ve Risk v1.0 Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 1 Proyecto: Análisis de la información generada por Casa Herradura mediante los Conteos Cíclicos y Monitoring, con un enfoque epidemiológico regional. Reporte del Primer entregable: Adecuación de bases de datos integrada de conteos cíclicos, conteos fitosanitarios, cuadrillas DSI y Monitoring, clima y suelo y análisis estadístico descriptivo y gráficos exploratorios. Responsable: Dr. Gustavo Mora Aguilera Profesor e Investigador Titular Epidemiología Agrícola Colegio de Postgraduados-Montecillo [email protected] Tel. (01-595) 95-202-00 Ext. 1620 Edificio Fitosanidad

Upload: sinaveflab

Post on 13-Apr-2017

233 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 1

Proyecto:

Análisis de la información generada por Casa Herradura mediante los

Conteos Cíclicos y Monitoring, con un enfoque epidemiológico regional.

Reporte del Primer entregable:

Adecuación de bases de datos integrada de conteos cíclicos, conteos fitosanitarios,

cuadrillas DSI y Monitoring, clima y suelo y análisis estadístico descriptivo y gráficos

exploratorios.

Responsable:

Dr. Gustavo Mora Aguilera

Profesor e Investigador Titular

Epidemiología Agrícola

Colegio de Postgraduados-Montecillo

[email protected]

Tel. (01-595) 95-202-00 Ext. 1620

Edificio Fitosanidad

Page 2: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 2

Presentación

El proyecto inició formalmente el 30 de mayo con la firma del convenio respectivo y la

canalización del primer recurso en junio del 2011.

Aunque el inicio se da en el marco de las fechas mencionadas anteriormente, las

actividades se comenzaron a partir de la gestión del proyecto en la primera semana de

mayo.

Este primer reporte corresponde a la primera etapa del proyecto en el contexto del

primer entregable: Adecuación de bases de datos integrada de conteos cíclicos, conteos

fitosanitarios, cuadrillas DSI y Monitoring, clima y suelo y análisis estadístico descriptivo y

gráficos exploratorios.

I. Introducción

El presente trabajo corresponde al primer informe de avances de investigación del

proyecto: Análisis de la Información Generada por Casa Herradura mediante los Conteos

Cíclicos y Monitoring, con un enfoque epidemiológico regional.

Los primeros análisis correspondientes al primer entregable se generaron a partir del

reconocimiento de las bases de datos proporcionadas por Casa Herradura, la cual

correspondió a la base de datos de Cuadrillas vs Monitor. A la par, se exploraron

preliminarmente otras bases de datos de las cuales se generaron resúmenes de variables

(Ver anexo 2).

Se realizó un análisis exploratorio gráfico y de cuadros resumen por variable, región y

por enfermedad (plagas y enfermedades) de las variables que contenía la base de datos para

determinan su pertinencia y sus posibles usos en análisis estadísticos descriptivos u otros

(Ver anexo 1).

En apoyo al informe de Monitoring presentado por el M.C Elías Hernández y equipo de

Casa Herradura se realizaron algunos análisis estadísticos complementarios. Empleando la

misma base de datos (Cuadrillas vs Monitor) se realizaron gráficas temporales por región

productiva para determinar el grado e intensidad de la(s) enfermedad(es).

Los datos obtenidos de la gráficas temporales se metieron es SAS v6.12 para el cálculo

de Área Bajo la Curva de Progreso de la Enfermedad (ABCPE). Se ajustaron al modelo

Weibull mediante el procedimiento PROC GLM por gráfica temporal de cada región

productiva. Se realizaron análisis de varianza (Prueba de Duncan) por regiones y por fecha

de evaluación utilizando los datos de ABCPE generados en el procedimiento anterior (Ver

anexo 3).

A través de la integración de información generada por personal de Casa Herradura, se

integró, en MS Excel 2007, un modelo de simulación de riesgos epidemiológicos-

económicos a nivel regional basado en el sistema de simulación MonteCarlo (N=5000), el

cual se nombró Ag@ve-Risk v1.0.

Page 3: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 3

Ag@ve-Risk v1.0 se desarrolló como un sistema dinámico interactivo de multicriterios

regionales para la simulación de % incidencia en la cadena productiva y sus repercusiones

económicas dentro de la misma.

El sistema Ag@ve-Risk v1.0 ofrece parámetros cuantitativos estadísticos, económicos

y epidemiológicos para la toma de decisiones en un contexto de planeación y programación

para la operación de recursos económicos y humanos en la producción de Agave de Tequila

Herradura.

Además, ofrece un panorama innovador en la integración de modelos a diferentes

escalas y visiones de análisis, su carácter dinámico-práctico permite la interacción directa

con el modelo a través de la elección de diferentes escenarios de ocurrencia. La

plurifuncionalidad de Ag@ve-Risk v1.0 permite la visión integradora de los procesos

complementarios de la cadena productiva del Agave.

II. Justificación

La estimación de perdidas en la cadena productiva del Agave es uno de los elementos

importantes en la planeación y toma de decisiones en procesos posteriores de la cadena

productiva. Para ello, predecir escenarios de riesgo epidemiológicos en las plantaciones de

Agave de Tequila Herradura es uno de los eslabones primordiales.

En este sentido, resulta imprescindible entender la relación de los procesos biológicos

que operan dentro del cultivo y sus efectos económicos dentro del mismo. La planeación

agrícola de los procesos productivos primarios resulta una de las herramientas técnicas que

permiten a través de la incorporación de diversos elementos epidemiológicos, económicos y

productivos diseñar las estrategias potenciales para la toma de decisiones operativas.

La incorporación de variables de los subsistemas epidemiológicos como el hospedero,

clima, manejo, etc., en conjunto con variables econométricas y productivas sugieren la

pertinencia de análisis multivariados, combinados y complementarios capaces de ofrecer

posibles escenarios de interacción entre dichos elementos.

La simulación de estos escenarios de interacción entre los elementos epidemiológicos,

económicos y productivos por medio de métodos matemáticos y estadísticos resulta factible

ya que brinda parámetros cuantitativos y probabilidades de ocurrencia de uno varios o

sucesos a través de la repetitividad sistemática de las interacciones.

No obstante, determinar la pertinencia de las variables explicativas de un determinado

proceso resulta unas de las actividades con mayor responsabilidad, criterio y visión, ya que

una inadecuada decisión en la elección cambiaría el sentido explicativo del proceso. Es por

ello que la calidad de los datos que alimentan los procesos simulativos debe tener estricto

apego a la realidad del entorno.

La integración de esta idea a través de un sistema dinámico de análisis cuantitativo de

multicriterios epidemiológicos y económicos que ofrezcan al usuario un conjunto de

elementos con una base racional bien sustentada, permitirá una mejora en la planeación de

Page 4: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 4

los procesos productivos desde la cadena primaria de producción, lo que repercutiría

directamente en los procesos de producción industrial a través de mejora en la

programación de recursos y esfuerzos encaminados a la mejora de la calidad del Agave.

III. Marco Metodológico

A) Origen de los Datos

Los datos que alimentaron el programa Ag@ve-Risk v1.0 fueron las bases de datos de

Conteo Cíclico No. 7 (Agosto-Octubre, 2010), de las cuales se obtuvieron datos de

porcentaje de plantas muertas por ciclo (edad de plantación) y por zona (región productiva),

de la siguiente forma:

Donde: %Pm = % de Plantas Muertas, Pv = Número de Plantas Vivas al 2010 y Pm = Número de

Plantas muertas al 2010.

Los ciclos analizados fueron del 2000 al 2009, mientras que las zonas o regiones

productivas reportadas fueron: Altos, Centro, Magdalena, Nayarit y Sur.

Una vez obtenido el %Pm se generaron gráficas de columnas 2-D del % de plantas

muertas versus la edad de plantación, lo anterior para visualizar la tendencia y distribución

de los datos (Figura 1).

Figura 1. Histogramas (2-D) de % de plantas muertas versus edad de la plantación: Caso Alto (A) y

Centro (B).

Derivado de las gráficas (histogramas) de %Pm se generaron gráficas (líneas)

epidemiológicas de %Pm por edad, comenzando desde el año más reciente al más lejano

(2009-2000) para invertir la curva a una forma ascendente (Figura 2), para fines de

posteriores análisis epidemiológicos.

0%

10%

20%

30%

40%

50%

60%

2002 2004 2005 2006 2007 2008 2009

% m

ue

rte

Edad Planta

Zona Altos

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

2001 2002 2003 2004 2005 2006 2007 2008 2009

% m

ue

rte

Edad Planta

Zona Centro

Edad de Plantación

% P

lan

tas

Mu

ert

as

Zona o región productiva

A) B)

Page 5: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 5

Figura 2. Gráficas temporales de incidencia de plantas muertas en Agave. Ejemplo: Zona Altos (A)

y Centro (B).

B) Ajuste de Epidemias al Modelo Weibull

La incidencia de plantas muertas (%Pm) por zona o región productiva fueron

incluidas en análisis estadísticos en el programa SAS (Sistem Analysis Statistical v. 6.12)

para su ajuste mediante el modelo flexible Weibull de dos parámetros, mediante los

procedimientos PROC MODEL y PROC NLIN.

El modelo Weibull se desarrolló con la siguiente fórmula:

Donde: y = incidencia, t= tiempo, b= parámetro de tasa y c=parámetro de forma

C) Programación de modelo Weibull en MS Excel (Biomodel v2)

Los parámetros obtenidos del modelo de Weibull (b y c) de cada región productiva

fueron adaptados y programados en el programa Biolmodel v2 Weibull (G. Mora. No

publicado), el cual permite comparar gráficamente dos epidemias en función de sus

parámetros de estimación y en función del tiempo de inicio de la epidemia a diferentes

intervalos (ver Hoja “Weibull” en Ag@ve-Risk v1.0).

D) Simulación MonteCarlo a través de Multicriterios Regionales Epidemiológicos y

Económicos

D.1) Parámetros Epidemiológicos

Los parámetros epidemiológicos empleados para realizar las simulaciones MonteCarlo

(MC) fueron los siguientes:

Parámetro de tasa (b) por región productiva

Parámetro de forma (c) por región productiva

Intervalos de confianza (α=5%) de los parámetros b y c

Número de Plantas por región productiva

0%

10%

20%

30%

40%

50%

60%

2009 2008 2007 2006 2005 2004 2002

% m

ue

rte

Edad Planta

Zona Altos

0%

20%

40%

60%

80%

100%

120%

2009 2008 2007 2006 2005 2004 2003 2002 2001

% m

ue

rte

Edad Planta

Zona CentroA) B)

Page 6: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 6

D.2) Parámetros Económicos

Los parámetros económicos empleados para realizar las simulaciones MC fueron los

siguientes:

Costos de producción agrícola por región productiva

Valor unitario de la piña

Porcentaje de Mermas

Variación porcentual (%) de costos de producción y del valor unitario

Tipo de cambio (Dólar)

D.3) Simulación MonteCarlo

Los parámetros epidemiológicos y económicos de estimación para cada región

productiva se adaptaron en MS-Excel para realizar 5000 simulaciones estadísticas por el

método MonteCarlo.

La fórmula general empleada para la simulación MC se define a continuación:

Donde:

Ut = Utilidad neta

Nt = Número total de plantas por región productiva

nt = Número total de de plantas por hectárea

t = tiempo de proyección

b = parámetro de tasa

c = parámetro de forma

Va = Valor Unitario de la piña

Co = Costo de producción por región hectárea

Las 5000 simulaciones se realizaron mediante números aleatorios de los parámetros b, c,

Va y Co y se definen a continuación:

Parámetros epidemiológicos. Las simulaciones realizadas se calcularon con base en

los intervalos de confianza (α=5%) de los parámetros b y c derivados del

procedimiento PROC NLIN en SAS.

Parámetros económicos. Se calcularon a través de la variación porcentual de costos

de producción, valor unitario y mermas.

D.3.1) Representación gráfica de la simulación MC

Las 5000 simulaciones realizadas a través del modelo MC (Sección D.3) para la

estimación de Utilidades Netas se graficaron por medio de histogramas de frecuencias para

determinar la forma de distribución de los datos. El procedimiento utilizado fue a través de

la siguiente función de MS Excel:

Page 7: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 7

Donde:

Datos = 5000 simulaciones

Grupo = clases

Para fines representativos, el número de clases empleado fue de 40 más la clase 0

(número mínimo del conjunto de datos). Las clases se determinaron a través de la siguiente

fórmula:

Donde:

MIN = función de Excel para determinar el valor mínimo

MAX = función de Excel para determinar el valor máximo

Datos = 5000 simulaciones

N = número deseado de clases

D.4) Estadística Descriptiva y Probabilidad

Como parte de las simulaciones MC se generaron un conjunto de estadísticas

descriptivas y probabilidades asociadas a las simulaciones. A continuación se enlistan las

herramientas empleadas:

Tendencia Central

Media, mediana y error estándar

Dispersión

Desviación estándar, mínimo, máximo, rango (máximo – mínimo), cuartíl

25% y 75% y Rango intercuartil (cuartil 25% - cuartil 75%).

Cuantíles, percentiles e intervalos

Percentil 5, 25, 95 y 97.5%, Percentil α/2, Percentil 1- α/2 (α= 5%).

Probabilidades

Apartado dinámico, en el que el usuario coloca los valores de los cuales requiere saber su

probabilidad.

Probabilidad mayor. Devuelve la probabilidad de un número mayor al

indicado (Pr > num).

Probabilidad menor. Devuelve la probabilidad del número menor al indicado

(Pr > num).

Probabilidad rango. Devuelve la probabilidad de un rango de datos indicado

(Pr < num > )

Page 8: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 8

E. Variables Respuesta

Epidemiológicas

E.1. Número de Plantas Vivas o Plantas a Cosecha

Corresponde al número total de plantas vivas proyectadas después de la selección de

una epidemia a un tiempo determinado. Se calcula de la siguiente forma:

E.2. Número de Plantas Muertas

Corresponde al número de plantas muertas proyectadas después de la selección de

una epidemia a un tiempo determinado de proyección. Se calcula de la siguiente forma:

E.3. Número de Piñas a Proceso

El número de piñas finales a proceso es la cantidad de plantas jimadas considerando

la merma en el proceso de jima, se calcula de la siguiente forma:

Económicas

E.5. Utilidad Neta (MXN)

Es la utilidad neta expresada en pesos mexicanos (MNX), considera la sustracción

de los costos de producción, se calcula como sigue:

E.6. Utilidad Neta (US)

Es la utilidad neta expresada en dólares americanos (US$), se calcula como sigue:

Page 9: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 9

IV. Ag@ve Risk v1.0: Manual de procedimientos

i. Estructura

Ag@ve-Risk v1.0 es un archivo de MS Excel en formato de “Excel habilitado para

macros”. Consta de cuatro hojas de cálculo más una presentación del programa. En cada

hoja de cálculo hay botones de opción para trasladarse entre hojas. Ag@ve-Risk v1.0 se

basa en el modelo de simulación MonteCarlo ajustado de 5000 simulaciones.

Contiene gráficas dinámicas, métodos y parámetros estadísticos, cuadros resumen,

entre otras herramientas convenientes para el análisis y la toma de decisiones dentro del

contexto de la planeación agrícola con un enfoque epidemiológico.

Presentación. Es la presentación del programa, incluye los datos generales del

grupo desarrollador del programa y de los solicitantes.

Modelo. Esta hoja es el “input” del sistema, en ella se determinan parámetros

específicos para establecer las simulaciones. Los cuadros en todos azules indican que los

valores se calculan automáticamente, mientras que los tonos verdes y amarillo claro con

letras en color rojo indican que los valores pueden ser modificados para fines de la

simulación.

Page 10: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 10

MCsim. Es la hoja en la que se realizan los cálculos de simulación (MonteCarlo

n=5000), así como la determinación de algunos gráficos complementarios y estadísticos

descriptivos generales.

Page 11: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 11

Weibull. Esta hoja contiene los las epidemias de incidencia por muerte de plantas

de agave ajustados al modelo flexible Weibull (Sección III.B).

El modelo empleado en este desarrollo se encuentra de forma dinámica en la

selección de regiones productivas de agave (seis regiones productivas) en diferentes

tiempos y a diferentes intervalos para la realización de gráficos representativos de las

curvas epidémicas.

Epidemias Originales. Contiene los histogramas de frecuencia por regiones

productivas empleando los datos originales de campo, obtenidos en la base de datos de

conteos cíclicos 7 (CC7 final.xls) proporcionada por Casa Herradura.

Page 12: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 12

ii. Modo de Uso Paso 1. Abrir el programa Ag@ve-Risk v1.0.xlsx proporcionado por el instructor.

NOTA: Dado que el archivo está guardado en un formato habilitado para macros, al abrirse

en un equipo nuevo Excel bloquea automáticamente esta función. Para activar los macros

siga los siguientes pasos:

1. En la parte superior de la hoja de cálculo aparece una ventana de aviso en la que

se anuncia que se han bloqueado algunas opciones.

2. Dar clic en la opción de Habilitar…

3. Seleccionar la opción de Habilitar macros

4. Dar OK.

Paso 2. Explorar cada una de las ventanas con ayuda de la explicación dada en el apartado

1.

Paso 3. Iniciar con reconocimiento de las opciones o multicriterios epidemiológicos y de

producción.

Multicriterios Dinámicos

A) Parámetros Epidemiológicos. Este apartado esta precargado con los datos

obtenidos por el ajuste de los datos originales a un modelo Weibull y con un total de

1,200,000 plantas por región. Cambiar el valor de plantas por región con datos

diferentes.

1. Dando clic sobre cualquier casilla considera los parámetros asociados a esta

región productiva.

2. Los botones de acción “Datos Originales” y “Ver Weibull” permiten visualizar

los datos de campo o el ajuste al modelo Weibull.

Page 13: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 13

B) Parámetros de Costos de Producción.

1. Especificar los costos de producción anual por hectárea y por cada concepto.

2. Los costos de producción deben incluirse según la región determinada en el paso

(A), por lo que el programa hace un recordatorio de la región que se eligió.

3. Definir porcentaje de variación de los costos (%).

4. El factor de % de reducción está incluido como una variable de análisis, se

puede definir por cada concepto la reducción deseada del costo de producción

total.

C) Determinación del Valor Unitario y mermas de la producción y factor

inflacionario dentro de los costos y valor de la producción

1. Definir el valor unitario de la planta.

2. Definir el % de variación de valor unitario de cada planta.

3. Indicar el % de mermas en la producción.

4. Indicar sí se considera el factor inflacionario en la simulación.

1

2

2

1

2

3

4

1

2 3

4

Page 14: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 14

D) Tiempo de proyección y simulación

1. Indicar el tiempo en el que se quiere hacer la proyección, este parámetro se

encuentra dado en meses, 12 meses=1 año.

E) Tipo de cambio (Dólar). 2) Definir el valor del dólar a la fecha actual para calcular

las utilidades tanto en Moneda Nacional (MNX) como en Dólar (US$).

F) Probabilidad de las utilidades. 1) Indicar un valor (Utilidad Neta) que se requiera

determinar su probabilidad de ocurrencia después de la simulación.

G) Simulación. 1) Para poder realizar simulaciones del modelo con los parámetros

elegidos anteriormente, ejecutar el botón de acción Nueva Simulación 5000 las

veces que requiera simular el modelo. 2) El botón de acción MCsim permite

movilizarse a la hoja de cálculo con el modelo de simulación, los datos de

estadísticas descriptivas e histogramas de frecuencias.

3) El botón de acción Simulación Cadena Secundaria está planeado para

movilizarse a la simulación de datos en la cadena secundaria o industria, la cual está

actualmente en proceso de construcción.

1

2

1

Page 15: Manual ag@ve risk v1.0

Manual de Usuario Ag@ve Risk v1.0

Responsable: Dr. Gustavo Mora Aguilera. Colegio de Postgraduados. Campus Montecillo 15

H) Histograma de punto de equilibrio. Calcula la utilidad neta según las

consideraciones epidemiológicas, costos y valor de la producción elegidas; y

determina el tiempo en el que estas consideraciones representan una pérdida

económica en la cadena primaria.

V. Perspectivas Futuras de Ag@ve-Risk v1.0

El desarrollo de Ag@ve-Risk v1.0 permitió visualizar nuevas áreas de oportunidad que

complementarían y mejorarían la propuesta planteada en este desarrollo. Se enlistan a

continuación las áreas de oportunidad planteadas:

Desarrollo de la cadena secundaria (transformación) utilizando el mismo formato de

visualización del desarrollado para la cadena primaria.

Idear las estrategias para vincular sistemáticamente las bases de datos generadas por

Casa Herradura, para lo cual es pertinente:

o La uniformización de formatos de las bases de datos.

o Diseño y programación de la plataforma o sistema web que permita el

desarrollo de la propuesta.

Registrar Ag@ve-Risk v1.0 como desarrollo formal o patente

1

2 3