xcongresoandaluzdesociologia.ujaen.es€¦  · web view2020. 11. 11. · •cuadrante 2. variable...

20
Autocorrelación espacial bivariante entre eventos temporales. Conceptos y aplicación mediante un ejercicio práctico del desempleo municipal en Andalucía. Acevedo- Blanco, Antonio- Jesús. [email protected] d.es Martínez- Quintana, Violante. [email protected] 1

Upload: others

Post on 20-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Autocorrelación espacial bivariante entre eventos temporales. Conceptos y aplicación mediante un ejercicio práctico del desempleo municipal en Andalucía.

Acevedo-Blanco, Antonio-Jesús.

[email protected]

Martínez-Quintana, Violante.

[email protected]

Resumen.

En investigación social la autocorrelación espacial bivariante es normalmente utilizada en base a atender las posibles relaciones que pueda plantearse entre el valor de un indicador en una ubicación espacial concreta y el valor medio ponderado de otra variable en las ubicaciones vecinas.

Esta comunicación propone un ejercicio práctico de Análisis Espacial Exploratorio (ESDA[footnoteRef:1]) a partir de un enfoque alternativo donde se examina la autocorrelación entre ubicaciones espaciales y hechos sociales distanciados en el tiempo. En pocas palabras, se propone examinar la autocorrelación espacial como extensión de la dependencia de los fenómenos sociales con el contexto geográfico y el tiempo. [1: ESDA por sus siglas en inglés; Exploratory Spatial Data Analysis ]

La comunicación se desarrolla en las siguientes fases;

1) Introducción abreviada a la autocorrelación espacial en perspectiva sociológica.

i. Notas introductorias sobre autocorrelación espacial.

ii. El estadístico I de Moran.

2) La CEB entre eventos temporales.

i. Correlación entre eventos temporales

iii. Correlación entre retardos.

iv. Regresión en el tiempo.

v. Regresión compuesta; retardos y tiempo.

3) Ejercicio práctico.

i. 3.1 Metodología y software. El programa Geoda.

ii. 3.2 Indicador. Tasa Municipal de desempleo.

iii. 3.3 Resultados y discusión.

4) Conclusiones y Desarrollos Futuros.

La comunicación que presentamos se enmarca en el proyecto de investigación doctoral en el que ambos autores trabajan. El ejercicio práctico se desarrollará en base a los datos facilitados por el Instituto de Estadística y Cartografía de Andalucía (IECA) para el periodo comprendido entre los años 2002 y 2019.

Presentamos por tanto una comunicación eminentemente práctica, cuyos resultados y posibles desarrollos aspiran al avance en el conocimiento tanto para el corpus de investigación de la “Sociología del paro", como para las metodologías conectadas con los desarrollos de Sistemas de Información Geográfica (GIS), el Big Data y la estadística sociométrica espacial.

Introducción abreviada a la autocorrelación espacial en perspectiva sociológica.Notas introductorias sobre autocorrelación espacial.

Por autocorrelación, o dependencia espacial según otros autores, se plantea una relación de indicadores en las que el territorio se configura como variable independiente, o siendo más precisos en la definición, explicativa, de los fenómenos sociales (Acevedo-Blanco, 2019).

Los hechos sociales no pueden explicarse a partir de un modelo científico de tabula rasa pues ocurren y se desarrollan en lugares y territorios concretos. El territorio configura y moldea a las sociedades o lo que es lo mismo, espacio geográfico y sociedad son mutuamente constructivos. Las particularidades de los individuos, las sociedades y el espacio geográfico donde se desarrolla el mundo vida de las personas correlacionan entre sí influyendo en los comportamientos, definiciones e identidades colectivas (Soja, 1980). Por tanto, no cabe duda que resulta más que pertinente incluir en los modelos explicativos de las ciencias sociales el territorio entre las variables explicativas de los fenómenos sociales (Agnew, 1996).

Desde el inicio de la Sociología como ciencia social el territorio ha jugado un papel importante en la explicación de los hechos sociales. Ya en el “El Suicidio” de Emilie Durkheim (1992) se ponía en valor el espacio físico geográfico como otra de las variables explicativas del hecho social de suicidio. Conexionar contextos geográficos y fenómenos sociales ha sido una constante sociológica desde los trabajos de Sorokin y los posteriores desarrollos tanto en la Escuela de Chicago, como con posterioridad en la Escuela de los Angeles (Porter, 2011).

Los avances en computación y Sistemas de Información Geográfica (SIG) han posibilitado el desarrollo de propuestas multidisciplinares y modelos explicativos de conexión en ciencias sociales. Dentro de este paradigma el Análisis Espacial Exploratorio (ESDA por sus siglas en inglés)[footnoteRef:2] se plantea de gran utilidad en la formulación de modelos estadísticos capaces de conectar en su procedimiento, disciplinas tan afines y dispares a la vez como la Geografía, Sociología, Economía, Criminología o Marketing (Chasco & Fernández-Avilés, 2009). [2: Exploratory Spatial Data Analysis ]

Anselin define define ESDA como “conjunto de técnicas que describen y visualizan distribuciones espaciales, identifican localizaciones atípicas (“spatial outliers”), descubren esquemas de agrupación espacial, asociaciones (“clusters”) o puntos calientes (“hot spots”) y sugieren estructuras espaciales u otras formas de dependencia” (Anselin, 1999:68). De esta definición se desprende que los indicadores sociales pueden estar condicionados por estructuras o esquemas de dependencia espacial. Dilucidar estos patrones de dependencia resulta especialmente recomendable pues llegado el caso, pueden llegar a invalidar los modelos estadísticos por la posible “inestabilidad estructural en forma de varianza no constante de los residuos de una regresión (heteroscedasticidad, o en los coeficientes del modelo” (Anselin, 2007:4).

El estadístico I de Moran.

En síntesis el estadístico I de Moran (Moran, 1950) es un coeficiente de Pearson resultante de la correlación entre ubicaciones y retardo espacial. Al igual que el coeficiente de correlación de Pearson el estadístico I de Moran expresa una medida de autocorrelación espacial con valores que van desde -1 a 1 donde el valor 1 indica correlación perfecta, 0 ausencia de correlación y -1 dispersión perfecta.

Por retardo se entiende el promedio ponderado del indicador en la ubicaciones vecinas a una dada. Para operacionalizar los criterios de vecindad el usuario introduce una matriz de todas las ubicaciones donde la intersección entre filas y columnas marca los criterios de contigüidad asignando valor 1 para ubicaciones vecinas y valor 0 para las no vecinas. Los criterios de contigüidad, operacionalización de las matrices y clasificaciones de vecindad escapan de los límites de esta comunicación. Para el lector interesado la Profesora e investigadora Coro Chasco en la obra que a continuación se referencia realiza una profunda revisión, en castellano, de los conceptos y métodos básicos necesarios para adentrarse con garantías en el campo de la correlación espacial (Chasco & Fernández-Avilés, 2009).

La representación gráfica del índice se propone por Luc Anselin (Anselin, 1995) presenta en puntuaciones estandarizadas (media 0 desviación típica 1) la variable en el eje de abscisas x y su retardo espacial (promedio ponderado de valores de los vecinos) en el eje de ordenadas y . La línea de ajuste de pendiente representa el índice I de Moran dividiéndose la representación gráfica en cuatro cuadrantes que numerados siguiendo el sentido de las agujas del reloj representan:

•Cuadrante 1. Variable por debajo de la media / retardo por encima de la media. Este cuadrante incluye objetos espaciales que no responden a la situación de correlación espacial. En este caso se trata de municipios con valores inferiores a la media con vecinos que superan el valor medio del indicador.

•Cuadrante 2. Variable por encima de la media / retardo por encima de la media. (Hot spots / High-High. Puntos calientes) Se incluyen en este cuadrante municipios con altos valores del índice rodeados de vecinos con valores altos. Autocorrelación espacial positiva con valores altos con relación a la media.

•Cuadrante 3. Variable por debajo de la media/ retardo por debajo de la media. (Cold spots / Low-Low. Puntos fríos). En este cuadrante encontramos zonas de municipios con valores bajos con respectos a la media de la variable. Situación de Autocorrelación espacial positiva con valores bajos relativos a la media.

•Cuadrante 4. Variable por encima de la media / retardo por debajo de la media. Este cuadrante se presenta opuesto al Cuadrante 1. La ventaja de esta representación gráfica en cuadrante permite la detección de outliers ya que los valores de los municipios no están correlacionados con los valores de estos en sus ubicaciones circundantes.

La Correlación Espacial Bivariante entre eventos temporales.

La especificación bivariante a menudo da lugar a malinterpretaciones que asumen la correlación entre variables en la misma ubicación. El concepto y procedimiento correcto es el de entender la Correlación Espacial Bivariante como la relación entre el valor de una variable en una ubicación determinada con el retardo espacial de otra variable. Por ejemplo, relacionar la tasa de paro de un determinado municipio con los ingresos medios por unidad de consumo de las ubicaciones vecinas.

Un enfoque alternativo podría plantearse en cuanto a relacionar el valor de una determinada variable en una ubicación con el valor de la misma variable en momentos anteriores en el tiempo. Expresado, en otros términos, plantear una correlación espacial bivariada medida en dos puntos en el tiempo .

Por tanto, una posible interpretación debemos plantearla en los términos de comprender la relación espacial de dependencia entre los valores pasados del indicador en los territorios vecinos y un valor actual del indicador en las ubicaciones concretas. Se plantea de esta forma una correlación de pasado que predice el futuro.

Si bien en para el cálculo de la I de Moran en la correlación espacial univariante establecer los términos e un mero formalismo, cuando se planteen correlaciones espaciales bivariantes entre eventos temporales resulta necesario tener en cuenta la especificación correcta del modelo de regresión lineal pues se puede llegar a cometer el error de plantear los términos a la inversa dando lugar a la falacia de una proposición de futuro prediciendo el pasado.

Ejercicio práctico.

Para este ejercicio reproducimos con datos reales de desempleo en Andalucía el procedimiento que se sigue en el libro de trabajo de Geoda (Anselin, 2020).

Metodología y software. El programa Geoda.

GeoDa presenta un programa de entorno amigable, interactivo, que propone traducir datos en relaciones o patrones espaciales de comportamiento de las variables (Li et al., 2015). El propósito y desarrollo del software plantea ir más allá del simple mapeo de variables incorporando a los gráficos adecuados para el análisis espacial, estadísticos y pruebas de dependencia espacial especialmente útiles para la investigación social geográfica, de geomarketing y/o econométrica espacial (Chasco, 2006).

Indicador; Tasa Municipal de desempleo.

La Tasa Municipal de Desempleo (TMD), se desarrolla por el Instituto de Estadística y Cartografía de Andalucía (IECA, 2019) proponiendo un indicador de municipal de desempleo cociente de sumar en el denominador el registro de “Demandantes de empleo no Ocupados” (DENOS) a los “Afiliados a la Seguridad Social en alta laboral que trabajan en Andalucía” (ASSrm). El numerador resulta del registro DENOS.

Denominador y numerador se presentan desagregados municipalmente representado el primero una aproximación a la población activa municipal. El cálculo de la tasa refleja la media anual de los registros por municipio.

TMD=DENOS / (DENOS + ASSrm)

Procedimiento.Transformación de variables.

Para el desarrollo del ejercicio práctico se construyen cuatro variables producto de:

1. Estandarizar las Tasas municipales de desempleo de los años 2012 y 2019.

2. Calcular los retardos espaciales estandarizados para las variables anteriores.

Variable

Variable transformada

TMD12 (Gráfico 1)

TMD12st (Mapa 1)

TMD19 (Gráfico1)

TMD19st (Mapa 2)

Retardo TMD12

Wtmd12st

Retardo TMD19

Wtmd19st

Gráfico 1 Box Plot Tasa Municipal de Desempleo 2012-2019

Fuente: Elaboración propia con GeoDa a partir IECA

Mapa 1 Tasa Municipal de Desempleo año 2012. Valores estandarizados.

Fuente: Elaboración propia con GeoDa

Mapa 2 Tasa Municipal de Desempleo año 2019. Valores estandarizados.

Fuente: Elaboración propia con GeoDa

El Gráfico (1), box plot, muestra conjuntamente la distribución, atípicos y estadísticos descriptivos de las variables TMD12 y TMD19. Un análisis detallados de los principales estadísticos y distribuciones excedería de los límites de esta comunicación por lo que simplemente nos centraremos en visualizar rápidamente el gráfico para comprobar como la Tasa Municipal de Desempleo desciende de media ocho puntos en los ocho años de periodo de tiempo que comprenden ambas variables.

Con respecto a los Mapas (1 y 2) hay que señalar que ambos reproducen el mapeo de las variables con puntuaciones estandarizadas, o lo que es lo mismo, con puntuaciones relativas a la distancia con respecto de la media de la distribución. La interpretación debe de plantearse en el sentido de comprobar si entre un periodo y otro de tiempo los territorios y ubicaciones concretas ocupan la misma posición de paro con respecto a la media del conjunto de municipios andaluces. Al igual que se apuntó en el gráfico anterior un análisis detallado excede los propósitos de esta ponencia. Simplemente señalar que los mapas parecen dejar entrever una diferencia profunda entre regímenes de paro de Andalucía Oriental con la Andalucía Occidental.

Especialmente significativo resulta el indicador de paro para el valle del río Guadalquivir y la provincia de Cádiz. Si bien con los mapas que presentamos no se llega a señalar con precisión si los descensos en el indicador para estos territorios han sido similares a los de otros, si podemos señalar como comarcas y municipios con tasas de paro altos permanecen dentro del conjunto autonómico relegadas estructuralmente a ocupar puestos que sobrepasan los límites medios de desempleo en Andalucía.

Correlación entre eventos temporales.

Gráfico 2 Diagrama de dispersión x=TMD12st / y=TMD19st.

Fuente: Elaboración propia con GeoDa

La correlación entre eventos temporales se puede ejemplificar como la relación entre una variable y su retardo en el tiempo (x=TMD12st / y=TMD19st.). Esta relación produce una pendiente muy significativa 0.765 sugiriendo una correlación temporal muy fuerte de la variable a lo largo del tiempo.

En otras palabras, la pendiente del Gráfico (2) sugiere una fuerte correlación del paro a través del tiempo. Las ubicaciones que tasas altas de desempleo, y viceversa, presentan altas tasas de desempleo en eventos temporales posteriores. Esta correlación apunta al desempleo como elemento estructural en Andalucía. Municipios con alto nivel de desempleo continúan manteniendo las posiciones altas del ranking casi una década después.

Correlación entre retardos.

Gráfico 3 Diagrama de dispersión x=Wtmd12st / y=Wtmd19st.

Fuente: Elaboración propia con GeoDa

La correlación entre retardos espaciales sugiere una alta correlación entre los dos periodos de tiempo (x=Wtmd12st / y=Wtmd19st). Es lógico, por otra parte, pensar que si existe una alta correlación de la variable entre diferentes momentos en el tiempo también exista una fuerte correlación temporal entre sus vecinos. En el Gráfico (3) nuevamente se arroja una pendiente positiva muy significativa 0.902 incluso más alta que para la correlación de la variable en el tiempo.

Recordemos que el retardo es el promedio ponderado de los valores vecinos a una ubicación dada. Por tanto, la correlación entre retardo y tiempo sugiere aún más el carácter estructural del desempleo en Andalucía. Si traducimos retardos por territorios observamos como los territorios con altas tasas de paro en 2012 mantienen el mismo nivel alto de desempleo una década después.

Regresión en el tiempo.

Gráfico 4 Diagrama de dispersión x=Wtmd12st / y=TMD19st.

Fuente: Elaboración propia con GeoDa

La formulación más apropiada para una regresión espacio-temporal se expresa como los valores de los retardos espaciales pueden difundirse ubicaciones a las ubicaciones asociadas en periodos de tiempo posteriores (x=Wtmd12st / y=TMD19st). De nuevo el valor de la pendiente es bastante significativa 0.902, casi próxima a 1. Esta correlación casi perfecta apunta hacia una fuerte difusión del desempleo.

Expresado en los términos que ocupan a esta ponencia, la correlación espacial propone que los territorios determinan en gran medida la tasa municipal de desempleo de las ubicaciones a las que pertenecen. Por tanto, los resultados parecen indicar un efecto difusión del territorio o la influencia que ejercen los vecinos en los niveles de desempleo municipal en Andalucía.

Regresión compuesta; retardos y tiempo.

Tabla 1Informe de Regresión.

----------

SUMMARY OF OUTPUT: ORDINARY LEAST SQUARES ESTIMATION

Data set : TMD_2019

Dependent Variable : TMD19st Number of Observations: 786

Mean dependent var :-1.1259e-015 Number of Variables : 3

S.D. dependent var : 0.999364 Degrees of Freedom : 783

R-squared : 0.609165 F-statistic : 610.201

Adjusted R-squared : 0.608166 Prob(F-statistic) : 0

Sum squared residual: 306.806 Log likelihood : -745.574

Sigma-square : 0.391834 Akaike info criterion : 1497.15

S.E. of regression : 0.625966 Schwarz criterion : 1511.15

Sigma-square ML : 0.390338

S.E of regression ML: 0.62477

Variable Coefficient Std.Error t-Statistic Probability

CONSTANT -0.0117944 0.0223929 -0.526704 0.59855

Wtmd12st 0.297286 0.0431197 6.89444 0.00000

TMD12st 0.63884 0.0288919 22.1114 0.00000

REGRESSION DIAGNOSTICS

MULTICOLLINEARITY CONDITION NUMBER 2.118972

TEST ON NORMALITY OF ERRORS

TEST DF VALUE PROB

Jarque-Bera 2 233.5708 0.00000

DIAGNOSTICS FOR HETEROSKEDASTICITY

RANDOM COEFFICIENTS

TEST DF VALUE PROB

Breusch-Pagan test 2 426.7378 0.00000

Koenker-Bassett test 2 190.6018 0.00000

============================== END OF REPORT ================================

Fuente: Elaboración propia con GeoDa.

Para finalizar se incluye en la especificación de la regresión tanto la variable retardo en el tiempo (Wtmd12st) como la correlación de la variable entre eventos temporales (TMD2012st). Al controlar el efecto conjunto de las variables en un modelo de regresión múltiple los coeficientes se reducen con respecto a anteriores estimaciones.

Los coeficientes de las pendiente tanto de la variable Wtmd12st (0.29) como el de la variable TMD2012st (0.63) resultan positivos señalando por tanto un efecto de correlación en las ubicaciones tanto de los valores anteriores en el tiempo de la propia ubicación, como con los valores de los retardos espaciales en el evento temporal anterior.

Conclusiones y Desarrollos Futuros.

Este trabajo ha desarrollado una propuesta alternativa a la correlación espacial bivariante normalmente utilizada planteando la dependencia de los hechos sociales con la perspectiva del espacio-tiempo. Desde un punto de vista estrictamente estadístico y/o econométrico ESDA está especialmente indicado para planteamientos exploratorios iniciales que posteriormente puedan servir de base generadora de teoría emergente y desarrollo de posteriores análisis confirmatorios.

Siguiendo la línea apuntada hemos podido comprobar la correlación existente a través del tiempo en el caso del desempleo en Andalucía. Territorios (retardos) y municipios (ubicaciones) correlacionan en sus indicadores de desempleo espacial y temporalmente. Esta dependencia del contexto espacial-temporal del paro andaluz sugiere una conclusión dominante para la comunicación; “el carácter estructural, longitudinal, focalizado y dependiente del contexto territorial del desempleo en Andalucía”.

Desde este prisma exploratorio se plantean diferentes propuestas y alternativas de investigación. En primer lugar, para precisar los cálculos, resultaría interesante comprobar las diferencias entre tasas de desempleo en el periodo de trabajo propuesto (2002-2019). Para esta alternativa utilizaríamos el estadístico “Diferencial I de Moran” para comprobar la correlación localizada en cuanto al indicador. Posteriormente se localizarían mediante clústeres LISA (Local Indicators Spatial Association) los territorios en los que el aumento o descenso del desempleo en el periodo de tiempo han sido más acusados.

En segundo lugar, y partiendo de los efectos que para el empleo en Andalucía ha tenido la pandemia de la COVID 19, los resultados de este análisis exploratorio proponen comprobar la localización, dependencia territorial y discontinuidad en la tendencia del indicador de paro municipal.

Por último, apoyados en la necesaria triangulación de métodos, resultaría interesante desarrollar futuros planteamientos de investigación de corte cualitativo basándonos en estudios de caso dentro de los marcos geográficos que delimitan las propuestas del ESDA. Esta línea de trabajo se plantea como la segunda parte del proyecto de tesis doctoral que el primer autor desarrolla bajo la dirección de la segunda autora de esta comunicación.

Hemos querido con esta ponencia en el X Congreso Andaluz de Sociología proponer un ejercicio meramente experimental, encaminado al estudio del principal problema social en Andalucía, el paro. Las conclusiones de este trabajo proponen el carácter estructural del desempleo en Andalucía. Cuando todas las políticas y medidas para paliar el desempleo se centran en un paradigma de desempleado deficitario de inputs de empleabilidad, una explicación geo-sociológica, en la que el territorio de residencia se plantea como otra de las variables dependientes de la situación de desempleo, se hace cada vez más necesaria en orden a plantear soluciones al principal lastre para el desarrollo de Andalucía como sociedad.

Referencias.

Acevedo-Blanco, A.-J. (2019). ESDA con software GEODA. El territorio como variable explicativa en el análisis sociológico. In Estrella Gualda Caballero (Ed.), Sociedades y Fronteras. Actas del IX Congreso Andaluz de Sociología (Collectane, pp. 543–569). UHU.ES PUBLICACIONES. Servicio de Publicaciones de la Universidad de Huelva. http://www.uhu.es/publicaciones/?q=libros&code=1208

Agnew, J. (1996). Mapping politics: how context counts in electoral geography. Political Geography, 15(2), 129–146. https://doi.org/10.1016/0962-6298(95)00076-3

Anselin, L. (1995). Local Indicators of Spatial Association—LISA. Geographical Analysis, 27(2), 93–115. https://doi.org/10.1111/j.1538-4632.1995.tb00338.x

Anselin, L. (1999). The future of spatial analysis in the social sciences. Geographic Information Sciences, 5(2), 67–76. https://doi.org/10.1080/10824009909480516

Anselin, L. (2007). Spatial Econometrics. In A Companion to Theoretical Econometrics (pp. 310–330). wiley. https://doi.org/10.1002/9780470996249.ch15

Anselin, L. (2020). Global Spatial Autocorrelation (2). Geoda WorkBook. http://geodacenter.github.io/workbook/5b_global_adv/lab5b.html#bivariate-spatial-correlation---a-word-of-caution

Chasco, C. (2006). Análisis estadístico de datos geográficos en geomarketing: el programa GeoDa. Distribución y Consumo, ISSN 1132-0176, 178, 34. http://www.mercasa.es/files/multimedios/1290704766_DYC_2006_86_34_45.pdf

Chasco, C., & Fernández-Avilés, G. (2009). Análisis de datos espacio-temporales para la economía y el geomarketing. Netbiblo.

Durkheim, E. (1992). El suicidio (Vol. 37). Ediciones Akal.

IECA. (2019). Instituto de Estadística y Cartografía de Andalucía. Sistema de Información Multiterritorial de Andalucía (SIMA). TASA MUNICIPAL DE DESEMPLEO. https://www.juntadeandalucia.es/institutodeestadisticaycartografia/badea/operaciones/consulta/anual/26168?CodOper=b3_151&codConsulta=26168

Li, X., Anselin, L., & Koschinsky, J. (2015). GeoDa Web - Enhancing Web-based mapping with spatial analytics. In H. Y., A. M., S. J., R. M., & G. M. (Eds.), 23rd ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems, ACM SIGSPATIAL GIS 2015 (Vols. 03-06-Nove). Association for Computing Machinery. https://doi.org/10.1145/2820783.2820792

Moran, P. (1950). Notes on Continuous Stochastic Phenomena. Biometrika, 37(1/2), 17–23. http://www.jstor.org/stable/2332142

Porter, J. R. (2011). Context, Location, and Space: The Continued Development of our “Geo-Sociological” Imaginations. The American Sociologist, 42(4), 288–302. https://doi.org///dx.doi.org.ezproxy.uned.es/10.1007/s12108-011-9131-4

Soja, E. (1980). The Socio-Spatial Dialectic. Annals of the Association of American Geographers, 70(2), 207–225. http://www.jstor.org.ezproxy.uned.es/stable/2562950

1