análisis de la estructura en la distribución de los ... · this paper describes and infers the...
TRANSCRIPT
i
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL
Facultad de Ciencias Naturales y Matemáticas
TRABAJO FINAL DE LA MATERIA INTEGRADORA
“Análisis de la estructura en la distribución
de los ingresos de los ecuatorianos usando
modelo de regresión cuantílica robusta”
INFORME DE PROYECTO INTEGRADOR
Previa a la obtención del Título de:
INGENIERA EN ESTADÍSTICA INFORMÁTICA
Presentado por:
WILSON ABDÓN ORDÓÑEZ RAMOS
GUAYAQUIL – ECUADOR
AÑO: 2017
ii
AGRADECIMIENTOS
“Agradezco en primer lugar a mis padres
Wilson Ordóñez Vicuña y Marilyn Ramos
Grande por su apoyo de toda las etapas de
mi vida, y también agradezco a mis
compañeros y profesores de la
Universidad por su apoyo por mi pasó en
la ESPOL”.
iii
DECLARACIÓN EXPRESA
"La responsabilidad del contenido desarrollado en la presente propuesta de la
materia integradora corresponde exclusivamente a Wilson Abdón Ordóñez Ramos
y el patrimonio intelectual del mismo a la ESCUELA SUPERIOR POLITÉCNICA
DEL LITORAL”
Wilson Abdón Ordóñez Ramos
iv
RESUMEN
En este trabajo se describe e infiere la estructura de la distribución de los ingresos
que obtiene los ecuatorianos por su trabajo ajustados a la horas de trabajo y a la
inflación para representar mejor su poder adquisitivo que recibe debido a las horas
dedicado a su actividad laboral, en este estudio se destaca que ha habido un
aumentos significativo de los ingresos desde el 2007 hasta el 2014, en la
desigualdad medidos en ratios cuantílicos ha disminuido significativamente desde
2007 hasta el 2014 y aumentado desde el 2015 al 2016. En el lado de la distribución
por sexo, se observa que existe una brechas entre los ingresos a favor del hombre
y esta brecha es mayor entre las personas que recibe los menores ingresos por
sus horas de trabajos en comparación aquellos que recibe un mayor ingresos,
además se observa que en la zona geográfica Costa la desigualdad es mayor en
las áreas urbanas que rurales, hecho que no se observa en otras zonas
geográficas, aunque esta diferencia ha ido disminuyendo con los años y por último
tenemos que aquellos con educación superior recibe mayor ingresos por su trabajo
en comparación a aquellos que no tiene este nivel de instrucción.
Palabras clave: ingresos, ratios de desigualdad, regresión cuantilica robusta,
distribución, trabajo, INEC, ENEMDU. Ecuador.
v
ABSTRACT
This paper describes and infers the structure of the income distribution that
Ecuadorians obtain by their work adjusted to the hours of work and inflation to get
better representation of their purchasing power that receive due to the hours
dedicated to their work activity, in This study highlights that there has been a
significant increase in income from 2007 to 2014, the inequality measured in
quantile ratio has declined significantly from 2007 to 2014 and increased from 2015
to 2016. On the distribution side by Sex, it is observed that there is a gap between
income in favor of men and this gap is higher among people who receives the lowest
income for their work hours compared to those who receive a higher income, in
addition it is observed that in the geographical area Coastal, the inequality is greater
in urban than rural areas, this phenomenon is not observed in other geographical
areas, although this difference has been declining over the years and lastly it is
observed that those with higher education receive higher income for their work
compared to those who do not have this level of education.
Key words: income, ratios of inequality, robust quantile regression, distribution,
labor, INEC, ENEMDU. Ecuador.
vi
ÍNDICE GENERAL
AGRADECIMIENTOS ......................................................................................ii
DECLARACIÓN EXPRESA ............................................................................ iii
RESUMEN ......................................................................................................iv
ABSTRACT .....................................................................................................iv
ÍNDICE GENERAL ..........................................................................................vi
ABREVIATURAS .......................................................................................... viii
ÍNDICE DE TABLAS Y FIGURAS ...................................................................ix
CAPÍTULO 1 ................................................................................................... 1
1. INTRODUCCIÓN ...................................................................................... 1
1.1 Descripción del problema. .............................................................. 1
1.2 Objetivos del Proyecto. ................................................................... 1
Objetivos Generales ..................................................................... 1
Objetivos específicos .................................................................... 1
1.3 Justificación .................................................................................... 2
CAPÍTULO 2 ................................................................................................... 3
2. METODOLOGÍA ....................................................................................... 3
2.1 Origen y Estructuración de los datos .............................................. 3
2.2 Ajustes a los valores de los Ingresos. ............................................. 4
2.2.1 Ajuste a la Inflación ............................................................ 4
2.2.2 Ajuste a la Estacionalidad .................................................. 4
2.3 Regresión cuantílica ....................................................................... 5
2.4 Modelo Robusto para la regresión cuantílica usando clase generalizada
de distribuciones asimétricas. ...................................................................... 5
2.5 Familias de Distribuciones Asimétricas .......................................... 6
2.5.1 Definición de la Normal Asimétrica .................................... 6
2.5.2 Definición de la Familia de Distribuciones Asimétrica ........ 7
2.6 Estimación de los parámetros del modelo de regresión cuantílica robusta
usando distribuciones asimétricas. .............................................................. 7
2.7 Estimación de la variancia de los parámetros de una regresión usando
errores con distribuciones asimétricas. ........................................................ 9
2.8 Estimación de los parámetros con los datos ponderados por
observaciones. ........................................................................................... 10
2.9 Análisis de los ingresos y desigualdad con regresión cuantílica. .. 11
vii
CAPÍTULO 3 ................................................................................................. 14
3. ANÁLISIS DESCRIPTIVO ...................................................................... 14
3.1 Distribución e Histograma de la variable lh=log(INGH) ................. 14
3.2 Descripción General de los cuantiles por año ............................... 15
3.3 Descripción General de los cuantiles por año y Sexo ................... 15
3.4 Descripción General de los cuantiles por Año y Áreas ................. 16
3.5 Descripción General de los cuantiles por Año y Zonas ................ 17
3.6 Descripción General de los cuantiles por Año y Educación .......... 18
3.7 Descripción General de los cuantiles por Año y Años de Experiencia 19
3.8 Cuantiles por Áreas, Zona, Sexo y Años de la Encuesta ............. 20
3.9 Cúantiles por Nivel de Instrucción, Área, Sexo y Años de la Encuesta 23
3.10 Cúantiles por Nivel de Instrucción, Años de ocupación, Área, Sexo y
Años de la Encuesta .................................................................................. 23
CAPÍTULO 4 ................................................................................................. 25
4. INFERENCIA CON MODELOS ESTADÍSTICO ..................................... 25
4.1 Modelo 1: Ingresos con respecto al Tiempo (INGH~ANIO) .......... 25
4.2 Modelo 2: Ingresos con respecto al tiempo, Zona geográfica y Área rural
o urbana (INGH~ANIO*ZONA*AREA) ....................................................... 28
4.3 Modelo 3: Ingresos con respecto al Tiempo, Zona, Área y Sexo
(INGH~ANIO*ZONA*AREA*SEXO) ........................................................... 31
CONCLUSIONES ......................................................................................... 33
5. CONCLUSIONES ................................................................................... 33
RECOMENDACIONES ................................................................................. 33
6. RECOMENDACIONES ........................................................................... 33
BIBLIOGRAFÍA ............................................................................................. 34
APÉNDICES ................................................................................................. 35
APÉNDICE A ................................................................................................ 36
Archivos en el CD ......................................................................................... 36
viii
ABREVIATURAS
ENEMDU Encuesta Nacional de Empleo, Desempleo y Subempleo
INEC Instituto Nacional de Estadística y Censos
IPC Índice del Precio al Consumidor
v.a. Variable Aleatoria
ix
ÍNDICE DE TABLAS Y FIGURAS
Tabla 2.1: Diccionario de Variables ................................................................. 3
Tabla 2.2: 𝜿, 𝒉𝒖|𝝂 y función de densidad de algunos de los miembros de la familia
asimétrica. ....................................................................................................... 7
Tabla 2.3: Distribución Condicional de 𝑼 dada 𝒀 por cada distribución especifica de
SKD. ................................................................................................................ 9
Tabla 3.1 Valores de los parámetros ............................................................ 15
Tabla 4.1 Valores de los parámetros ............................................................ 25
Tabla 4.2 Estimación de los ingresos por Cuantiles y años .......................... 25
Tabla 4.3 Valores de los parámetros ............................................................ 28
Tabla 4.4 Valores de los parámetros ............................................................ 29
Tabla 4.5 Valores de los parámetros ............................................................ 31
Tabla 4.6 Valores de los parámetros ............................................................ 31
Figura 3.1 Histograma y Ajuste de Distribución de la variable Ingresos en escala
logarítmica..................................................................................................... 14
Figura 3.2 Ingresos por Cuantiles y Años ..................................................... 15
Figura 3.3 Ratios de Desigualdad por Años .................................................. 15
Figura 3.4 Ingresos por Cuantiles, Años y Sexo .......................................... 16
Figura 3.5 Ingresos por Cuantiles, Años y Sexo .......................................... 16
Figura 3.6 Ingresos por Cuantiles, Años y Áreas .......................................... 17
Figura 3.7 Ratios de Desigualdad por Años y Áreas ..................................... 17
Figura 3.8 Ingresos por Cuantiles, Años y Zonas ......................................... 18
Figura 3.9 Ratios de Desigualdad por Años y Zonas .................................... 18
Figura 3.10 Ingresos por Cuantiles, Años y Educación ................................. 19
Figura 3.11 Ratios de Desigualdad por Años y Educación .......................... 19
Figura 3.12 Ingresos por Cuantiles, Años y Años de experiencias ............... 20
Figura 3.13 Ratios de Desigualdad por Años y Años de experiencias .......... 20
Figura 3.14 Gráficas de la evolución de los Ingresos desde el año 2003 separado
por Género, Área, Cuantiles y Región .......................................................... 21
Figura 3.15 Gráficas de la evolución de los Ingresos desde el año 2003 separado
por Género, Área, Cuantiles y Nivel de Instrucción ....................................... 23
Figura 3.16 Gráficas de la evolución de los Ingresos desde el año 2003 separado
por Género, Área, Cuantiles y Nivel de Instrucción ....................................... 24
Figura 4.1 Porcentaje de cambio en los ingresos por años consecutivos ..... 27
Figura 4.2 Porcentaje de Cambio de ratios entre años consecutivos. .......... 27
Figura 4.3 Porcentaje cambio en los ingresos en los cuantiles debido al área urbana
y rural ............................................................................................................ 30
Figura 4.4 Porcentaje de cambio entre los ratios de desigualdad de las Áreas
Urbana con respecto al Rural........................................................................ 30
Figura 4.5 Proporción de los Ingresos entre Hombre/Mujer .......................... 32
x
CAPÍTULO 1
1. INTRODUCCIÓN
1.1 Descripción del problema.
Con el propósito de conocer las causas de las desigualdades en los
ingresos de los ecuatorianos y describir la manera que se distribuye los
ingresos, aquello para fundamentar los planes de desarrollo del país, es
importante conocer y medir los ingresos y la desigualdad entre las
regiones geográficos sea de la zona rural o urbana , y los distintos grupos
humanos objeto de este estudio, a fin de verificar si existen diferencias
significativas entre los ingresos y la desigualdad de estos grupos, y a la
vez identificar qué variables podrían afectar al aumento o disminución de
los ingresos y la desigualdad.
El proyecto se propone seleccionar y aplicar modelos de regresión
cuantílica robusta que permitirán describir la desigualdad y los ingresos
de los grupos humanos por diferentes regiones del país sea de la zona
rural o urbana . Además se verificara si existen diferencias significativas
entre los grupos de diversa edad, educación y sexo.
1.2 Objetivos del Proyecto.
Objetivos Generales
Determinar las variables significativas que afecta la desigualdad de
ingresos y los ingresos en sí de los ecuatorianos en la población objetivo,
contribuyendo al mejoramiento del plan de desarrollo del país.
Objetivos específicos
Determinar los modelos de regresión cuantílica seleccionando el
más adecuado a la muestra recogida.
Analizar los ratios de desigualdad en base de los modelos de
regresión cuantílica estableciendo las variables significativas.
Establecer las relaciones más significativas entre las variables
describiendo el nivel de desigualdad entre ingresos.
2
1.3 Justificación
En este proyecto propone usar y seleccionar modelos de regresión
cuantílica robusta que permitirá describir la desigualdad en ingresos de
los diferentes grupos humanos por diferentes ciudades del país y
además verificar si existe diferencia significativa entre los grupos de
diferentes edad, educación y Género.
3
CAPÍTULO 2
2. METODOLOGÍA
2.1 Origen y Estructuración de los datos
Los datos fueron obtenidos de las bases de datos generadas por la
“Encuesta Nacional de Empleo, Desempleo y Subempleo” (INEC, La
Encuesta de Empleo, Desempleo y Subempleo, 2007-2016) (ENEMDU)
que lo realizan desde el año 2000, para este trabajo se usó los datos del
ENEMDU realizados entre el 2007 y el 2016, debido a que las bases de
datos de estos años contienen todas las variables que es de nuestro
interés estudiar, estas variables se especifica en la Taba #1. Entre 2007
y el 2016 existen 34 archivos “.sav” donde se guarda las bases de datos
de los ENEMDU realizados, todos estos archivos fueron depurado y
estructurado en uno solo, al final se analizó 478 000 observaciones que
corresponde a la población objetico que son las personas que percibe
algún tipo de ingreso mensual.
Tabla 2.1: Diccionario de Variables
Variables Usada Código Nombres Originales/Formula
Sexo de la Persona SEXO En las bases de datos está con el código:
SEXO o P02
Edad de la Persona EDAD EDAD o P03
Región geográfica donde
reside
ZONA RN
Área Rural o Urbana AREA AREA
Hora Total que trabaja a la
semana
HORT =P51A+P51B+P51C
Suma de las Horas trabajadas en todas las
actividades
Ingresos por cada 160
horas de trabajos
INGH =INGRL/(HORT)*160
4
Variables Usada Código Nombres Originales/Formula
Este resultado es ajustado por medio del IPC
al su equivalente para enero del 2016 y
ajustado en base a la mediana de cada mes
Nivel máximo de
instrucción
EDUC P03, NIVINST,P10A
Años de experiencia
ejerciendo su ocupación
principal
ANT1 P45
Factor de Expansión FACT FEXP
Año de la Encuesta
ENEMDU
ANIO (En la nombre de las bases de datos Indica)
Mes de la Encuesta MES (En el nombre de las bases de datos indica)
Fuente: Elaboración Propia
2.2 Ajustes a los valores de los Ingresos.
2.2.1 Ajuste a la Inflación
El poder adquisitivo que te otorga cierta cantidad de dinero aumenta
o disminuye de manera dinámica, debido a que el nivel general de los
precios de los bienes, medido con el Índice del Precio al Consumidor
(IPC) (INEC, Índice de Precios al Consumidor, 2014), no se mantiene
constante y fluctúa a través del tiempo (inflación o deflación). Con el
propósito de reducir este efecto en el análisis, se ajustó los valores de
los ingresos proporcionalmente al IPC tal como se muestra en la
expresión 2.1.
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑠 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 𝑎 𝑙𝑎 𝐼𝑛𝑓𝑙𝑎𝑐𝑖ó𝑛 =
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑠𝐼𝑃𝐶𝑚𝑒𝑠−1,𝑎ñ𝑜
𝐼𝑃𝐶01,2016
(2.1)
2.2.2 Ajuste a la Estacionalidad
Los meses en que se realizó las encuestas pueden presentar
características estacionarias, con el objetivo de reducir este efecto se
propone ajustar los Ingresos al mes de diciembre usando
proporciones de medianas, tal como se indica en la expresión 2.2
5
𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑠 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 𝑎 𝑙𝑎 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑑𝑎𝑑
= 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑠𝑀𝑒𝑑𝑖𝑎𝑛𝑎(𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑠𝑑𝑖𝑐𝑖𝑒𝑚𝑏𝑟𝑒)
𝑀𝑒𝑑𝑖𝑎𝑛𝑎(𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑠𝑚𝑒𝑠)
(2.2)
2.3 Regresión cuantílica
La regresión cuantílica es un tipo de regresión que busca predecir los
cuantiles condicionado de una variable aleatoria 𝑌, dado las variables
dependientes 𝑋 (𝑥1, 𝑥2, 𝑥3, … ) a través de una relación lineal, tal como
se muestra en la expresión 2.3. (Koenker, 2005)
𝑄𝑝(𝑌|𝑥1, 𝑥2, … , 𝑥𝑛) = 𝛽0𝑝 + 𝛽1𝑝𝑥1 + 𝛽2𝑝𝑥2 + ⋯ + 𝛽𝑛𝑝𝑥𝑛 (2.3)
Donde 𝑄𝑝(𝑌|𝑥1, 𝑥2, … , 𝑥𝑛) es el cuantíl 𝑝 de la v.a. 𝑌, dado las variables
dependientes 𝑥𝑖 ’s, y 𝛽0𝑝, 𝛽1𝑝, … , 𝛽𝑛𝑝 son los coeficientes de la regresión,
las cuales varían según el cuantil 𝑝 que se desea predecir.
Se puede usar varios modelos estocásticos para estimar los coeficientes
lineales de los cuantiles condicionales, en este trabajo se optó por un
modelo de Robusto en base de distribuciones asimétrica.
2.4 Modelo Robusto para la regresión cuantílica usando clase
generalizada de distribuciones asimétricas.
Este modelo es propuesto en base al trabajo de Wichitaksorn
(Wichitaksorn, 2014), donde se utilizan una re-parametrización de una
familia de distribuciones asimétricas, así definiendo el parámetro de
asimétrica con 𝑝 (un número entre 0 y 1), esta re-parametrización se
realiza de manera que al calcular el cuantil coincidente con el parámetro
𝑝 de la variable aleatoria es igual a la moda (𝑄𝑝(𝑒) = 𝑀𝑜𝑑𝑎(𝑒)), dicha
parametrización facilita aplicar estas distribuciones a una regresión
cuantílica.
𝑦𝑖 = 𝛽0 + 𝑥𝑖𝑡𝛽𝑝 + 𝜀𝑖𝑝
(2.4)
𝜀𝑝𝑖 es el error del modelo mostrado de regresión en la expresión 2.4 que
son v.a independientes e igualmente distribuida con distribución
6
asimétrica, parámetro de asimetría 𝑝 , moda 0 , y otros parámetros 𝜃
propias de cada distribución asimétrica, en particular (𝜀𝑝𝑖 ~𝑆𝐾𝑁(0, 𝑝, 𝜃)),
con esto tenemos que el cuantil 𝑝 de 𝜀𝑝𝑖 es 0, y el cuantil 𝑝 la variable
𝑦𝑖 dado 𝑥𝑖 es igual a la combinación lineal de las variables dependientes
𝑥𝑖 , tal como se muestra en la expresión 2.5.
𝑄𝑝(𝑦𝑖|𝑥𝑖) = 𝛽0 + 𝑥𝑖𝑡𝛽𝑝 + 𝑄𝑝(𝜀𝑖𝑝) = 𝛽0 + 𝑥𝑖
𝑡𝛽𝑝 + 0 (2.5)
En base de la representación estocástica mostrada en la expresión 2.4
obtenemos una relación lineal del cuantil 𝑝 de la v.a 𝑦𝑖 condicionado por
𝑥𝑖.
2.5 Familias de Distribuciones Asimétricas
En esta subsección se describirá a las distribuciones pertenecientes a
la familia asimétrica que se usará en nuestro análisis.
2.5.1 Definición de la Normal Asimétrica
Decimo que 𝑋 tiene una distribución normal-asimétrica con locación
𝜇, escala 𝜎 > 0 y parámetro de asimetría 𝑝 ∈ (0,1), si esta sigue la
siguiente función de distribución
𝑓(𝑥|𝜇, 𝜎, 𝑝) =4𝑝(1 − 𝑝)
√2𝜋𝜎2𝑒
−2𝜌𝑝2(
𝑥−𝜇𝜎
) (2.6)
Sea 𝕀 la función indicador, entonces 𝜌𝑝(𝑢) = 𝑢 𝑝 − 𝕀(𝑢 < 0).
Una propiedad de la distribución normal-asimétrica es que es cerrada
bajo la transformación de escala y locación, y además se puede
expresar esta distribución en relación a la distribución normal estandar
con la expresión 2.7 (Christian E. Galarza, 2016):
𝑋 = 𝜇 + 𝜎𝐼|𝑍| (2) (2.7)
Donde 𝑍~𝑁(0,1) y la v.a. 𝐼 es discreta y tiene la siguiente función de
probabilidad:
𝑃 (𝐼 = −1
2(1−𝑝)) = 𝑝 & 𝑃 (𝐼 =
1
2𝑝) = 1 − 𝑝 (2.8)
7
2.5.2 Definición de la Familia de Distribuciones Asimétrica
Sea 𝒁~𝑁(0,1) y 𝑼 una variable aleatoria positiva, con 𝑼
independiente de 𝒁, y 𝑰 una variable aleatoria discreta tal como se
especifica en la expresión 2.8. Entonces la familia de distribuciones
asimétrica 𝒀~𝑆𝐾𝐷(𝜇, 𝜎, 𝑝, 𝜈) se define:
𝒀 = 𝜇 + [𝜎𝜅(𝑼)1/2]𝑰|𝒁| (2.9)
La función de distribución de la v.a. 𝑼 con parámetro 𝜈 se representa
con ℎ(𝑢| 𝜈), y 𝜅 es una función de v.a..
La funciones ℎ(. |𝜈) y 𝜅 se define según la familia de distribución
asimétrica que se quiere formar, esto se muestra en la tabla 2.
(Christian E. Galarza, 2016)
Tabla 2.2: 𝜿, 𝒉(𝒖|𝝂) y función de densidad de algunos de los miembros de la familia asimétrica.
Distribución 𝜿(𝒖) 𝒉(𝒖|𝝂) 𝒇(𝒚|𝝁, 𝝈, 𝝂)
t de student asimétrica
𝑢−1 𝐺 (𝜈
2,𝜈
2) 4𝑝(1 − 𝑝)Γ (
𝜈 + 12
)
Γ (𝜈2
) √𝜈𝜋𝜎(
4
𝜈𝜌𝑝
2 (𝑦 − 𝜇
𝜎) + 1)
−𝜈+1
2
Laplace Asimétrica
𝑢 𝐸𝑥𝑝(2) 2𝑝(1 − 𝑝)
𝜎𝑒
−2𝜌𝑝2(
𝑦−𝜇𝜎
)
Slash Asimétrica
𝑢−1 𝐵𝑒𝑡𝑎(𝜈, 1) 𝜈 ∫ 𝑢𝜈−1𝜙𝑠𝑘𝑑 (𝑦| 𝜇, 𝑢−
12𝜎, 𝑝) 𝑑𝑢
1
0
Normal Contaminada Asimétrica
𝑢−1 𝜈𝕀(𝑢 = 𝛾) + (1 − 𝜈)𝕀(𝑢 = 1)0 ≤ 𝜈, 𝛾 ≤ 1
𝜈𝜙𝑠𝑘𝑑 (𝑦|𝜇, 𝛾−12𝜎, 𝑝) + (1 − 𝜈)𝜙𝑠𝑘𝑑(𝑦|𝜇, 𝜎, 𝑝)
Fuente: Christian E. Galarza, 2016
𝑮( 𝜶, 𝜷) denota la distribución Gamma con parámetro de forma 𝜶 > 𝟎
y parámetro de tasa 𝜷 > 𝟎 , 𝑬𝒙𝒑(𝜷) Denota la distribución
exponencial con media 𝜷, 𝑩𝒆𝒕𝒂(𝜶, 𝜷) denota la distribución beta y
𝝓𝒔𝒌𝒅 denota la función de probabilidad de la distribución asimétrica
normal definida en la expresión 2.6.
2.6 Estimación de los parámetros del modelo de regresión cuantílica
robusta usando distribuciones asimétricas.
Sea el modelo de regresión:
𝒀𝒊~𝑆𝐾𝐷(𝑥𝑖𝑡𝛽𝑝, 𝜎, 𝑝, 𝜈) (2.10)
8
Donde 𝑌1, 𝑌2, 𝑌3,… son independiente e idénticamente distribuida, este
modelo puede ser representando en relación a la distribución normal
asimétrica condicionándolo a una variable aleatoria 𝑼 en base lo
mostrado en la expresión 2.9, así deducimos la expresión 2.11.
(𝒀𝒊|𝑼𝒊 = 𝑢𝑖)~𝑆𝐾𝑁 (𝑥𝐼𝑡𝛽𝑝, √𝜅(𝑢𝑖)𝜎, 𝑝) (2.11)
𝑈𝑖~ℎ(𝑢𝑖|𝜈) (2.12)
A partir de ahí se puede estimar los parámetros usando algoritmo EM,
donde tenemos datos observados obtenidos de 𝒀 y datos no
observados de la v.a. 𝑼. Se inicia con una estimación de los parámetros
𝜽(0) cualquiera.
Paso E: Se define la función 𝑄.
𝑄(𝜽|𝜽(𝑘)) ∝ −𝑛 log 𝜎 − 2 ∑ 𝜅−1(𝑢𝑖)̂ 𝜉𝑖2𝑧𝑖
2𝑛𝑖=1 +
∑ 𝐸[log ℎ(𝑢𝑖|𝝂) | 𝑦𝑖 , 𝜃(𝑘)]𝑛𝑖=1
(2.13)
Paso M: Encontrar 𝜽 = (𝛽𝑝, 𝜎2, 𝜈) que maximiza la función 𝑄 , que
resulta ser:
�̂�p(k+1)
= (𝐗T𝛀(k)𝐗)−1
𝐗T𝛀(k)𝐲
σ2̂(k+1)
=4
n(𝐲 − 𝐗β̂p
(k+1))
T𝛀(k) (𝐲 − 𝐗�̂�p
(k+1)) (2.14)
Donde 𝛀 es una matriz diagonal, cuyos elementos son
𝜉𝑖2𝜅−1(𝑢𝑖)̂ con 𝜉𝑖 = (1 − 𝑝)𝕀{𝑦𝑖 ≤ 𝑥𝑖
𝑡𝛽𝑝} + (𝑝)𝕀{𝑦𝑖 > 𝑥𝑖𝑡𝛽𝑝} , para 𝑖 =
1, … , 𝑛. 𝑿 la matriz de diseño y 𝒚 las observaciones.
El parámetro 𝜈 es calculado de manera numérica maximizando la
función de log-verosimilitud en base de la distribución del error de la
regresión.
9
�̂�(𝑘+1) = arg max𝝂
∑ log 𝑓 (𝑦𝑖|�̂�𝑝(𝑘+1)
, 𝜎2̂(𝑘+1)
, 𝝂)
𝑛
𝑖=1
(2.15)
Iterar el paso M hasta que la función de log-verosimilitud sea el
máximo posible.
Las funciones 𝜅−1 depende la distribución asimétrica que suponemos
para el error.
Tabla 2.3: Distribución Condicional de 𝑼 dada 𝒀 por cada distribución especifica de SKD.
Distribución Distribución de 𝑼 Distribución
Condicional de 𝑼|𝒀 𝜿−𝟏(𝒖𝒊)̂
t de student asimétrica
𝐺 (𝜈
2,𝜈
2) 𝐺 (
𝜈 + 1
2,𝜈 + 4𝜉𝑖
2𝑧𝑖2
2)
𝜈 + 1
𝜈 + 4𝜉𝑖2𝑧𝑖
2
Laplace Asimétrica
𝐸𝑥𝑝(2) 𝐺𝐼𝐺 (
1
2, 2𝜉𝑖
2𝑧𝑖2,
1
2)
1
2ξ𝑖|𝑧𝑖|
Slash Asimétrica
𝐵𝑒𝑡𝑎(𝜈, 1) 𝑇𝐺 (𝜈 +
1
2 ,2𝜉𝑖
2𝑧𝑖2, 1 )
[𝜈 +
12
2𝜉𝑖2𝑧𝑖
2]ℱ (1|𝜈 +
32
, 2𝜉𝑖2𝑧𝑖
2)
ℱ (1|𝜈 +12
, 2𝜉𝑖2𝑧𝑖
2)
Normal Contaminada Asimétrica
𝜈𝕀(𝑢 = 𝛾) + (1 − 𝜈)𝕀(𝑢 = 1)0 ≤ 𝜈, 𝛾 ≤ 1
𝑎𝕀(𝑢 = 𝛾) + 𝑏𝕀(𝑢 = 1)
𝑎 + 𝑏
𝑎𝛾 + 𝑏
𝑎 + 𝑏
Fuente: Christian E. Galarza, 2016
En la tabla 3, ℱ(𝑥|𝛼, 1/𝛽) es la función de acumulación de la
distribución 𝐺𝑎𝑚𝑚𝑎(𝛼, 1/𝛽). Además las expresiones 𝑎 y 𝑏 están dada
por 𝑎 = 𝜈𝜙 (𝑦𝑖|𝑥𝑖𝑡𝛽𝑝,
𝛾−1𝜎2
4𝜉𝑖2 ) y 𝑏 = (1 − 𝜈)𝜙 (𝑦𝑖|𝑥𝑖
𝑡𝛽𝑝,𝜎2
4𝜉𝑖2 ). La noatación
𝑇𝐺(𝑎, 𝑏, 𝑡) representa la variable aleatoria con distribución 𝐺𝑎𝑚𝑚𝑎(𝑎, 1/
𝑏) truncado hacia la derecha hasta el valor 𝑡. 𝐺𝐼𝐺(𝜈, 𝑎, 𝑏) denotan la
distribución Inversa Gaussiana Generalizada [Barndorff-Nielsen &
Shephard (2001)], cuya función de densidad es dada por:
𝑓(𝑥|𝜈, 𝑎, 𝑏) =(𝑏/𝑎)𝜈
2𝐾𝜈(𝑎𝑏)𝑥𝜈−1𝑒
−12
(𝑎2
𝑥+
𝑏2
𝑥), 𝑥 > 0, 𝜈 ∈ ℝ, 𝑎, 𝑏 > 0 (2.16)
Con 𝐾𝜈(. ) Siendo la función modificada de Bessel de tercera clase.
2.7 Estimación de la variancia de los parámetros de una regresión
usando errores con distribuciones asimétricas.
10
La estimación de la matriz varianza se obtiene con la inversa de la matriz
de información del modelo, a continuación se muestra la fórmula para la
matriz de varianza de los estimadores:
S = [2
𝜎𝑊𝑋
2
𝜎𝑊(𝑧) − 1]
𝐼 = 𝑆𝑇𝑆𝑉𝑎𝑟(𝜃|𝑦) = (𝐼)−1
(2.17)
Donde 𝑧 es el error de la regresión, 𝐼 la matriz de información, 𝑊 es una
matriz diagonal con elementos 𝑧𝑖𝜉𝑖2𝜅−1(𝑢𝑖)̂ , el factor 𝜉𝑖
2𝜅−1(𝑢𝑖)̂ ha sido
calculado para la matriz 𝛀 de la última iteración del paso M del algoritmo
EM. (Christian E. Galarza, 2016)
2.8 Estimación de los parámetros con los datos ponderados por
observaciones.
Existe ocasiones que los datos se pondera por observaciones, por esta
razón se usará la aproximación de Kish para calcular el tamaño de la
muestra efectiva y los grados de libertad para la varianza (Koenker,
2005).
𝑛 =(∑ 𝑤𝑖
𝑁𝑖=1 )
2
∑ 𝑤𝑖2𝑁
𝑖=1
(2.18)
Donde 𝑤𝑖 es la ponderación asignada por observación, 𝑛 el tamaño de
muestra efectiva.
En base al tamaño de muestra efectiva, se ajusta las ponderaciones de
manera que su suma de igual a dicho tamaño.
𝑤𝑖′ = 𝑛
𝑤𝑖
∑ 𝑤𝑖𝑁𝑖=1
∑ 𝑤𝑖′
𝑁
𝑖=1= 𝑛
(2.19)
Donde 𝑤𝑖′ son las ponderaciones ajustadas al tamaño de muestra
efectiva 𝑛.
Con las nuevas ponderaciones 𝑤𝑖′ se procede a estimar los parámetros
de la regresión de manera parecida a la mostrada en la sección 2.7, lo
11
que cambia es la matriz diagonal 𝛀 en la expresión 2.14, la matriz
diagonal 𝑾 en la expresión 2.17 y la función de verosimilitud mostrada
en el 2.15 de la manera que se muestra en las expresiones 2.20, 2.21,
2.22 respectivamente. A parte que el tamaño de la muestra 𝑛 se
reemplaza con el tamaño de la muestra efectiva calculado en la
expresión 2.18.
𝛀 = 𝑑𝑖𝑎𝑔[𝑤𝑖′𝜉𝑖
2𝜅−1(𝑢𝑖)̂ ] (2.20)
𝐖 = 𝑑𝑖𝑎𝑔[𝑤𝑖′𝑧𝑖𝜉𝑖
2𝜅−1(𝑢𝑖)̂ ] (2.21)
�̂�(𝑘+1) = arg max𝝂
∑ 𝑤𝑖′ log 𝑓 (𝑦𝑖|�̂�𝑝
(𝑘+1), 𝜎2̂
(𝑘+1), 𝝂)
𝑛
𝑖=1
(2.22)
2.9 Análisis de los ingresos y desigualdad con regresión cuantílica.
En el análisis de los ingresos mensuales es importante el
comportamiento de los diferentes cuantiles de ingresos, pues suele
representar diferentes clases sociales y por lo tanto podría tener
comportamientos diferenciados, por esta razón es idóneo analizar los
ingresos con modelo de regresión cuantílica pues permite una
interpretación intuitiva. Para el modelo cuantílico se supondrá el
logaritmo de base 10 de los ingresos como variables de respuesta, 𝑙𝑦 =
log10 𝑦 (Donde 𝑦 es la variable “ingresos”)
𝑄𝑝[𝑙𝑦] = 𝑋𝛽 + 𝜀𝑖𝑝 (2.23)
Con la estimación de los coeficientes del modelo cuantílico, junto a sus
varianzas, se podría realizar varias inferencias sobre la importancia de
una variable o combinación lineal de variables para los ingresos en
diferentes cuantiles, esto es posible suponiendo los coeficientes de la
regresión sigue una distribución normal multivariada.
12
𝛽𝑝~𝑁 (�̂�𝑝, Σ�̂�
𝑝)
𝐾 = 𝐶𝛽𝑝~𝑁 (𝐶�̂�𝑝, 𝑆 = 𝐶Σ�̂�
𝑝𝐶′)
(2.24)
Donde 𝐶 es una matriz que representa combinación lineal de los
coeficientes.
También supondremos que las estimaciones de coeficientes para
distintos cuantiles son independientes entre sí.
𝑉𝑎𝑟(𝛽𝑝, 𝛽𝑞) = 0 (2.25)
Con esta suposición se podrá realizar inferencias sobre las diferencias
de los ingresos entre los cuantiles.
𝑄𝑝[𝑙𝑦] − 𝑄𝑞[𝑙𝑦] = log10 𝑄𝑝[𝑦] − log10 𝑄𝑝[𝑦] = log10
𝑄𝑝[𝑦]
𝑄𝑞[𝑦]= log10 𝑟𝑝:𝑞
log10 𝑟𝑝:𝑞 = 𝑋(𝛽𝑝
− 𝛽𝑞) + (𝜀𝑖𝑝 − 𝜀𝑖𝑞)
(𝛽𝑝 − 𝛽𝑞)~𝑁 (�̂�𝑝 − �̂�𝑞, Σ�̂�𝑝
+ Σ�̂�𝑞
)
(2.26)
Como se muestra en la expresión 2.26, a ser 𝑙𝑦 logaritmo de ingresos y
el logaritmo una función creciente, tenemos que la diferencia entre los
cuantiles de los logaritmos de ingresos es igual al logaritmo del ratio
entre estos cuantiles, y este ratio 𝑟𝑝:𝑞 mide la proporción de ingresos
recibe los de los cuantiles superiores con respecto a los de inferiores, y
se interpreta como una medida de desigualdad, en este trabajo se usará
los ratios 90:10, 90:50, 50:10.
Para verificar si una variable o valores de coeficientes es influyente o
sea distinto a 0 en el modelo, se usa las pruebas de hipótesis
estadísticas, donde se establece como hipótesis nula que los valores
estimados de los coeficientes sigue una distribución normal con media
0, esta hipótesis se rechaza cuando la probabilidad de obtener la
estimación que se obtuvo suponiendo una normal con media 0 es menor
a 0.05 (Nivel de Significancia).
𝑃 (𝑧 ≥ |𝑘𝑖|| 𝜇 = 0, 𝜎 = √𝑠𝑘(𝑖,𝑖)
) ≤ 0.05 (2.24)
13
En el caso multivariado, la hipótesis nula es que los coeficientes sigue
una distribución normal multivariada con medias 0, el estadístico de
prueba es la distancia de mahalanobis 𝑑 = √𝛽′Σ−1𝛽 , si suponemos a
𝛽 como una normal multivariada con media 0 y matriz de covarianzas Σ,
entonces la distancia estimada 𝑑 sigue una distribución Chi con grados
de libertad igual al número de elementos en 𝛽, por lo tanto se calcula la
probabilidad de obtener una distancia mayor a la que se estimó, si esta
probabilidad es menor a 0.05, se rechaza la hipótesis nula de que los
coeficientes sea igual 0.
𝑃 (𝐷 ≥ √�̂�′Σ−1�̂�|𝑔. 𝑙 = 𝑁. 𝐸𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝛽) ≤ 0.05
(2.24)
14
CAPÍTULO 3
3. ANÁLISIS DESCRIPTIVO
Con el objetivo de conocer cómo se comporta y evolucionas los ingresos en
sus cuantiles a través de los años y los diferente grupos, se calcula de manera
empírica estos mismos para cada grupo y años.
3.1 Distribución e Histograma de la variable lh=log(INGH)
Figura 3.1 Histograma y Ajuste de Distribución de la variable Ingresos en
escala logarítmica Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Vemos en la figura 3.1 que la distribución de los logaritmos de los
ingresos sigue una distribución normal contaminada con los siguientes
parámetros.
𝑙𝑦 = log10 𝑦 ~𝑁𝐶(𝜇, 𝜎, 𝛾, 𝜇) (3.1)
Y función de densidad:
𝑓(𝑦) = 𝜈𝜙 (𝑦|𝜇, 𝛾−
1
2𝜎) + (1 − 𝜈)𝜙(𝑦|𝜇, 𝜎) (3.2)
En la tabla 3.1 se muestra los valores de los parámetros.
PARÁMETROS VALORES 10^VALORES
Histograma de los Ingresos ajustado
Ingresos
De
nsid
ad
1 2 5 12 31 76 191 475 2961 18438 114815
0.0
00
.34
0.6
81
.02
1.3
7
15
𝝂 0,5357
𝜸 0,1886 1/𝛾= 5.30
𝝈 0,2060
𝝁 2,4797 10𝜇= 301,82
Tabla 3.1 Valores de los parámetros
3.2 Descripción General de los cuantiles por año
Figura 3.2 Ingresos por Cuantiles y Años
Figura 3.3 Ratios de Desigualdad por Años
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o En la figura 3.2 se observa un aumento general de los Ingresos
de los Ecuatorianos, en todos los cuantiles hasta el 2013 y
desde el 2014 ha disminuido los ingresos.
o En la figura 3.3 se observa que el ratio de desigualdad entre los
10% más rico y los 10% más pobres (ratio 90:10), hasta el 2014,
desde ahí ha aumentado este ratio, y lo mismo sucede si
comparamos el ratio de desigualdad entre quienes tienen
ingreso mediano con respecto a los 10% más pobres (ratio
50:10).
3.3 Descripción General de los cuantiles por año y Sexo
91.53 94.35 94.48
104.44 107.76118.07
129.26 128.55
113.99
98.03
157.31167.73 161.61
182.77196.05
216.39 224.06214.24
205.72
185.61
258.21 262.08 257.64
292.43311.47
332.44350.09 342.79
326.58306.34
457.63 445.54 430.96458.14
486.08509.67
538.6 531.55493.74 474.67
864.91821.19 791.91
852.92 863.64 881.6942.55
889.87822.89 809.92
90
120
150
200
260
330
430
560
730
940
2008 2010 2012 2014 2016
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Cuantiles 10% 25% 50% 75% 90%
9.45
8.7
8.388.17
8.01
7.477.29
6.92
7.22
8.26
3.35
3.133.07
2.92
2.77
2.652.69
2.6
2.52
2.64
2.822.78
2.732.8
2.892.82
2.67
2.86
3.12
2008 2010 2012 2014 2016
7.04
8.16
9.45
2.52
2.92
3.38
Años
Ratio
s d
e D
esig
uald
ad
Ratios 90:10 90:50 50:10
91.53 94.35 94.48
104.44 107.76118.07
129.26 128.55
113.99
98.03
157.31167.73 161.61
182.77196.05
216.39 224.06214.24
205.72
185.61
258.21 262.08 257.64
292.43311.47
332.44350.09 342.79
326.58306.34
457.63 445.54 430.96458.14
486.08509.67
538.6 531.55493.74 474.67
864.91821.19 791.91
852.92 863.64 881.6942.55
889.87822.89 809.92
90
120
150
200
260
330
430
560
730
940
2008 2010 2012 2014 2016
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Cuantiles 10% 25% 50% 75% 90%
91.53 94.35 94.48
104.44 107.76118.07
129.26 128.55
113.99
98.03
157.31167.73 161.61
182.77196.05
216.39 224.06214.24
205.72
185.61
258.21 262.08 257.64
292.43311.47
332.44350.09 342.79
326.58306.34
457.63 445.54 430.96458.14
486.08509.67
538.6 531.55493.74 474.67
864.91821.19 791.91
852.92 863.64 881.6942.55
889.87822.89 809.92
90
120
150
200
260
330
430
560
730
940
2008 2010 2012 2014 2016
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Cuantiles 10% 25% 50% 75% 90%
9.45
8.7
8.388.17
8.01
7.477.29
6.92
7.22
8.26
3.35
3.133.07
2.92
2.77
2.652.69
2.6
2.52
2.64
2.822.78
2.732.8
2.892.82
2.67
2.86
3.12
2008 2010 2012 2014 2016
7.04
8.16
9.45
2.52
2.92
3.38
Años
Ratio
s d
e D
esig
uald
ad
Ratios 90:10 90:50 50:10
9.45
8.7
8.388.17
8.01
7.477.29
6.92
7.22
8.26
3.35
3.133.07
2.92
2.77
2.652.69
2.6
2.52
2.64
2.822.78
2.732.8
2.892.82
2.67
2.86
3.12
2008 2010 2012 2014 2016
7.04
8.16
9.45
2.52
2.92
3.38
Años
Ratio
s d
e D
esig
uald
ad
Ratios 90:10 90:50 50:10
16
Figura 3.4 Ingresos por Cuantiles, Años y Sexo
Figura 3.5 Ingresos por Cuantiles, Años y Sexo
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o En la figura 3.4 se observa que los Hombres gana más que las
mujeres en los cuantiles del 10%, pero esta brecha disminuye
proporcionalmente para los cuantiles altos.
o En la figura 3.5 se observa que el ratio de desigualdad 90:10
entre mujeres es mucho mayor que entre hombres, el ratio con
respecto a la mediana 90:50 se comporta igual entre hombres
y mujeres, pero existe una gran diferencia en el ratio 50:10,
donde se observa que la mujer con ingreso mediana gana
aproximadamente 1.2 veces más que el 10% de las mujeres
con menos ingresos.
3.4 Descripción General de los cuantiles por Año y Áreas
101.69
166.84
266.95
457.63
893.8
104.83
175.59
266.85
444.6
838.66
105
172.38
264.55
430.96
821.38
116.97
194.95
292.43
452.57
852.92
125.08
209.93
320.72
492.63
862.1
132.24
220.4
335.01
503.24
881.6
148.85
241.29
355.48
538.6
939.32
144.33
228.53
342.79
527.9
889.87
133.87
220.81
329.16
491.97
828.87
115.63
198.29
308.61
464.01
809.92
76.27
143.01
245.97
464.78
847.84
78.62
147.42
262.08
450.78
791.48
81.55
143.65
243.13
430.96
760.91
87.22
165.71
291.21
467.89
852.92
85.77
169.34
302.97
481.47
865.95
96.98
184.03
330.6
522.35
881.6
100.54
196.97
344.71
547.58
943.63
102.84
195.88
333
539.85
889.87
86.06
175.62
315.54
500.75
817.24
80.35
163.11
302.93
490.15
809.92
80
100
130
180
230
310
410
540
710
940
2008 2010 2012 2014 2016
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Cuantiles 10% 25% 50% 75% 90% Sexo Hombres Mujer
8.79
87.82
7.29
6.896.67
6.316.17 6.19
7
11.12
10.07
9.339.78
10.1
9.099.39
8.65
9.5
10.08
3.35
2.62
3.14
2.55
3.1
2.52
2.92
2.5
2.692.56
2.632.53
2.64
2.39
2.6
2.38
2.522.62
3.22
3.02
3.33
2.98
3.34
2.86
3.533.41
2.74
3.43
3.24
3.673.77
(6,5
0]
(0,6
]
2008 2010 2012 2014 2016
6.65
7.89
9.36
11.12
2.38
2.82
3.35
3.97
Años
Ratio
de D
esig
uald
ad
Sexo Hombres Mujer Ratios 90:10 90:50 50:10
101.69
166.84
266.95
457.63
893.8
104.83
175.59
266.85
444.6
838.66
105
172.38
264.55
430.96
821.38
116.97
194.95
292.43
452.57
852.92
125.08
209.93
320.72
492.63
862.1
132.24
220.4
335.01
503.24
881.6
148.85
241.29
355.48
538.6
939.32
144.33
228.53
342.79
527.9
889.87
133.87
220.81
329.16
491.97
828.87
115.63
198.29
308.61
464.01
809.92
76.27
143.01
245.97
464.78
847.84
78.62
147.42
262.08
450.78
791.48
81.55
143.65
243.13
430.96
760.91
87.22
165.71
291.21
467.89
852.92
85.77
169.34
302.97
481.47
865.95
96.98
184.03
330.6
522.35
881.6
100.54
196.97
344.71
547.58
943.63
102.84
195.88
333
539.85
889.87
86.06
175.62
315.54
500.75
817.24
80.35
163.11
302.93
490.15
809.92
80
100
130
180
230
310
410
540
710
940
2008 2010 2012 2014 2016
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Cuantiles 10% 25% 50% 75% 90% Sexo Hombres Mujer
101.69
166.84
266.95
457.63
893.8
104.83
175.59
266.85
444.6
838.66
105
172.38
264.55
430.96
821.38
116.97
194.95
292.43
452.57
852.92
125.08
209.93
320.72
492.63
862.1
132.24
220.4
335.01
503.24
881.6
148.85
241.29
355.48
538.6
939.32
144.33
228.53
342.79
527.9
889.87
133.87
220.81
329.16
491.97
828.87
115.63
198.29
308.61
464.01
809.92
76.27
143.01
245.97
464.78
847.84
78.62
147.42
262.08
450.78
791.48
81.55
143.65
243.13
430.96
760.91
87.22
165.71
291.21
467.89
852.92
85.77
169.34
302.97
481.47
865.95
96.98
184.03
330.6
522.35
881.6
100.54
196.97
344.71
547.58
943.63
102.84
195.88
333
539.85
889.87
86.06
175.62
315.54
500.75
817.24
80.35
163.11
302.93
490.15
809.92
80
100
130
180
230
310
410
540
710
940
2008 2010 2012 2014 2016
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Cuantiles 10% 25% 50% 75% 90% Sexo Hombres Mujer
8.79
87.82
7.29
6.896.67
6.316.17 6.19
7
11.12
10.07
9.339.78
10.1
9.099.39
8.65
9.5
10.08
3.35
2.62
3.14
2.55
3.1
2.52
2.92
2.5
2.692.56
2.632.53
2.64
2.39
2.6
2.38
2.522.62
3.22
3.02
3.33
2.98
3.34
2.86
3.533.41
2.74
3.43
3.24
3.673.77
(6,5
0]
(0,6
]
2008 2010 2012 2014 2016
6.65
7.89
9.36
11.12
2.38
2.82
3.35
3.97
Años
Ratio
de D
esig
uald
ad
Sexo Hombres Mujer Ratios 90:10 90:50 50:10
8.79
87.82
7.29
6.896.67
6.316.17 6.19
7
11.12
10.07
9.339.78
10.1
9.099.39
8.65
9.5
10.08
3.35
2.62
3.14
2.55
3.1
2.52
2.92
2.5
2.692.56
2.632.53
2.64
2.39
2.6
2.38
2.522.62
3.22
3.02
3.33
2.98
3.34
2.86
3.533.41
2.74
3.43
3.24
3.673.77
(6,5
0]
(0,6
]
2008 2010 2012 2014 2016
6.65
7.89
9.36
11.12
2.38
2.82
3.35
3.97
Años
Ratio
de D
esig
uald
ad
Sexo Hombres Mujer Ratios 90:10 90:50 50:10
17
Figura 3.6 Ingresos por Cuantiles, Años y Áreas
Figura 3.7 Ratios de Desigualdad por Años y Áreas
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o En la figura 3.6 se observamos que hay diferencias en los
ingresos entre quienes viven en áreas urbanas y rurales en
todos los cuantiles, los que viven en áreas rurales tiene menor
ingresos con respecto quienes viven en áreas urbanas.
o En la figura 3.7 se observamos que la desigualdad en áreas
rurales es mayor que en áreas urbanas, así se observa en los
ratios 90:10, 90:50 y 50:10
3.5 Descripción General de los cuantiles por Año y Zonas
114.41 121.68100.74
121.85 138.55 157.43 161.58 152.27 142.24 129.35
57.265.52 60.47
71.48 69.28 70.5386.18 91.41
73.1561
183.62 195.58166.72
208.88 230.92 252.23 258.53 247.18 238.18 219.35
114.41 124.8 118.1139.25 138.55 146.93 163.74 166.11 148.63
127.12
297.93 306.63263.97
320.46 347.3 371.92 383.01 368.5 348.69 337.47
190.68 196.56 201.56226.63 230.92 247.95 277 269.93 257.24
227.14
557.73 524.16447.92
531.69 567.68 587.73 612.93 593.24 549.01 539.94
286.02 294.84 302.35 328.98 346.38 368.38 401.8 415.27 387.67 343.97
1016.95 943.49829.59
982.08 953.69 980.78 1050.27 973.81 900.24 886.35
479.08 484.85 492.71 497.13 544.97 566.74 603.23 634.16 617.17 560.17
10
%2
5%
50
%7
5%
90
%
2008 2010 2012 2014 2016
60
80
110
150
210
110
150
210
290
150
210
290
400
210
290
400
550
760
400
550
760
1050
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Area Urbana Rural
8.89
7.75
8.23 8.06
6.88
6.236.5 6.4 6.33
6.85
8.37
7.4
6.95
7.87 8.04
7 6.94
8.44
9.18
3.41
3.08 3.14 3.06
2.752.64
2.742.64 2.58 2.63
2.51 2.47 2.44
2.19
2.362.29
2.18
2.35 2.4 2.47
2.62.52
2.62 2.632.51
2.36 2.37 2.42 2.452.61
3.33
3
3.333.17
3.333.52
3.21
2.95
3.523.72
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
6.67
7.83
9.18
2.18
2.56
3
3.52
2.56
3
3.52
Años
Ratio
de D
esig
uald
ad
Area Urbana Rural Ratios 90:10 90:50 50:10
114.41 121.68100.74
121.85 138.55 157.43 161.58 152.27 142.24 129.35
57.265.52 60.47
71.48 69.28 70.5386.18 91.41
73.1561
183.62 195.58166.72
208.88 230.92 252.23 258.53 247.18 238.18 219.35
114.41 124.8 118.1139.25 138.55 146.93 163.74 166.11 148.63
127.12
297.93 306.63263.97
320.46 347.3 371.92 383.01 368.5 348.69 337.47
190.68 196.56 201.56226.63 230.92 247.95 277 269.93 257.24
227.14
557.73 524.16447.92
531.69 567.68 587.73 612.93 593.24 549.01 539.94
286.02 294.84 302.35 328.98 346.38 368.38 401.8 415.27 387.67 343.97
1016.95 943.49829.59
982.08 953.69 980.78 1050.27 973.81 900.24 886.35
479.08 484.85 492.71 497.13 544.97 566.74 603.23 634.16 617.17 560.17
10
%2
5%
50
%7
5%
90
%
2008 2010 2012 2014 2016
60
80
110
150
210
110
150
210
290
150
210
290
400
210
290
400
550
760
400
550
760
1050
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Area Urbana Rural
114.41 121.68100.74
121.85 138.55 157.43 161.58 152.27 142.24 129.35
57.265.52 60.47
71.48 69.28 70.5386.18 91.41
73.1561
183.62 195.58166.72
208.88 230.92 252.23 258.53 247.18 238.18 219.35
114.41 124.8 118.1139.25 138.55 146.93 163.74 166.11 148.63
127.12
297.93 306.63263.97
320.46 347.3 371.92 383.01 368.5 348.69 337.47
190.68 196.56 201.56226.63 230.92 247.95 277 269.93 257.24
227.14
557.73 524.16447.92
531.69 567.68 587.73 612.93 593.24 549.01 539.94
286.02 294.84 302.35 328.98 346.38 368.38 401.8 415.27 387.67 343.97
1016.95 943.49829.59
982.08 953.69 980.78 1050.27 973.81 900.24 886.35
479.08 484.85 492.71 497.13 544.97 566.74 603.23 634.16 617.17 560.17
10
%2
5%
50
%7
5%
90
%
2008 2010 2012 2014 2016
60
80
110
150
210
110
150
210
290
150
210
290
400
210
290
400
550
760
400
550
760
1050
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Area Urbana Rural
8.89
7.75
8.23 8.06
6.88
6.236.5 6.4 6.33
6.85
8.37
7.4
6.95
7.87 8.04
7 6.94
8.44
9.18
3.41
3.08 3.14 3.06
2.752.64
2.742.64 2.58 2.63
2.51 2.47 2.44
2.19
2.362.29
2.18
2.35 2.4 2.47
2.62.52
2.62 2.632.51
2.36 2.37 2.42 2.452.61
3.33
3
3.333.17
3.333.52
3.21
2.95
3.523.72
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
6.67
7.83
9.18
2.18
2.56
3
3.52
2.56
3
3.52
Años
Ratio
de D
esig
uald
ad
Area Urbana Rural Ratios 90:10 90:50 50:10
8.89
7.75
8.23 8.06
6.88
6.236.5 6.4 6.33
6.85
8.37
7.4
6.95
7.87 8.04
7 6.94
8.44
9.18
3.41
3.08 3.14 3.06
2.752.64
2.742.64 2.58 2.63
2.51 2.47 2.44
2.19
2.362.29
2.18
2.35 2.4 2.47
2.62.52
2.62 2.632.51
2.36 2.37 2.42 2.452.61
3.33
3
3.333.17
3.333.52
3.21
2.95
3.523.72
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
6.67
7.83
9.18
2.18
2.56
3
3.52
2.56
3
3.52
Años
Ratio
de D
esig
uald
ad
Area Urbana Rural Ratios 90:10 90:50 50:10
18
Figura 3.8 Ingresos por Cuantiles, Años y Zonas
Figura 3.9 Ratios de Desigualdad por Años y Zonas
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o En la figura 3.8 se observa que los ingresos en las zona Sierra
se tiene mayor ingresos que la zona Costa y Amazonía en los
cuantiles altos, en el cuantiles mediano se observamos que no
existe mucha diferencia y en los cuantiles más bajos vemos
que en la Costa se tiene mayor ingresos
o En la figura 3.9 se observa que en la Amazonía existe menor
desigualdad en ingresos en comparación de otras zonas según
todos los ratios
3.6 Descripción General de los cuantiles por Año y Educación
83.42 82.3797.98 97.48 86.59
99.18112.03 124.58
102.8986.94
100.11 93.58
134.58
68.64 69.8979.01 83.55
73.89 66.91
102.59 102.84
73.564.28
157.31 160.74 173.66 182.77 178201.51
229.8 228.4 214.36185.61
158.9 174.72155.14
187.46207.83 220.4 221.6 207.64 204.08 191.16
127.12 131.04151.17 158.4 153.95 146.93
186.72 191.96151.41
129.83
286.02 280.8 288.55 304.62 314.05349.33 377.02 373.74 347.85 324.56
245.16 262.08238.17
277.81309.15 330.6 332.77 315.37 303.54 296.97
245.16 250.85 263.97 278.51 288.65 293.87356.55 342.79
308.68267.16
508.47 511.06 503.91 516.63 503.4 551 603.23 622.73 574.5 540.94
429.03 401.86 377.93 406.15471.46 481.57 479.36 456.8 435.45 428.86429.03 468 493.45
438.65519.57 535.57
631.24 622.91539.82
476.84
953.39 948.73 907.04 977.21 900.58 969.76 1053.51933.75 898.61
810.86707.62 678.76 731.08
808.22 793.44 812.52726.72 712.46 711.69
726.48825.55 825.15 751.79
981.4 969.76 991.03 989.81877.75
777.7
10
%2
5%
50
%7
5%
90
%
2008 2010 2012 2014 2016
60
90
120
160
90
120
160
220
300
220
300
410
300
410
570
770
570
770
1050
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Zona Sierra Costa Amazonia
11.43 11.52
9.2610.02 10.4
9.78 9.48.27
9.0710.34
8.1
6.487.25
6 5.955.4 5.66 5.4 5.67
6.33
10.44
9
13.2814.49
9.63
11.94 12.1
3.33 3.38
3.14 3.21
2.872.78 2.79 2.76
2.682.77
2.72.85
2.63 2.61
2.4 2.44
2.3 2.35 2.4
2.96
3.43.3
2.89 2.84 2.91
3.43 3.41
2.943.12
3.63 3.523.37
3
3.38
3.73
2.45 2.42.54
2.28 2.28 2.25 2.32 2.34 2.412.64
3.34
3.91
4.39
3.33
4.2 4.16
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
5.15
6.33
7.79
9.58
11.78
14.49
2.25
2.77
3.4
2.25
2.77
3.4
4.19
Años
Ratio
de D
esig
uald
ad
Zona Sierra Costa Amazonia Ratios 90:10 90:50 50:10
19
Figura 3.10 Ingresos por Cuantiles, Años y Educación
Figura 3.11 Ratios de Desigualdad por Años y Educación
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o En la Figura 3.10 observamos que los ingresos de las
personas con educación superior es mayor que las personas
sin educación superior en todos los cuantiles.
o En la Figura 3.11 se observa que la desigualdad en ingresos
entres lo que tiene educación superior e menor de aquellos
que no en todos los ratios.
3.7 Descripción General de los cuantiles por Año y Años de
Experiencia
81.72 87.36 83.36 94.69 92.37 105.61 110.8 114.26 100.485.2
204.59 218.4186.63
225.42 230.92 258.43 287.25 267.85 257.24 231.83
143.01 149.76 141.71162.46 173.19 187.34 201.08 197.25 184.33 163.38
339.13 327.6288.74
337.92 349.84 382.02 430.88 397.62 381 348.91
228.81 234 220.27253.44 277.1 297.54 313.37 303.06 292.48 269.98
583.47 550.37477.58
548.31 554.21 600.59680.79 642.73 617.37 588.18
357.52 353.81 332.58 365.54 402.95 421.91 430.88 428.49 402.33 381.23
1001.06 926.02 828.93974.77 917.9 944.57 1057.81 986.27 922.01 894.28
600.64 576.58 520.99 568.62 626.78 628.14 635.55 641.59 603.45 573.48
1677.961319.8
1523.08 1388.511723.53
1424.92
10
%2
5%
50
%7
5%
90
%2008 2010 2012 2014 2016
80
110
160
230
320
110
160
230
320
440
160
230
320
440
620
880
320
440
620
880
1230
440
620
880
1230
1720
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Educación Educación Obligatoria Educación Superior
7.35
6.6
6.256
6.79
5.955.74
5.62
6.01
6.73
8.2
7.076.76
5.87
5.37
6
5.54
5.9
2.63
2.462.37
2.24 2.26
2.112.03
2.122.06
2.12
2.88
2.71 2.76 2.78
2.45
2.31
2.53
2.42.31 2.33
2.82.68 2.64 2.68
3
2.82 2.83
2.65
2.91
3.17
2.522.43 2.4
2.32 2.37 2.4 2.4
2.54
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
5.15
6.01
7.02
8.2
2.03
2.37
2.77
2.37
2.77
3.23
Años
Ratio
de D
esig
uald
ad
Educación Educación Obligatoria Educación Superior Ratios 90:10 90:50
7.35
6.6
6.256
6.79
5.955.74
5.62
6.01
6.73
8.2
7.076.76
5.87
5.37
6
5.54
5.9
2.63
2.462.37
2.24 2.26
2.112.03
2.122.06
2.12
2.88
2.71 2.76 2.78
2.45
2.31
2.53
2.42.31 2.33
2.82.68 2.64 2.68
3
2.82 2.83
2.65
2.91
3.17
2.522.43 2.4
2.32 2.37 2.4 2.4
2.54
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
5.15
6.01
7.02
8.2
2.03
2.37
2.77
2.37
2.77
3.23
Años
Ratio
de D
esig
uald
ad
Educación Educación Obligatoria Educación Superior Ratios 90:10 90:50 50:10
7.35
6.6
6.256
6.79
5.955.74
5.62
6.01
6.73
8.2
7.076.76
5.87
5.37
6
5.54
5.9
2.63
2.462.37
2.24 2.26
2.112.03
2.122.06
2.12
2.88
2.71 2.76 2.78
2.45
2.31
2.53
2.42.31 2.33
2.82.68 2.64 2.68
3
2.82 2.83
2.65
2.91
3.17
2.522.43 2.4
2.32 2.37 2.4 2.4
2.54
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
5.15
6.01
7.02
8.2
2.03
2.37
2.77
2.37
2.77
3.23
Años
Ratio
de D
esig
uald
ad
Educación Educación Obligatoria Educación Superior Ratios 90:10 90:50 50:10
20
Figura 3.12 Ingresos por Cuantiles, Años y Años de experiencias
Figura 3.13 Ratios de Desigualdad por Años y Años de experiencias
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o En la figura 3.12 se observa que las personas con menos
años de experiencia tiende a obtener mayores ingresos en los
cuantiles más bajos y mediano, mientras que en el cuantil
90% se observa que las personas con mayor años
experiencia recibe mayores ingresos por su trabajo.
o En la figura 3.12 se observa una menor desigualdad en los
ingresos por aquellos grupos que tienen menos años de
experiencia en la ocupación en que trabaja.
3.8 Cuantiles por Áreas, Zona, Sexo y Años de la Encuesta
101.69 104.83 98.99121.85 125.08
143.01 146.02 138.42 131.66113.89
68.64 69.8983.36 77.98 80.05 79.34
92.33 95.9877.17
67.49
163.44 174.72 163.77194.95 211.68 228.56 241.29 228.53 222.94 202.28
134.43 146.77 156.3 152.31 153.95 165.3 172.35 173.03 159.66 144.63
259.8 262.08 251.96292.43
323.29 350.68 359.07 350.71 333.65 314.97
257.42 262.08 274.15 277.1 293.87321.37 306.06 281.16 269.97
440.94 427.19 402.94438.65 471.46 506.92 534.29 533.23 493.74 474.67
520.14574.51 526.01 493.74 476.03
817.19 748.8 694.66779.82 773.58 839.62 893 856.97 803.22 792.41976.95 913.67 839.44
10
%2
5%
50
%7
5%
90
%
2008 2010 2012 2014 2016
70
90
130
170
130
170
230
320
230
320
430
320
430
590
800
590
800
1090
Años
Ingre
sos M
ensuale
s a
justa
do a
la Infla
ció
n y
Hora
s d
e T
rabajo
Años de Experiencia Menor a 16 años Mayor a 16 años
8.047.14 7.02
6.4 6.18 5.87 6.12 6.19 6.16.96
14.81 14.93
12.92 13.54 13.6612.65
11.67
10.18
11.84 12.44
3.15
2.862.76
2.67
2.39 2.392.49 2.44 2.41
2.52
3.95 3.983.73 3.85 3.95
3.42 3.353.19 3.25
3.11
2.55 2.5 2.552.4
2.582.45 2.46
2.53 2.53
2.77
3.75 3.75
3.47 3.52 3.463.7
3.48
3.19
3.64
4
P9
0_
10
.90
%P
90
_5
0.9
0%
P5
0_
10
.50
%
2008 2010 2012 2014 2016
5.4
6.62
8.11
9.94
12.18
14.93
2.39
2.93
3.59
2.39
2.93
3.59
Años
Ratio
de D
esig
uald
ad
Años de Experiencia Menor a 16 años Mayor a 16 años
21
Figura 3.14 Gráficas de la evolución de los Ingresos desde el año 2003 separado por Género, Área, Cuantiles y Región
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o Se Observa que los ingresos en la Costa es menor en
comparación de la demás regiones en especial en cuantiles
mayores
o La brecha entre los ingresos de Hombres y Mujeres
disminuye en cuantiles mayores excepto en la Área Urbana
de la Sierra donde la brecha entre Hombres y Mujeres no
parece disminuir con los cuantiles.
o La brecha entre los ingresos de los que viven en Área Urbana
y Rural se mantiene entre los cuantiles, es interesante notar
que está brecha es menor en la zona Costa
22
o Se observa una bajada en los ingresos en general desde el
2012 o 2013.
o Se observa que la mediana de ingresos está entre 200 y 400
dólares en las zonas urbanas y rural entre 100 y 200 dólares
(2016).
23
3.9 Cúantiles por Nivel de Instrucción, Área, Sexo y Años de la
Encuesta
Figura 3.15 Gráficas de la evolución de los Ingresos desde el año 2003 separado por Género, Área, Cuantiles y Nivel de Instrucción
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o Se observa que existe un aumento notable en los ingresos
aquellas personas con educación Superior con respecto
aquellos que no tienes este nivel de instrucción
o La brecha entre género es más grande en el grupo de personas
con instrucción superior, aunque en la mayoría de los cuantiles
se muestra que está brecha está disminuyendo.
3.10 Cúantiles por Nivel de Instrucción, Años de ocupación, Área, Sexo
y Años de la Encuesta
24
Figura 3.16 Gráficas de la evolución de los Ingresos desde el año 2003 separado por Género, Área, Cuantiles y Nivel de Instrucción
Fuente: INEC, La Encuesta de Empleo, Desempleo y Subempleo, 2007-2016
Interpretaciones
o Se observa que existe cambio apreciable de la distribución de
los ingresos con la experiencia cuando se tiene instrucción de
educación superior, esto se puede deberse que la mayoría de
lo que tiene educación superior tiene ocupaciones más
especializa
25
CAPÍTULO 4
4. INFERENCIA CON MODELOS ESTADÍSTICO
En este capítulo se analizará algunas hipótesis sobre la estructura de
distribución de los Ingresos utilizando modelo cuantilico robusto cuyo error
siga una distribución “Normal Contaminada Asimétrica” con parámetros 𝝂, 𝜸 y
𝝈 . Para conocer cómo se comporta y evolucionan los ingresos en sus
cuantiles a través de los años y de los diferente grupos.
4.1 Modelo 1: Ingresos con respecto al Tiempo (INGH~ANIO)
En este modelo se relaciona los ingresos monetario por años en
diferentes cuantiles, contiene 10 variables independiente que se ha
estimado. En la tabla 4.1 se muestra los parámetros de la distribución
del error estimado por cada cuantil.
Tabla 4.1 Valores de los parámetros 10% 25% 50% 75% 90%
𝝂 0,0729 0,1219 0,5764 0,1381 0,0516
𝜸 0,0237 0,0973 0,1592 0,1698 0,0420
𝝈 0,1000 0,2500 0,5000 0,7500 0,9000
lks -140150,65 -110034,49 -89523,42 -104623,99 -129659,83
Fuente: Análisis de Datos del ENEMDU
Además con los coeficientes de este modelo podemos estimar con
intervalo de confianza los ingresos promedio en cada cuantil por
diferentes años.
Tabla 4.2 Estimación de los ingresos por Cuantiles y años 10% 25% 50% 75% 90%
2007 $ 97.31
(±2.06%) $152.56 (±2.87%)
$260.64 (±2.93%)
$508.01 (±2.50%)
$870.35 (±1.68%)
26
10% 25% 50% 75% 90%
2008 $ 99.82
(±2.09%) $159.21 (±2.98%)
$266.60 (±3.07%)
$500.74 (±2.64%)
$851.48 (±1.75%)
2009 $ 97.47
(±0.81%) $153.26 (±1.18%)
$258.52 (±1.29%)
$484.10 (±1.14%)
$819.54 (±0.78%)
2010 $108.76 (±2.13%)
$171.57 (±3.05%)
$286.95 (±3.19%)
$524.10 (±2.68%)
$905.19 (±1.76%)
2011 $113.33 (±1.74%)
$182.30 (±2.43%)
$308.99 (±2.65%)
$552.03 (±2.28%)
$913.24 (±1.56%)
2012 $122.93 (±1.91%)
$196.71 (±2.84%)
$330.57 (±2.89%)
$580.24 (±2.54%)
$948.04 (±1.68%)
2013 $130.32 (±2.00%)
$208.20 (±2.94%)
$348.84 (±3.12%)
$610.49 (±2.72%)
$992.94 (±1.81%)
2014 $128.89 (±1.33%)
$202.30 (±1.91%)
$338.37 (±2.04%)
$592.21 (±1.95%)
$954.84 (±1.31%)
2015 $118.37 (±0.87%)
$189.77 (±1.29%)
$320.23 (±1.42%)
$556.88 (±1.35%)
$899.47 (±0.91%)
2016 $106.12 (±0.89%)
$172.94 (±1.29%)
$298.77 (±1.41%)
$530.92 (±1.30%)
$853.49 (±0.89%)
Fuente: Análisis de Datos del ENEMDU
Con este modelo podemos revisar los siguientes hipótesis:
H1: Los ingresos del año n con respecto al año n-1 no ha cambiado
significativamente
En la Figura 4.1 observamos que:
Hubo un aumento significativo en los ingresos de aprox. un 4% en los
cuantiles 20% y 25% en el año 2008 con respecto al año 2007.
Hubo una disminución significativa entre del 10% al 5% en todos los
cuantiles de los ingresos en el año 2016 con respecto al 2015 y en el
año 2015 con respecto al 2014.
Hubo un aumento significativo entre 4% al 12% de los ingresos en
todos los cuantiles desde 2010 hasta el 2013.
27
Figura 4.1 Porcentaje de cambio en los ingresos por años consecutivos
Fuente: Análisis de Datos del ENEMDU
H2: La proporciones para medir desigualdad de 90:10, 50:10, 90:50
del año n con respecto al año n-1 no ha cambiado
significativamente (se verificará por cada años)
Figura 4.2 Porcentaje de Cambio de ratios entre años consecutivos. Fuente: Análisis de Datos del ENEMDU
44
4 56 7 7 8 7 65 4
-3 -4
-2-4-4-4 -3 -3-3-3 -4
8 9 8 8 7 7 6 6 55 4
-8-6-6-6 -5 -5 -6 -6-6-6 -6
12 121212 12 119 88 8
10
6 6 66 6 6 5 55 5 5
-10-10-9-8 -8 -7 -6 -5-5-4 -5
2014-2013 2015-2014 2016-2015
2011-2010 2012-2011 2013-2012
2008-2007 2009-2008 2010-2009
10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90
-11-8.33-5.67
-3-0.332.33
57.67
10.3313
-11-8.33-5.67
-3-0.332.33
57.67
10.3313
-11-8.33-5.67
-3-0.332.33
57.67
10.3313
Cuantiles
% d
e C
am
bio
en lo
s in
gre
sos e
ntr
e lo
s a
ños
Significancia (valor p) >0.05 <0.05
-4.62
-6.31-4.3
2.58 3.065.84
4.06
2014-2013 2015-2014 2016-2015
2011-2010 2012-2011 2013-2012
2008-2007 2009-2008 2010-2009
90-10 90-50 50-10 90-10 90-50 50-10 90-10 90-50 50-10
-10.61-8.48-6.35-4.23
-2.10.032.164.296.418.54
-10.61-8.48-6.35-4.23
-2.10.032.164.296.418.54
-10.61-8.48-6.35-4.23
-2.10.032.164.296.418.54
Cuantiles% d
e C
am
bio
en la
desig
uald
ad m
edid
o e
n d
ifere
nte
s r
atio
s e
ntr
e lo
s a
ños
Significancia (valor p) >0.05 <0.05
28
En la figura 4.2 vemos que si ha cambiado la desigualdad de manera
significativa:
El ratio 90:10 ha disminuido significativamente en el 2008 con
respecto al 2007, en el 2012 con respecto al 2011, y aumentado en el
2015 con respecto al 2014 y en el 2016 con respecto al 2015.
El ratio 90:50 ha disminuido significativamente en el 2011 con
respecto al 2010
El ratio 50:10 ha aumentado significativamente en el 2016 y 2015
respectivamente
4.2 Modelo 2: Ingresos con respecto al tiempo, Zona
geográfica y Área rural o urbana (INGH~ANIO*ZONA*AREA)
En este modelo se relaciona los ingresos monetario por años en
diferentes cuantiles. A continuación se muestra los parámetros de la
distribución del error del modelo estimado por los principales cuantiles.
Tabla 4.3 Valores de los parámetros
10% 25% 50% 75% 90%
𝝂 0,0692 0,1157 0,4687 0,1432 0,0566
𝜸 0,0242 0,0985 0,1946 0,1568 0,0380
𝝈 0,1177 0,2212 0,2093 0,2202 0,1211
lks -117625 -91172 -73319 -85671 -108600
Fuente: Análisis de Datos del ENEMDU
La fórmula del modelo completo es:
~(Interception)+ ANIO+ ZONA+ AREA+
ANIO:ZONA+ ANIO:AREA+ REGI:AREA+ ANIO:ZONA:AREA
A continuación revisaremos las hipótesis a considerar:
H1: Años, Zona y Área son independientes/dependientes entre sí
por cada cuantil.
Para comprobar esta hipótesis, se va a testear si el conjunto de
coeficientes asociados a la triple interacción ANIO:ZONA:AREA son
29
todos igual a 0 o al por lo contrario existe algún coeficiente distinto a 0,
esto ser hará por cada cuantíl.
Tabla 4.4 Valores de los parámetros Interacción ANIO:REGI:AREA
Cuantiles Estadístico de prueba Rechazo si es mayor:
10% 53.5186 5.373 (Se rechaza la Ho)
25% 41.4132 5.373 (Se rechaza la Ho) 50% 34.7499 5.373 (Se rechaza la Ho)
75% 28.1029 5.373 (Se rechaza la Ho)
90% 33.5479 5.373 (Se rechaza la Ho) Fuente: Análisis de Datos del ENEMDU
Observamos en la tabla 4.4 que todos los cuantiles se recha la hipótesis
de que los coeficientes asociado a la interacción ANIO:REGI:AREA son
distinto a 0, demostrando así que las tres variables son dependiente
entre sí para explicar los ingresos.
H2: No hay diferencias significativas entre los Ingresos Áreas Rural
y Urbana. (Estimar en qué proporción son diferentes por Año y
Cuantil)
En la Figura 4.3 se observa una disminución de las proporciones en el
año 2009 en la zona de Costa y Sierra, mientras que en la Sierra existió
una disminución de esta proporción en el 2014 y que la hipótesis de que
no existe diferencia significativa en los ingresos de quienes viven en
áreas rurales, con respecto a quienes viven en áreas urbanas se rechaza
en todos los años, cuantiles y zonas geográfica, pues las estimaciones
de las proporciones entre los ingresos de quienes viven en áreas urbana
con respecto a quienes viven en área rurales son todos significativos, la
varianza de estas estimaciones es mayor en la Amazonía.
30
Figura 4.3 Porcentaje cambio en los ingresos en los cuantiles debido al área urbana y rural
Fuente: Análisis de Datos del ENEMDU
H3: No hay diferencias significativas entre las proporciones de desigualdad entre Áreas Rural y Urbana.
Figura 4.4 Porcentaje de cambio entre los ratios de desigualdad de las Áreas
Urbana con respecto al Rural. Fuente: Análisis de Datos del ENEMDU
Observamos que las proporciones de los ratios de desigualdad 90:10,
90:50 y 50:10 entre Áreas Urbana y Rurales disminuye en la Costa, en
la Sierra también disminuye esto ratios, mientras en la Amazonía no se
observa una tendencia clara.
121
39
98
132
14
93106
7
90
127
19
74
137
19
91
139
28
114
135
22
9183
27
66
121
30
126
46
106 111
37
94
118
24
93 92
6
111
18
58
126
25
80
122
29
115
25
69 73
30
93
30
112104
41
101
40
82
97
34
76
11
66
87
23
51
94
31
64
89
34
81
28
59 63
32
63
30
8578
38
121
63
121
52
92 90
23
72
117
38
61
104
46
62
98
44
101
41
77
35
53
70
36
83
46
73
130
76
129
63
105100
32
71
132
57
71
103
58
27
102
51
108
51
89
36
72
35
74
4457
10 25 50
75 90
4
41
78
116
4
41
78
116
153
4
41
78
116
4
41
78
116
4
41
78
116
07 08 09 10 11 12 13 14 15 16 07 08 09 10 11 12 13 14 15 16 07 08 09 10 11 12 13 14 15 16
07 08 09 10 11 12 13 14 15 16 07 08 09 10 11 12 13 14 15 16
Cuantiles
Po
rce
nta
je d
e c
am
bio
en
lo
s In
gre
so
s
V2 1 Sierra 2 Costa 3 Amazonia
Significancia (valor p) <0.5
4
27
-13
-1
44
6
-3
24
-10
2
32
-14
33
-33
-16
18
-7-12
24
-23
3
-13
-22
4
-23
-1
14
26
-6
1622
81419
3
24
13
5
20
-23
7
13
2
15
-8
16
3
-11
5
-10
-3
4
-14-9
1
-15
18
-2
-15
4
-18
3
-13-18
11
-21
4
-9
-23
5
-17-11
4-2
-26
0
-17-21
-5-11
90-10 90-50 50-10
-39-34-29-24-19-14-9-416
1116212631364146
07 08 09 10 11 12 13 14 15 16 07 08 09 10 11 12 13 14 15 16 07 08 09 10 11 12 13 14 15 16
Cuantiles
Pro
po
rció
n e
ntr
e r
atio
de
de
sig
ua
lda
d
Significancia (valor p) >0.5 <0.5
V2 1 Sierra 2 Costa 3 Amazonia
31
4.3 Modelo 3: Ingresos con respecto al Tiempo, Zona, Área y Sexo
(INGH~ANIO*ZONA*AREA*SEXO)
En este modelo se relaciona los ingresos monetario por años en
diferentes cuantiles. A continuación se muestra los parámetros de la
distribución del error del modelo estimado por los principales cuantiles.
Tabla 4.5 Valores de los parámetros
10% 25% 50% 75% 90%
𝝂 0,0662 0,1100 0,4742 0,1399 0,0555
𝜸 0,0242 0,0993 0,1966 0,1571 0,0382
𝝈 0,1174 0,2217 0,2083 0,2207 0,1213
lks -115033,3640 -89329,8482 -72464,3431 -85249,6537 -108157,3741
Fuente: Análisis de Datos del ENEMDU
La fórmula del modelo completo es:
~(Interception)+ ANIO+ ZONA+ AREA+ SEXO+ ANIO:ZONA+ ANIO:AREA+ ZONA:AREA+
ANIO:SEXO+ ZONA:SEXO+ AREA:SEXO+ ANIO:ZONA:AREA+ ANIO:ZONA:SEXO+ ANIO:AREA:SEXO+ ZONA:AREA:SEXO+ ANIO:ZONA:AREA:SEXO
A continuación revisaremos las hipótesis a considerar:
H1: Años, Zona, Área y Sexo son independientes/dependientes
entre sí por cada cuantil.
Para comprobar esta hipótesis, se va a testear si el conjunto de
coeficientes asociados a la triple interacción ANIO:ZONA:AREA:SEXO
son todos igual a 0 o al por lo contrario existe algún coeficiente distinto
a 0, esto ser hará por cada cuantíl.
Tabla 4.6 Valores de los parámetros Interacción ANIO:REGI:AREA
Cuantiles Estadístico de prueba Rechazo si es mayor a: 10% 19.1450 5.373 (Se rechaza la Ho) 25% 13.0738 5.373 (Se rechaza la Ho) 50% 8.3049 5.373 (Se rechaza la Ho)
32
75% 5.4305 5.373 (Se rechaza la Ho) 90% 9.2244 5.373 (Se rechaza la Ho)
Fuente: Análisis de Datos del ENEMDU
Observamos en la tabla 4.4 que todos los cuantiles se recha la hipótesis
de que los coeficientes asociado a la interacción ANIO:REGI:AREA son
distinto a 0, demostrando así que las tres variables son dependiente
entre sí para explicar los ingresos.
H2: No hay diferencias significativas entre los Ingresos de Séxo
Masculino y Femenino. (Estimar en qué proporción son diferentes
por Año, Área y Cuantil)
En la Figura 4.5 se observa que la hipótesis de que no existe diferencia
significativa en los ingresos de Hombres y mujeres se rechaza en en la
mayoría de los casos, excepto para el cuantil 10% en la zona Costa
Rural, y el cúantil 75% y 90% en la zona de Amazonía durante ciertos
años.
Figura 4.5 Proporción de los Ingresos entre Hombre/Mujer
Fuente: Análisis de Datos del ENEMDU
22.81
35.7146.43
29.02
17.71
37.64
22.68
33.64
63.66
28.2
56.8
21.89
40.94
23.5
15.24
39.9831.76
19.59
41.59
22.26
42.25
18.11
65.81
19.91
32.31
15.62
31.77
8.63
24.21
11.63
39.06
9.92
24.97
10.1
33.69
6.84
42.77
20.19
29.59
15.08
22.4219.65
11.18
21.46
10.22
17.82
7.89
22.05
21.49
13.09
29.75
19.0115.38
22.94
12.3817.26
21.37
8.912.35
17
16.54
41.28
23.8718.95
31.57 29.15
46.1635.72
60
19.1
47.89
32.2425.11
14.61
28.0822.12
17.33
32.04
19.72
27.7721.54
33.73
14.77
35.54
15.58
22.85
8.5313.66
7.12
14.09
7.125.336.237.42 6.966.46
17.31
4.76
11.79
4.962.21 2.523.533.45 2.632.06
3.09
-5.41
3.3
-6.18
3.7 2.73
-9.45
4.52 5.2
-12.01
3.41
-6.121.39
68.48
14.18
57.24
31.3340.02
23.330.03
39.7
29.53
40.95
23.5527.76
67.26
28.2922.25
34.1125.34
27.8121.9427.51
37.67
20.43
27.03
18.9
16.33
25.04
16.7213.2
9.98
20.91 21.27
12.48
1 Sierra 2 Costa 3 Amazonia
10
25
50
75
90
7 8 9 10 11 12 13 14 15 16 7 8 9 10 11 12 13 14 15 16 7 8 9 10 11 12 13 14 15 16
-12.01
3.099.22
14.9319.8824.86
32.4
76.14
-12.01
3.099.22
14.9319.8824.86
32.4
76.14
-12.01
3.099.22
14.9319.8824.86
32.4
76.14
-12.01
3.099.22
14.9319.8824.86
32.4
-12.01
3.099.22
14.9319.8824.86
32.4
Años
% d
e C
am
bio
en lo
s in
gre
sos e
ntr
e H
om
bre
/Muje
rpor
Años, C
uantil
es y
Áre
a
Significancia (valor p) >0.05 <0.05 Área 1 Urbana 2 Rural
33
CONCLUSIONES
5. CONCLUSIONES
1. Los Ingresos recibido mensualmente por los ecuatorianos ha
aumentado de manera generalizada en todos los cuantiles hasta el 2014,
después de lo cual comenzó a disminuir
2. Se ha observa una disminución de la desigualdad desde el 2007, pero
en el 2014 se ha visto un aumento en la desigualdad de los Ingresos.
3. El Sexo si es influyente en el ingreso que se recibe, en especial en
los cuantiles más bajo, en los cuantiles alto la diferencia no es muy pronunciada
4. El Nivel de Instrucción es influye en los Ingresos, en especial se
observa un salto significativo entre aquellos que tiene educación superior y
aquellos que no.
5. Se observa que la desigualdad en área urbana en la costa es
significativamente más alta que la desigualdad en la área rural, efecto que no
observa igual en la Sierra y en el Oriente
RECOMENDACIONES
6. RECOMENDACIONES
1. Las Bases de datos ENEMDU de diferentes trimestre están muy dispersos,
sería bueno ordenar mejor dichas bases de datos
2. En este trabajo se puede expandir para incluir otras variables como profesión o
carga en el hogar.+
3. Se puede consolidar las bases de datos de años anteriores al 2007, aunque
dichas bases de datos no contenía todos los variables usadas.
34
BIBLIOGRAFÍA
Buchinsky, M. (1994, 03). Changes in the U.S. Wage Structure 1963-1987:
Application of Quantile Regression. Econometrica, 62.
Christian E. Galarza, V. H. (2016, 06). Robust Quantile Regression using a
Generalized Class of Skewed Distributions. Instituto de Matemática,
Estatística e Computação Científica, 07.
INEC. (2007-2016). La Encuesta de Empleo, Desempleo y Subempleo. La
Encuesta de Empleo, Desempleo y Subempleo.
INEC. (2014). Índice de Precios al Consumidor. Índice de Precios al Consumidor.
Kish, L. (1965). Survey Sampling. John Wiley \& Sons, Inc.
Koenker, R. (2005). Quantile Regression. Cambridge University Press.
Pereira, P. S. (2004). Does education reduce wage inequality? Quantile regression
evidence from 16 countries. Labour Economics, 11.
T.J. Hastie, R. T. (1990). Generalized Additive Models (1 ed.). Chapman and
Hall/CRC.
Wichitaksorn, N. C. (2014, 12). A generalized class of skew distributions and
associated robust quantile regression models. Canadian Journal of Statistics,
42.
35
APÉNDICES
36
APÉNDICE A
ARCHIVOS EN EL CD
37
Nombre del Archivo Dirección Descripción
200312 mercado_laboral_educacion_dic2003.sav
\bases de datos\sav
Base de datos del ENEMDU
200512 mercado_laboral_educacion_dic2005.sav
Base de datos del ENEMDU
200612 mercado_laboral_educacion_dic2006.sav
Base de datos del ENEMDU
200712 mercado_laboral_educacion_dic2007.sav
Base de datos del ENEMDU
200809 Septiembre_per2008.sav Base de datos del ENEMDU
200810 Octubre_per2008.sav Base de datos del ENEMDU
200812 mercado_laboral_educacion_dic2008.sav
Base de datos del ENEMDU
200903 empleo_subempleo_2009_mar_spss.sav
Base de datos del ENEMDU
200906 Base Datos Junio 2009.sav Base de datos del ENEMDU
200909 septiembre2009_per.sav Base de datos del ENEMDU
200912 mercado_laboral_educacion_dic2009.sav
Base de datos del ENEMDU
201012 mercado_laboral_educacion_dic2010.sav
Base de datos del ENEMDU
201112 mercado_laboral_educacion_dic2011.sav
Base de datos del ENEMDU
201212 mercado_laboral_educacion_dic2012.sav
Base de datos del ENEMDU
201312 mercado_laboral_educacion_dic2013.sav
Base de datos del ENEMDU
201409_EnemduBDD_15anios (2).sav Base de datos del ENEMDU
201412 mercado_laboral_educacion_dic2014.sav
Base de datos del ENEMDU
201503 mercado_laboral_educacion_mar2015.sav
Base de datos del ENEMDU
201506 mercado_laboral_educacion_jun2015.sav
Base de datos del ENEMDU
201509_EnemduBDD_15anios.sav Base de datos del ENEMDU
201512_EnemduBDD_15anios.sav Base de datos del ENEMDU
201603_EnemduBDD.sav Base de datos del ENEMDU
201606_EnemduBDD.sav Base de datos del ENEMDU
201609_EnemduBDD_per.sav Base de datos del ENEMDU
dat.R Código en R para estructurar las bases de datos
EM2.R Código del algoritmo EM para la regresión cuantilica robusta
38
Nombre del Archivo Dirección Descripción
lqr_axuliares.R Funciones auxiliares que se usó para la programación de la regresión cuantilica
progc.cpp Código en C++ usado en lqr_auxiliares
datos.RData Datos estructurados del ENEMDU en .Rdata
DATOS.sav Datos estructurados del ENEMDU en .sav
convsh.R
\bases de datos\
Códigos auxiliares para las pruebas de Hipótesis
descriptivo_area_general.R Códigos para la estadística descriptivas
descriptivo_educación_general.R Códigos para la estadística descriptivas
descriptivo_experiencia_general.R Códigos para la estadística descriptivas
descriptivo_ingresos_general.R Códigos para la estadística descriptivas
descriptivo_sexo_general.R Códigos para la estadística descriptivas
descriptivo_zona_general.R Códigos para la estadística descriptivas
gráficas.R Códigos para la gráficas de los modelos
graficas_descriptivas.R Códigos para la estadística descriptivas
hipotesis_modelos.R Las Hipótesis de los modelos
hist_w.R Código Histograma ponderado
leer_modelos.R Leer los modelos
mod1.R Código para ejecutar el modelo 1
mod2.R Código para ejecutar el modelo 2
mod3.R Código para ejecutar el modelo 3
mod1.RData Datos del modelo 1
mod2.RData Datos del modelo 2
mod3.RData Datos del modelo 3
hipotesis.Rdata Datos de las hipótesis en diferentes modelos
bibliografia.bib
\Escrituras\
Bibliografía en formato .bib
bibliografia.xml Bibliografía en formato .xml
Poster.pdf Poster en pdf
Poster.pptx Poster en pptx
Proyecto Integrador.docx Proyecto Integrador en .docx
Proyecto Integrador.pdf Proyecto Integrador en .pdf