pgg1 estadística descriptiva instructor: dr. porfirio gutiérrez gonzález correo:...

23
PGG 1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: [email protected]

Upload: tere-rosa

Post on 27-Jan-2016

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 1

Estadística Descriptiva

Instructor: Dr. Porfirio Gutiérrez GonzálezCorreo: [email protected]

Page 2: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 2

Importancia de la estadística

EstadísticaEstadística

DescriptivaDescriptiva

InferencialInferencial

- Agricultura- Biología- Negocios- Química - Comunicaciones- Economía- Educación- Electrónica- Medicina- Física- Psicología- Sociología- etc.

Page 3: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 3

Estadística descriptiva• Se relaciona principalmente con la recopilación,

presentación y descripción de datos.

Se refiere a la técnica de interpretar y usar valores resultantes de la estadística descriptiva para responder preguntas que no solo requieren del análisis directo sino del uso de la inducción para alcanzar conclusiones más generales.

Estadística inferencial

Page 4: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 4

Población, Muestra, Parámetros y Estadísticos

Parámetros generalmente desconocidos

Pobl

ació

n o

Uni

vers

o

Muestra

mss2

xss2

Estadísticos estimados

Inferir

Aleatoriamente

Page 5: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 5

Para analizar el comportamiento o distribución de un conjunto de datos, comúnmente se inicia calculando los estadístico básicos.

Algunos estadísticos que se pueden calcular son: Media, Mediana, Moda (medidas de tendencia central) Desviación Estándar, Rango, Coeficiente de Variación

(medidas de variabilidad)

Medidas de tendencia central y variabilidad

Page 6: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 6

Medidas de tendencia central

Media aritmética o promedio

X = X1 + X2 + X3 + . . . + Xn =

n

S Xj j = 1

n

n

MedianaEs un conjunto de números ordenados en orden de magnitud ascendente, es decir de menor a mayor; el dato que ocupa la posición central corresponde a la mediana.

Page 7: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 7

ModaEn un conjunto de números es el valor que ocurre con mayor frecuencia, es decir, es el valor más frecuente.

La moda puede no existir en la distribución e incluso puede tener 2 o más.

En el caso de una moda la distribución es unimodal; cuando existen dos modas es bimodal; tres modas, trimodal; y así sucesivamente.

Page 8: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 8

Medidas de dispersión o variabilidad

La dispersión o variabilidad de los datos intenta dar una idea de qué tan esparcidos se encuentran los datos en una distribución.

Page 9: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 9

Rango o amplitud

En un conjunto de datos el rango se define como la diferencia existente entre el valor máximo y el valor mínimo del conjunto de datos.

2,4,3,5,4,3,5,7,6,2,4,5,7,4

Rango = R = VALORmax - VALOR min

R = 7 - 2

R = 5

Page 10: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 10

Desviación estándar

La desviación estándar representa las desviaciones de cada uno de los números obtenidos con respecto a su media aritmética, dividido entre el total de datos menos 1. Se obtiene de la siguiente manera:

𝑆=√∑𝑖=1

𝑛

(𝑋 𝑖− 𝑋 )2

𝑛−1

Varianza

𝑆2=∑𝑖=1

𝑛

(𝑋 𝑖−𝑋 )2

𝑛−1

Page 11: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 11

ProblemaUn producto debe tener un % vol. de alcohol de 40%, con una tolerancia de ±5%. De los muestreos para evaluar la calidad se obtienen los siguientes datos:

41.77 39.28 40.31 34.03 38.89 42.7039.36 38.83 39.02 35.43 41.81 44.6539.67 42.12 45.22 42.23 38.80 39.5740.47 39.52 40.39 38.37 37.26 40.7542.83 41.66 42.94 38.67 42.69 40.5637.49 43.59 38.08 39.20 42.07 42.1639.70 40.38 41.47 41.84 39.48 37.9839.14 41.03 37.68 41.66 40.68 40.6741.75 39.81 42.71 39.83 38.17 41.8941.86 41.77 38.82 40.77 40.10 37.67

Page 12: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 12

Resultados estadísticos

Recuento 60Promedio 40.321Mediana 40.385Moda 41.77Varianza 4.299Desviación Estándar 2.073Coeficiente de Variación 5.14Mínimo 34.03Máximo 45.22Rango 11.19

Page 13: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 13

El promedio de % Volumen es 40.321, con esto puedo afirmar que, si se evalúan a otros 60 .

¿Se esperaría que el promedio fuera de 40.321?

¿Se esperaría que la desviación estándar fuera de 2.07?

Page 14: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 14

Regla empírica. Muchos de los datos que surgen en la práctica se ha observado.

• -S y +S está el 68%• ± 2S está el 95%• ± 3S el 99.7%

99.994 %

68.26 %

99.73 %

95.44 %

- 4 s + 4 s- 3 s

- 2 s - s+ 3 s

+ 2 s+ s

Page 15: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 15

• Regla empírica

± 3S el 99.7%

-3(S)=40.32-3*2.07=34.11

+3(S)=40.32+3*2.07=46.53

Intervalo [34.11, 46.53]

El 99.7% de la producción del producto tienen % volumen de 34.11 a 46.53

Page 16: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 16

Intervalo de confianza para la media poblacional

Sea es una muestra

aleatoria de tamaño

tomada de una población

normal con media y

varianza conocida.

Entonces un intervalo de

confianza del 100%(1-) para

esta dada por 𝒙−𝒁∝/𝟐𝝈√𝒏

≤𝝁≤𝒙+𝒁∝/𝟐𝝈√𝒏

Donde es el punto de la distribución normal estándar, que corresponde al nivel de confianza dado

Page 17: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 17

-

-

-

𝟑𝟗 .𝟕𝟗≤𝝁≤𝟒𝟎 .𝟖𝟓

0.05

0.01

*Investigación para el alumno: 1) Investigar el intervalo de confianza para la varianza poblacional.2) Procedimiento para la construcción de un histograma.3) Diagrama de caja o de bigotes.4) Resolver el problema 1 de estadística descriptiva, con el

intervalo de confianza para la media y la varianza.

Page 18: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 18

Histograma para el % de volumen de alcohol

45.043.542.040.539.037.536.034.5

18

16

14

12

10

8

6

4

2

0

VOLUMEN

Frecu

enci

a

Histograma de VOLUMEN

Page 19: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 19

Es una gráfica de barras la cual presenta en forma ordenada los datos del proceso con el propósito de determinar el comportamiento y distribución del proceso del que fueron tomados los datos.

Histograma

Page 20: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 20

Tipos de HistogramasEs posible obtener información útil sobre el estado de una población al momento de observar la forma del histograma.Las siguientes son formas típicas, las cuales podemos emplear como indicios en el análisis de un proceso.

Representa a un procesoestable en el cual los factoresde variación (6 M´s) son losúnicos que producen la variación del proceso.

1 2 3 4 5 6 7

5

10

15

TIPO GENERAL (Normal)

Page 21: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 21

1 2 3 4 5 6 7 8

5

10

15

TIPO BIMODAL (Doble pico)

1 2 3 4 5 6 7 8

5

10

15

TIPO PEINETA

Principalmente es el resultado de mediciones inadecuadas oregistros favorecidos.

Surge cuando dos característicasde trabajo totalmente diferentesse conjugan en un solo proceso deobservación.Ejemplo: turnos diferentes,

grupos diferentes, aulas distintas, etc.

Page 22: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 22

1 2 3 4 5 6 7 8

5

10

15

TIPO SESGO POSITIVO

1 2 3 4 5 6 7

5

10

15

TIPO JOTA ( Precipicio )

Es generado por fuentes externas al proceso, las cuales producen una tendencia de los datos a incrementarsu distancia respecto al valor centralde los datos.

Es generado de igual manera por causas externas, entre las que podemos mencionar la alteración de parámetros para ajustar un procesodentro de los límites de especificacióno de control establecidos.

Page 23: PGG1 Estadística Descriptiva Instructor: Dr. Porfirio Gutiérrez González Correo: pgutierrezglez@gmail.com

PGG 23

Diagrama de Caja para el % Volumen de alcohol

45.0

42.5

40.0

37.5

35.0

VOLU

MEN

Gráfica de caja de VOLUMEN

*Tarea para el alumno: 1) Obtener e interpretar el histograma y diagrama de caja para el

problema 1.2) Realizar el análisis estadístico o exploratorio del problema 5.