estadstica descriptiva-1230745228674108-2

Post on 20-Aug-2015

44 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

ESTADESTADÍÍSTICA STICA DESCRIPTIVADESCRIPTIVAJose Gonzales VillanuevaJose Gonzales VillanuevaProfesor de MatemProfesor de Matemááticatica

clavero_matematica_gonzales@yahoo.esclavero_matematica_gonzales@yahoo.es

www.matewww.mate--clavero.blogspot.comclavero.blogspot.com

LICEO NAVAL CAPITLICEO NAVAL CAPITÁÁN DE CORBETA N DE CORBETA MANUEL CLAVEROMANUEL CLAVERO

¿¿Por quPor quéé hay que conocer la hay que conocer la EstadEstadíística y quistica y quiéénes la utilizan?nes la utilizan?

• Está presente en todas las áreas del saber humano. Lo utilizan médicos, banqueros, deportistas, amas de casa.

• Es una herramienta fundamental en la investigación.

• Permite realizar una buena toma de decisiones.

DefiniciDefinicióónn• La Estadística es una ciencia con base

matemática que utiliza instrumentos para recoger datos, presentarlos, ordenarlos y analizarlos para obtener información útil que permita inferir conclusiones y garantice una buena toma de decisiones.

SubdivisiSubdivisióón de la Estadn de la Estadíísticastica

ESTADÍSTICA

ESTADÍSTICADESCRIPTIVA

ESTADÍSTICAINFERENCIA

TEORÍA DEDECISIONES

TTéérminos usados en rminos usados en EstadEstadíísticastica

OrganizaciOrganizacióón y Presentacin y Presentacióón n de datosde datos

• Cuando se realiza la recopilación , se obtiene una gran cantidad de datos.

DATOS

•Clasificados

•Ordenados

•Presentados

deben

ser

•Comprensión

•Descripción

•Análisis

Tablas

y

Gráficos

para

facilitar

en

PresentaciPresentacióón de datos n de datos no agrupadosno agrupados

• Ejemplo 1: Los sueldos mensuales de 60 empleados de la empresa Metro de Ventanilla, son los siguientes

450580634364470660471501530450

382645507625480518380462500574

340

430

650

560

460

537

376

587

607

600

560

400

492

428

526

393

67

432

500

466

512382560558440

591550409618570

528321470407453

565424613335440

Datos no agrupados

32h

35G

31F

30E

36D

32C

34B

30A

Nº de alumnos

Sección

• Ejemplo 2: Número de alumnos de tercer grado de secundaria matriculados el presente año 2008 en cada sección

Datos agrupados en una tabla sin intervalos

PresentaciPresentacióón de datos n de datos agrupadosagrupados

15[1,90 - 2,00>

14[1,80 - 1,90>

15[1,70 - 1,80>

15[1,60 - 1,70>

16[1,50 - 1,60>

18[1,40 - 1,50>

14[1,30 - 1,40>

15[1,20 - 1,30>

15[1,10 - 1,20>

13[1,00 - 1,10>

FrecuenciaEstatura (cm.)

• Ejemplo 3: Distribución de 150 habitantes de la unidad vecinal Santa Rosa según estatura

Datos agrupados en una tabla con intervalos

PresentaciPresentacióón de datos n de datos agrupadosagrupados

ConstrucciConstruccióón de una n de una distribucidistribucióón de frecuenciasn de frecuencias

1. Nos fijamos en el número de datos (n)

2. Buscamos el dato mínimo y máximo y calculamos el rango (r)

r = máx. - mín.

3. Determinamos el número de intervalos (m) m = 1 + 3,3 log(n)

4. Verificamos la amplitud del intervalo (c)c = r/m

• Ejemplo 4: La siguiente tabla muestra los gastos semanales de 80 trabajadores de una compañía agrupados en intervalos

ConstrucciConstruccióón de una n de una distribucidistribucióón de frecuenciasn de frecuencias

100180Total

1006.2510.0625805650[700 - 800>

93.7522.50.93750.2257518550[500 - 600>

71.2521.250.71250.21255717450[400 - 500>

50350.50.354028350[300 - 400>

158.750.150.0875127250[200 - 300>

6.256.250.06250.062555150[100 -200>

Hi x 100%hi x 100%HihiFifixi[Li - Ls>

Frecuencia relativa

acumulada porcentual

Frecuencia relativa

porcentual

Frecuencia relativa

acumulada

Frecuencia relativa

Frecuencia absoluta

acumulada

Frecuencia absoluta

Marca de clase Intervalos

GrGrááficos Estadficos EstadíísticossticosHistograma Polígono

Pastel Barras

ReducciReduccióón de Datosn de DatosMedidas deMedidas deResumenResumen

De Posición o

Tendencia Central

De Dispersión o

Variabilidad

De Deformacióno

Asimetría

Rango

Varianza

Desviación Estándar

De Apuntamientoo

Kurtosis

Media

Mediana

Moda

Simetría

Asimetría Positiva

Asimetría Negativa

Platikúrtica

Mesokúrtica

Leptokúrtica

¡¡¡¡¡¡ Ganaste un viaje !!!Ganaste un viaje !!!

Playa BávaroPunta Cana

República Dominicana

Playa Tambor Punta ArenasCosta Rica

GrGrááfico de temperaturas fico de temperaturas registradas el aregistradas el añño 2008o 2008

152230333535302530222420Playa Bavaro

101525203538323025202015Playa Tambor

DicNovOctSepAgoJulJunMayAbrMarFebEne

0

5

10

15

20

25

30

35

40

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic

Tem

pera

tura

(ºC

)

Playa Tambor Playa Bavaro

Surge la preguntaSurge la pregunta

¿Qué playa es más calurosa?

NNºº de personas que visitan mensualmente de personas que visitan mensualmente el Parque de las Leyendasel Parque de las Leyendas

142510Noviembre154757Mayo

254611Setiembre102435Marzo

245615Agosto187234Febrero

132534Diciembre243518Junio

182568Octubre123543Abril

325415Julio154250Enero

Nº de personas

MesNº de personas

Mes

Medidas de PosiciMedidas de Posicióón o n o Tendencia CentralTendencia Central

• Son valores numéricos en torno a los cuales se agrupan los valores de una variable estadística.

La Media (X)La Media (X)

el valor de la variable que indicael promedio de todos los datos

trabajados

PARA DATOS NO AGRUPADOS

PARA DATOSAGRUPADOS

nXXX

n

XX n21

n

1ii +++==

∑= ...

es

Se calcula

nf Xf Xf X

n

f XX nn2211

n

1iii +++==

∑= ...

Donde:n : es el número de datos trabajadosX1,X2,…: En los Datos No Agrupados son los valores de la variable y en los

Datos Agrupados son la marca de clase del intervalo 1, intervalo 2, …f : es la frecuencia absoluta.

Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados

Sean los puntajes obtenidos en 5 exámenes de Aritmética:

15 ; 12 ; 13 ; 15 ; 20Determinar la nota media

155

752015131215 ==++++=5

X

Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados

Dada la siguiente tabla de distribución de frecuencias, calcular la media aritmética

134625

37057478-70

26446670-62

17435862-54

15035054-46

25264246-38

13643438-30

xi x fifixiLs>-[Li

84,5325

1346 ==X

Donde:Li : es el límite inferior del intervalo medianon : es el número de datos trabajadosF : es la frecuencia absoluta acumulada del intervalo anterior al intervalo

medianof : es la frecuencia absoluta del intervalo medianoC : es el tamaño de la amplitud del intervalo

La Mediana (Me)La Mediana (Me)

el valor de la variable que divideal total de observaciones en dos

partes de igual tamaño

PARA DATOS NO AGRUPADOS

PARA DATOSAGRUPADOS

Ordenando de menor a mayor y eligiendo el central. Si no hubiese un dato central, entonces será igual a la media de los dos

valores centralesC

f

F 2

n

L Me i ×

−+=

es

Se calcula

Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados

Sean los puntajes obtenidos en 5 exámenes de Aritmética:

15 ; 12 ; 13 ; 15 ; 20Determinar la mediana

Ordenar datos:

12 ; 13 ; 15 ; 15 ; 20

Me = 15 25

2557478-70

2046670-62

1635862-54

1335054-46

1064246-38

443438-30

FifixiLs>-[Li

Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados

Dada la siguiente tabla de distribución de frecuencias, calcular la mediana

10

46

12.5

F =

Li =

n / 2 =

52.67Me =

8C =

3f =

Datos

Donde:Li : es el límite inferior del intervalo modald1 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)

del intervalo inmediato anterior.d2 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)

del intervalo inmediato posterior.C : es el tamaño de la amplitud del intervalo

La Moda (La Moda (MoMo))

el dato que más se repite o la mayor frecuencia de un

conjunto de datos

PARA DATOS NO AGRUPADOS

PARA DATOSAGRUPADOS

Se toma el dato que más se repiteSi fuesen dos valores diferentes,se habla de bimodal, de ser tres,

sería trimodal

C d d

d L Mo

21

1i ×

++=

es

Se calcula

Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados

Sean los puntajes obtenidos en 5 exámenes de Aritmética:

15 ; 12 ; 13 ; 15 ; 20Determinar la moda

Conteo:

12 � 1 vez13 � 1 vez15 � 2 veces20 � 1 vez

Mo = 15

25

57478-70

46670-62

35862-54

35054-46

64246-38

43438-30

fixiLs>-[Li

Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados

Dada la siguiente tabla de distribución de frecuencias, calcular la mediana

3d2 =3fi+1 =

8

4

6

C =

fi-1 =

fMo =

41.20Mo =

2d1 =

38Li =

Datos

COMPARACICOMPARACIÓÓN DE MEDIA, N DE MEDIA, MEDIANA Y MODAMEDIANA Y MODA

Pueden haber muchas modas o ninguna

Requiere de un ordenamiento previo de datos que sería difícil sin un ordenador

Se ve influenciada por los valores extremos

Desventajas

Es la que más fácilmente se determina, puesto que la podemos obtener por inspección

Cuando la distribución es casi simétrica se puede utilizar:Moda = 3Me- 2X

No toma en cuenta los valores extremos

Es útil cuando la tabla de frecuencias no presenta los valores del extremo inferior del 1er intervalo y del extremo superior del ultimo intervalo

Toma en cuenta todos los valores de la variable

Es fácil de interpretarVentajas

ModaMedianaMedia

Ejemplo Demostrativo 1Ejemplo Demostrativo 1Usando la hoja de calculo de Excel halle las tres MTC estudiadas para los siguientes datos:

12, 141, 11, 14, 12, 10, 10, 12, 11, 14

121224,7ModaMedianaMedia

Vemos que:La media se ve afectada por el valor extremo 141.

Ejemplo Demostrativo 2Ejemplo Demostrativo 2Usando la hoja de calculo de Excel halle las tres MTC estudiadas para los siguientes datos:

12, 15, 11, 14, 13, 10, 20, 17

amodal13,514ModaMedianaMedia

Vemos que:Al no haber ningún valor que se repita, no hay moda , por lo tanto el sistema es amodal

Posiciones relativas de la Posiciones relativas de la Media, la Mediana y la Moda. Media, la Mediana y la Moda.

En casos en que la distribución de frecuencias es poco asimétrica se cumple la siguiente relación empírica

Media – Moda = 3(media- mediana)

De acuerdo a la simetría o asimetría de la distribución de frecuencias se cumple lo siguiente

EjemploEjemplo

Ejemplo demostrativo 1Ejemplo demostrativo 1En un estudio sobre comprensión de lectura en inglés hecho a 100 personas la menor nota fue de 40 puntos y la mayor, de 180. Para la distribución de frecuencias se usaron siete intervalos de igual longitud y las frecuencias de los intervalos fueron respectivamente: 19, 20, 25, 15, 10, 6 y 5.

1.Construye la distribución de frecuencias con sus intervalos, marcas de clase y frecuencias.2.Calcula la media, la mediana y la moda de las notas3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana y la moda

1. Distribuci1. Distribucióón de frecuenciasn de frecuencias

8910.000.890.108910130140-1205

7915.000.790.157915110120-1004

6425.000.640.25642590100-803

100.001.00100

1005.001.000.051005170180-1607

956.000.950.06956150160-1406

3920.000.390.2039207080-602

1919.000.190.1919195060-401

Hi x 100%hi x 100%HihiFifixiLs>-[LiNº

Frecuencia relativa

acumulada porcentual

Frecuencia relativa

porcentual

Frecuencia relativa

acumulada

Frecuencia relativa

Frecuencia absoluta

acumulada

Frecuencia absoluta

Marca de clase Intervalos 7

2. Medidas de tendencia central2. Medidas de tendencia central

9300

850

900

1300

1650

2250

1400

950

xi x fi

20C =

25f =

39F =

80Li =

50n / 2 =

Datos

20C =

80Li =

10d2 =

5d1 =

15fi+1 =

20fi-1 =

25fMo =

Datos

93S / n =

Media (x)

88.80Me =

Mediana (Me)

86.67Mo =

Moda (Mo)

3. Histograma3. Histograma

Ahora tuAhora tuLos gastos semanales de 65 amas de casa oscilan entre 60 y 300 soles. Agrupando los datos en 8 intervalos de igual amplitud se tienen las siguientes frecuencias: 2, 3, 5, 7, 12, 15, 13, 8

1.Construye la distribución de frecuencias con sus intervalos, marcas de clase y frecuencias.2.Calcula la media, la mediana y la moda de las notas3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana y la moda

FFáábula bula El El ááguila y guila y las gallinaslas gallinas

top related