universidad salesiana de bolivia - aula...

68
UNIVERSIDAD SALESIANA DE BOLIVIA 1 ----------------------------------------------------------------------------------------- UNIVERSIDAD SALESIANA DE BOLIVIA CONTADURÍA PÚBLICA Y SISTEMAS DOSSIER GESTIÓN II – 2016 ESTADISTICA I QUINTO SEMESTRE PARALELOS: 5A1 5C1 Lic. Jorge Troche Luna ESTADISTICA I ----------------------------------------------------------------------------------------- Lic. Jorge Justo Troche Luna

Upload: vodieu

Post on 30-Sep-2018

218 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 1-----------------------------------------------------------------------------------------

UNIVERSIDAD SALESIANA DE BOLIVIACONTADURÍA PÚBLICA Y SISTEMAS

DOSSIER

GESTIÓN II – 2016

ESTADISTICA IQUINTO SEMESTRE

PARALELOS:5A15C1

Lic. Jorge Troche Luna

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 2: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 2-----------------------------------------------------------------------------------------

NDICE

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 3: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 3-----------------------------------------------------------------------------------------EL PAPEL DE LA ESTADISTICA

REPRESENTACIONES GRAFICASMEDIDAS DE POSICIONMEDIDAS DE DISPERSIONANALISIS BIVARIANTESPROBABILIDADESANALISIS COMBINATORIO Y PERMUTACIONES

BIBLIOGRAFIA

Estadística descriptiva “ Luis Zapata”.Estadística “Murray/ Spiegel Serie Shawn”Estadística – Tópicos de estadística descriptiva y probabilidades “Maximo Mitak”Estadística descriptiva “Chungara”.Estadística descriptiva “Rufino Molla”.Probabilidades de “Paul Meyer”.Probabilidades de “Rufino Moya”.Estadística y Probabilidades serie Schaum

EL PAPEL DE LA ESTADISTICA

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 4: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 4-----------------------------------------------------------------------------------------

Estadística.-Es una ciencia parte de la matemática teórica aplicada que permite el manejo de información con el

objetivo de describir y tomar decisiones. Se divide en dos grandes áreas:

a) Estadística Descriptiva

b) Estadística Inferencial

a) Estadística Descriptiva.- La estadística descriptiva proporciona un conjunto de técnicas y

métodos para la recolección, organización, resumen, análisis e interpretación de los datos con

el objetivo principal de describir a una población o un conjunto de datos, por medio de cuadro,

tablas e indicadores.

b) Estadística Inferencial.- La estadística proporciona un conjunto de métodos y técnicas

teóricas basadas en la estadística descriptiva y las probabilidades para inferir, estimar,

proyectar, pronosticar con el objetivo principal de la toma de decisiones.

Población.- es un conjunto de personas, animales, objetos u observaciones que tienen al menos

una característica en común y debe estar bien definida en tiempo y espacio.

Ejemplo:

Censo.- Es el recuento de todos los elementos de la población.

Parámetro (θ).- Es una medida obtenida con todos los elementos de la población.

Muestra ( ).- Es un subconjunto de la población que debe ser representativa, es decir debe tener

un tamaño adecuado y debe ser obtenido mediante técnicas de muestreo puesto que la

representatividad que debe tener de garantizar las características y estructuras de la población.

GRAFICA:

Tipos de muestreo.-

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 5: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 5-----------------------------------------------------------------------------------------

Existen varias técnicas de muestreo como ser el muestreo aleatorio simple, el muestreo por

conglomerado, el muestreo estratificado, el muestreo sistemático, entre los principales muestreos

probabilísticos y los muestreos por cuotas o conveniencia entre los muestreos no probabilísticos

Los muestreos probabilísticos se caracterizan por ser obtenidos mediante métodos aleatorios.

Muestreo aleatorio simple:

El procedimiento empleado es el siguiente:

1. Se asigna un número a cada individuo de la población

2. A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios,

números aleatorios

generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para

completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población

que estamos manejando es muy grande.

Ejemplo: formar el equipo de fútbol de la universidad seleccionando 11 boletas de una urna con el nombre de todos los alumnos de la universidad.

Muestreo aleatorio sistemático:

Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en

lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es

un número elegido

al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+

(n−1)k, es

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 6: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 6-----------------------------------------------------------------------------------------decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población

entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un

número al azar entre 1 y k

Muestreo aleatorio estratificado:

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen

reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías

típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica

(se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el

estado civil, etc.).

Muestreo aleatorio por conglomerados:

Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos

de la población, es decir, que las unidades muéstrales son los elementos de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que

forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos

universitarios, una caja de determinado producto, etc., son conglomerados naturales.

Muestreo por cuotas:

También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen

conocimiento de los estratos de la población y/o de los individuos más "representativos" "adecuados"

para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio

estratificado, pero no tiene el carácter de aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que

reúnen unas determinadas condiciones.

Ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

Muestreo opinático o intencional:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 7: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 7-----------------------------------------------------------------------------------------Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras

"representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy

frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han

marcado tendencias de voto.

Estimador (Ô).-Es una medida obtenida únicamente por los valores de la muestra.

Ejemplo:PARAMETROS:

Media PoblacionalVarianza poblacionalTamaño de la PoblaciónProporción poblacional

ESTIMADORES:Media muestralVarianza muestralTamaño de muestraProporción muestral

Variables Observables.-

TIPOS DE VARIABLES CUALITATIVAS NOMINALES

ORDINALES

CUANTITATIVAS DISCRETAS

CONTINUAS

Son características o atributos de los elementos de la población de la población que pueden ser

medidas.

Variables Observables Cualitativas.-Son atributos no numéricos de los elementos de la población y se dividen en variables observables

cualitativas nominal. Que se caracterizan por no tener un orden preestablecido y las variables

observables cualitativas ordinales que se caracterizan por tener un orden preestablecido.

Ejemplo.-

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 8: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 8-----------------------------------------------------------------------------------------

Variables observables cuantitativas.-Son características de la población numéricas que cuantifican únicamente cada uno de ellos. Se

clasifican en cuantitativas Discretas que se caracterizan en tomar valores aislados y enteros. Las

variables observables cuantitativas continuas que se caracterizan por tomar cualquier valor dentro de

un intervalo.

Ejemplo:

Organización y representación de datos.-Ejemplo: ℙ: Mujeres casadas de la zona de Achachicala𝕩: nº de hijos

X (1) = x (Amanda Flores) = 2X (2) = 4 X (6) = 2 X (10) = 1 Conjunto de datosX (3) = 3 X (7) = 2 X (11) = 0X (4) = 0 X (8) = 3 X (12) = 5X (5) = 1 X (9) = 2 X (13) = 4

Distribuciones de Frecuencia.-Son tablas o arreglos divididos en clases o intervalos que permiten resumir de forma ordenada un

conjunto de datos o serie de datos.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 9: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 9-----------------------------------------------------------------------------------------

a) Para variables cualitativas o cuantitativas discretas.

CLASES (K)

Donde:

n: total de las observaciones o tamaño de

muestra.

Frecuencia Absoluta.-Numero de veces que se repite la clase o intervalo

K = G

CUADRO Nº 1

DISTRIBUCION MUJERES CASADAS DE LA ZONA DE ACHACHICALA SEGÚN EL NÚMERO DE HIJOS

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

VARIABLE CONTEO FRECUENCIAX(1) n(1)

X(2) n(2)X(3) n(3): :X(k) n(k)

Nº DE HIJOS ( ) CONTEO Nº DE MUJERES ()

0 I_ 2

1 I_I 32 ⊟ I 63 I_ 24 I_ 25 I 1TOTAL 16

Nº DE HIJOS ( ) CONTEO Nº DE MUJERES

0 I_ 2

1 I_I 32 ⊟ I 63 I_ 24 I_ 25 I 1TOTAL 16

Page 10: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 10-----------------------------------------------------------------------------------------

FUENTE: Sub Alcaldia Zona Norte

b) Para Variables Cuantitativas Continuas

CLASES (K)

Donde:

: Límite o extremo inferior de la clase i

Límite o extremo superior de la clase i

Si el

= = Se dice que la distribución tiene extremos o limites reales, donde cualquier valor x (j)

Se evalúa considerando:

= Se dice que la distribución tiene limites o extremos aparentes, donde cualquier valor x(j)

Se evalúa considerando:

Ejemplo:Distribución estudiantes según nota final de calculo.

EXTREMOS REALES

K = G

5 ≤ K ≤ 15Ejemplo:ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

INTERVALO -

CONTEO FRECUENCIA

- n(1)

- n(2)

- n(3): :

- n(k)

NOTA FINAL -

CONTEO Nº DE ESTUDIANTES ( )

20 – 30 I_I 330 – 42 ⊟⊟ 1042 – 51 ⊟ ⊟⊟⊟⊟ 2551 – 60 ⊟⊟⊟⊟⊟⊟⊟⊟⊟ I_I 4360 – 80 ⊟⊟I_ 1280 - 95 ⊟I 6TOTALES N = 99

Page 11: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 11-----------------------------------------------------------------------------------------Distribución de personas según edad

EXTREMOS APARENTES

Ejemplo:Distribución de estudiantes según estatura (mt.)

Frecuencias Relativas ( ).-Representa la proporción de observaciones de la clase (i) y se define:

Donde:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

INTERVALO -

Nº PERSONAS ( ) EXTREMOS REALES -

10 – 19 6 9.5 – 19.520 – 29 10 19.5 – 29.530 – 39 30 29.5 – 39.540 – 49 15 39.5 – 49.550 – 59 6 49.5 – 59.5TOTALES n = 67

EXTREMOS REALES

-

Nº Est.

% % %

1.40 – 1.44 4 0.044 4 0.44 90 1.001 4.4 4.4 100.1 0.041.44 – 1.52 9 0.1 13 0.144 86 0.957 10 14.4 95.7 0.081.52 – 1.55 15 0.167 28 0.311 77 0.857 16.7 31.1 85.7 0.031.55 – 1.60 23 0.256 51 0.567 62 0.069 25.6 56.7 69 0.051.60 – 1.63 18 0.2 69 0.767 39 0.434 20 76.7 43.4 0.031.63 – 1.69 14 0.156 83 0.923 21 0.234 15.6 93.3 23.4 0.061.69 – 1.80 7 0.078 90 1.00 7 0.078 7.8 100.1 7.8 0.11TOTALES 90 1.001

Page 12: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 12-----------------------------------------------------------------------------------------

Frecuencias acumuladas (menor q).-

Frecuencias acumuladas absolutas ( ).-

Representa el numero de observaciones menor a la clase (i) y se define como:

Frecuencias acumuladas relativas ( ).-Representa la proporción de observaciones menor o la clase (i)

Frecuencias des acumuladas (mayor que).-

Frecuencias des acumuladas absolutas ( ).-Representa el nº de observaciones mayor a la clase (i) y se define:

Frecuencias des acumuladas absolutas ( ).-Representa el nº de observaciones mayor a la clase (i) y se define:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 13: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 13-----------------------------------------------------------------------------------------Frecuencias porcentuales.-

Notación matemática.-

N (1.40 ≤ X < 1.44) = 4P (1.60 ≤ X < 1.63) = 0.2N (X <1.60) = 51P (X < 1.52) = 0.144N (X ≥ 1.52) = 77P (X ≥1.63)=0.234P% (1.69≤X<1.80)=7.8%P% (X<1.60)= 56.7%Ancho de clase ( ) o Amplitud de clase.-Es el tamaño de la clase (i) y se define como el extremo inferior.

b

a)

q

q = (1.62-1.60) = 12

N (x≤1.62)=4+9+15+23+12 = 63

Ejemplo:¿Qué proporción de estudiantes tienen una estatura ≥ a 1.57mt. ?P (x≥1.57)=? 0.078+0.156+0.2+ b b) q

q = (1.60-1.57) = 13.8

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 14: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 14-----------------------------------------------------------------------------------------P (x≥1.57)= 0.078+0.156+0.2+0.153 = 0.587¿Qué % est. (1.49 y 1.64)?

q = (1.52-1.44) = = 0.44q = (1.69-1.64) = = 0.12Método para construir una distribución de frecuencias de anchos iguales de variable continúa.

1) Recorrido ( )

2) Nº de Intervalos (K)

n: total de observaciones o tamaño de muestra3) Ancho de clase ( )

Tomar en cuenta que: 5≤X≤15Ejemplo:ℙ: empleados públicos𝕏: ingreson :30: 1500 (Salario mas bajo):8300(Salario mas alto)

1) =8300-1500=68002) =5.477 =63) = 1242

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

INGRESO -

CONTEO Nº EMPLEADOS PUBLICOS ( )

1500 - 2742 I_I 3 21212742 – 3984 ⊟ I_ 7 33633984 – 5226 ⊟⊟I_ 12 46055226 – 6468 □ 4 58476468 – 7710 I_I 3 70897710 - 9852 I 1 8781TOTALES N = 30

Page 15: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 15-----------------------------------------------------------------------------------------

Ejemplo:Dada la siguiente distribución de anchos iguales y extremos reales, completar dicha frecuencia

1.

2.

3.4.5. 6.7.

8.

Representante de clase o marca de clase.-Es el valor mas representativo de la clase (i); para una variable discreta es la misma variable para una variable continua se define como:

Representaciones graficas.-Nos permiten observar la estructura de la información o el comportamiento a simple vista.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

EXTREMOS REALES

-

Nº Personas

20 – 25 20 0.1 20 200 22.525 – 30 20 0.1 40 180 27.530 – 35 80 0.4 120 160 32.535 - 40 50 0.25 170 80 37.540 - 45 30 0.15 200 30 42.5TOTALES n =200

Page 16: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 16-----------------------------------------------------------------------------------------

Diagramas de barras.-Son representaciones en el plano cartesiano para variables cualitativas y cuantitativas discretas donde en el eje de las abscisas se ubica la variable y en el eje de las coordenadas con barras proporcionales a dichas frecuencias.

Frecuencias ( )

Ejemplo:Distribución de estudiantes según numero de materias aprobadas el anterior semestre.

Diagrama de barras de frecuencia absoluta será:

Diagramas reales de áreas o histogramas.-

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Nº DE MATERIASAPROBADAS ( )

Nº DE ESTUDIANTES ( )

1 22 83 124 155 246 18TOTAL 79

Page 17: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 17-----------------------------------------------------------------------------------------Son representaciones graficas en el plano cartesiano para variables cuantitativas continuas donde en el eje de las coordenadas “x” se encuentran los limites reales de la distribución y en el eje “y” las alturas con rectángulos proporcionales a la frecuencia con base en el ancho de clase.ALTURA ( )

Ejemplo:Distribución de jugadores de un equipo de La Paz según edad.

Polígonos de frecuencia.-Son representaciones graficas en el plano cartesiano de una poligonal generada por la unión de los pares ordenados ( ) o ( ) si la variable es discreta y ( ) si la variable es continua.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

EDAD -

Nº JUGADORES

18 – 20 4 2 220 – 24 5 4 1.2524 – 26 10 2 526 – 27 8 1 827 - 32 4 5 0.832 – 40 4 8 0.5TOTALES n =35

Page 18: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 18-----------------------------------------------------------------------------------------

NOTA: En caso de que la distribución tenga anchos iguales las alturas ( ) pueden ser sustituidas por las frecuencia absolutas ( ).

Diagramas Circulares o tortas.-Son representaciones graficas para variables cualitativas y cuantitativas discretas mediante sectores circulares de tal manera que el ángulo es proporcional.

Ejemplo:Distribución de empresas según razón social

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

RAZON SOCIAL ()

Nº DE EMPRESAS ()

SRL. 10 51SA. 40 205

LTDA. 15 77

SC. 5 27

TOTAL n =70

Page 19: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 19-----------------------------------------------------------------------------------------

Diagramas de frecuencia acumulada y des acumulada.-a) Para variables discretas

Ejemplo:Distribución de estudiantes según número de más asistencias a clase.

Construyendo un diagrama de frecuencia acumulada porcentual tenemos:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

%

Nº DE INASISTENCIA ESTUDIANTES % %

0 12 0.24 0.24 24 1001 15 0.3 0.54 54 762 10 0.2 0.74 74 463 6 0.12 0.86 86 264 4 0.08 0.94 94 145 3 0.06 1 100 6TOTALES 50 1

Page 20: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 20-----------------------------------------------------------------------------------------

P% (X≤2)=74%P% (X≥4)=14%

b) Para variables continuas u ojivas.-NOTA: Los extremos para representaciones graficas deben ser reales.

Ejemplo.-Distribución de empresas según ingreso mensual en miles de dólares.

Estadígrafo.-Es una medida que depende únicamente de los valores obtenidos en una muestra.

Ejemplo:Si

Condiciones que debe cumplir un estadígrafo.-1. Debe estar bien definido es decir no debe ser ambiguo porque debe ser interpretado.2. Deben intervenir la mayoría de las observaciones, mejor si todas.3. Debe prestarse al cálculo.4. No debe ser valores extremos.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

INGRESO -

Nº EMPRESAS

1 – 3 14 14 1203 – 5 25 39 1065 – 8 42 81 81

8 – 12 32 113 39

12 - 15 7 120 7TOTALES n =120

Page 21: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 21-----------------------------------------------------------------------------------------

Tipos de estadígrafo.-De acuerdo a su naturaleza existen:

Estadígrafos o medidas de posición.Estadígrafos o medidas de dispersión.Estadígrafos o medidas de asimetría.Estadígrafos o medidas de curtosis.Estadígrafos o medidas de correlación.Estadígrafos o medidas de regresión.Estadígrafos o medidas de concentración.

MEDIDAS DE POSICION

Definición.-Son medidas que representan a un conjunto de datos también denominados promedios.

Media aritmética(x o x͞ ).-Es el promedio mas conocido y el mas representativo si la distribución es simétrica o casi simétrica del conjunto de los datos y se define como:

Serie de datos no agrupados SD ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 22: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 22-----------------------------------------------------------------------------------------

Distribución de frecuencias o datos agrupados DF

Ejemplo:X: Nº de materias asignadas en este semestre.5, 4, 6, 6, 3 (Serie de datos)

Ejemplo:Distribución de personas según edad.

Propiedades.-1. La M(x) de una constante es la misma constante.2. La M( ) = CM(x)3. La M (x ± y) = M(x) ± M(y)4. a)

b)

5. Si Entonces:

Comprobando la propiedad 4 ene l primer ejemplo:(5-4.8) + (4-4.8) + (6-4.8) + (6-4.8) + (3-4.8) = 0

Comprobando la propiedad en el segundo ejemplo:Si = C=5 y T=32.5

5(-0.035)+ 32.5 = 32.32

Media aritmética ponderada.-ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

EDAD -

Nº PERSONAS

20 – 25 20 22.5 450 5 -2 -4025 – 30 32 27.5 880 5 -1 -3230 – 35 64 32.5 2080 5 0 035 – 40 42 37.5 1575 5 1 4240 - 45 12 42.5 510 5 2 24TOTALES 170 5495 -6

Page 23: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 23-----------------------------------------------------------------------------------------Si es un conjunto de datos donde son los pesos o ponderaciones de los respectivamente, entonces:

Ejemplo:Un estudiante obtuvo las siguientes calificaciones primer parcial 80%, segundo parcial 60%, y el examen final 35%cuyas ponderaciones son: primer parcial 20%, segundo parcial 35%, y el final 45% = 100%.

Ejemplo.-En la universidad salesiana existe 3 paralelos de cálculo cuyos promedios son:

Hallar el promedio o la media aritmética de la materia Calculo I

Ejemplo.-El salario promedio de una empresa de los trabajadores es bs.2640, el salario promedio de las mujeres es bs.2490 y el de salario promedio de los hombres es bs.2700.

= 2490 = 2700

Que porcentaje son hombres y porcentaje son mujeres.M: Porcentaje mujeresH: Porcentaje hombres

264000-249000 = 210H

• H son 71.43%• M son 28.57%

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

PARALELOS Nº ESTUDIANTES

A 50 60B 20 80C 80 55TOTALES 150

Page 24: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 24-----------------------------------------------------------------------------------------Mediana Me (x).-Es el valor que divide a un conjunto de datos ordenados en dos partes iguales

Ejemplo:

Me (x)Para serie de datos si

Si n es impar

Si n es par Ejemplo:X: nota primer parcial 72, 40, 58, 63, 80, 25N = 625, 40, 58, 63, 72, 80

Para distribuciones de frecuenciaSi la variable es discreta

Si la variable es continua

Donde:

La clase que contiene a la mediana es aquella que primero sobrepasa al valor en la columna de las frecuencias acumuladas absolutas en

Ejemplo.-

Ejemplo:Dada la distribución:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Nº HIJOS Nº DE MUJERES

0 6 61 12 182 18 363 32 684 15 835 3 86TOTALES 86

GANANCIA -

Nº E.

1000 - 2000 2 2 1000 0.0022000 – 3000 8 10 1000 0.0083000 – 5000 21 31 2000 0.0115000 – 7000 43 74 2000 0.0227000 – 10000 25 99 3000 0.00810000 – o mas 10 109 ∞TOTALES 109

Page 25: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 25-----------------------------------------------------------------------------------------

Moda (Mo).-Es el valor que mas se repite

Ejemplo:X: Nº de materias aprobadas3, 6, 2, 4, 6, 5, 6, 7… Cuando existen dos se llama bimodal para distribuciones de frecuencia

Si la variable es discreta

En el ejemplo

Si la variable es continua la moda

Donde La clase que contiene a la es aquella cuyo es máximo

La mayoría de las empresas tienen una ganancia de 5880bs.

Momentos ordinarios de orden.-

Si r=0 S.D. Si r≠0

Si r=0 D.F. Si r≠0

En general

Si r= -1 = media armónica ( ) Si r= 0 = media geométrica ( ) Si r= 1 = media aritmética ( ) Si r= 2 = media cuadrática ( )

a)Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 26: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 26-----------------------------------------------------------------------------------------

b) Media geométrica: se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos resultados y al producto fiinal se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).

Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica.La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada.Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información.Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.Luego:

S.D. Media Armónica

D.F.

S.D. Media Geométrica

D.F.

SD Media Aritmética

D.F.

S.D. Media Cuadrática

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 27: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 27-----------------------------------------------------------------------------------------

D.F.

Ejemplo:Gasto en pasajes 3, 8, 2, 5

General:

3.45 ≤ 3.94 ≤4.5 ≤5.049

Relación empírica.-Si un conjunto de datos tiene distribución simétrica o casi simétrica entonces:

Ejemplo.-Distribución de empresas según ganancia (en miles $us).

Media aritmética.-

Mediana.-

Moda.-

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

GANANCIA -

Nº EMP.

1 – 3 3 2 6 3 2 1.5 0.903 123 – 5 6 4 24 9 2 1.5 3.612 965 – 7 12 6 72 21 2 2 9.338 4327 – 9 9 8 72 30 2 1.125 8.128 5769 - 11 2 10 20 32 2 0.2 2 200TOTALES 32 194 6.325 23.981

Page 28: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 28-----------------------------------------------------------------------------------------

Medida de posición no central fractiles.-Estas medidas dividen a la población en partes iguales y sirven para clasificar a un individuo dentro de una determinada muestra o población (mismo concepto que la mediana)

Cuartiles.-Medidas de localización que divide a la población en cuatro partesiguales (Q1, Q2 y Q3).Q1: Valor de la distribución que deja el 75% de los valores por encimaQ2: Valor de la variable que deja el 50% de los valores de la variable por encima (coincide con la mediana)Q3: Valor de la variable que deja el 25% de los valores de la variable por encima

Deciles.-Medidas de localización que divide a la población en diez partes iguales dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de la distribución.

Percentiles.-Medidas de localización que divide a la población en cien partes iguales. El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.Pk = Percentil k-ésimo es aquel valor que deja a su izquierda el K*1% de la distribución

Reflexiones sobre las medidas de posición central.-a) La media, la mediana y la moda coinciden en toda distribución simétrica o normalb) La media aritmética es la medida de posición que más se utiliza pues normalmente es la que mejor representa los datos, al intervenir todos ellos en su deter minación. Por otra parte permite la aplicación del cálculo de probabilidades. Ahora bien, tiene el inconveniente de que en el caso de que exista una gran diferencia entre los valores extremos pierda gran parte de su utilidad al estar afectada por ellos. Por ello en este caso es más conveniente el uso de la mediana.c) Un promedio puede actuar como medida de tendencia central solamente si existe una cantidad considerable de concentración en la distribución de frecuencias, es decir, que la variación no es demasiado grande.d) Un promedio sirve como una medida útil de localización para comparar dos o más distribuciones de frecuencias solamente si las que se comparan tienen aproximadamente la misma forma.

Medidas de dispersión.-

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 29: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 29-----------------------------------------------------------------------------------------Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los valores en general están cerca o alejados de estos valores centrales, para ver si estos valores son o no son representativos. Es por esto por lo que surge la necesidad de estudiar medidas de dispersión. Los momentos son valores específicos de la distribución y van íntimamente ligados a las medidas de dispersión y se hallan con la siguiente fórmula:

Momentos de orden rMomentos respecto al origen (Momentos respecto ala media

El momento de orden r es el promedio de las desviaciones de los valores de una variable, con respecto al origen o a la media, elevadas a la potencia r.Relación entre momentos:m0 = a0

a1= mediam1= 0

Desviación media.-Mide el grado de dispersión de un conjunto de datos con respecto ala media aritmética es decir mide la distancia promedio entre los valores observados y su media, se define como la DM(x).

Ejemplo:𝕏: Edad 19,22,25,23

Tiene una diferencia de 1 año,75.

Desviación mediana.-

Desviación estándar ( ).-(Desviación típica)La desviación típica es la mejor medida de dispersión y la más empleada. Cuando las distribuciones de frecuencias se aproximan a una distribución simétrica o normal entonces se verifica una propiedad muy importante que consiste, en que aproximadamente:

El 68% de los valores de la variable están comprendidos entrex ± s El 95% de los valores de la variable están comprendidos entre

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 30: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 30-----------------------------------------------------------------------------------------

x ± 2s El 99% de los valores de la variable están comprendidos entrex ± 3s

Ejemplo:

Varianza ( ).-Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

Propiedades.-1.2.3.

4.Ejemplo.-Distribución de estudiantes según peso corporal (Kg)

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

PESO CORPORAL -

Nº EST.

40 – 45 4 42.5 170 51.428 661.21 722545 - 50 10 47.5 475 78.57 617.32 22562.550 – 55 18 52.5 945 51.48 146.92 49612.555 – 60 22 57.5 1265 47.146 101.03 72737.560 – 65 12 57.5 750 85.716 612.27 4687565 - 70 4 62.5 270 48.572 589.81 18225TOTALES 70 67.5 3875 362.858 2728.56 217237.5

Page 31: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 31-----------------------------------------------------------------------------------------Mediante la propiedad 4.-

En el ejemplo: T=57.5 C=5

Luego:

Coeficiente de variación.-El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

El coeficiente de variación se suele expresar en porcentajes:

El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas.Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.La mayor dispersión corresponderá al valor del  coeficiente de variación mayor.Ejemplo.-Una distribución tiene x = 140 y σ = 28.28 y otra  x = 150 y σ = 24. ¿Cuál de las dos presenta mayor dispersión?

La primera distribución presenta mayor dispersión .

Desviación intercuartil o Rango Intercuartil.-Es la diferencia entre los cuartiles 3 y 1. Es decir, es el rango del 50\% de las observaciones centrales, las más representativas de la masa de datos. Tiene la propiedad de ser muy resistente a valores extremos.DIC = Q3-Q1

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 32: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 32-----------------------------------------------------------------------------------------

Relaciones empíricas.-

Mejores medidas.-MEDIDAS SIMETRICA ASIMETRICAPOSICION CENTRALDISPERSION Q

Variable estandarizada.-Se define como:

: De variable a variable

Es decir:

: a valor a valor

Coeficiente de simetría.-

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 33: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 33-----------------------------------------------------------------------------------------Cuantifica el grado de asimetría que presenta la muestra. Se define como el promedio de los cubos de las desviaciones en torno a la media, dividido por la desviación standard elevada también al cubo. La fórmula es:

Si los datos presentan una cola larga hacia la derecha, el coeficiente de simetría es positivo. Si presentan una cola larga hacia la hacia la izquierda, el coeficiente de simetría es negativo. Si hay simetría, el coeficiente es cercano a cero.

Ejemplo: coeficiente de simetría

El signo positivo del coeficiente de simetría de la muestra 1 indica que tiene sesgo hacia la derecha. El coeficiente de simetría de la muestra 2 indica que no tiene sesgo. La muestra 3 tiene sesgo hacia la izquierda.

Coeficiente de curtosis.-Cuantifica el hecho que la masa de datos presenta una forma de campana (mesocúrtica), una formamás bien puntiaguda en la parte central (leptocúrtica) o muy plana (platicúrtica). El coeficiente de curtosis se define como el promedio de las desviaciones elevadas a la cuarta potencia, respecto de la media, dividido por la desviación standard elevado a la cuarta. A todo esto se le resta el número 3. La fórmula es

Los datos con forma de campana (mesocúrticos) tienen un coeficiente de curtosis cercano a cero. Sison leptocúrticos o con forma puntiaguda, el coeficiente es negativo. Si son planos o platicúrticos, sucoeficiente de curtosis es positivo.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 34: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 34-----------------------------------------------------------------------------------------

Ejemplo.- Coeficiente de curtosis

Los primeros dos conjuntos aparecen con forma lepticúrtica (puntiagudos), mientras el de la muestra3 aparece con forma platicúrtica (más plano). Eso se puede apreciar por el hecho que las tres barrasmás grandes, en el histograma correspondiente a este tercer conjunto, tienen alturas similares. Si secomparan con los histogramas de los primeros dos conjuntos, hay más diferencia entre la barra másalta y las que le siguen.

Análisis bivariante.-Distribuciones bidimensionales.-

En algunos experimentos las medidas que se obtienen son dobles, pertenecientes a dos variables distintas, a las que llamaremos X e Y respectivamente. Este tipo de estudios es muy frecuente. Daremos algunos ejemplos:

Comparación entre mortalidad y natalidad Ídem entre extensión y población de diversos países. Diferencias de renta entre la población en general y los titulados universitarios. Pruebas pretest y postest. Influencia de la latitud en la temperatura media. Ídem de las horas de estudio en la calificación en una asignatura. Etc.

Tipos de variables Las dos variables que se comparan pueden ser de igual naturaleza, ambas nominales u ordinales o de intervalo, o de distinta, lo que da lugar a muchos casos posibles, que es imposible estudiarlos todos en este curso. Incluimos algunos ejemplos: Tablas simples de comparación de dos datos cuantitativos

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 35: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 35-----------------------------------------------------------------------------------------

En estos casos cada par de valores representa a un sujeto o medición. Se representan mediante gráficos de dispersión XY

Distribuciones de frecuencia bivariantes.-a) Tablas de doble entrada:

En ellas la X y la Y pueden ser de naturaleza muy distinta, por lo que se disponen en tabla de doble entrada. Cuando existen frecuencias, es el mejor método, pues permite tratar una variable por columnas y otra por filas. La siguiente tabla muestra la distribución de las llamadas telefónicas con origen o destino en los cuatro hijos de una pareja.

Estas tablas de doble entrada con frecuencias admiten una representación gráfica muy intuitiva mediante barras (columnas) ordenadas en varios conjuntos mediante tres ejes.

Tipos de frecuencias en una distribución bidimensional.-ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 36: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 36----------------------------------------------------------------------------------------- Para aclarar las definiciones de los tipos de frecuencias usaremos la siguiente tabla:

Frecuencias conjuntas.- Se representan por nij, y son las frecuencias incluidas en la tabla primitiva de entrada. Los subíndices i y j representan la fila y columna en la que está situada la frecuencia.Así, en la tabla n13 = 7 y n34 = 13 Llamaremos N a la suma total de estas frecuencias. En el ejemplo, N es 109. Representaremos este hecho mediante un sumatorio doble sin índices, para no complicar las fórmulas:

Al conjunto de las frecuencias conjuntas lo denominaremos como Distribución conjunta de las dos variables.

Frecuencias marginales.- Llamaremos frecuencia marginal de un valor de X, a la que le corresponde a ese valor si no tenemos en cuenta la existencia de Y. En la práctica coincide con la suma de todas las frecuencias contenidas en la fila correspondiente a ese valor. En la tabla del ejemplo, la frecuencia marginal de B es 26, suma de las frecuencias de la segunda fila. La frecuencia marginal de la fila i se representará por ni* De la misma forma se define la frecuencia marginal en la variable Y, como la que tendría si no se tuviera en cuenta la X, o la suma de la columna correspondiente. En el ejemplo, la frecuencia marginal de Marzo es n*3 = 20

Frecuencias condicionadas.- Son las frecuencias que posee una variable si sólo consideramos un valor (o varios) de la otra variable. En la práctica se traduce a considerar sólo una fila o sólo una columna, según el valor elegido. Las frecuencias condicionadas se representan con este símbolo: nx/y, que se puede leer como Frecuencia de x condicionada por y. En la tabla del ejemplo, la distribución de X condicionada a Marzo es la columna A=7, B=6, C=7. Las frecuencias condicionadas son más representativas si se convierten en proporciones o porcentajes. Medidas en una distribución bidimensional.- Al existir dos variables X e Y, las medidas también son dobles. Así, consideraremos las siguientes:

Media de X.-Tiene la misma definición que en el caso unidimensional. Viene dada por la fórmula

si los datos están aislados y por esta otra

si están agrupados.

Media de la Y.- Se define de forma similar:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 37: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 37-----------------------------------------------------------------------------------------y para agrupados

(Las siguientes definiciones las desarrollaremos sólo para aislados, pues su traducción es fácil)

Varianzas y desviaciones típicas.- También serán dobles: La varianza de X será

y su desviación típica sx será la raíz cuadrada de esa expresión. En el caso de Y la definición es similar:

Covarianza.- Esta medida es muy interesante. Mide el paralelismo existente entre ambas variables (en función sólo de los datos presentes en la tabla). Si la covarianza es grande, manifestará la existencia de un cierto paralelismo o dependencia (en sentido estadístico) entre X e Y. Si es pequeña, indicará que ambas variables se comportan de manera más independiente. Su definición es:

y puede ser positiva, cero o negativa. El significado de la varianza es el siguiente: Si en el numerador la mayoría de los productos son positivos, será porque las diferencias de X y de Y tienen el mismo signo. Eso significa que para X mayor que la media, la Y también lo es, y al contrario, a valores pequeños de X le corresponden pequeños en Y. Por tanto, los productos serán mayoritariamente positivos y la varianza crecerá. Una varianza positiva y alejada del valor cero indica un cierto paralelismo entre X e Y, en el que a valores mayores de X le corresponden los mayores en Y. Si los productos son mayoritariamente negativos, es que las diferencias tienen distintos signos, por lo que Una varianza negativa y alejada del cero indica un paralelismo inverso, en el que a valores pequeños de X le corresponden valores grandes de Y, y a la inversa.Por último, si están muy repartidos los productos positivos y negativos, es que apenas existe paralelismo, y la varianza se acercará a cero. El problema de la varianza es que carece de un valor máximo, por lo que es difícil juzgar si la correspondencia entre las dos variables es la mejor posible.

Coeficiente de correlación.- Como en el caso de una variable, la covarianza no es adecuada para establecer comparaciones entre medidas muy diferentes, además del inconveniente de no tener un valor máximo, lo que impide valorar el grado de paralelismo existente en los datos. Para normalizar la covarianza procederemos como en el Coeficiente de Variación: dividiremos dicha covarianza entre las dos desviaciones típicas (de X y de Y respectivamente). Al resultado le daremos el nombre de Coeficiente de correlación y lo representaremos por r.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 38: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 38-----------------------------------------------------------------------------------------El coeficiente r también recibe el nombre de Coeficiente de Pearson o también Coeficiente de correlación producto-momento. También se puede demostrar que este coeficiente es en realidad la covarianza del conjunto si expresamos los datos en medidas típicas z (ver sesión 3). El valor de r oscila entre -1 y +1, y mide el paralelismo o correlación entre X e Y. Si sus valores se acercan a 1 o a -1, diremos que existe correlación fuerte, y está cerca del cero, débil. Podemos desarrollar más estos comentarios mediante una tabla:

Se deben evitar interpretaciones erróneas del coeficiente r. Seleccionamos las más frecuentes: La dependencia es sólo matemática: no supone relación causa-efecto. Las causas nunca son tan simples y pueden existir, pero respecto a una tercera variable.Se deben evitar demasiados adjetivos como correlación regular, media, pues el significado exacto de r depende de cada experimento en concreto. Si la relación entre datos es de tipo curvilíneo, el coeficiente r pierde representatividad. A veces, si existe asimetría, r no puede acercarse al 1.

PROBABILIDADES

La probabilidad y la estadística son, sin duda, las ramas de las Matemáticas que están en mayorauge en este siglo, y tienen una tremenda aplicabilidad en todos los aspectos y ciencias, especialmente en las Ciencias Sociales, puesto que aquellas variables que influyen en dichas ciencias, económicas, demográficas, suelen tener carácter aleatorio, es decir, no son deterministas, y se fundamentan en predicciones a partir de datos conocidos. Todo aquello que implique predicción nos lleva al terreno de la probabilidad.

Experimentos aleatorios.-En todos los aspectos de la vida a veces nos encontramos con acontecimientos predeterminados, esdecir, tales que podemos decir el resultado de dichos acontecimientos antes de que finalice o inclusode que comience. Tal es el caso de:

1. Tirar una piedra desde un edificio (sabemos que se caerá).2. Calentar un cazo de agua (sabemos que la temperatura sube).3. Golpear una pelota (sabemos que se va a mover, e incluso conociendo fuerzas que actúan, etc.,Podemos conocer precisamente donde caerá ).

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 39: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 39-----------------------------------------------------------------------------------------Tales acontecimientos o experimentos de los que podemos predecir el resultado antes de que se realicen se denominan experimentos deterministas. Sin embargo, analicemos otro tipo de experimentos, mucho mas interesantes desde el punto de vista matemático:Imaginemos que lanzamos un dado al aire (normal, de 6 caras y no trucado). .Podemos predecir el resultado que vamos a obtener?. Evidentemente no. Este es un experimento que no es determinista.A este tipo de experimentos, en los cuales no se puede predecir el resultado antes de realizar el experimento se les denomina experimentos aleatorios.Otros ejemplos de experimentos aleatorios pueden ser:Tirar una moneda al aire y observar que lado cae hacia arriba, rellenar una quiniela de futbol,jugar una partida de póker y, en general, cualquier juego en el que intervenga el azar.

Ejemplo:1. .Cual es el espacio muestral asociado al experimento de lanzar un dado normal al aire y observarla cara que queda hacia arriba?.Evidentemente, en este caso hay 6 posibles resultados (6 sucesos elementales) y el espacio muestralestará formado por: E={1,2,3,4,5,6}.

2. .Y en el caso del lanzamiento de una moneda?Entonces E={C,X}Evento o suceso.-Llamaremos suceso aleatorio a cualquier subconjunto del espacio muestral. El concepto de sucesoes fundamental en probabilidad. Dicho de forma simple, un suceso de un experimento aleatorio escualquier cosa que se nos ocurra afirmar sobre dicho experimento.Así, si tiramos una moneda dos veces, serían sucesos todos los siguientes:

1. Sale al menos una cara.2. Salen mas caras que cruces.3. La moneda cae de canto.4. No sale ninguna cruz.

Llamaremos suceso imposible al que no tiene ningún elemento y lo representaremos por .Llamaremos suceso seguro al formado por todos los posibles resultados (es decir, al espacio muestral).Llamaremos espacio de sucesos y lo representaremos por S, al conjunto de todos los sucesos aleatorios.

Ejemplo:De cuantas maneras posibles se puede elegir a un presidente y un secretario de un grupo de 7 personas. A, B, C, D, E, F, G

Ω = {(A,B);(A,C);(A,D);(A,E);(A,F);(A,G)}

Ejemplo:Una moneda tiene dos lados cara (c)y sello (s). Se lanza la moneda. Halar el espacio muestral.

a) Una vezΩ = {c, s }

b) Dos vecesΩ = {cc, cs, ss,}

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 40: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 40-----------------------------------------------------------------------------------------

c) Tres vecesΩ = {ccc, ccs, css, csc, scc, ssc, sss}

Ejemplo:Se tira una moneda 3 veces. Calcular la probabilidad de obtener alguna cara.Los problemas de este tipo, en los que se pide la probabilidad de obtener “alguna” cosa, se suelenresolver muy bien por paso al complementario. En este caso concreto, A = “obtener alguna cara”.

= “no obtener ninguna cara”= “obtener 3 cruces”.

Entonces, p(A) = , pues hay 8 casos posibles (2·2·2!,haz el diagrama de árbol!) y solo unofavorable (XXX, 3 cruces), por tanto:

Tipos de conjuntos.-ExtensiónComprensiónDiagrama de ven

A= {a, e, i, o, u} extensión A= {x∖ x es una vocal} comprensiónDiagrama de ven

Método del árbol.-

Ω= = es un producto cartesiano =

a) Hasta que salga caraΩ = {c, sc, ssc, sssc, ssssc,…,}

b) Hasta que saldo dos carasESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 41: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 41-----------------------------------------------------------------------------------------

Ω = {cc, scc, csc, sscc, scsc,…,}

Definición axiomática.-Las definiciones anteriores son netamente empíricas o experimentales, sin embargo después de establecer una forma de determinar la probabilidad experimentalmente, se pueden deducir leyes o propiedades de la probabilidad en forma lógica o computacional bajo ciertas suposiciones llamados axiomas de la probabilidad.La probabilidad de un evento A se define como el número P(A), tal que cumple con los siguientes axiomas:

AXIOMA 1: La probabilidad P(A) de cualquier evento no debe ser menor que cero ni mayor que uno: 0 < P(A) < 1AXIOMA 2: P(S) = 1AXIOMA 3: Si A y B son dos eventos mutuamente exclusivos (A Ç B = Æ ), entonces: P (A È B) = P(A) + P(B)Toda la teoría elemental de la probabilidad está construida sobre las bases de estos tres simples axiomas.Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por elAXIOMA 4: Si A1, A2, … son eventos mutuamente exclusivos, entonces tenemos queP(A1 È A2 È …) = P(Al) + P(A2) +…+

Teoremas.-Además de P(E) = 1, P( ) = 0, 0   P(A)   1, tenemos:1) Si A   B =   (A y B se excluyen mutuamente) entonces:

P(A   B) = P(A) + P(B)2)  P(A) + P(Ac) = 13) Si A B     entonces 

 P(A   B) = P(A) + P(B) - P(A   B)4) Si A y B son eventos independientes ( la ocurrencia de A no influye en la ocurrencia de B), entonces 

 P(A   B) = P(A) • P(B)5) Si A y B son eventos dependientes (la ocurrencia de A influye en la ocurrencia de B), entonces 

 P(A   B) = P(A) • P(B/A) P(B/A) es la probabilidad del evento B, sabiendoque ha ocurrido A.

Ejemplo:María y José son dos amigos la probabilidad que María asista a clases es 0.8 y José 0.65 y la probabilidad de que ambos asistan a clases es 0.53.

DATOS:M: asista a clases MaríaJ: asista a clases JoséP(M)=0.8P(J)=0.65P(M∩J)=0.53

a) Cual es la probabilidad que María no asista.P(M)=1 – P(M) = 1 – 0.8 =0.2

b) Cual es la probabilidad que solo asista José.P(J∩ )= P(J) – P(M∩J)

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 42: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 42-----------------------------------------------------------------------------------------

= 0.65 – 0.53 =0.12

c) Cual es la probabilidad que ninguno asista.P( ∩ )= 1 – P(M∩J)

= 1 - [P(M)+P(J) - P(M∩J)]= 1 - [(0.8+0.65) – 0.53] = 0.08

ANALISIS COMBINATORIO Y PERMUTACIONES

¿Qué diferencia hay?

Normalmente usamos la palabra "combinación" descuidadamente, sin pensar en si el  orden de las cosas es importante. En otras palabras:

"Mi ensalada de frutas es una combinación de manzanas, uvas y bananas": no importa en qué orden pusimos las frutas, podría ser "bananas, uvas y manzanas" o "uvas, manzanas y bananas", es la misma ensalada.

"La combinación de la cerradura es 472": ahora sí importa el orden. "724" no funcionaría, ni "247". Tiene que ser exactamente 4-7-2.

Así que en matemáticas usamos un lenguaje más preciso:

Si el orden no importa, es una combinación.Si el orden sí importa es una permutación.

Con otras palabras:

Una permutación es una combinación ordenada.

Permutaciones.-

Hay dos tipos de permutaciones:

Se permite repetir: como la cerradura de arriba, podría ser "333". Sin repetición: por ejemplo los tres primeros en una carrera. No puedes quedar

primero y segundo a la vez.

Permutaciones con repetición.-

Son las más fáciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las permutaciones posibles son:

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 43: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 43-----------------------------------------------------------------------------------------n × n × ... (r veces) = nr

(Porque hay n posibilidades para la primera elección, DESPUÉS hay n posibilidades para la segunda elección, y así.)

Por ejemplo en la cerradura de arriba, hay 10 números para elegir (0,1,...,9) y eliges 3 de ellos:

10 × 10 × ... (3 veces) = 103 = 1000 permutaciones

Así que la fórmula es simplemente:

nr

donde n es el número de cosas que puedes elegir, y eliges r de ellas(Se puede repetir, el orden importa)

 Permutaciones sin repetición.-

En este caso, se reduce el número de opciones en cada paso.

Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?

Después de elegir por ejemplo la "14" no puedes elegirla otra vez.

Así que tu primera elección tiene 16 posibilidades, y tu siguiente elección tiene 15 posibilidades, después 14, 13, etc. Y el total de permutaciones sería:

16 × 15 × 14 × 13 ... = 20,922,789,888,000

Pero a lo mejor no quieres elegirlas todas, sólo 3 de ellas, así que sería solamente:

16 × 15 × 14 = 3360

Es decir, hay 3,360 maneras diferentes de elegir 3 bolas de billar de entre 16.

¿Pero cómo lo escribimos matemáticamente? Respuesta: usamos la "función factorial"

La función factorial (símbolo: !) significa que se multiplican números descendentes. Ejemplos:

4! = 4 × 3 × 2 × 1 = 24 7! = 7 × 6 × 5 × 4 × 3 × 2 × 1 = 5040

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 44: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 44-----------------------------------------------------------------------------------------

1! = 1

Nota: en general se está de acuerdo en que 0! = 1. Puede que parezca curioso que no multiplicar ningún número dé 1, pero ayuda a simplificar muchas ecuaciones.

Así que si quieres elegir todas las bolas de billar las permutaciones serían:

16! = 20,922,789,888,000

Pero si sólo quieres elegir 3, tienes que dejar de multiplicar después de 14. ¿Cómo lo escribimos? Hay un buen truco... dividimos entre 13!...

16 × 15 × 14 × 13 × 12 ...= 16 × 15 × 14 = 3360

13 × 12 ...

¿Lo ves? 16! / 13! = 16 × 15 × 14

La fórmula se escribe:

donde n es el número de cosas que puedes elegir, y eliges r de ellas(No se puede repetir, el orden importa)

Ejemplo:

Nuestro "ejemplo de elegir en orden 3 bolas de 16" sería:

16!=

16!=

20,922,789,888,000= 3360

(16-3)! 13! 6,227,020,800

¿De cuántas maneras se pueden dar primer y segundo premio entre 10 personas?

10!=

10!=

3,628,800= 90

(10-2)! 8! 40,320

(que es lo mismo que: 10 × 9 = 90)

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 45: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 45-----------------------------------------------------------------------------------------Notación

En lugar de escribir toda la fórmula, la gente usa otras notaciones como:

Combinaciones.-

También hay dos tipos de combinaciones (recuerda que ahora el orden no importa):

Se puede repetir: como monedas en tu bolsillo (5,5,5,10,10) Sin repetición: como números de lotería (2,14,15,27,30,33)

Combinaciones con repetición.-

En realidad son las más difíciles de explicar, así que las dejamos para luego.

Combinaciones sin repetición.-

Así funciona la lotería. Los números se eligen de uno en uno, y si tienes los números de la suerte (da igual el orden) ¡entonces has ganado!

La manera más fácil de explicarlo es:

imaginemos que el orden sí importa (permutaciones), después lo cambiamos para que el orden no importe.

Volviendo a las bolas de billar, digamos que queremos saber qué 3 bolas se eligieron, no el orden.

Ya sabemos que 3 de 16 dan 3360 permutaciones.

Pero muchas de ellas son iguales para nosotros, porque no nos importa el orden.

Por ejemplo, digamos que se tomaron las bolas 1, 2 y 3. Las posibilidades son:

El orden importa El orden no importa1 2 31 3 2

1 2 3

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 46: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 46-----------------------------------------------------------------------------------------

2 1 32 3 13 1 23 2 1

Así que las permutaciones son 6 veces más posibilidades.

De hecho hay una manera fácil de saber de cuántas maneras "1 2 3" se pueden ordenar, y ya la sabemos. La respuesta es:

3! = 3 × 2 × 1 = 6

(Otro ejemplo: 4 cosas se pueden ordenar de 4! = 4 × 3 × 2 × 1 = 24 maneras distintas, ¡prueba tú mismo!)

Así que sólo tenemos que ajustar nuestra fórmula de permutaciones para reducir por las maneras de ordenar los objetos elegidos (porque no nos interesa ordenarlos):

Esta fórmula es tan importante que normalmente se la escribe con grandes paréntesis, así:

donde n es el número de cosas que puedes elegir, y eliges r de ellas(No se puede repetir, el orden no importa)

Y se la llama "coeficiente binomial".

Notación

Además de los "grandes paréntesis", la gente también usa estas notaciones:

Ejemplo:

Entonces, nuestro ejemplo de bolas de billar (ahora sin orden) es:

16! = 16! = 20,922,789,888,000 = 560

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 47: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 47-----------------------------------------------------------------------------------------

3!(16-3)! 3!×13! 6×6,227,020,800

O lo puedes hacer así:

16×15×14=

3360= 560

3×2×1 6

Es interesante darse cuenta de que la fórmula es bonita y simétrica:

Con otras palabras, elegir 3 bolas de 16 da las mismas combinaciones que elegir 13 bolas de 16.

16!=

16!=

16!= 560

3!(16-3)! 13!(16-13)! 3!×13!

Triángulo de Pascal.-

Puedes usar el triángulo de Pascal para calcular valores. Baja a la fila "n" (la de arriba es n=0), y ve a la derecha "r" posiciones, ese valor es la respuesta. Aquí tienes un trozo de la fila 16:

1 14 91 364 ...1 15 105 455 1365 ...1 16 120 560 1820 4368 ...

 Combinaciones con repetición.-

Ejemplo:

Digamos que tenemos cinco sabores de helado: banana, chocolate, limón, fresa y vainilla. Puedes tomar 3 paladas. ¿Cuántas variaciones hay?

Vamos a usar letras para los sabores: {b, c, l, f, v}. Algunos ejemplos son

{c, c, c} (3 de chocolate) {b, l, v} (uno de banana, uno de limón y uno de vainilla) {b, v, v} (uno de banana, dos de vainilla)

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 48: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 48-----------------------------------------------------------------------------------------(Y para dejarlo claro: hay n=5 cosas para elegir, y eliges r=3 de ellas.El orden no importa, ¡y sí puedes repetir!)

Bien, no puedo decirte directamente cómo se calcula, pero te voy a enseñar una técnica especial para que lo averigües tú mismo.

Imagina que el helado está en contenedores, podrías decir "sáltate el primero, después 3 paladas, después sáltate los 3 contenedores siguientes" ¡y acabarás con 3 paladas de chocolate!

Entonces es como si ordenaras a un robot que te trajera helado, pero no cambia nada, tendrás lo que quieres.

Ahora puedes escribirlo como   (la flecha es saltar, el círculo es tomar)

Entonces los tres ejemplos de arriba se pueden escribir así:

{c, c, c} (3 de chocolate):{b, l, v} (uno de banana, uno de limón y uno de vainilla):{b, v, v} (uno de banana, dos de vainilla):

entonces ya no nos tenemos que preocupar por diferentes sabores, ahora tenemos un problema más simple para resolver: "de cuántas maneras puedes ordenar flechas y círculos"

Fíjate en que siempre hay 3 círculos (3 paladas de helado) y 4 flechas (tenemos que movernos 4 veces para ir del contenedor 1º al 5º).

Así que (en general) hay r + (n-1) posiciones, y queremos que r de ellas tengan círculos.

Esto es como decir "tenemos r + (n-1) bolas de billar y queremos elegir r de ellas". Es decir, es como el problema de elegir bolas de billar, pero con números un poco distintos. Lo podrías escribir así:

donde n es el número de cosas que puedes elegir, y eliges r de ellas(Se puede repetir, el orden no importa)

Es interesante pensar que podríamos habernos fijado en flechas en vez de círculos, y entonces habríamos dicho "tenemos r + (n-1) posiciones y queremos que (n-1) tengan flechas", y la respuesta sería la misma...

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 49: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 49-----------------------------------------------------------------------------------------

¿Qué pasa con nuestro ejemplo, cuál es la respuesta?

(5+3-1)!=

7!=

5040= 35

3!(5-1)! 3!×4! 6×24

Definición empírica “a posteriori” o frecuencial.-La definición clásica se ve limitada a situaciones en las que hay un número finito de resultados igualmente probables. Por desgracia, hay situaciones prácticas que no son de este tipo y la definición de Laplace no se puede aplicar. Por ejemplo, si se pregunta por la probabilidad de que un paciente se cure mediante cierto tratamiento médico, o la probabilidad de que una determinada máquina produzca artículos defectuosos, entonces no hay forma de introducir resultados igualmente probables. Por ello se necesita un concepto más general de probabilidad. Una forma de dar respuesta a estas preguntas es obtener algunos datos empíricos en un intento por estimar las probabilidades.Supongamos que efectuamos un experimento n veces y que en esta serie de n ensayos el evento Aocurre exactamente r veces, entonces la frecuencia relativa del evento es  ,o sea, 

Si continuamos calculando esta frecuencia relativa cada cierto número de ensayos, a medida que aumentamos n, las frecuencias relativas correspondientes serán más estables; es decir; tienden a ser casi las mismas; en este caso decimos que el experimento muestra regularidad estadística o estabilidad de las frecuencias relativas. Esto se ilustra en la siguiente tabla, de una moneda lanzada al aire 1000 veces. 

# de lanzamientos

# de

caras

Frecuencia relativa

Frecuencia acumulada

Frecuencia acumulada relativa

1 - 100 52 0.52 52 0.520

100 - 200 53 0.53 105 0.525

200 - 300 52 0.52 157 0.523

300 - 400 47 0.47 204 0.510

400 - 500 51 0.51 255 0.510

500 - 600 53 0.53 308 0.513

600 - 700 48 0.48 356 0.509

700 - 800 46 0.46 402 0.503

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 50: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 50-----------------------------------------------------------------------------------------

800 - 900 52 0.52 454 0.504

900 -1000 54 0.54 508 0.508

Total: 1000 508 0.508

 

En un total de 1000 lanzamientos ocurrieron 508 caras, es decir la frecuencia relativa es aproximadamente 0.50.

Tres investigadores realizaron experimentos y obtuvieron los siguientes resultados

Investigador Número de lanzamientos

Número de caras

Frecuencia relativa

Buffon 4040 2048 0.5069

K. Pearson 12000 6019 0.5016

K. Pearson 24000 12012 0.5005

La mayoría de experimentos aleatorios de importancia práctica tienen estabilidad, por esto podemos sospechar que prácticamente será cierto que la frecuencia relativa de un evento E en un gran número de ensayos es aproximadamente igual a un determinado número P(E), o sea, la probabilidad del evento E es

Obsérvese que este número es una propiedad que no depende solamente de E, sino que se refiere a un cierto espacio muestra S y a un experimento aleatorio. Entonces, decir que el evento E tiene probabilidad P(E) significa que si efectuamos el experimento muchas veces, es prácticamente cierto que la frecuencia relativa de E, fr(E) es aproximadamente igual a P(E).

Cuando se usa la definición frecuencial, es importante tomar en cuenta los siguientes aspectos:

i. La probabilidad obtenida de esta manera es únicamente una estimación del valor real.ii. Cuanto mayor sea el número de ensayos, tanto mejor será la estimación de la probabilidad;

es decir, a mayor número de ensayos mejor será la estimación.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 51: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 51-----------------------------------------------------------------------------------------iii. La probabilidad es propia de sólo un conjunto de condiciones idénticas a aquéllas en las que

se obtuvieron los datos, o sea, la validez de emplear esta definición depende de que las condiciones en que se realizó el experimento sean repetidas idénticamente.

Probabilidad condicional.-

Para dos eventos cualesquiera A y B en un espacio muestra S, tales que P(A) > 0 con P(A) ¹ 0, la probabilidad del evento B dado el evento A, se define por .

En esta sección examinaremos como la probabilidad de ciertos eventos depende o se ve influida por la ocurrencia de otros. Para ello veremos algunos ejemplos.

Ejemplo:

Se seleccionan dos semillas aleatoriamente, una por una, de una bolsa que contiene 10 semillas de flores rojas y 5 de flores blancas. ¿Cuál es la probabilidad de que:

a. La primera semilla sea roja?b. La segunda semilla sea blanca dado que la primera fue roja?

Solución:

a. La probabilidad de que la primera semilla sea roja es  , puesto que hay 10 semillas de flores

rojas de un total de 15. Escrito con notación de probabilidad tenemos: b. La probabilidad de que la segunda semilla sea blanca se ve influida por lo que salió primero,

es decir esta probabilidad está sujeta a una condición, la de que la primera semilla sea roja.

Este tipo de probabilidad se le llama probabilidad condicional y se denota por 

, y se lee: la probabilidad de B2 dado R1.

Esta probabilidad  , puesto que todavía hay 5 semillas blancas en un total de 14 restantes.

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna

Page 52: UNIVERSIDAD SALESIANA DE BOLIVIA - AULA …virtual.usalesiana.edu.bo/.../plandisciplina/22016/4330.docx · Web viewMide el grado de dispersión de un conjunto de datos con respecto

UNIVERSIDAD SALESIANA DE BOLIVIA 52-----------------------------------------------------------------------------------------Veamos la situación en un diagrama de árbol:

Probabilidad conjunta.-La que da la probabilidad de la intersección de dos eventos. La tabla de probabilidad conjunta proporciona un resumen de la información de probabilidad. 

ESTADISTICA I -----------------------------------------------------------------------------------------Lic. Jorge Justo Troche Luna