textoest218

PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU

ESTADISTICAPARA INGENIERIA

Autor:

Dr. Cristian Bayes

Lima, Marzo 2014

Bayes, C.

ii

Indice general

1. Organizacion y resumen de datos 1

1.1. Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Organizacion de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3. Medidas de Tendencia Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.4. Medidas de Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.5. Medidas de Forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.6. Graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. Probabilidad 19


2.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.3. Calculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.4. Conteo de puntos muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.5. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.6. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3. Variable Aleatoria 35


3.2. Variable Aleatoria Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3. Variable Aleatoria Continua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.4. Otras propiedades de valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.5. Funcion de una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4. Distribuciones de probabilidad 51

4.1. Distribuciones Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1.1. Distribucion Hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1.2. Distribucion de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.1.3. Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.1.4. Distribucion Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.1.5. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . . 56

4.1.6. Distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.2. Distribuciones Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

iii

Bayes, C. INDICE GENERAL

4.2.1. Distribucion Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2.2. Distribucion Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.3. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.4. Distribucion Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.5. Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.2.6. Distribucion Log-Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.2.7. Distribucion Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.2.8. Distribuciones de Valor Extremo . . . . . . . . . . . . . . . . . . . . . . . 62

4.2.9. Distribucion de Valor Extremo tipo I . . . . . . . . . . . . . . . . . . . . . 63

4.2.10. Distribucion de Valor Extremo tipo II . . . . . . . . . . . . . . . . . . . . 63

4.3. Distribuciones Muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.3.1. Distribucion Chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.3.2. Distribucion t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.3.3. Distribucion F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5. Inferencia Estadstica 67

5.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Bibliografa 71

iv

Captulo 1

Organizacion y resumen de datos

1.1. Conceptos basicos

Estadstica

Es un conjunto de metodos cientficos para la recoleccion, organizacion, analisis e interpretacion

de datos con la finalidad de realizar conclusiones y toma de decisiones validas.

Usualmente se divide en:

Estadstica Descriptiva: El objetivo de la estadstica descriptiva es resumir las prin-

cipales caractersticas de un conjunto de datos a traves de tablas, graficos y medidas

numericas.

Estadstica Inferencial: Se encarga del analisis de los datos con el proposito de realizar

conclusiones validas acerca de la poblacion de donde originalmente se recolectaron estos

datos. La Estadstica inferencial esta basada en la teora de probabilidades.

Poblacion

Es un conjunto de elementos que poseen al menos un atributo en comun, sobre los cuales se

desea investigar una o mas caractersticas. El numero de elementos que conforman una poblacion

sera denotado por la letra N .

Ejemplo 1.1.

Son ejemplos de poblacion:

Las bolsas de cemento producidas en un da por una fabrica.

Los hogares de una region.

Caudal de un ro.

Muestra

Es un subconjunto de la poblacion. El numero de elementos que conforman una muestra sera de-

notado por la letra n. Se dira que una muestra es aleatoria si sus elementos han sido seleccionados

mediante un procedimiento probabilstico.

Ejemplo 1.2.

Son ejemplos de una muestra:

50 bolsas de cemento seleccionadas de la produccion de un da de una fabrica.

1

Bayes, C. CAPITULO 1. ORGANIZACION Y RESUMEN DE DATOS

400 hogares seleccionados de una region.

20 mediciones del volumen anual de un ro.

Variable

Es el resultado de una medicion o una caracterstica en los elementos de la poblacion. Una

variable suele ser denotada por una letra mayuscula, por ejemplo: X, Y , Z.

Ejemplo 1.3.

Son ejemplos de variable:

X = Peso de una bolsa de cemento de la produccion de un da de una fabrica.

Y = Ingreso mensual de un hogar de una region.

Z = Nivel socioeconomico de un hogar de una region.

se denominara como dato al valor que toma una variable en un elemento de la poblacion. Un

conjunto de n datos de una variable X se suele denotar como x1, x2, ..., xn.

Ejemplo 1.4.

Considerando las variables dadas en el Ejemplo 1.3 son ejemplos de datos:

x1 = 42.5, x2 = 42.3, x3 = 42.7, x4 = 42.9, x5 = 41.9, tenemos n = 5 datos

y1 = 5400, y2 = 2300, y3 = 3000, y4 = 4370, tenemos n = 4 datos

z1 = B, z2 = A, z3 = B, z4 = B, z5 = B, z6 = C, tenemos n = 6 datos

Las variables se pueden clasificar en

Variables cuantitativas: Es una variable que toma valores numericos, por lo tanto se

pueden realizar operaciones aritmeticas con ella. Se dividen en

Discretas: son aquellas variables que pueden tomar un numero enumerable de va-lores que puede ser finito o infinito. Usualmente se consideran numeros enteros.

Continuas: son aquellas variables que pueden asumir cualquier valor dentro de unintervalo de valores, por lo que pueden tomar un numero no enumerable de valores.

Variables cualitativas: Es una variable que no toman valores numericos al contrario

son definidas por varias categoras que representan una clasificacion de los elementos de

una poblacion. Aun cuando estas categoras puedan ser representadas por numeros no es

posible realizar operaciones aritmeticas con ellos. Las variables cualitativas se denominan:

Nominal: cuando no existe ningun orden entre las categoras. Ordinal: cuando existe un orden entre las categoras.

Ejemplo 1.5.

Clasifique las variables dadas en el Ejemplo 1.3.

2

Bayes, C. 1.2. ORGANIZACION DE DATOS

Parametro

Es una medida que describe a una poblacion. Un parametro resume la informacion de una po-

blacion por lo tanto su valor es unico y generalmente es desconocido, usualmente es un valor que

deseamos conocer. Un parametro suele ser denotado por una letra griega, por ejemplo: para

la media, 2 para la varianza, para una proporcion, no necesariamente se sigue esta notacion

para el mnimo y el maximo se suele usar Mn y Max.

Estadstica

Es una medida que describe a una muestra, se puede definir tambien como una funcion de las

observaciones de la muestra que no depende de ningun parametro. Seguiremos la siguiente no-

tacion para los siguientes estadsticas: X para la media muestral, S2 para la variancia muestral,

p para la proporcion muestral, mn para el valor mnimo y max para el valor maximo de una

muestra.

Estimador

Es una estadstica que es utilizada para estimar el valor de un parametro.

Estimacion

Es el valor que se obtiene para un estimador para una muestra dada.

Ejemplo 1.6.

Considerando como poblacion los hogares de una cierta region y como variable el ingreso de

estos hogares, podemos definir como parametro = ingreso promedio de un hogar de esta

region, como estimador de este parametro podemos utilizar a X la media muestral, que para

los datos del Ejemplo 1.4 nos da la siguiente estimacion X = 3767.5.

1.2. Organizacion de datos

Tabla de frecuencias

Variable cualitativa

Cuando la variable en estudio es cualitativa, una tabla de frecuencias estara constituida por

una lista de las posibles categoras acompanadas por el numero de veces que ocurre cada una

de ellas. En este caso asumiremos que la variable tiene k categoras diferentes y consideraremos

la siguiente notacion

nj : la frecuencia o numero de veces que ocurre la categora j.

fj : la frecuencia relativa de la categora j, calculada como fj = nj/n, siendo n el numero

total de datos.

pj : el porcentaje de la categora j, calculado como pj = 100 fj .

Es claro que se cumple que

kj=1

nj = n,

kj=1

fj = 1 y

kj=1

pj = 100 %. La informacion contenida

en la tabla de frecuencias puede ser representada a traves de graficos como:

3


Grafico de barras: a cada categora se la representa por una barra cuya altura es proporcio-

nal a la frecuencia con que ocurre. En este tipo de graficos se suele dejar un espacio entre

las barras para indicar que se esta presentando informacion de una variable cualitativa.

Grafico de sectores circulares: a cada categora se la representa por un sector del crculo

proporcional a la frecuencia con que ocurre.

Ejemplo 1.7.

Durante un mes se monitoreo el estado de la calidad del aire en una ciudad, estos fueron los

resultados:

Bueno Moderado Bueno Malo Moderado Malo

Malo Moderado Malo Malo Malo Moderado

Moderado Moderado Moderado Malo Muy Malo Malo

Moderado Moderado Malo Moderado Moderado Malo

Malo Moderado Moderado Bueno Moderado Malo

La variable estado de la calidad del aire tiene las siguiente categoras: Bueno, Moderado, Malo

y Muy Malo. Una vez que hemos identificado las categoras pasamos a construir la tabla de

frecuencias:

j Categoras Frecuencia Frecuencia relativa Porcentaje

nj fj pj

1 Bueno 3 0.10 10

2 Moderado 14 0.47 47

3 Malo 12 0.40 40

4 Muy Malo 1 0.03 3

Total 30 1.00 100

La informacion contenida en esta tabla se presenta en forma grafica en la Figura 1.1.

Variable cuantitativa discreta

Cuando la variable en estudio es cuantitativa discreta, una tabla de frecuencias estara cons-

tituida por una lista de las posibles valores que puede tomar la variable acompanadas por el

numero de veces que ocurre cada uno de estos valores. En este caso asumiremos que la variable

X tiene k valores distintos x1, ..., xk y consideraremos la siguiente notacion

nj : la frecuencia o numero de veces que ocurre el valor xj .

fj : la frecuencia relativa del valor xj , calculada como fj = nj/n, siendo n el numero total

de datos.

pj : el porcentaje del valor xj , calculado como pj = 100 fj .

Esta tabla de frecuencias suele ser resumida a traves de:

Grafico de bastones: a cada valor posible xj se la representa por una lnea vertical cuya

altura es proporcional a la frecuencia con que ocurre.

4


Bueno Moderado Malo Muy Malo

0.0

0.1

0.2

0.3

0.4

Bueno10%

Moderado47%

Malo40%

Muy Malo3%

Figura 1.1: Grafico de Barras y de Sectores circulares

Ejemplo 1.8.

En un cierto distrito durante un mes se registro el numero de accidentes de transito por da,

estos fueron los resultados:

1 2 0 3 1 0 1 0 4 2

1 1 2 0 1 1 0 3 1 1

0 2 1 0 4 0 1 2 2 2

La variable numero de accidentes de transito por da en un distrito puede tomar los siguientes

valores: 0, 1, 2, 3 y 4. A continuacion presentamos la tabla de frecuencias para este conjunto de

datos

Numero de Frecuencia Frecuencia relativa Porcentaje

accidentes nj fj pj

0 8 0.27 27

1 11 0.37 37

2 7 0.23 23

3 2 0.07 7

4 2 0.07 7

Total 30 1.00 100

La informacion contenida en esta tabla se presenta en forma grafica en la Figura 1.2.

Variable cuantitativa continua

Cuando la variable en estudio es cuantitativa continua, para construir una tabla de frecuencias se

agrupan las observaciones en clases y se consideran las frecuencias en cada clase. Consideraremos

las clases como intervalos de igual amplitud, podemos seguir el siguiente procedimiento:

5


0.0

0.1

0.2

0.3

Nmero de accidentes

Frec

uenc

ia re

lativ

a

0 1 2 3 4

l

l

l

l l

Figura 1.2: Grafico de bastones

Establecer el numero de clases k, usualmente se consideran entre 5 y 10 intervalos, es-

ta es una decision subjetiva se puede escoger cualquier valor que consideremos permita

representar adecuadamente a los datos. Una sugerencia es seguir la regla de Sturges:

k = 1 + 3.3log10(n).

Determinar la amplitud de los datos, A = maxmn.

Determinar el tamano de la clase, c =A

k. Se debe redondear por exceso al numero de

decimales que tengan los datos.

Usar c para construir los intervalos de cada clase, en este caso se considera que los intervalos

son cerrados por la izquierda y abiertos por la derecha, con excepcion del ultimo que es

cerrado en ambos lados.

Construir la tabla, calculando la frecuencia de cada clase.

Usualmente se considera la siguiente notacion

xj : marca de clase, el punto medio del intervalo de clase.

nj : la frecuencia de la clase j.

fj : la frecuencia relativa de la clase j, calculada como fj = nj/n, siendo n el numero total

de datos.

pj : el porcentaje de la clase j, calculado como pj = 100 fj .

6


Nj : la frecuencia acumulada de la clase j, calculada como Nj =

jh=1

nh.

Fj : la frecuencia relativa acumulada de la clase j, calculada como Fj =

jh=1

Fh.

Pj : el porcentaje acumulado de la clase j, calculada como Pj =

jh=1

ph.

Esta tabla de frecuencias suele ser resumida a traves de:

Histograma: a cada clase se la representa por una barra cuya altura es proporcional a

la frecuencia con que ocurre. En este tipo de graficos no se debe dejar espacios entre

las barras para indicar que se esta presentando informacion de una variable cuantitativa

continua.

Polgono de frecuencias: Se unen los puntos medios de cada barra del histograma.

Grafico de frecuencias acumuladas: Se utiliza las frecuencias acumuladas y los limites

superiores de cada intervalo de clase para la construccion este grafico.

Ejemplo 1.9.

Se registro el consumo de electricidad en kWh de 50 hogares en un cierto distrito estos fueron

los resultados:

589 493 531 355 469 432 415 468 617 426

300 439 464 430 403 525 478 392 432 459

398 372 488 481 620 484 509 522 488 502

596 567 466 477 580 555 520 525 425 650

384 497 438 501 521 452 508 462 457 577

Considerando la regla de Sturges debemos considerar k = 1 + 3.3log10(50) = 6.6 7 clases.Luego, tenemos como valores mnimo 300 kWh y maximo 650 kWh, por la tanto la amplitud

es de A = 650 300 = 350 con lo que obtenemos que el ancho del intervalo de clase es dec = 350/7 = 50. A partir de estos resultados obtenemos la siguiente tabla de frecuencias para

este conjunto de datos

Clase Intervalo Marca Frecuencia Frecuencia Porcentaje Frecuencia Frec. rel. Porcentaje

de clase de clase relativa acumulada acumulada acumulado

j xj nj fj pj Nj Fj Pj

1 [300, 350) 325 1 0.02 2 1 0.02 2

2 [350, 400) 375 5 0.10 10 6 0.12 12

3 [400, 450) 425 9 0.18 18 15 0.30 30

4 [450, 500) 475 16 0.32 32 31 0.62 62

5 [500, 550) 525 10 0.20 20 41 0.82 82

6 [550, 600) 575 6 0.12 12 47 0.94 94

7 [600, 650] 625 3 0.06 6 50 1.00 100

Total 50 1.00 100

7


Se puede observar que las frecuencias, van cambiando a partir del valor 1 en el primer intervalo

hasta alcanzar los valores de 9, 16 y 10 en los intervalos 3, 4 y 5 para luego decrecer en los

intervalos 6 y 7. Esto sugiere que la mayora de los hogares tienen un consumo de electricidad

intermedio entre los intervalos 3, 4 y 5 (de 400 a 550 kWh). Que existen pocos hogares con

consumo de electricidad bajos o altos. Estos resultados tambien se pueden observar si analizamos

las frecuencias relativas y los porcentajes. Otras posibles interpretaciones que podemos hacer

son: solamente el 1 % de los hogares tienen consumos por debajo de los 350 kWh; el 18 % de los

hogares tienen consumos mayores a los 550 kWh.

La informacion contenida en esta tabla se presenta tambien en forma grafica en la Figura 1.3.

Consumo en kWh

Frec

uenc

ia

300 350 400 450 500 550 600 650

05

1015

ll

l

l

l

l

l

l

300 350 400 450 500 550 600 650

0.0

0.2

0.4

0.6

0.8

1.0

Consumo en kWh

Frec

uenc

ia re

lativ

a

Figura 1.3: Histograma con polgono de frecuencias y grafico de frecuencias acumuladas

1.3. Medidas de Tendencia Central

En esta seccion estudiaremos estadsticas que son utilizadas para representar el centro de

un conjunto de datos. Consideraremos a partir de ahora en las definiciones que contamos con

una muestra de tamano n denotada por x1, x2, ..., xn.

Media

La media muestral es la suma de todos los datos dividido por el numero de datos. Se suele

denotar por una letra con una barra encima (X). La media muestral estara en las mismas

unidades que los valores de la muestra x1, x2, ..., xn.

X =

ni=1

xi

n=x1 + x2 + ...+ xn

n

A continuacion presentamos algunas caractersticas de la media:

La media es calculada tomando en cuenta todos los valores de la muestra.

La media puede verse fuertemente afectada por la presencia de valores outlier (observa-

ciones que son muy grandes o muy pequenas con respecto al resto de observaciones).

8

Bayes, C. 1.3. MEDIDAS DE TENDENCIA CENTRAL

Es el valor de b que minimiza

ni=1

(xi b)2

Ejemplo 1.10.

Una forma de evaluar la calidad del aire es medir la cantidad de material particulado menor de 10

micrometros (que pueden tener efectos nocivos en la salud), se tienen las siguientes mediciones

en g/m3 durante 6 das en una ciudad:

39.39 39.12 32.08 29.85 48.25 36.09

La media muestral sera

X =39.39 + 39.12 + 32.08 + 29.85 + 48.25 + 36.09

6= 37.46 g/m3

Consideremos ahora que el primer valor sea reemplazado por un valor outlier quedando ahora

el conjunto de datos como

89.39 39.12 32.08 29.85 48.25 36.09

ahora tenemos que X = 45.80, observamos que un unico valor outlier puede tener un fuerte

impacto en el valor de la media.

En algunas ocasiones se nos presentara el problema en que necesitamos calcular la media

de un conjunto de datos que se presenta como una tabla de frecuencias, en esos calcularemos la

media como

X =

kj=1

xjnj

n=

kj=1

xjfj

donde la variable toma x1, ..., xk valores distintos; nj es la frecuencia y fj es la frecuencia relativa

del valor xj . Este caso se suele denominar como media ponderada.

Ejemplo 1.11.

Si consideramos los datos del Ejemplo 1.8 tenemos que el numero de accidentes promedio por

da es

X =0 8 + 1 11 + 2 7 + 3 2 + 4 2

30= 1.3.

Mediana

La mediana es el valor que ocupa la posicion central en los datos ordenados. Si tenemos una

muestra x1, x2, ..., xn, para calcular la mediana primero ordenamos los datos como x(1) x(2) ... x(n), luego la mediana es calculada como

Me =

x(n+1

2) , si n es impar

x(n2

) + x(n2

+1)

2 , si n es par

9


A continuacion presentamos algunas caractersticas de la mediana:

El 50 % de los datos es menor a la mediana y el 50 % son mayores.

La mediana es calculada tomando en cuenta solamente los valor(es) central(es).

La mediana no es fuertemente afectada por la presencia de valores outlier

Es el valor de b que minimizani=1

|xi b|.

Ejemplo 1.12.

Considerando los datos del Ejemplo 1.10, calculamos ahora la mediana, primero ordenamos los

datos

29.85 32.08 36.09 39.12 Me

39.39 48.25

como el numero de datos n = 6 es par, la mediana sera el promedio de las observaciones centrales

Me =x(3) + x(4)

2=

36.09 + 39.12

2= 37.605

como en el Ejemplo 1.10 consideramos que la observacion 39.39 es reemplazada por 89.39,

ordenamos los datos nuevamente

29.85 32.08 36.09 39.12 Me

48.25 89.39

y calculamos la medianaMe = 37.605, observamos que en este caso la mediana no es influenciada

por el valor outlier.

Moda

Se define la moda como el valor que mas se repite en un conjunto de datos. Utilizaremos como

notacion Mo.

Ejemplo 1.13.

Para los datos del Ejemplo 1.7 la moda del estado de la calidad del aire sera Moderado. En el

Ejemplo 1.8 la moda del numero de accidentes por dia sera 1. Como ningun dato se repite en

el Ejemplo 1.10 la moda no existe en este caso.

Cuantiles

El p-esimo cuantil es el valor qp de modo que el 100p% de los valores es menor que este

valor y 100(1 p) % son mayores. Por ejemplo, el cuantil 50 % q0.50 sera la mediana. Una formasencilla de calcular los cuantiles es a traves de la siguiente aproximacion

qp =

x(k) + x(k+1)

2 , si k es entero

x(k) , si k no es entero

donde k = np y k es el valor de k redondeado por exceso. Como casos particulares tenemos:

10

Bayes, C. 1.4. MEDIDAS DE DISPERSION

Cuartiles: dividen a los datos en 4 partes iguales, se denotan por Q1, Q2 y Q3 que serian

los cuantiles 0.25, 0.50 y 0.75.

Deciles: dividen a los datos en 10 partes iguales, se denotan por D1, D2, .... y D9 que

serian los cuantiles 0.10, 0.20, ... y 0.90.

Percentiles: dividen a los datos en 100 partes iguales, se denotan por P1, P2, ... y P99 que

serian los cuantiles 0.01, 0.02, ... y 0.99.

Ejemplo 1.14.

Considerando los datos del Ejemplo 1.10, calculamos ahora los cuantiles q0.25 y q0.75.

Para q0.25 tenemos que k = 6 0.25 = 1.5, as k = 2 entonces q0.25 = x(2) = 32.08.

Para q0.75 tenemos que k = 6 0.75 = 4.5, as k = 5 entonces q0.75 = x(5) = 39.39.As tenemos que el 25 % de las observaciones es menor a 32.08 y el 75 % son mayores a este

valor. En forma similar podemos decir que el 75 % de las observaciones es menor a 39.39 y el

25 % son mayores.

1.4. Medidas de Dispersion

Las medidas de dispersion representan la variabilidad de los valores de un conjunto de datos.

Variancia

La variancia muestral es definida como

S2 =

ni=1

(xi X)2

n 1 =

ni=1

x2i nX2

n 1Para ver como la variancia es una medida de variabilidad, consideremos las distancias de cada

observacion a la media xi X, podemos observar que entre mayor sea la variabilidad mayorsera el el valor de algunas xi X. La variancia considera el promedio de estas distancias alcuadrado.

Ejemplo 1.15.

Considerando los datos del Ejemplo 1.10, la variancia es dada por

S2 =(39.392 + 39.122 + 32.082 + 29.852 + 48.252 + 36.092) 6 37.462

6 1 = 42.33

Desviacion estandar

La variancia puede ser difcil de interpretar debido a que esta medida en unidades al cuadrado

de la variable original. Por esta razon se suele utilizar la desviacion estandar que es definida

como la raz cuadrada de la varianza

S =S2

esta medida si estara en las mismas unidades que la variable en estudio.

11


Ejemplo 1.16.

Considerando los datos del Ejemplo 1.10, la desviacion estandar es dada por

S =

42.33 = 6.51

Coeficiente de Variabilidad

El coeficiente de variabilidad es definido como la razon entre la desviacion estandar y la media,

CV = 100 SX

como podemos observar es una medida relativa, por lo que no tiene unidades. Una de las prin-

cipales aplicaciones de esta medida es para comparar conjuntos de datos medidos en diferentes

unidades.

Ejemplo 1.17.

Considerando los datos del Ejemplo 1.10, el coeficiente de variabilidad es dado por

CV = 100 6.5137.46

= 17.37

Rango

Es la distancia entre el valor mnimo y el maximo

R = x(n) x(1)

Ejemplo 1.18.

Considerando los datos del Ejemplo 1.10, el rango es dado por

R = x(6) x(1) = 48.25 29.85 = 18.4

Rango intercuartlico

Es la distancia entre el primer y tercer cuartil

RIC = Q3 Q1

Entre el primer y tercer cuantil estan contenidas el 50 % de las observaciones, donde hemos

descartado el 25 % de las observaciones mas grandes y el 25 % de las mas pequenas. Esta es una

medida alternativa al rango que no es afectada por valores extremos.

Ejemplo 1.19.

Considerando los datos del Ejemplo 1.10 y los resultados del Ejemplo 1.14, el rango intercuartli-

co es dado por

RIC = 39.39 32.08 = 7.31

1.5. Medidas de Forma

Las medidas presentadas en esta seccion son consideradas para conjuntos de datos unimo-

dales.

12

Bayes, C. 1.5. MEDIDAS DE FORMA

Asimetra

Un conjunto de datos sera simetrico si se distribuyen con igual frecuencia alrededor de un

punto central, en este caso la media, mediana y moda coinciden (X = Me = Mo). Se pueden

presentar dos tipos de asimetra:

Asimetra positiva o hacia la derecha: La mayor parte de los observaciones se con-

centran en valores bajos y pocos en valores altos. En este caso Mo < Me < X.

Asimetra negativa o hacia la izquierda: La mayor parte de los observaciones se

concentran en valores altos y pocos en valores bajos. En este caso X < Me < Mo.

Estos tipos de asimetria se encuentran ilustrados en la Figura 1.4. El coeficiente de asimetra

de Pearson es dado por

A1 =X Mo

S

si A1 = 0 los datos son simetricos, si A1 < 0 los datos presentan asimetra negativa o a la

izquierda y si A1 > 0 los datos presentan asimetra positiva o hacia la derecha. Una definicion

alternativa de esta medida es dada por

A2 =3(X Me)

S

que se basa en la siguiente relacion 3(X Me) X Mo que se cumple cuando los datospresentan poca asimetra. Una medida mas exacta de asimetra es dada por

1 =

1

n

ni=1

(xi X

)3s3

que se interpreta de manera similar al coeficiente de asimetra de Pearson.

asimetra negativa a la izquierda

Media Mediana Moda

simetra

Den

sity

MediaMediana

Moda

asimetra positiva a la derecha

Den

sity

Moda Mediana Media

Figura 1.4: Asimetra

Curtosis

Es una medida del apuntalamiento de la distribucion de frecuencias de un conjunto de datos

con referencia a la distribucion Normal. Se pueden presentar los siguientes tipos de curtosis:

Mesocurtica: Tiene el mismo apuntalamiento de la distribucion Normal.

13


Leptocurtica: Es mas apuntalada que la distribucion Normal, los datos se concentran en

los valores centrales y pocos en los valores extremos de la variable.

Platicurtica: Es mas achatada que la distribucion Normal, los datos se encuentran mas

dispersos.

Estos tipos de curtosis se encuentran ilustrados en la Figura 1.5. El coeficiente de curtosis de

Pearson es dado por

=0.5(Q3 Q1)D9 D1

si = 0.25 los datos son mesocurticos, si > 0.25 los datos son leptocurticos y si < 0.25 los

datos son mesocurticos. Una medida mas precisa para medir curtosis es dada por

2 =

1

n

ni=1

(xi x)4

s4 3

en este caso 2 = 0 indica que los datos son mesocurticos, 2 > 0 indica que los datos son

leptocurticos y 2 < 0 indica que los datos son mesocurticos.

Platicrtica Mesocrtica

Den

sity

Platicrtica

Den

sity

Figura 1.5: Curtosis

Ejemplo 1.20.

Calcule algunas medidas de asimetra y curtosis para los datos del Ejemplo 1.9.

1.6. Graficos

En esta seccion presentamos algunos graficos adicionales para el analisis de datos.

Boxplot

Tambien denominado diagrama de cajas y bigotes, es un grafico que permite visualizar la ten-

dencia central, dispersion, asimetra y la presencia de valores atpicos u outliers. Esta basado en

5 medidas estadsticas: el mnimo, el primer cuartil, la mediana, el tercer cuartil y el maximo,

a continuacion detallamos brevemente como se construye este tipo de grafico (ver Figura 1.6):

14

Bayes, C. 1.6. GRAFICOS

Dibujar una caja con limites el primer y tercer cuartil.

Dibujar una linea central en la posicion de la mediana.

Calcular las siguientes cantidades: LI = Q1 1.5RIC y LS = Q3 + 1.5RIC.

Dibujar los bigotes, una linea desde el Q1 hasta el menor valor de los datos que no sea

menor a LI y una linea desde el Q3 hasta el mayor valor de los datos que no sea mayor a

LS.

Marcar los valores menores a LI y mayores a LS con un , estos seran considerados valoresoutlier.

* *

Q1 Mediana Q3

Outlier Q11.5 RIC Q3+1.5 RIC Outlier

menor valor antes de Q11.5 RIC mayor valor antes de Q3+1.5 RIC

Figura 1.6: Boxplot

La lnea central (mediana) nos da una medida de tendencia central, el ancho de la caja (rango

intercuartil) nos da una medida de dispersion y la posicion de la lnea central en la caja nos

indica el tipo de asimetra (ver Figura 1.7).

asimetra negativa simetrica asimetra positiva

Figura 1.7: Asimetra y Boxplot

Ejemplo 1.21.

Se registro el tiempo de duracion en horas de 10 componentes electronicos elegidos al azar

126 130 130 133 136 148 148 157 189 199

15


presentaremos estos datos a traves un grafico de boxplot. Primero calculamos las siguientes

medidas

Mnimo: x(1) = 126

Maximo: x(10) = 199

Mediana: Me = 142

Primer cuartil: Q1 = 130

Tercer cuartil: Q3 = 157

Luego, el RIC = 27 con el cual obtenemos LI = 89.5 y LS = 197.5. As tenemos que el bigote

del lado izquierdo ira hasta 126 (el primer valor observado mayor a LI) y el bigote del lado

derecho ira hasta 189 (el primer valor observado menor a LS). Finalmente, la observacion 190

sera marcada como un valor outlier. El grafico obtenido se muestra en la Figura 1.8

*

140 160 180 200

Tiempo de duracin

Figura 1.8: Boxplot para los datos del ejemplo 1.21

Analizando directamente el grafico, podemos observar que los datos presentan asimetra positiva

y que existe un valor outlier.

Diagrama de tallos y hojas

Es un grafico similar al histograma pero que adicionalmente presenta el valor individual de

cada observacion. Para construir este grafico primero se divide cada observacion en dos partes:

el tallo y la hoja, usualmente el tallo seran los primeros dgitos y la hoja el ultimo dgito, por

ejemplo para el numero 37, 3 sera la parte del tallo y 7 la hoja. Luego, se listan los valores

posible para el tallo en forma vertical y se van colocando los valores de las hojas en la parte

derecha.

16

Bayes, C. 1.6. GRAFICOS

Ejemplo 1.22.

Consideremos los siguientes datos correspondientes al tiempo de vida medido en anos de un

cierto producto:

2.5 4.4 3.8 4.8 3.5 4.0 3.3 2.9

3.7 1.9 3.4 3.6 4.1 3.4 5.0 4.0

2.8 4.6 3.7 3.9 3.2 3.6 4.2 3.4

3.6 3.4 4.0 4.7 3.5 4.4 2.2 3.7

5.0 4.1 3.5 2.9 4.2 3.3 4.5 3.8

consideraremos como tallo el valor antes del punto decimal y como hoja el valor despues del

punto decimal, el diagrama de tallos y hojas se presenta en la Figura 1.9.

1 | 9

2 | 25899

3 | 2334444555666777889

4 | 0001122445678

5 | 00

Figura 1.9: Diagrama de tallos y hojas para los datos del Ejemplo 1.22

En caso consideremos que que se necesitan mas tallos para representar adecuadamente a los

datos, podemos subdividir cada tallo en 2, marcando con un punto . al tallo que tomara los

valores de hojas 0-4 y con un * al que tomara los valores de hojas de 5-9, este grafico se presenta

en la Figura 1.10.

1*| 9

2.| 2

2*| 5899

3.| 2334444

3*| 555666777889

4.| 000112244

4*| 5678

5.| 00

Figura 1.10: Diagrama de tallos y hojas para los datos del Ejemplo 1.22

El diagrama de tallos y hojas es de facil elaboracion y ademas nos permite observar directamen-

te los valores de las observaciones, lo que no se puede hacer con el histograma. Sin embargo,

debemos tener en cuenta que los tallos son determinados por las unidades en que hayan sido

medidas las variables, y no como en el histograma en el que se divide la amplitud de los datos

en una serie de intervalos adecuadamente elegidos.

17


1.7. Ejercicios

1. Clasifique cada una de las siguientes variables e indique un grafico que se puede realizar

con la informacion de cada variable.

El tiempo que una persona debe espera en una fila en un banco.

El numero de multas en un mes de un distrito.

La temperatura medida en grados centgrados.

El estado civil de una persona.

2. El siguiente Boxplot recoge informacion de las notas de un examen de matematicas de un

aula de 60 alumnos.

*

1012

1416

18

(a) Indique cual es el valor de la mediana.

(b) Indique cuales son las notas mnima y maxima.

(c) Cuantos alumnos tuvieron notas entre 14 y 17? (Indicar un numero no un porcentaje).

(d) Indique que tipo de asimetra presentan los datos.

3. Considere las siguientes variables obtenidas en 10 ensayos de un robot mecanico al recoger

un objeto

Papel 12.10 11.60 12.50 8.20 11.90 10.00 7.54 7.40 9.10 10.60

Tiza 17.50 16.00 19.00 15.90 15.80 13.60 12.90 14.20 15.40 14.20

(a) Compare los resultados obtenidos en ambas tareas utilizando medidas estadsticas.

(b) Realice un grafico de boxplot.

18

Captulo 2

Probabilidad


Experimento Aleatorio

Es un experimento que tiene las siguientes caractersticas:

No se conoce el resultado del experimento, pero si conocemos los posibles resultados del

experimento.

Es posible repetir el experimento bajo las mismas condiciones.

Cuando el experimento se repite un gran numero de veces, aparece un modelo definido de

regularidad

Ejemplo 2.1.

Son ejemplos de experimento aleatorio:

Lanzar una moneda.

Lanzar un dado.

Medir la cantidad de material particulado menor de 10 micrometros en una ciudad.

Medir el estado de la calidad del aire en una ciudad.

El numero de accidentes de transito por da en un distrito.

Tiempo de corrosion de una pieza de maquinaria

Espacio Muestral

El espacio muestral es el conjunto de todos los posible resultados de un experimento aleatorio,

utilizaremos la letra como notacion.

Ejemplo 2.2.

Para los experimentos aleatorios dados en el Ejemplo 2.1 presentamos sus espacios muestrales

= {cara, sello}

= {1, 2, 3, 4, 5, 6}

= [0,)

19

Bayes, C. CAPITULO 2. PROBABILIDAD

= {Bueno,Moderado,Malo,Muy Malo}

= {1, 2, 3, 4, ...}

= [0,)

Los espacios muestrales los podemos clasificar como

Espacio muestral finito.

Espacio muestral infinito enumerable.

Espacio muestral infinito no enumerable.

Ejemplo 2.3.

Clasifique los espacios muestrales dados en el Ejemplo 2.2.

Evento

Es cualquier subconjunto del espacio muestral. Se dice que un evento ocurre si alguno de sus ele-

mentos es el resultado del esxperimento. Los eventos se suelen denotar por una letra mayuscula.

Ejemplo 2.4.

Si definimos como experimento aleatorio el lanzamiento de un dado, su espacio muestral sera

dado por = {1, 2, 3, 4, 5, 6}, seran ejemplos de eventos:

A = {el resultado es par}A = {2, 4, 6}

B = {el resultado es menor a 3}B = {1, 2}

A continuacion presentamos algunos tipos de eventos

Evento unitario o elemental si A contiene solamente un elemento de .

Evento compuesto si tienen mas de un resultado del experimento aleatorio.

es el evento seguro o cierto

es el evento imposible

Se dice que dos eventos A y B son mutuamente excluyentes si no tienen elementos en

comun, por lo tanto no pueden ocurrir al mismo tiempo, esto es A B = .

Algunas operaciones basicas con eventos son

Interseccion : A B = {w | w A w B}

Union : A B = {w | w A w B}

20

Bayes, C. 2.2. PROBABILIDAD

Complemento : AC = {w | w / A}

Diferencia: AB = {w | w A w / B} esto es AB = A BC

Producto Cartesiano: AB = {(w1, w2) | w1 A w2 B}

Tenemos las siguientes propiedades

A A = AA A = A

A B = B AA B = B A

A AC = A AC =

A = AA =

A = A = A

C = C = (AC)C = A

A (B C) = (A B) (A C)A (B C) = (A B) (A C)

(A B)C = AC BC(A B)C = AC BC

Cuando se trabaje con mas de dos o tres eventos consideraremos la siguiente notacion

A1 A2 ... An =ni=1

Ai

A1 A2 ... An =ni=1

Ai

2.2. Probabilidad

Definicion Axiomatica

Sea un experimento aleatorio y su espacio muestral. La probabilidad de cualquier evento

A se denota por P (A) y satisface:

(i) P (A) 0

(ii) P () = 1

21


(iiia) Si A y B son eventos mutuamente excluyentes entonces

P (A B) = P (A) + P (B)

(iiib) Si A1, A2, ..., An, ... son eventos mutuamente excluyentes entre s, entonces

P

( i=1

Ai

)=

i=1

P (Ai)

Propiedades

A partir de los 3 axiomas podemos encontrar las siguientes propiedades

P () = 0

P (AC) = 1 P (A)

Si A B P (A) P (B)

P (AB) = P (A) P (A B)

P (A B) = P (A) + P (B) P (A B)

P (AB C) = P (A) +P (B) +P (C)P (AB)P (AC)P (B C) +P (AB C)

Sean A1, A2, ..., An eventos entonces

P

(ni=1

Ai

)=

ni=1

P (Ai)i

Bayes, C. 2.3. CALCULO DE PROBABILIDADES

Sabemos que P (A) = 0.40, P (B) = 0.30 y P (AC BC) = 0.35.

En la parte (a) nos piden P (A B) y en la parte (b) P (A B).

Por la ley de Morgan tenemos que

P (AC BC) = P ((A B)C) = 0.35por lo tanto P (A B) = 0.65

Sabemos que P (A B) = P (A) + P (B) P (A B) de donde podemos encontrar

P (A B) = P (A) + P (B) P (A B) = 0.40 + 0.30 0.65 = 0.05

2.3. Calculo de probabilidades

La definicion axiomatica de la probabilidad define las propiedades que debe tener una me-

dida de probabilidad. Sin embargo, no nos indica como realizar el calculo de la probabilidad de

algun evento. Consideraremos las siguientes formas de asignar o calcular probabilidades.

Clasica

Si el espacio muestral es finito y asumimos que todos los resultados del experimento son

igualmente posibles de ocurrir, entonces la probabilidad de un evento A es definida como

P (A) =n(A)

n()

donde n(A) es el numero de elementos de A.

Ejemplo 2.6.

Si consideramos el lanzamiento de un dado, asumiendo que cualquiera de las caras del dado

tienen las mismas posibilidades de ocurrir, calcule la probabilidad de que el resultado del expe-

rimento sea un numero par.

Solucion:

En este caso el espacio muestral sera dado por = {1, 2, 3, 4, 5, 6} y el eventoA = {resultado sea par} ={2, 4, 6} por lo que

P (A) =n(A)

n()=

3

6=

1

2

Frecuencia relativa

Si se repite n veces un experimento aleatorio y el evento A ocurre nA veces, entonces la proba-

bilidad de A es definida como

P (A) =nAn

Formalmente esta probabilidad debe ser calculada en el lmite esto es P (A) = lmn

nAn

.

Ejemplo 2.7.

Se recopilaron datos sobre el numero de accidentes en un distrito durante 30 das

23


Numero de Frecuencia

accidentes

0 8

1 11

2 7

3 2

4 2

calcule la probabilidad que en un da no haya accidentes de transito en el distrito.

Solucion:

Sea el evento A = {en un da no hay accidentes de transito en el distrito} entonces

P (A) =nAn

=8

30= 0.2667

Subjetiva

Es una probabilidad calculada a partir de una opinion personal acerca de que tan posible es

que un evento ocurra. La probabilidad subjetiva no presenta calculos formales y solamente

representa un opinion personal basada en experiencias pasadas, informacion o creencias.

Ejemplo 2.8.

La probabilidad que la tasa de crecimiento del pas sea mayor al 6 % es de 0.25.

Geometrica

Si el espacio muestral es infinito y y asumimos que todos los resultados del experimento son

igualmente posibles de ocurrir, entonces la probabilidad de un evento A se puede definir como

P (A) =m(A)

m()

donde m(A) es una medida del evento A.

Ejemplo 2.9.

Si consideramos como experimento aleatorio el tiempo en horas hasta que falle un circuito don-

de sabemos que su espacio muestral es dado por = [0, 200], asumiendo que cualquiera de los

resultados tienen la misma posibilidad de ocurrir, calcule la probabilidad de que el circuito dure

mas de 150 horas.

Solucion:

Sea el evento A = {el circuito dure mas de 150 horas} = [150, 200] por lo que

P (A) =m(A)

m()=

50

200= 0.25

2.4. Conteo de puntos muestrales

Regla del producto

Si un primer experimento puede realizarse de n1 formas distintas, el segundo de n2, ..., hasta

24

Bayes, C. 2.4. CONTEO DE PUNTOS MUESTRALES

el k-esimo que puede realizarse de nk formas distintas. Entonces los k experimentos pueden

realizarse de

n1 n2 . . . nkformas distintas.

Regla de la adicion

Sean A y B son dos eventos mutuamente excluyentes, entonces n(A B) = n(A) + n(B).Adicionalmente, si tenemos 2 eventos A y B cualesquiera tenemos que n(A B) = n(A) +n(B) n(A B)Ejemplo 2.10.

Una contrasena para acceder a un sistema debe tener 5 caracteres los cuales pueden ser letras

(27) o numeros (10).

(a) Cuantas contrasenas diferentes se pueden formar?

(b) Cuantas contrasenas diferentes se pueden formar de modo que tengan solo numeros?

(c) Cuantas contrasenas diferentes se pueden formar si deben tener por lo menos una letra?

Solucion:

(a) 37 37 37 37 37 = 375 = 69, 343, 957

(b) 10 10 10 10 10 = 105 = 100, 000

(c) Por complemento, 375 105 = 69, 243, 957

Permutacion

Una permutacion es un arreglo de elementos en un orden en particular. Por ejemplo, las per-

mutaciones posibles de los elementos A, B y C seleccionando 2 elementos cada vez son

AB,BA,AC,CA,BC,CB.

El numero de permutaciones de n elementos distintos seleccionando r cada vez es dado por:

Pnr = n(n 1)...(n r + 1) =n!

(n r)!

donde n! = 1 2 ... n y por convencion 0! = 1.Ejemplo 2.11.

8 alumnos se han presentado a una competencia, de cuantas formas distintas se puede asignar

el primer y el segundo lugar?

Solucion:

En este caso de 8 elementos distintos estamos seleccionando 2 y el orden interesa, por lo tanto

nos estan preguntando

P 82 =8!

(8 2)! = 7 8 = 56.

25


Combinacion

Una combinacion es un arreglo de elementos donde el orden no interesa. Por ejemplo, las com-

binaciones posibles de los elementos A, B y C seleccionando 2 elementos cada vez son

AB,AC,BC.

El numero de combinaciones de n elementos distintos seleccionando r cada vez es dado por:

Cnr =

(n

r

)=

n!

r!(n r)! =Pnrr!

Es facil ver que (n

n

)=

(n

0

)= 1

Ejemplo 2.12.

Una junta esta conformada por 5 personas, 2 mujeres y 3 hombres, se va formar una comision

de 3 miembros, calcule

(a) de cuantas formas diferentes se puede conformar la comision.

(b) de cuantas formas diferentes se puede conformar la comision de modo que este conformada

por una mujer y dos hombres.

(c) la probabilidad de que este conformada solamente por hombres.

Solucion:

(a) En este caso el espacio muestral estara conformado por

= {formas diferentes en que se puede conformar la comision de 3 miembros de la junta}

como no importa el orden, tenemos que n() sera el numero de combinaciones que se puede

formar de 5 elementos seleccionando 3 cada vez

n() = C53 =5!

3!(5 3)! = 10

(b) Sea el evento A = {la comision este conformada por una mujer y dos hombres}, en estecaso haremos uso del principio de la multiplicacion, considerando primera la seleccion de

una mujer y luego la seleccion de los dos hombres que conformaran la comision,

n(A) = C21 C32 =2!

1!(2 1)! 3!

2!(3 2)! = 1 3 = 3

26

Bayes, C. 2.5. PROBABILIDAD CONDICIONAL

(c) Sea el evento B = {la comision este conformada por tres hombres}, en este caso tambienharemos uso del principio de la multiplicacion,

n(B) = C20 C33 =2!

0!(2 0)! 3!

3!(3 3)! = 1 1 = 1

finalmente la probabilidad pedida es dada por

P (B) =n(B)

n()=

1

10.

Permutacion con elementos repetidos

Se tienen n elementos, de los cuales n1 son del tipo 1, n2 del tipo 2,..., nk del tipo k, con

n = n1 + n2 + ... + nk. El numero de permutaciones distintas considerando los n elementos es

dado por

Pnn1,n2,...,nk =n!

n1!n2!...nk!

Ejemplo 2.13. Si tenemos tenemos dos fichas rojas y una negra, las permutaciones posibles

serian RRN , RNR y NRR, usando permutacion con elementos repetidos obtenemos

P 31,2 =3!

1!2!= 3.

2.5. Probabilidad condicional

Sean A y B dos eventos de un mismo espacio muestral . La probabilidad condicional de A

dado que ha ocurrido B esta dada por

P (A | B) = P (A B)P (B)

desde que P (A) > 0. Debemos notar, que en probabilidad condicional, estamos considerando

un espacio muestral restringido a que se conoce que el evento B ha ocurrido. En otras palabras,

el evento B esta reemplazando al espacio muestral y la probabilidad condicional P (A | B) escalculada como la probabilidad de A con respecto al nuevo espacio muestral.

Es importante resaltar que la probabilidad condicional tambien es una probabilidad y por lo

tanto, satisface los 3 axiomas de la probabilidad.

Ejemplo 2.14.

Considere como experimento el lanzamiento de un dado, calcule la probabilidad que se obtenga

un numero par si se sabe que el resultado fue menor o igual que 3.

Solucion:

Definimos los eventos:

A = {resultado es par}

27


B = {resultado es menor o igual a 3}

Debemos calcular la probabilidad A dado que el evento B ha ocurrido esto es

P (A | B) = P (A B)P (B)

=1/6

1/2=

1

3

1 3 5

2 4 6

B A

Regla del producto

Dados dos eventos A y B en un espacio muestral , la probabilidad de que ambos ocurran esta

dado por:

P (A B) = P (B)P (A | B).

Para 3 eventos A, B y C tenemos que

P (A B C) = P (A)P (B | A)P (C | A B)

De manera similar podemos generalizar cuando se tienen n eventos, A1, A2, A3,..., An

P (A1A2A3. . .An) = P (A1)P (A2 | A1)P (A3 | A1A2) . . . P (An | A1A2A3. . .An1)

Ejemplo 2.15.

En un proceso de manufactura consta de dos procesos. La probabilidad que un producto no tenga

fallas luego del primer proceso es de 0.95. Si el producto no tuvo fallas en el primer proceso la

probabilidad que no tenga fallas en el segundo proceso es de 0.97. Calcule la probabilidad que

el producto no tenga fallas en los dos procesos.

Solucion:


A = {el producto no tuvo fallas en el primer proceso}B = {el producto no tuvo fallas en el segundo proceso}

Sabemos que P (A) = 0.95 y P (B | A) = 0.97,

Debemos calcular

P (A B) = P (A)P (B | A) = 0.95 0.97 = 0.9215

28

Bayes, C. 2.5. PROBABILIDAD CONDICIONAL

Teorema de Probabilidad total

Sea B1, . . . , Bn una particion del espacio muestral , esto esni=1

Bi = y para todo i 6= jBi Bj = . Sea A otro evento definido sobre entonces:

P (A) =

ni=1

P (Bi)P (A | Bi)

Prueba:

Es facil ver que el evento A es la union de los eventos mutuamente excluyentes A B1,A B2,..., A Bn (ver Figura 2.1) por lo tanto

P (A) =ni=1

P (A Bi)

Luego, aplicando la regla del producto tenemos que P (A Bi) = P (Bi)P (A | Bi) con loque queda probado el teorema.

Figura 2.1: Probabilidad Total

Ejemplo 2.16.

Si el nivel de contaminacion del aire es alto la probabilidad de que un equipo electronico falle

es de 0.05. La probabilidad de que falle si el nivel de contaminacion del aire es bajo es de 0.001.

Ademas se conoce que el 25 % de los das se tiene un alto nivel de contaminacion del aire.

Calcule la probabilidad de que el equipo falle en un cierto da.

Solucion:


B1 = {en un da el nivel de contaminacion del aire es alto}B2 = {en un da el nivel de contaminacion del aire es bajo}notemos que los eventos B1 y B2 son una particion del espacio muestral.

Al mismo tiempo ocurre el evento

A = {el equipo electronico fallo}

29


Sabemos que P (B1) = 0.25, P (B2) = 0.75, P (A | B1) = 0.05 y P (A | B2) = 0.001.

Debemos calcular P (A), utilizando el teorema de probabilidad total tenemos que

P (A) = P (B1)P (A | B1) + P (B2)P (A | B2)= 0.25 0.05 + 0.75 0.001= 0.01325

Teorema de Bayes

Sea B1, . . . , Bn una particion del espacio muestral , esto esni=1

Bi = y para todo i 6= jBi Bj = . Sea A otro evento definido sobre entonces:

P (Bj | A) =P (Bj)P (A | Bj)ni=1

P (Bi)P (A | Bi)

Prueba:

Por definicion de probabilidad condicional tenemos que

P (Bj | A) = P (A Bj)P (A)

Por la regla del producto tenemos que P (A Bj) = P (Bj)P (A | Bj).

Por el teorema de la probabilidad total P (A) =ni=1

P (Bi)P (A | Bi).

Reemplazando estos dos ultimos resultados en la definicion P (Bj | A) queda demostradoel teorema.

Denominaremos a las probabilidades P (B1), . . . , P (Bn) como probabilidad a priori, esto es las

probabilidades de los eventos B1, . . . , Bn antes de tener ninguna otra informacion. El Teorema

de Bayes nos permite revisar estas probabilidades en base a la informacion que el evento A ha

ocurrido, esto es podemos calcular P (B1 | A), . . . , P (Bn | A) que son denominadas probabilida-des a posteriori.

Ejemplo 2.17.

Cuando una maquina que produce circuitos esta funcionando correctamente, el 93 % de los

circuitos producidos satisface las especificaciones. Cuando la maquina no funciona correctamente

solamente el 55 % de los circuitos producidos satisfacen las especificaciones. La maquina esta en

buen estado el 92 % del tiempo. Si se selecciona un circuito y este cumple con las especificaciones

cual es la probabilidad de que la maquina no haya estado funcionando correctamente? Solucion:


B1 = {la maquina funciona correctamente}B2 = {la maquina no funciona correctamente}notemos que los eventos B1 y B2 son una particion del espacio muestral.

30

Bayes, C. 2.6. INDEPENDENCIA

Al mismo tiempo ocurre el evento

A = {el circuito seleccionado cumple con las especificaciones}

Sabemos que P (B1) = 0.92, P (B2) = 0.08, P (A | B1) = 0.93 y P (A | B2) = 0.55.

Debemos calcular P (B2 | A), utilizando el teorema de Bayes tenemos que

P (B2 | A) = P (B2)P (A | B2)P (B1)P (A | B1) + P (B2)P (A | B2)

=0.08 0.55

0.92 0.93 + 0.08 0.55= 0.0489

Podemos representar la informacion sobre el problema a traves de un diagrama del arbol,

ver Figura 2.2.

Figura 2.2: Diagrama del arbol

2.6. Independencia

Dos eventos A y B son independientes si la ocurrencia de uno de ellos no afecta la probabi-

lidad de ocurrencia del otro, esto es:

P (A | B) = P (A) o P (B | A) = P (B).

Por la definicion de probabilidad condicional obtenemos la siguiente definicion equivalente que

es util para verificar la independencia de eventos:

Dos eventos A y B son independientes si y solamente si P (A B) = P (A)P (B).

Propiedad:

Las siguientes situaciones son equivalentes:

Los eventos A y B son independientes.

31


Los eventos A y BC son independientes.

Los eventos AC y B son independientes.

Los eventos AC y BC son independientes.

Si consideramos ahora que tenemos A1, A2,..., An eventos mutuamente independientes (Ai es

independiente de Aj para todo i 6= j), entonces tenemos que

P (A1 A2 . . . An) = P (A1)P (A2) . . . P (An).

Ejemplo 2.18.

Se va realizar un evento durante dos das, se sabe que el primer da puede tener nivel de

contaminacion del aire aceptable con probabilidad 0.40, el segundo da puede tener nivel de

contaminacion del aire aceptable con probabilidad 0.30. Se conoce que el nivel de contaminacion

del aire de un da es independiente del otro.

(a) Cual es la probabilidad de que los dos das se tenga un nivel de contaminacion aceptable?

(b) Cual es la probabilidad de que al menos uno de los das se tenga un nivel de contaminacion

aceptable?

(c) Cual es la probabilidad de que solamente uno de los das se tenga un nivel de contaminacion

aceptable?

(d) Cual es la probabilidad de que los dos das no se tenga un nivel de contaminacion aceptable?

Solucion:

Los eventos son:

A = {El primer da tiene un nivel de contaminacion del aire aceptable}B = {El segundo da tiene un nivel de contaminacion del aire aceptable}

Sabemos que P (A) = 0.40, P (B) = 0.30 y que A y B son independientes. Usando las

propiedades de independencia tenemos que

(a) P (A B) = P (A)(B) = 0.40 0.30 = 0.12

(b) P (A B) = P (A) + (B) P (A B) = 0.40 + 0.30 0.40 0.30 = 0.58

(c) P (A BC) + P (AC B) = 0.40 0.70 + 0.60 0.30 = 0.46

(d) P (AC BC) = P (AC)(BC) = 0.60 0.70 = 0.42

32

Bayes, C. 2.7. EJERCICIOS

2.7. Ejercicios

1. Un aparato electronico consta de dos circuitos A y B. La probabilidad que falle el circuito

A es de 0.25, que fallen los dos circuitos es de 0.18 y que falle al menos uno de los circuitos

es de 0.56. Calcular la probabilidad que:

(a) Falle solamente el circuito B.

(b) Falle el circuito A si se sabe que el circuito B funciona correctamente

2. En una ciudad se publican tres revistas A, B y C. El 25 % de la poblacion lee A, 35 % lee

B y el 25 % lee C. Ademas, el 10 % lee A y B, el 8 % lee A y C, el 12 % lee B y C, y el

3 % lee las tres revistas. Si se elige una persona aleatoriamente de esta ciudad, calcule la

probabilidad de que:

(a) Lea solamente una revista.

(b) Lea como maximo dos revistas.

(c) Lea la revista B si se sabe que lee las revistas A y C.

(d) Lea la revista A si sabe que lee al menos una de las otras dos revistas.

3. El precio de dos productos A y B se distribuye uniformemente entre 10 y 30 soles. Calcular

(a) La probabilidad de que el costo de los dos productos sea mayor a 24 soles.

(b) La probabilidad de que el producto A haya costado mas de 20 soles, si sabe que se

pago mas de 24 soles por los dos productos.

4. En una empresa, produce circuitos en 3 fabricas, el 30 % de los circuitos se produce en la

fabrica 1, el 20 % en la fabrica 2, y el resto en la fabrica 3. En la fabrica 1 se sabe que el

1 % de los circuitos producidos resultan defectuosos; el 3 % en la fabrica 2; y el 4 % en la

fabrica 3.

a) Cual es la probabilidad de producir un circuito defectuoso?.

b) Si un circuito elegido al azar resulta defectuoso, cual es la probabilidad de que se

haya fabricado en la fabrica 3.

5. Un sistema consta de 10 componentes en serie. Por lo tanto, si cualquier componente

falla todo el sistema tambien fallara. Cualquier componente tiene probabilidad de fallar

de 0.01. Asuma independencia entre los componentes del sistema.

a) Cual es la probabilidad de falla del sistema?

b) Si se requiere que la probabilidad que el sistema funcione sea de 0.99 cual debera

ser la probabilidad de falla de cada componente?

6. Una empresa generadora de energa electrica tiene 3 plantas P1, P2 y P3 que funcionan

de manera independiente las cuales pueden fallar con probabilidad 0.10, 0.09 y 0.12 res-

pectivamente. La empresa es la unica que abastece de energa electrica a una ciudad, si

las tres plantas funcionan correctamente la probabilidad que haya un apagon es de 0.02,

33


en caso que una de ellas falle la probabilidad que ocurra un apagon es 0.15, si dos fallan

la probabilidad que ocurra un apagon es 0.40.

(a) Calcule la probabilidad de que ocurra un apagon.

(b) Si no ocurrio un apagon, Cual es la probabilidad de que haya fallado solo una planta?

7. La probabilidad de que falle el motor de un avion es de 0.08 y cada uno funciona indepen-

dientemente de los otros. Con cuantos motores debe estar equipado un avion para tener

una probabilidad mayor o igual a 0.999 de que el avion vuele? Suponga que es suficiente

que un motor funcione para que el avion se mantenga en vuelo.

8. Cuatro componentes que funcionan independientemente estan conectados en un sistema

como se muestra en la Figura 2.3. Si la probabilidad de fallar de los componentes C1, C2,

C3 y C4 es de 0.30, 0.20, 0.10 y 0.25 respectivamente. Calcule la probabilidad de falla de

todo el sistema.

C1

C2

C3

C4

Figura 2.3: Figura para el Problema 8

34

Captulo 3

Variable Aleatoria


Variable Aleatoria

Usualmente cuando se realiza un experimento aleatorio, no siempre se esta interesado en

todos los detalles del resultado de un experimento sino solamente en alguna medida numeri-

ca determinada por este resultado. Por ejemplo, si lanzamos dos veces una moneda podemos

no estar interesados en el resultado que puede ser (cara, cara) o (cara, sello) o (sello, cara) o

(sello, sello) sino solamente en el numero de caras obtenidas en el experimento. Estas medidas

numericas son denominadas de variables aleatorias.

Formalmente una variable aleatoria es una funcion

X() : R

que asigna a cada punto del espacio muestral en un numero real R. El valor que puedatomar una variable aleatoria depende del resultado de un experimento, por lo tanto su valor

no es conocido antes que el experimento sea realizado y podemos asignar probabilidades a los

posibles valores que puede tomar. Usualmente se consideran letras mayusculas para denotar

una variable aleatoria, por ejemplo X, y letras minusculas para denotar un valor particular que

pueda tomar, por ejemplo x. Los posibles valores que puede tomar una variable se denomina

rango, al rango de una variable aleatoria X se le denota como RX .

Ejemplo 3.1.

Se lanza dos veces una moneda y estamos interesados solamente en el numero de caras obtenidas

en el experimento. En este caso el espacio muestral esta dado por

= {SS, SC,CS, SS}

donde C denota que obtuvimos un cara y S un sello. Sobre este espacio muestral se define la

variable aleatoria X =numero de caras obtenidas en el experimento, s aplicamos X a cada

35

Bayes, C. CAPITULO 3. VARIABLE ALEATORIA

punto del espacio muestral tenemos

X(SS) = 0

X(SC) = 1

X(CS) = 1

X(CC) = 2

Por lo tanto el rango de X es RX = {0, 1, 2}. Finalmente, podemos calcular probabilidades paracada posible valor de X

P (X = 0) = P ({SS}) = 14

P (X = 1) = P ({SC,CS}) = 12

P (X = 2) = P ({CC}) = 14

Las variables aleatorias se pueden clasificar en

Discretas: si su rango es finito o infinito enumerable.

Continuas: si su rango es infinito no enumerable.

En la mayora de problemas practicos, las variables aleatorias continuas representan medidas,

tales como alturas, pesos, temperaturas, tiempos de duracion o distancias, mientras que las

variables aleatorias discretas representan datos de conteo, como el numero de productos que

cumplen las especificaciones o el numero de accidentes en un da en un distrito.

3.2. Variable Aleatoria Discreta

Una variable aleatoria que puede asumir un numero finito de valores o una cantidad enu-

merable de valores, cuyas probabilidades son conocidas es denominada de variable aleatoria

discreta.

Ejemplo 3.2.

Continuando con el Ejemplo 3.1, tenemos que X=numero de caras obtenidas en dos lanza-

mientos de una moneda es una variable aleatoria discreta. Los posibles valores x de X y sus

probabilidades son

x 0 1 2

P (X = x) 0.25 0.50 0.25

Notemos que los valores x presentados son todos los posibles casos y que las probabilidades

suman 1.

36

Bayes, C. 3.2. VARIABLE ALEATORIA DISCRETA

Funcion de probabilidad

Sea X una variable aleatoria discreta con rango RX , definiremos f(x) como la funcion de

probabilidad de X por

f(x) = P (X = x)

esta debe cumplir:

f(x) 0, x RXxRX

f(x) = 1

Cualquier funcion en RX y que cumpla con los dos propiedades es una funcion de probabilidad

para X.

0.0

0.1

0.2

0.3

x

f(x)

0 1 2 3 4

l

l

l

l l

Figura 3.1: Funcion de probabilidad de una variable aleatoria discreta

Ejemplo 3.3.

Se tiene un lote de 10 artculos de los cuales 4 son defectuosos. Se van a seleccionar al azar una

muestra de 3 de estos artculos, la variable de interes es X = el numero de artculos defectuosos

en la muestra.

(a) Encuentre la funcion de probabilidad X.

Solucion:

El rango de X es RX = {0, 1, 2, 3}.

f(0) = P (X = 0) =C40C

63

C103=

1

6

f(1) = P (X = 1) =C41C

62

C103=

1

2

37


f(2) = P (X = 2) =C42C

61

C103=

3

10

f(3) = P (X = 3) =C43C

60

C103=

1

30

Por lo que la funcion de probabilidad de X puede ser escrita como

x 0 1 2 3

f(x) 1612

310

130

En forma equivalente podemos expresar f(x) como

f(x) =C4xC

63x

C103, x = 0, 1, 2, 3.

Funcion de distribucion acumulada

La funcion de distribucion acumulada de una variable aleatoria discreta X es dada por

F (x) = P (X x) =tx

f(t), x R

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x)

l l

l l

l l

l l

l

Figura 3.2: Funcion de distribucion acumulada de una variable aleatoria discreta

Ejemplo 3.4.

Continuando con el Ejemplo 3.2, tenemos que la funcion de distribucion acumulada de X es

dada por

38

Bayes, C. 3.2. VARIABLE ALEATORIA DISCRETA

F (x) =

0, x < 016 , 0 x < 123 , 1 x < 22930 , 2 x < 31, x 3

Valor esperado y varianza

Sea X una variable aleatoria discreta con funcion de probabilidad f(x) y rango de valores

RX , entonces su media o valor esperado es dado:

= E(X) =xRX

xf(x)

El valor esperado de g(X), donde g(.) es cualquier funcion, es dado por

E(g(X)) =xRX

g(x)f(x)

La varianza de X se define por:

2 = V ar(X) = E((X )2) =

xRX(x )2f(x).

Usualmente para calcular la varianza se utiliza la siguiente formula

2 = E(X2) E(X)2.

Ejemplo 3.5.

En el contexto del Ejemplo 3.2.

(a) Calcule el valor esperado y la varianza del numero de artculos defectuosos en la muestra.

(b) Si cada artculo se vende a 100 soles y por cada defectuoso se debe devolver 50 soles, calcule

la ganancia esperada por los tres artculos seleccionados.

Solucion:

El valor esperado de X es dado por

E(X) =xRX

xf(x)

= 0 16

+ 1 12

+ 2 310

+ 3 130

= 1.2

39


Para calcular la varianza de X primero calculamos

E(X2) =xRX

x2f(x)

= 02 16

+ 12 12

+ 22 310

+ 32 130

= 2

por lo tanto

V ar(X) = E(X2) E(X)2 = 2 1.22 = 0.56

Finalmente, la ganancia es dada por g(X) = 300 50X por lo que

E(g(X)) =xRX

g(x)f(x)

= g(0) 16

+ g(1) 12

+ g(2) 310

+ g(3) 130

= 300 16

+ 250 12

+ 200 310

+ 150 130

= 240

3.3. Variable Aleatoria Continua

Una variable aleatoria continua puede asumir un numero infinito no enumerable de valores,

por lo tanto no es posible asignar probabilidad a cada posible valor como en el caso de una va-

riable aleatoria discreta. En este tipo de variable se calcula probabilidades utilizando la funcion

de densidad de probabilidad.

Funcion de densidad de probabilidad

Sea X una variable aleatoria continua con rango RX , f(x) es una funcion de densidad

probabilidad de X si cumple:

f(x) 0, x RXRX

f(x)dx = 1

P (a X b) =baf(x)dx

Notemos que una variable aleatoria continua tiene probabilidad 0 de asumir exactamente un

valor de su rango, esto es

P (X = x) = 0, x RX .

40

Bayes, C. 3.3. VARIABLE ALEATORIA CONTINUA

x

f(x)

a b

Figura 3.3: Funcion de probabilidad de una variable aleatoria continua

Ejemplo 3.6.

Suponga que el error en el llenado de una bebida, en mililitros, es una variable aleatoria continua

X con funcion de densidad de probabilidad

f(x) = c(4 x2), 2 < x < 2

(a) Encuentre el valor de c de modo que f(x) sea una funcion de densidad.

(b) Calcule la probabilidad que el error se encuentre entre 1 y 1

Solucion:

Una funcion de densidad debe cumplir queRX

f(x)dx = 1, entonces tenemos

RX

f(x)dx =

22

c(4 x2)dx

= c

(4x x

3

3

)2

2

=32

3c

por lo tanto c =3

32.

41


La probabilidad pedida es dada por

P (1 x 1) =11

3

32(4 x2)dx

=3

32

(4x x

3

3

)1

1

=22

32

Funcion de distribucion acumulada

La funcion de distribucion acumulada de una variable aleatoria continua X es dada por

F (x) = P (X x) =x

f(t)dt, x R

la cual tiene las siguientes propiedades

P (a x b) = F (b) F (a)

F (x) es no decreciente.

F () = 0 y F () = 1.

f(x) =d

dxF (x)

Como una variable aleatoria continua tiene probabilidad 0 de asumir exactamente un valor de

su rango, tenemos ademas que P (a X b) = P (a < X < b) = P (a X < b) = P (a < X b) = F (b) F (a)

Ejemplo 3.7.


(a) Encuentre la funcion de distribucion acumulada.

(b) Calcule la probabilidad de que el error haya sido menor a 0 si se sabe que fue mayor a -1.

Solucion:

La funcion de distribucion acumulada es dada por

F (x) =

x2

3

32(4 t2)dt

=3

32

(4t t

3

3

)x

2

=1

32(12x x3 + 16)

42

Bayes, C. 3.3. VARIABLE ALEATORIA CONTINUA

x

f(x)

Figura 3.4: Funcion de distribucion acumulada de una variable aleatoria continua

La probabilidad pedida es dada por

P (X < 0 | X > 1) = P (1 < X < 0)P (X > 1)

=F (0) F (1)

1 F (1)

=0.5 0.156251 0.15625

= 0.4074

Valor esperado y varianza

Sea X una variable aleatoria continua con funcion de probabilidad f(x) y rango de valores

RX , entonces su media o valor esperado es dado:

= E(X) =

RX

xf(x)dx

El valor esperado de g(X), donde g(.) es cualquier funcion, es dado por

E(g(X)) =

RX

g(x)f(x)dx

43


La varianza de X se define por:

2 = V ar(X) = E((X )2) =

RX

(x )2f(x)dx.

Usualmente para calcular la varianza se utiliza la siguiente formula

2 = E(X2) E(X)2.

Ejemplo 3.8.


(a) Calcule el valor esperado y la varianza del error de llenado de una bebida.

(b) Si cada mililitro errado genera un costo de 0.05 soles, as sea por exceso o por defecto,

calcule el costo esperado.

Solucion:

El valor esperado de X es dado por

E(X) =

RX

xf(x)dx

=

22

x3

32(4 x2)dx

=3

32

(2x2 x

4

4

)2

2= 0

Para calcular la varianza de X primero calculamos

E(X2) =

RX

x2f(x)dx

=3

32

(4x3

3 x

5

5

)2

2= 0.8

por lo tanto

V ar(X) = E(X2) E(X)2 = 0.8 02 = 0.8

44

Bayes, C. 3.4. OTRAS PROPIEDADES DE VALOR ESPERADO

Finalmente, el costo es dado por g(X) = 0.05|X| por lo que

E(g(X)) =

RX

g(x)f(x)

=

02xf(x) +

20

xf(x)

=

02x 3

32(4 x2)dx+

20

x3

32(4 x2)

= 332

(2x2 x

4

4

)0

2+

3

32

(2x2 x

4

4

)2

0

= 0.75

3.4. Otras propiedades de valor esperado

E(a) = a.

E(a+ bX) = a+ bE(X).

V ar(a) = 0.

V ar(a+ bX) = b2V ar(X).

E(aX + bY ) = aE(X) + bE(Y ) para cualesquiera v.a. X e Y .

V ar(aX + bY ) = a2V ar(X) + b2V ar(Y ) solamente si las v.a. X e Y son independientes.

Ejemplo 3.9.

La fabricacion de una pieza metalica requiere de dos etapas independientes entre s, sean las

variables aleatorias X = tiempo de fabricacion requerido en la primera etapa e Y = tiempo

de fabricacion requerido en la segunda etapa, ambos medidos en minutos. Las funciones de

densidad de X e Y son dadas por

fX(x) = 2 x2, 2 < x < 4 y fY (y) =

1

2, 1 < y < 3

Cada minuto de fabricacion en la primera etapa por pieza cuesta 3 soles, cada minuto de la

segunda etapa por pieza cuesta 5 soles y ademas los materiales usados cuestan 10 soles por

pieza.

(a) Calcule el costo total esperado en la fabricacion de una pieza metalica.

(b) Calcule la varianza del costo total de fabricacion.

Solucion:

45


Sea C el costo total por la fabricacion de una pieza metalica, entonces tenemos que

C = 3X + 5Y + 10

por lo tanto

E(C) = E(3X + 5Y + 10)

= 3E(X) + 5E(Y ) + 10

= 3 83

+ 5 2 + 10= 28

Como X e Y son independientes

V ar(C) = V ar(3X + 5Y + 10)

= 32V ar(X) + 52V ar(Y )

= 32 29

+ 52 13

= 10.33

3.5. Funcion de una variable

Sea la funcion Y = g(X) y asumimos que conocemos la funcion de probabilidad de X si es

discreta o la funcion de densidad si X es continua, denotada por fX(x). Adicionalmente, consi-

deraremos que y = g(x) es una funcion inyectiva en RX , esto es a cada valor de x le corresponde

un unico valor de y.

As tenemos que si X es discreta, la funcion de probabilidad de Y es dada por

fY (y) = fX(g1(y)

)donde g1(y) es la funcion inversa. En el caso que X sea continua, la funcion de densidad de Yes dada por

fY (y) = fX(g1(y)

) ddyg1(y).

Ejemplo 3.10.

La temperatura medida en grados Fahrenheit de un da es una variable aleatoria X cuya funcion

de densidad es dada por

fX(x) =1

36, 50 < x < 86

Determine la funcion de densidad de probabilidad de Y la temperatura medida en grados Cel-

sius. Recuerde que Y = 5(X 32)/9.

46

Bayes, C. 3.5. FUNCION DE UNA VARIABLE

Solucion:

Tenemos que Y = g(X), con g(X) = 5(X 32)/9 que es una funcion inyectiva.

La funcion inversa es g1(y) =9

5y + 32, luego

fY (y) = fX(g1(y)

) ddyg1(y)

= fX

(9

5y + 32

)95

=1

36 9

5

=1

20

Como el rango de X es 50 < x < 86, tenemos que 10 < 5(x 32)/9 < 30 por lo que elrango de Y es 10 < y < 30. Finalmente, la funcion de densidad de Y es dada por

fY (y) =1

20, 10 < y < 30.

47


3.6. Ejercicios

1. Considere el siguiente juego que consiste en lanzar tres veces una moneda, por cada cara

la persona que lanzo la moneda recibe un sol y por cada sello la persona debe pagar un

sol. Se esta interesado en la posible ganancia resultante de este juego.

(a) Describa el espacio muestral del experimento.

(b) Determine el rango de la ganancia.

(c) Considere que existe la misma posibilidad de obtener un sello o una cara en el lan-

zamiento de la moneda, asigne probabilidades a cada valor del rango encontrado en

(b).

2. El numero de artculos defectuosos por lote de 10 unidades es una variable aleatoria X

cuya funcion de probabilidad es :

x 0 1 2 3 4

P (X = x) 1/16 k 6/16 4/16 1/16

(a) Calcular el valor de la constante k

(b) Si un lote tiene al menos dos artculos defectuosos, cual es la probabilidad de que

tenga exactamente 3?.

(c) Hallar E(X) y V ar(X).

(d) Un cliente inspecciona el lote, si este tiene menos de dos artculos artculos defectuosos

se pasa la inspeccion y el cliente compra el lote a 1000 soles, si encuentra al menos

dos defectuosos tambien compra el lote al mismo precio pero se le debera devolver 50

soles por cada artculo defectuoso encontrado. Calcule la ganancia esperada.

3. Considere la variable aleatoria X =el numero de lanzamientos de un dado hasta conseguir

un 1. Asuma que el resultado de cada lanzamiento es independiente de los otros.

(a) Encuentre la funcion de probabilidad de X.

(b) Calcule la probabilidad de que sea necesarios mas de 2 lanzamientos para conseguir

un 1.

(c) Calcule el valor esperado de X.

4. El numero de errores que puede tener una pieza de tela de 10 metros es una variable

aleatoria con funcion de probabilidad

x 0 1 2 3

f(x) a a b b

Se sabe que en promedio ocurren 1.7 errores por cada 10 metros de tela.

(a) Calcular el valor de las constantes a y b.

(b) Calcular la probabilidad una pieza de tela de 10 metros tenga exactamente 3 errores

si se sabe que tiene al menos un error.

48

Bayes, C. 3.6. EJERCICIOS

5. Suponga que la variable aleatoria X tiene funcion de densidad de probabilidad

f(x) = ex, si x > 0

Encontrar la funcion de densidad de Y = X2 y calcule el valor esperado de X y de Y .

6. La demanda semanal de un producto, en toneladas, es una variable aleatoria X cuya

funcion de densidad es dada por

f(x) =x

50, 0 < x < 10.

Cada tonelada producida cuesta 10 mil soles y se vende a 25 mil soles. Toda cantidad

que no se consigue vender, se pierde sin generar un costo adicional al de su fabricacion.

Suponga que en cierta semana un productor decide fabricar 5 toneladas.

a) Cual es la probabilidad de satisfacer la demanda?

b) Cual es la probabilidad de que se satisfaga la demanda y al mismo tiempo el productor

gane mas de 30 mil soles?

c) Cual es la probabilidad de que la demanda no sea satisfecha?

d) Cual es la utilidad esperada?

7. Una estacion de servicio es abastecida de gasolina una vez por semana. El volumen X

de la posible venta semanal en miles de galones tiene la siguiente funcion de distribucion

acumulada

F (x) = 1 (1 x)k, 0 < x < 1

(a) Halle el valor de k si se sabe que la probabilidad de que se vendan mas de 500 galones

es 0.0625

(b) Cual debe ser la capacidad del tanque de la estacion de servicio para que la proba-

bilidad de que su provision se agote en una semana sea solo de 0.01?

8. El tiempo de duracion de un cierto componente electronico es una variable aleatoria X

con funcion de densidad

f(x) =

{ax , 0 x < 1b(2 x) , 1 x 2

donde X, esta medido en anos. Ademas se sabe que en promedio uno de estos componentes

dura 1.2 anos.

a) Halle las constantes a y b.

b) Encuentre la funcion de distribucion acumulada.

c) El componente se vende a 10000 soles y se la da una garanta de 6 meses (si falla antes

de 6 meses se devuelve el dinero). Calcule la utilidad esperada por la venta de 20 de

estos componentes.

49


d) Si el componente tiene 6 meses de funcionamiento, calcule la probabilidad que dure

mas de un ano.

50

Captulo 4

Distribuciones de probabilidad

En este captulo presentaremos algunas de las distribuciones de probabilidad mas importan-

tes.

4.1. Distribuciones Discretas

4.1.1. Distribucion Hipergeometrica

Sea una poblacion de N elementos, M de los cuales presentan una caracterstica de interes

y N M no la presentan. Si de esta poblacion se selecciona una muestra aleatoria de tamanon sin reemplazo y se define una variable aleatoria X como

X = el numero de elementos que presentan la caracterstica de interes en la muestra.

Entonces X es una variable aleatoria con distribucion Hipergeometrica, cuya funcion de proba-

bilidad es dada por:

f(x) =

(M

x

)(N Mn x

)(N

n

) ,x = {max {0, n+M N} , . . . ,min {M,n}}

Consideraremos la siguiente notacion X HG(N,M,n) para representar esta distribucion.Los parametros de esta distribucion pueden tomar los siguientes valores N = 1, 2, . . ., M =

0, 1, . . . , N y n = 1, 2, . . . , N .

El valor esperado y la varianza son dados por

E(X) = nM

Ny V ar(X) = n

(M

N

)(N MN

)(N nN 1

).

Ejemplo 4.1.

Se tiene un lote de 10 artculos de los cuales 4 son defectuosos. Se van a seleccionar al azar y

sin reemplazo una muestra de 3 de estos artculos, la variable de interes es X = el numero de

artculos defectuosos en la muestra.

(a) Calcule la probabilidad que los tres artculos sean defectuosos.

(b) Calcule el valor esperado y la varianza de X.

51

Bayes, C. CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Solucion:

Tenemos que

X HG(10, 4, 3)

entonces la funcion de probabilidad de X es dada por

f(x) =

(4

x

)(6

3 x

)(

10

3

) , x = 0, 1, 2, 3

por lo tanto P (X = 3) = f(3) =

(4

3

)(6

0

)(

10

3

) = 130

Luego,

E(X) = 34

10= 1.2 y V ar(X) = 3

(4

10

)(6

10

)(7

9

)= 0.56.

4.1.2. Distribucion de Bernoulli

Un ensayo de Bernoulli es un experimento aleatorio que cumple las siguientes condiciones

Para cada ensayo solamente son posibles dos resultados, usualmente denominados, exito

(E) y fracaso (F) con

P (E) = p y P (F ) = 1 p

p la probabilidad de exito se mantiene constante al repetirse el experimento.

Si definimos la variable aleatoria X como

X =

{1, si el resultado es un exito

0, si el resultado es un fracaso

Entonces X es una variable aleatoria con distribucion Bernoulli, cuya funcion de probabilidad

es dada por:

f(x) = px(1 p)1x, x = 0, 1

El valor esperado y la varianza son dados por

E(X) = p y V ar(X) = p(1 p).Ejemplo 4.2.

Como ejemplos de ensayos de Bernoulli tenemos

El lanzamiento de una moneda, en este caso los posibles resultados son {cara, sello}, siconsideramos como un exito el obtener una cara tenemos que p = P (Exito) = 0.5.

52

Bayes, C. 4.1. DISTRIBUCIONES DISCRETAS

En el lanzamiento de un dado si consideramos obtener el valor de 6 o no, en este caso los

posibles resultados son {obtener un 6, no obtener un 6}, si consideramos como un exito elobtener un 6 tenemos que p = P (Exito) = 1/6.

4.1.3. Distribucion Binomial

Consideremos que se repite en forma independiente n ensayos de Bernoulli con probabilidad

p de obtener un exito. Si definimos la variable aleatoria X como

X = Numero de exitos obtenidos en n ensayos de Bernoulli.

Entonces X es una variable aleatoria con distribucion Binomial, cuya funcion de probabilidad

es dada por:

f(x) =

(n

x

)px(1 p)nx, x = 0, 1, ..., n, 0 < p < 1

Consideraremos la siguiente notacion X Binomial(n, p) para representar esta distribucion.El valor esperado y la varianza son dados por

E(X) = np y V ar(X) = np(1 p).

Ejemplo 4.3.

Se sabe que la probabilidad de que un artculo producido por una cierta empresa sea defectuoso

es de 0.01 independientemente de los otros. Los artculos se venden en cajas de 12 unidades

y tienen una garanta de reemplazo por una caja nueva si se encuentra mas de un artculo

defectuoso.

(a) Calcule la probabilidad que la garanta aplique en una de estas cajas.

(b) Si se venden 4 de estas cajas calcule la probabilidad que la garanta aplique solamente en

una de estas cajas.

(c) Si se venden 1000 de estas cajas, calcule el numero esperado de cajas en que se aplicara la

garanta.

Solucion:

Definimos

X = numero de artculos defectuosos en una caja de 12 unidades,

como existe independencia entre los artculos y la probabilidad de que un artculo sea

defectuoso es de 0.01 y no cambia tenemos que

X Binomial(12, 0.01)

entonces la funcion de probabilidad de X es dada por

fX(x) =

(12

x

)0.01x(1 0.01)12x, x = 0, 1, ..., 12

53

Bayes, C. CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Luego,

P (se aplique la garanta) = P (X > 1)

= 1 P (X 1)= 1 P (X = 0) P (X = 1)= 1 fX(0) fX(1)

= 1(

12

0

)0.010(1 0.01)120

(12

1

)0.011(1 0.01)121

= 0.006174

Definimos ahora

Y = numero de cajas en que la garanta se aplica de 4 vendidas,

como existe independencia entre las cajas y la probabilidad de que en una caja se aplique

la garanta no cambia, tenemos que

Y Binomial(4, p)

entonces la funcion de probabilidad de Y es dada por

fY (y) =

(4

y

)py(1 p)4y, y = 0, 1, 2, 3, 4

donde p = P (exito) = P (en una caja se aplique la garanta) = P (X > 1) = 0.006174

Luego,

P (Y = 1) = fY (1) =

(4

1

)0.0061741(1 0.006174)41 = 0.02424.

Definimos ahora

W = numero de cajas en que la garanta se aplica de 1000 vendidas,

como existe independencia entre las cajas y la probabilidad de que en una caja se aplique

la garanta no cambia, tenemos que

W Binomial(1000, 0.006174)

Finalmente

E(W ) = 1000 0.006174 = 6.17.

podemos decir que se espera que de 1000 cajas vendidas aproximadamente en 6 se aplique

la garanta.

54

Bayes, C. 4.1. DISTRIBUCIONES DISCRETAS

4.1.4. Distribucion Geometrica

Consideremos que se repite en forma independiente ensayos de Bernoulli con probabilidad

p de obtener un exito. Si definimos la variable aleatoria X como

X = Numero de ensayos de Bernoulli hasta obtener el primer exito.

Entonces X es una variable aleatoria con distribucion Geometrica, cuya funcion de probabilidad

es dada por:

f(x) = p(1 p)x1, x = 1, 2, ..., 0 < p < 1

Consideraremos la siguiente notacion X Geometrica(p) para representar esta distribucion.En este caso su funcion de distribucion acumulada tiene forma conocida dada por

F (m) = 1 (1 p)m

donde m es el mayor entero que sea menor o igual que x. El valor esperado y la varianza son

dados por

E(X) =1

py V ar(X) =

1 pp2

.

Ademas, la distribucion geometrica es la unica distribucion de probabilidad discreta que

tiene falta de memoria, esto es

P (X > m+ k | X > m) = P (X > k).

Ejemplo 4.4.

Se sabe que la probabilidad que ocurra una inundacion que puede causar danos importantes a la

infraestructura de una ciudad en un cierto ano es de 0.05. Asumiendo que existe independencia

entre la ocurrencia de las inundaciones.

(a) Calcule el numero promedio de anos hasta que ocurra una inundacion que cause danos

importantes a una ciudad.

(b) Calcule la probabilidad que el tercer ano ocurra una inundacion que cause danos importantes

a una ciudad.

(c) Si han pasado dos anos sin que ocurra una inundacion, calcule la probabilidad que pasen

dos anos mas antes que ocurra una inundacion que cause danos importantes a una ciudad

Solucion:

Definimos

X

textoest218

Documents

distribucion log

distribucion chi

distribucion hipergeometrica

distribucion de bernoulli

distribucion geometrica

distribucion de poisson

distribucion exponencial

distribucion gama