marketing

31
Variable aleatoria Formalmente, una variable aleatoria es una función, que asigna eventos (p.e., los posibles resultados de tirar un dado dos veces: (1, 1), (1, 2), etc.) a números reales (p.e., su suma). Una variable aleatoria o variable estocástica es una variable estadística cuyos valores se obtienen de mediciones en experimento aleatorio. Los valores posibles de una variable aleatoria pueden representar los posibles resultados de un experimento aún no realizado, o los posibles valores de una cantidad cuyo valor actualmente existente es incierto (p.e., como resultado de medición incompleta o imprecisa). Intuitivamente, una variable aleatoria puede tomarse como una cantidad cuyo valor no es fijo pero puede tomar diferentes valores; una distribución de probabilidad se usa para describir la probabilidad de que se den los diferentes valores. Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores aleatorios como valores lógicos, funciones... El término elemento aleatoriose utiliza para englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el de proceso estocástico, un conjunto de variables aleatorias ordenadas (habitualmente por orden o tiempo). Media Aritmética En matemáticas y estadística, la media aritmética (también llamada promedio o simplemente media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muestrales. Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación. Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo)

Upload: alichhel-velasquez

Post on 11-Jan-2016

4 views

Category:

Documents


0 download

DESCRIPTION

fundamentos de marketing

TRANSCRIPT

Page 1: Marketing

Variable aleatoria

Formalmente, una variable aleatoria es una función, que asigna eventos (p.e., los posibles

resultados de tirar un dado dos veces: (1, 1), (1, 2), etc.) a números reales (p.e., su suma).

Una variable aleatoria o variable estocástica es una variable estadística cuyos valores se

obtienen de mediciones en experimento aleatorio.

Los valores posibles de una variable aleatoria pueden representar los posibles resultados de un

experimento aún no realizado, o los posibles valores de una cantidad cuyo valor actualmente

existente es incierto (p.e., como resultado de medición incompleta o imprecisa).

Intuitivamente, una variable aleatoria puede tomarse como una cantidad cuyo valor no es fijo

pero puede tomar diferentes valores; una distribución de probabilidad se usa para describir la

probabilidad de que se den los diferentes valores.

Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores

aleatorios como valores lógicos, funciones... El término elemento aleatoriose utiliza para

englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el de proceso

estocástico, un conjunto de variables aleatorias ordenadas (habitualmente por orden o

tiempo).

Media Aritmética

En matemáticas y estadística, la media aritmética (también llamada promedio o

simplemente media) de un conjunto finito de números es el valor característico de una serie

de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemática o

valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de

sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media

muestral siendo uno de los principales estadísticos muestrales.

Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total

de la variable distribuida a partes iguales entre cada observación.

Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus

bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre

cada uno de ellos. Es decir, la media es una forma de resumir la información de una

distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tuviera la

misma cantidad de la variable.

También la media aritmética puede ser denominada como centro de gravedad de

una distribución, el cual no está necesariamente en la mitad.

Una de las limitaciones de la media aritmética es que se trata de una medida muy sensible a

los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy

pequeños tienden a reducirla, lo que implica que puede dejar de ser representativa de la

población.

La media aritmética se calcula sumando todos los componentes y dividiendo el resultado entre

el número de componentes. El resultado entero o decimal es la media aritmética.

Page 2: Marketing

Definición

Dados los n números , la media aritmética se define como:

Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:

Se utiliza la letra X con una barra horizontal sobre el símbolo para representar la media de una

muestra ( ), mientras que la letra µ (mu) se usa para la media aritmética de una población,

es decir, el valor esperado de una variable.

En otras palabras, es la suma de n valores de la variable y luego dividido por n : donde n es el

número de sumandos, o en el caso de estadística el número de datos se da el resultado

Propiedades

La suma de las desviaciones con respecto a la media aritmética es cero (0).

La media aritmética de los cuadrados de las desviaciones de los valores de la variable con

respecto a una constante cualquiera se hace mínima cuando dicha constante coincide con

la media aritmética.

Si a todos los valores de la variable se le suma una misma cantidad, la media aritmética

queda aumentada en dicha cantidad.

Si todos los valores de la variable se multiplican por una misma constante la media

aritmética queda multiplicada por dicha constante.

La media aritmética de un conjunto de números positivos siempre es igual o superior a

la media geométrica:

La media aritmética está comprendida entre el valor máximo y el valor mínimo del

conjunto de datos:

En otros términos hay por lo menos un dato que es mayor o igual que la media aritmética.

Por ejemplo, es fácil deducir que en una reunión de 38 individuos hay necesariamente al

menos 4 que nacieron el mismo mes. El promedio de individuos que nacieron por mes es

38/12 ≈ 3,167. Luego en algún mes nacieron en una cantidad entera y mayor o igual que el

promedio, o sea 4 ≥ 3,167.

Page 3: Marketing

Ejemplo 1. José cosechó del árbol 4 peras, Catalina – 2 peras, y María – 6. Los niños juntaron sus frutas y se las repartieron en forma igualitaria. ¿Cuántas peras obtuvo cada uno?Solución. Calculemos la media aritmética:

4 + 2 + 6 =

12 = 4

3 3Resultado: Cada uno obtuvo 4 peras.

Ejemplo 2. A los cursillos del inglés asistieron 15 personales el lunes, el martes — 10, el miércoles — 12, el jueves — 11, el viernes — 7, el sábado — 14, el domingo — 8. Calcular asistencia media de los cursillos por la semana.Solución. Calculemos la media aritmética:

15 + 10 + 12 + 11 + 7 + 14 + 8 =

77 = 11

7 7Resultado: en pto medio a los cursillos del inglés asistieron 11 personas al día.

Ejemplo 3. El piloto estuvo yendo dos horas a la velocidad de 120 km a la hora y horas a la velocidad de 90 km a la hora. Calcule la velocidad media del coche durante la carrera.Solución. Calculemos la media aritmética de las velocidades del coche por cada hora del camino:

120 + 120 + 90 =

330 = 110

3 3Resultado: la velocidad media del coche durante la carrera fue de 110 km a la hora.

Varianza

Es una medida estadística que mide la dispersión de los valores respecto a un valor central

(media).

Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una

distancia en metros, la varianza se expresa en metros al cuadrado. La desviación estándar, la

raíz cuadrada de la varianza, es una medida de dispersión alternativa expresada en las mismas

unidades.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y se

desaconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas.

En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

Definición

Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de la siguiente

forma:

Siendo:

: cada dato

Page 4: Marketing

: El número de datos

: la media aritmética de los datos

Page 5: Marketing

EJERCICIOSHALLAR LA VARIANZA DE UNA ENCUESTA REALIZADA A UN COLEGIO.Variable= Edad

HALLAR LA VARIANZA DE LA SIGUIENTE TABLA ESTADÍSTICA.

Desviación Estándar

La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) de lo que se apartan los datos de su media, y por tanto, se mide en las mismas unidades que la variable.Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en

Page 6: Marketing

su distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.Desviación estándar o TípicaEsta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:

EJEMPLO1.-El gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.Por lo que su media es:

Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.

2.-Ejemplo: Desviación estándar para datos no agrupadosCalcular la desviación estándar al siguiente conjunto de datos muéstrales.

220 215 218 210 210219 208 207 213 225213 204 225 211 221218 200 205 220 215217 209 207 211 218

PASO 1: Calcular la media aritmética.PASO 2: Calcular la varianzaEn este punto, la varianza es identificada por S2.PASO 3: Calcular la desviación estándar a partir de la raíz cuadrada de la varianza.Los datos se alejan en promedio de la media aritmética en 6,5516 puntos.

Page 7: Marketing

3.- Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes:2, 3, 6, 8, 11.12, 6, 7, 3, 15, 10, 18, 5.2, 3, 6, 8, 11.

12, 6, 7, 3, 15, 10, 18, 5.

1. VARIABLES ALEATORIAS DISCRETAS

En ocasiones, algunas variables aleatorias siguen distribuciones de probabilidad muy concretas, como por ejemplo el estudio a un colectivo numeroso de individuos que se modelizan por la distribución “Normal”.

Estudiaremos algunas de las distribuciones o modelos de probabilidad más importantes y que después nos resultarán muy útiles para el tema de la Estimación. Como hemos visto, las variables pueden ser discretas o continuas; por ello, también las distribuciones podrán ir asociadas a variables aleatorias discretas o continúas.

1.1. Distribución Binomial

Es una extensión de la distribución de Bernouilli. Supongamos que se repite un experimento “n” veces de forma idéntica e independiente. Los resultados de cada realización del experimento se clasifican en dos categorías (como en el caso de Bernouilli), una será la probabilidad de éxito p, y otra q=1-p, la de fracaso.

Así, por tanto, sea X una variable aleatoria discreta, se dice que se distribuye como una distribución binomial de parámetros (n,p). Siempre se debe de verificar que n>1 y que p tome valores entre 0 y 1.

La función de probabilidad viene dada por la expresión:

P= [X=x i ]=( nx i) px i(1−p)n− xi

x=1,2 ,…,n

Además, es fácil de comprobar que se verifica que

E [ x ]=np y queV [x ]=np (1−p )=npq

1.1.1. Propiedades de la distribución binomial:

La distribución Binomial se puede obtener como suma de n variables aleatorias

Page 8: Marketing

independientes Bernouilli con el mismo parámetro “p”.

Si tenemos dos variables aleatorias que se distribuyen según una Binomial con el mismo parámetro “p”, es decir, con la misma probabilidad de éxito, X → B(n, p) e Y → B(m, p) , entonces siempre se verifica

X +Y → B(n + m, p) .

Si no tienen la misma probabilidad no se pueden sumar.

Sea X una variable aleatoria e Y otra variable aleatoria que verifican que X → B(n, p) e Y=X/n, entonces se verifica

Y → B(1, p / n)

Y además su esperanza y varianza son

E[Y ]= p y V [Y ]=pq

.

n

1.2. Distribución de Poisson

Esta es una distribución discreta de gran utilidad sobre todo en procesos biológicos, donde X suele representar el número de eventos independientes que ocurren a velocidad constante en un intervalo de tiempo o en un espacio.

Así, por tanto, sea X una variable aleatoria discreta, se dice que se distribuye como una distribución de Poisson,

X → P(λ),

con λ > 0, si su función o distribución de probabilidad viene dada por:

P[ X = xi ]= e−λ

λxi

.xi !

En esta distribución λ representa el número promedio de ocurrencias en un intervalo de tiempo o en un espacio. Por lo tanto, para esta distribución se verifica que su esperanza y su varianza son: E[x ]= λ ,

V [x ]= λ .

Ejemplo: Una central telefónica recibe una media de 480 llamadas por hora. Si el número de llamadas se distribuye según una Poisson y la central tiene una capacidad para atender a lo sumo 12 llamadas por minuto, ¿cuál es la probabilidad de que en un minuto determinado no sea posible dar línea a todos los clientes?

Si definimos X = “Nº de llamadas por minuto” entonces X → P (8).

P (X > 12) = 1 − P (X ≤ 12) = 1 − 0,9362 = 0,0638.

1.3. Distribución Normal:

Page 9: Marketing

Es una de las distribuciones más importantes. Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan según una distribución normal.Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribución:Las ventajas teóricas de este modelo hacen que su uso se generalice en las aplicaciones reales.Sea X una variable aleatoria continua, se dice que se distribuye como una normal.

X → N (μ,σ); μ ∈ Rσ >o

donde se verifica que − ∞ < x < +∞, μ es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la campana de Gauss), y σ es cualquier valor entre –∞ y +∞, si su función de densidad viene dada por:

f ( x )= 1 e−

(x − μ ) 2σ 2

2πσ

Cuando la media de la distribución es 0 y la varianza es 1, se denomina "normal tipificada", y su ventaja reside en que hay tablas, o rutinas de cálculo que permiten obtener esos mismos valores, donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución. Es se verá con más detalle en el siguiente apartado.

1.3.1.Propiedades:

• Tiene un parámetro que es la media E[ X ]= μ .

• Tiene otro parámetro que nos da la dispersión.

V [ X ]= σ 2 .

• La media, la moda y la mediana coinciden.

• Es una función simétrica respecto a la media, como se puede ver en el gráfico.

• Si definimos la variable Y = a X + b, donde X se distribuye como una normal de parámetros X → N (μ,σ ); , entonces:

Y → N (aμ + b, aσ)

1.4. Distribución Normal Tipificada o Estandarizada

Como se decía anteriormente, este es un caso particular de una variable aleatoria

Page 10: Marketing

continua X que se distribuye como una Normal de parámetros (0,1), por lo que su función de densidad viene dada por:

f (x) = 1 e−x2

22π

1.4.1.Propiedades:

• E(x)=0.

• V(x)=1.

La importancia de la distribución normal tipificada es que tiene la ventaja, como ya hemos indicado, de que las probabilidades para cada valor de la curva se encuentran recogidas en una tabla.

Así, lo que se hará es transformar cualquier variable que se distribuya como una normal en una normal tipificada. Para hacer este cambio, se crea una nueva variable Z que será igual a la anterior X menos su media y dividida por su desviación típica (que es la raíz cuadrada de la varianza).

Esta nueva variable se distribuye como una normal tipificada, permitiéndonos, por tanto, conocer la probabilidad acumulada en cada valor, es decir, X → N (μ,σ); al definir la nueva variable

Z = X σ− μ siempre se verifica que Z → N (0;1);

X − μ x − μ

P[X ≤ x]= < =σ σ

x − μ

P Z < .

σ

Page 11: Marketing

1.5. Distribución Chi-Cuadrado de Pearson:

Sea X1, X2, X3....Xn variables aleatorias que se distribuyen como normales N(0,1), y se define una nueva variable X = X 12 + X 22 + X 32 +... + X n2 , entonces se diceque X se distribuye como una Chi-Cuadrado o Ji-cuadrado con n grados de libertad, donde n es el número de variables aleatorias normales independientes elevadas al cuadrado que se han sumado. Esta se representa como

X → χn2 ,

La variable aleatoria Chi-cuadrado se representa,

1.5.1.Propiedades:• Es una función asimétrica.

• E(x)= n.

• V(x)=2n.

1.6. Distribución T.Student:

Sea X una variable aleatoria que se distribuye como X → N (0,1) y sea Y otra variable

aleatoria que se distribuye como Y → χn2 , tal que X e Y son independientes, entonces

podemos definir otra variable aleatoria

T = X , Y

n

1.6.1.Propiedades:

• Es simétrica, está centrada en el punto (0,0) • Mo = Me =0

• E [T] = 0 si n>1

Page 12: Marketing

• V [T] = n/n-2 si n>2.

Cuando el número de variables aleatorias es muy grande, es decir, cuando n → ∞, la variable se puede aproximar por una normal.

Teoría del muestreo y estimación estadística

Muestreo

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir

de una población.

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a

la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a

los que se alcanzarían si se realizase un estudio de toda la población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado

(que consienta no solo hacer estimaciones de la población sino estimar también los márgenes

de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca

podremos estar enteramente seguros de que el resultado sea una muestra representativa,

pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se

puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se

pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada

muestra su probabilidad de extracción, sigue la llamada distribución muestral.

Tipos

Sin reposición de los elementos :' Cada elemento extraído se descarta para la subsiguiente

extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para

estimar la vida media de las bombillas que la integran, no será posible medir más que una vez

la bombilla seleccionada.

Con reposición de los elementos: Las observaciones se realizan con remplazo de los

individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones

muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede

considerarse con reposición aunque, realmente, no lo sea.

Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una

extracción es tan pequeña que el muestreo puede considerarse con reposición.

Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción

de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.

Muestreo sistemático

Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo.

Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda).

Luego hay que calcular una constante, denominada coeficiente de elevación:

Page 13: Marketing

K= N/n

Donde N es el tamaño de la población y n el tamaño de la muestra.

Para determinar en qué fecha se producirá la primera extracción, hay que elegir al azar un

número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares.

Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno.

Esto quiere decir que si tenemos un determinado número de personas que es la población (N)

y queremos escoger de esa población un número más pequeño el cual es la muestra (n),

dividimos el número de la población por el número de la muestra que queremos tomar y el

resultado de esta operación será el intervalo, entonces escogemos un número al azar desde

uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el

orden.

Muestreo estratificado

Consiste en la división previa de la población de estudio en grupos o clases que se suponen

homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de

estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo

que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo

sistemático, una de las técnicas de selección más usadas en la práctica.

Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los

estratos, existen dos técnicas de muestreo estratificado:

Asignación proporcional: el tamaño de la muestra dentro de cada estrato es proporcional

al tamaño del estrato dentro de la población.

Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan

más variabilidad. Para ello es necesario un conocimiento previo de la población.

Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las

opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos,

puede haber cierta homogeneidad. En la asignación proporcional, si la población está

compuesta de un 55% de mujeres y un 45 % de hombres, se tomaría una muestra que

contenga también esos mismos porcentajes de hombres y mujeres. En la asignación óptima, si

todos los hombres piensan igual, pero las mujeres son impredecibles, se tomaría una muestra

con más del 55% de mujeres.

Para una descripción general del muestreo estratificado y los métodos de inferencia asociados

con este procedimiento, suponemos que la población está dividida en h subpoblaciones o

estratos de tamaños conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean

Page 14: Marketing

homogéneas respecto a la característica en cuestión. La media y la varianza desconocidas para

el i-ésimo estrato son denotadas por mi y si2, respectivamente.

Muestreo por etapas múltiple

Esta técnica es la única opción cuando no se dispone de lista completa de la población de

referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se

obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso. En

el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados que se

extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla

en varias fases o extracciones sucesivas para cada nivel.

Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país

determinado, éstos pueden subdividirse en unidades primarias representadas por

circunscripciones didácticas y unidades secundarias que serían los propios profesores. En

primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la

lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra

de unidades secundarias de cada una de las primarias seleccionadas en la primera extracción.

Muestreo por conglomerados

Se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se

supone que contienen toda la variabilidad de la población, es decir, la representan fielmente

respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos

o conglomerados para la realización del estudio.

Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las

personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es

decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al

azar. Este método tiene la ventaja desimplificar la recogida de información muestral.

Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para

integrar la muestra, el diseño se llama muestreo bietápico.

Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer método

funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más

diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben

presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.

Homogeneidad de las poblaciones o sus subgrupos

Homogéneo significa, en el contexto de la estratificación, que no hay mucha variabilidad. Los

estratos funcionan mejor cuanto más homogéneos son cada uno de ellos respecto a la

característica a medir. Por ejemplo, si se estudia la estatura de una población, es bueno

distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya

menos variabilidad, es decir, sean menos heterogéneos. Dicho de otro modo, no hay tantas

diferencias entre unas estaturas y otras dentro del estrato que en la población total.

Page 15: Marketing

Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan las mismas

diferencias dentro del estrato que en toda la población, no hay por qué usar este método de

muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la

población, lo que se construyen son conglomerados, que ahorran algo del trabajo que

supondría analizar toda la población. En resumen, los estratos y los conglomerados funcionan

bajo principios opuestos: los primeros son mejores cuanto más homogéneo es el grupo

respecto a la característica a estudiar y los conglomerados, si representan fielmente a la

población, esto es, contienen toda su variabilidad, o sea, son heterogéneos.

Muestreo no probabilístico

Es aquél para el que no se puede calcular la probabilidad de extracción de una determinada

muestra. Por tal motivo, se busca seleccionar a individuos que tienen un conocimiento

profundo del tema bajo estudio y se considera que la información aportada por esas personas

es vital para la toma de decisiones.

Muestreo por cuotas

Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En

primer lugar es necesario dividir la población de referencia en varios estratos definidos por

algunas variables de distribución conocida (como el género o la edad). Posteriormente se

calcula el peso proporcional de cada estrato, es decir, la parte proporcional de población que

representan. Finalmente se multiplica cada peso por el tamaño de n de la muestra para

determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que

una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra

dentro de cada estrato.

Muestreo de bola de nieve

Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en

contacto entre sí. Consiste en identificar sujetos que se incluirán en la muestra a partir de los

propios entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen los

requisitos necesarios, servirán como localizadores de otros con características análogas.

Muestreo subjetivo por decisión razonada

En este caso las unidades de la muestra se eligen en función de algunas de sus características

de manera racional y no casual. Una variante de esta técnica es elmuestreo compensado o

equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra

para determinadas variables se acerque a la media de la población. La cual funciona en base a

referencias o por recomendación después se reconoce por medio de la estadística.

Tipos más importantes

Existen numerosas técnicas para seleccionar muestras. Este paso es de importancia vital en

Page 16: Marketing

un estudio estadístico, porque las conclusiones que se obtienen dependen muy esencialmente de la/s muestra/s analizada/s. Las técnicas que proporcionan las mejores muestras son las aleatorias, en las que cualquier integrante de la población tiene la misma probabilidad de ser elegido.

La cantidad de elementos que integran la muestra (el tamaño de la muestra) depende de múltiples factores, como el dinero y el tiempo disponibles para el estudio, la importancia del tema analizado, la confiabilidad que se espera de los resultados, las características propias del fenómeno analizado, etc.

Inicialmente, los muestreos se sividen en dos grandes grupos:

MUESTREO NO PROBABILÍSTICO: No se usa el azar, sino el criterio del investigador, es decir, él decide si la muestra es o no representativa. un ejemplo puede ser el realizado por un médico para investigar una determinanda enfremedad, selecciona sus pacientes.

MUESTREO PROBABILÍSTICO (ALEATORIO): Interviene el azar de alguna forma. Nos vamos a centrar en este tipo de muestreo.

2. MUESTREO ALEATORIO SIMPLE

Es el tipo de muestreo más simple y en él se basan todos los demás. Para obtener los elementos de la muestra se numeran los elementos de la población y se seleccionan al azar los elementos que debe contener la muestra. Todos los elementos tienen la misma probabilidad de ser elegidos.

3. MUESTREO ALEATORIO SISTEMÁTICO

Es una técnica parecida a la anterior, pero, tras elegir un primer elemento al azar, selecciona los demás a intervalor regulares, es decir, "sistematiza la selección de elementos.

Por ejemplo, si tenemos una población de 100 individuos y queremos seleccionar una muestra de 20, actuaríamos de la siguiente forma:

1. Numeramos los elementos o personas.2. Tenemos que elegir un elemento de cada 100/20= 5 (coeficiente de elevación).3. Elegimos al azar un elemento o persona entre los 5 primeros. Supongamos que

elegimos el número 2.4. Posteriormente seleccionamos un elemento cada 5, es decir, el 2+5=7, 7+5=12, etc. El

último sería el elemento número 97.

Page 17: Marketing

4. MUESTREO ESTRATIFICADO

Consiste en dividir la población total en clases homogéneas (estratos). Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

Afijación Igual: A cada estrato le corresponde igual número de elementos. Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de

la población en cada estrato.

A continuación vamos a ver un ejemplo para comprender el funcionamiento de la afijación proporcional. Supongamos que en un instituto, los 330 alumnos de E.S.O. están repartidos en grupos como sigue:

1º ESO 2º ESO 3º ESO 4º ESOCHICOS 46 50 36 28CHICAS 54 40 44 32

5. MUESTREO POR CONGLOMERADOS

Es parecido al muestreo estratificado, con la diferencia que la población se divide en grupos heterogéneos, como si fueran subpoblaciones dentro de la población general. Ejemplos de conglomerados serían unidades hospitalarias, mesas electorales, etc.

Distribución muestral

DISTRIBUCIÓN MUESTRAL Una distribución muestral es una distribución de Probabilidad de una estadística muestral calculada a partir de todas las muestras posibles de tamaño "n" elegidas al azar de una población determinada. Generalmente nos interesa conocer una o más de los siguientes características de la distribución muestral. 1.- Su forma funcional (como aparece en su representación gráfica). 2.- Su media. 3.- Su desviación estándar (error estándar)

Esquema: Distribución muestral

Page 18: Marketing

A. Si la selección se hace con reposición de una población finita o equivalentemente sin reposición de una población infinita

B. Si el muestreo es sin reemplazo en una población finita de tamaño N

Page 19: Marketing

A. DISTRIBUCIÓN MUESTRAL De CUANDO LA POBLACIÓN ES NORMAL ( es conocida)

Ejemplo.

Page 20: Marketing

B. DISTRIBUCIÓN MUESTRAL DE CUANDO SE DESCONOCE LA DISTRIBUCIÓN DE LA POBLACIÓN [ ES CONOCIDA

Page 21: Marketing

Ejemplo

C. DISTRIBUCIÓN DE LA MEDIA MUESTRAL CUANDO [ ES DESCONOCIDA]

Page 22: Marketing

ESTIMACION ESTADISTICA

En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor

aproximado de un parámetro de una población a partir de los datos proporcionados por

una muestra. Por ejemplo, una estimación de la media de una determinada característica de

una población de tamaño N podría ser la media de esa misma característica para

una muestra de tamaño n.1

La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos

métodos que se usan en función de las características y propósitos del estudio:

Estimación puntual:2

Método de los momentos;

Método de la máxima verosimilitud;

Método de los mínimos cuadrados;

Estimación por intervalos.

Estimación bayesiana.

ESTIMADOR: Un estimador es una regla que establece cómo calcular una estimación basada en las mediciones contenidas en una muestra estadística

ESTIMACION PUNTUAL

Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de una

fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado

grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla

media de los individuos. Lo más importante de un estimador, es que sea un estimador

eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o eficiente

(varianza mínima) Estimación puntual. Sea X una variable poblacional con distribución Fθ ,

siendo θ desconocido. El problema de estimación puntual consiste en, seleccionada una

muestra X1, ..., Xn, encontrar el estadístico T(X1, ..., Xn) que mejor estime el parámetro θ. Una

vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimación puntual

de θ, T(x1, ..., xn) = ˆ θ .

Vemos a continuación dos métodos para obtener la estimación puntual de un parámetro:

método de los momentos y método de máxima verosimilitud. Método de los momentos:

consiste en igualar momentos poblacionales a momentos muestrales. Deberemos tener tantas

igualdades como parámetros a estimar. Momento poblacional de orden r αr = E(Xr) Momento

muestral de orden r ar = Xn i=1 Xr i n

Método de máxima verosimilitud: consiste en tomar como valor del parámetro aquel que

maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra

seleccionada de una población con distribución Fθ o densidad fθ(x), la probabilidad de que

ocurra una realización x1, ..., xn viene dada por: Lθ(x1, ..., xn) = Yn i=1 fθ(xi)

Page 23: Marketing

A Lθ(x1, ..., xn) se le llama función de verosimilitud.(credibilidad de la muestra observada).

Buscamos entonces el valor de θ que maximice la función de verosimilud, y al valor obtenido

se le llama estimación por máxima verosimilitud de θ. Nota: si la variable X es discreta, en lugar

de fθ(xi ) consideramos la función masa de probabilidad pθ(xi).

Ejemplo 7.1: Sea X → N(µ, σ), con µ desconocido. Seleccionada una m.a.s. X1, ..., Xn, con

realización x1, ..., xn, estimamos el parámetro µ por ambos métodos. Según el método de los

momentos: E(X) = Xn i=1 Xi n = − X, y al ser µ = E(X) se obtiene que ˆ µ = − x. Por el método de

máxima verosimilitud: Lµ(x1, ..., xn) = Yn i=1 fµ(xi ) = = Yn i=1 1 √ 2πσ e −(xi−µ) 2 2σ

Estimación por Intervalos de confianza 109 y maximizamos en µ tal función; en este caso

resulta más fácil maximizar su logaritmo: lnLµ(x1, ..., xn) = − 1 2σ 2 Xn i=1 (xi − µ) 2 − n ln( √

2πσ) ∂ ∂µ lnLµ(x1, ..., xn) = 1 σ 2 Xn i=1 (xi − µ) = n − x − nµ σ 2 = 0 ⇐⇒ ˆ µ = −

.

ESTIMAVION POR INTERVALOS

Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro

estimado con una cierta probabilidad. En la estimación por intervalos se usan los siguientes

conceptos:

Intervalo de confianza

El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el

parámetro a estimar. Este intervalo contiene al parámetro estimado con un determinado nivel

de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un

axioma o un equivalente circunstancial.

Variabilidad del Parámetro

Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura

científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra

que prescinden de este aspecto. Habitualmente se usa como medida de esta variabilidad

la desviación típica poblacional y se denota σ.

Error de la estimación

Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza.

Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el

intervalo de confianza y, si se quiere mantener o disminuir el error, más observaciones

deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la

muestra, más error se comete al aumentar la precisión. Se suele llamar E, según la fórmula E =

(θ2 - θ1)/2.

Límite de Confianza

Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe

en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-α), aunque

habitualmente suele expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como nivel

Page 24: Marketing

de confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01

respectivamente.

Valor α

También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en

nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α). Por

ejemplo, en una estimación con un nivel de confianza del 95%, el valor α es (100-95)/100 =

0,05

Valor crítico

Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución que deja a su

derecha un área igual a α/2, siendo 1-α el nivel de confianza. Normalmente los valores críticos

están tabulados o pueden calcularse en función de la distribución de la población. Por ejemplo,

para una distribución normal, de media 0 y desviación típica 1, el valor crítico para α = 0,1 se

calcularía del siguiente modo: se busca en la tabla de la distribución ese valor (o el más

aproximado), bajo la columna "Área"; se observa que se corresponde con -1,28. Entonces Zα/2 =

1,64. Si la media o desviación típica de la distribución normal no coinciden con las de la tabla,

se puede realizar el cambio de variable t =(X-μ)/σ para su cálculo.

Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una estimación de

la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos interpretar

que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad del 99%.

Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente, la mitad del error,

para obtener el intervalo de confianza según las definiciones dadas.

Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van

relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del intervalo de

confianza, tenemos también una mayor probabilidad de éxito en nuestra estimación, es decir,

un mayor nivel de confianza

Tamaño de muestra

En estadística el tamaño de la muestra es el número de sujetos que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población.

¿Cuál debe ser el tamaño de la muestra?

Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en

cualquier estudio de investigación. Por ejemplo, un investigador desea determinar la

prevalencia de problemas oculares en niños en edad escolar y quiere realizar una encuesta.

La pregunta importante que debe ser contestada en todas las encuestas de muestra es:

"¿Cuántos participantes deben ser elegidos para una encuesta?" Sin embargo, la respuesta no

puede ser dada sin tener en cuenta los objetivos y circunstancias de las investigaciones.

Page 25: Marketing

La elección del tamaño de la muestra depende de consideraciones no estadísticas y

estadísticas. Las consideraciones no estadísticas pueden incluir la disponibilidad de los

recursos, la mano de obra, el presupuesto, la ética y el marco de muestreo. Las

consideraciones estadísticas incluirán la precisión deseada de la estimación de la prevalencia y

la prevalencia esperada de los problemas oculares en niños en edad escolar.

Para determinar el tamaño adecuado de las muestras es necesario seguir los tres criterios:

1. Nivel de precisión

El nivel de precisión, también llamado error de muestreo, es el rango en donde se estima que

está el valor real de la población. Este rango se expresa en puntos porcentuales. Por lo tanto, si

un investigador descubre que el 70% de los agricultores de la muestra han adoptado una

tecnología recomendada con una tasa de precisión de ~+mn~ 5%, el investigador puede

concluir que entre el 65% y el 75% de los agricultores de la población han adoptado la nueva

tecnología.2. Nivel de confianza

El intervalo de confianza es la medida estadística del número de veces de cada 100 que se

espera que los resultados se encuentren dentro de un rango específico.

Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una acción

probablemente cubrirán las expectativas el 90% de las veces.

La idea básica descripta en el Teorema del límite central es que cuando una población se

muestrea muchas veces, el valor promedio de un atributo obtenido es igual al valor real de la

población. En otras palabras, si un intervalo de confianza es del 95%, significa que 95 de 100

muestras tendrán el valor real de la población dentro del rango de precisión.

3. Grado de variabilidad

Dependiendo de la población objetivo y los atributos a considerar, el grado

de variabilidad varía considerablemente. Cuanto más heterogénea sea una población, mayor

deberá ser el tamaño de la muestra para obtener un nivel óptimo de precisión. Ten en cuenta

que una proporción de 55% indica un nivel más alto de variabilidad que un 10% o un 80%. Esto

se debe a que 10% y 80% significa que una gran mayoría no posee o posee el atributo en

cuestión.

Existen muchos enfoques para determinar el tamaño de la muestra, incluyendo el uso de un

censo en el caso de poblaciones más pequeñas, el uso de tablas publicadas, imitar un tamaño

de muestra de estudios similares y aplicar fórmulas para calcular un tamaño de la muestra.