ingenieria

414
" PROBABILIDAD Y ESTADI PARA INGENIEROS /" ST1 C A I IRWIN jMllbER, " ii JOHN' E . .FREUNO Profesores de Matemáticas de la Universidad de Arizona EDITORIAL REVERTÉ MEXICANA, s. A. MEXICO, D. F.

Upload: ulululala

Post on 07-Feb-2016

460 views

Category:

Documents


1 download

DESCRIPTION

ingenieria

TRANSCRIPT

Page 1: ingenieria

" PROBABILIDAD Y ESTADI PARA INGENIEROS

/"

ST1 C A I

IRWIN jMllbER, "

ii

JOHN' E. .FREUNO Profesores de Matemáticas de la Universidad de Arizona

EDITORIAL REVERTÉ MEXICANA, s. A .

MEXICO, D. F.

Page 2: ingenieria

Versidn al español de: PROBABILITY ANO 5TATISTiCS FOR ENGINEERS

Editada por: PRENTECE-HALL, I N C . Englewood Cliffs, New Jersey

Traducida por: ING. CARLOS OADOÑEZ ROMERO R.

Se termino t a impres ihae esta obra el. . d i a 15 de octubre de 1984, el L o s t a l le res Li tograf ica Jornan, S.A. de C.V. Cornonfort No. 48 local 29-C Col. Morelos M6x;co 062W. D . F .

:: :.v ,$

Derechos reservados en lengua española:

1967 EDITORIAL REVERTE MEXICANA, S . A . @ Río Panuco 14l-Mdstco 5, D. F.

Ti ra je 1,600 Ejemplares

Page 3: ingenieria

PREFACIO

Este libro se ha escrito para un curso introductorio en Cálculo de Prohahi- lidades y Estadística para estudiantes de ingenieria y ciencias físicas. Se ha expe- rimentado reiteradamente tanto en cursos para estudiantes universitarios y como en cursos de entrenamiento para ingenieros. Los autores han visto que el material de este libro se puede dar en dos semestres o en tres trimestres cuando los cursos son de tres sesiones semanales. Sin embargo, seleccionando los temas. el libro pue- de servir también como texto para cursos más cortos, dirigidos ya sea a la teoría o a las aplicaciones.

Los capítulos 2, 3, 4 y 7 dan una breve, pero rigurosa. introducción a la teo- ría de la Estadística y, junto con parte del material de los capítulos 5 y 16, son suficientes para un semestre de introducción a las Matemáticas de la Probabilidad y de la Estadística. Los capítulos 6, 8, 9, 10 y 11 contienen el material cornim de los métodos abreviados y no paramétricos. Los capítulos 12, 13 y 14 comprenden una introducción a algunos de los métodos normales, y más avanzados, de la estadística experimental, y los capítulos 5, 15 y 16 presentan aplicaciones especiales, algunas muy recientes, que se han venido haciendo cada vez mas importantes en los alios recientes.

V

Page 4: ingenieria

Los conocimientos matemáticos que debe tener el lector son los de un curso anual de Cálculo; éste se requiere principalmente para los capítulos 4 y 7, que tra- tan de la teoría básica de las distribuciones en el caso continuo, para los capítulos 5 y 16 que tratan las aplicaciones especiales (procesos aleatorios, fiabilidad, etc.) y para los métodos de mínimos cuadrados de los capítulos 12 y 13. El tratamiento de la probabilidad en el capítulo 2 es moderno en el sentido de que está basado en la teoría elemental de conjuntos.

Los autores desean expresar su agradecimiento a la D. Van Nostrand Com- pany por permitir reproducir el material de la tabla 11, a Sir Ronald A. Fisher, F. R. S., Cambridge, y a Messrs. Oliver and Boyd, Ltd.. Edimburgh, por permitir la reimpresión de la tabla IV de sus libros, Statistical Methods for Research Wor- kers; al profesor E. S . Pearson y a las compañías Biometrika por permitir la re- produccicin del material de las tablas v , VI y VIII; a Donald B. Owen y Adisson- Wesly, Inc., por permitir la reproducción de una parte de la tabla de nilmeros aleato- rios de su Handbook of Stcltistical Tables: a Frank J. Massey Jr., y al Journal of the American Statistical Association por permitir la reproducción del material de la ta- bla IX; a D. B. Duncan, H. L. Harter, y Biometrics por la reproducción de la tabla X; a la American Society for Testing Materials por la reproducción de la ta- bla XI; y a la McGraw-Hill Book Company por la reproducción de la tabla XII.

Los autores desean expresar su agradecimiento también al equipo editorial de Prentice-Hall, Inc., por su amable cooperación en la producción de este libro, a las diferentes secretarias que ayudaron a escribir el manuscrito, y sobre todo a sus esposas por no quejarse demasiado por las exigencias de sus esposos durante el tiempo en que se escribió este libro.

IRWIN MILLER y JOHN E. FREUND

vi

Page 5: ingenieria

CONTENIDO

1 INTRODUCCION, 1

l . I La moderna estadística, 1 1.2 Estadística e Ingeniería, 3

2

3

PROBABILIDAD, 5

1.1 Espacios de muestras. 5 2.2 Sucesos, 8 2.3 Probabilidad, I3 2.4 Algunos teoremas elementales. 18 2.5 Probabilidad condicional. 23 2.6 Regla de Bayes, 27 2.7 Espacios de muestreo más generales, 31

DlSfAlBUClONES DE PROBABILIDAD, 33

3.1 Variables aleatorias. 3.1 3.2 Distribucicin binomial, 36 3.3 Distribución hipergeométrica, 42 3.4 Distribucicin de Poisson. 44 3.5 Media y varianza de una distribucihn de probabilidad. 48 3.6 Teorema de Chebyshev. 53 3.7 Distribucicin multinomial. 56

vii

Page 6: ingenieria

APLICACIONES A LA INVESTIGACION OPERATIVA. 79

6 TRATAMIENTO DE DATOS, 97

6. I Distribuciones de fzecuencias. 07 6.2 Gráficas de distribuciones de frecuencias. 1 0 1 6.3 Medidas descriptivas, ] O X 6.4 Cálculo de y S, 11 1

7 DlSTRlBUClON DE MUESTRAS, 116

7.1 Población y muestras, 116 7.2 Distribución muestral de la media ( u conocida), 1 19 7.3 Distribución muestral de la media ( J- desconocida). 120 7.4 Distribución muestral de la varianza, 129

8 INFERENCIAS REFERENTES A LAS MEDIAS, 133

8. I Estimación puntual, 133 8.2 Estimación de intervalos. 136 8.3 Contraste de hipótesis, 141 8.4 Hipótesis referentes a una media, 150 8.5 Hipcitesis referentes a dos medias, 154

viii

Page 7: ingenieria

9 INFERENCIAS REFERENTES A LAS VARIANZAS, 163

9 . 1 Eslimacihn de varianzas. 163 9.2 Hiphtesis referentes a una varianza. 167 9.3 Hipc'ltcsis referentes a dos varianzas. 169

11 METODOS ABREVIADOS EMPLEADOS EN INFERENCIAS, 193

1 1 . I In1roduccicin. 193 I 1.7- Estirnaci6n rapida. IO5 I 1.3 Tests de los signos. 1 % I I .4 Tests por suma de nllrnetos de orden, 200 I 1.5 Tests de las series de tcirninos iguales, 204 I I . O Tests de Kolmogorov Srnirnov. 207

12 AJUSTE DE CURVAS, 210

12. I Mktodos dr mínimos cuadradoh. 710 12.2 Inferencias basadas en los estimadores de mínimos cuadrados,,215 12.3 Regresicin curvilínea, 223 12.4 Regresiíh milltiple, 228 12.5 Correlacih. 236

13 ANALISIS DE LA VARIANZA, 242

13.1 Introduccitin. 242 13.2 Clasificaciones en una sola direccicin, 24j 13.3 Clasificaciones en dos direcciones. 254 13.4 Comparaciones rnilltiples, 259 13.5 Otros diseños de experimentos. 263

ix

Page 8: ingenieria

14 EXPERIMENTACION FACTORIAL, 274

14.1 Experimentacihn de dos factores, 274 14.2 Experimentos de varios factores, 281 14.3 Experimentos factoriales. 2". 290 14.4 El mezclado en un experimento factorial 2". 301 14.5 Replicas fraccionales, 305

15 APLICACIONES A LA GARANTIA DE CALIDAD, 313

15.1 Garantía de calidad, 313 15.2 Control de calidad, 314 15.3 Grificas de control de medidas, 315 15.4 Gráficas de control de at-ibutos. 319 15.5 Límites de tolerancia. 326 15.6 Muestras de aceptacicin. 328

16 APLICACIONES A LA FIABILIDAD V A PRUEBAS DE DURACION DE VIDA, 338

1 6 . 1 Introduccicin. 338 16.2 Distribuciones del tiempo de fdllc.. 341 16.3 El modelo exponencial de fiabilidad. 343 16.4 El modelo exponencial en tests de dUrdciÓn dz vida, 348 16.5 El modelo M'eibull en tests de duración de vida. 35 I

BIBLIOGRAFIA, 357

TABLAS DE ESTADISTICA, 361

RESPUESTAS, 391

INDICE, 403

X

Page 9: ingenieria

I

1.1 La moderna estadística

El origen de la estadística está ligado a dos ramas del interés humano muy diferentes: los juegos de azar y lo que en la actualidad se llama “ciencia politica”. Los estudios hechos a mediados del siglo XVIII sobre probabilidades, condusieron a la teoría matemLica de’los errores en las medidas, .y las “leyes de los errores” derivadas de ella fueron la base de lo que hoy es la Estadistica matemhtica. En el mismo siglo, el analisis de las unidades políticas fue el punto de partida de la Es- tadística descriptiva. AI principio, esta se limitaba, simplemente a la presentación de datos en tablas y grhficas; posteriormente amplid sus objetivos al -considerar descripciones numéricas que condensaban las tablas y gráficas mencionadas.

En décadas recientes, el crecimiento de la Estadística se ha dejado sentir en la mayor parte de las actividades humanas y el hecho más importante de su creci- miento ha sido el paso de la Estadistica descriptiva a los métodos de inferencia estadística o Estadística inductiva. La inferencia estadística trata de obtener con- clusiones generales a partir de los datos que se deducen de muestras: así, se aplica a problemas tales como el de hacer el cúlculo estirnativo del consumo medio de

< ’ .

1

Page 10: ingenieria

2 1NTRQDUCCION

combustible de un proyectil a partir de los datos obtenidos en algunos vuelos de prueba, el de irlvestigar la demanda de un producto por medio de ensayos hechos con muestras del mismo y el de predecir la dureza de un metal, partiendo de los datos obtenidos de las caracteristicas de los productos resultantes de un proceso anterior de producción.

Las generalizaciones que se hacen en la inferencia estadística van más alla de la información contenida en un conjunto de datos. AI hacer inferencias inductivas de este tipo, se debe proceder con mucha cautela. Se ha de estudiar hasta dónde se puede ilegar con estas generalizaciones, a partir de un conjunto de datos, si real- mente son todos razonables y justificables, si será prudente esperar hasta reunir nuevos datos, etc .En efecto, algunos de los problemas más importantes de inferen- cia estadística se refieren a la evaluación de los riesgos y las consecuencias a que se está expuesto, al hacer generalizaciones a partir de los datos de muestras. Esto incluye la evaluación de las probabilidades de tomar decisiones erróneas, la posi- bilidad de hacer predicciones incorrectas y la de obtener estimaciones que se sal- gan de los límites permisibles.

En años recientes, se han hecho intentos para tratar todos estos problemas dcntro de la estructura de una teoría unificada llamada Teoría de la decisitin. Aun- que esta teoría tiene muchas ventajas conceptuales y teóricas, existen algunos pro- blemas en su aplicación difíciles de solventar. Para la comprensión de estos proble- mas, debemos tener en cuenta que, independientcnzeilte de la objetividad con que hayamos planeado 1111 experimento o una investigacibn, es imposible eliminar todos los elenlentos subjetivos. Basar un experimento (por ejemplo, la determinación de un calor específico) en 5, 12, 25, o más, medidas, es, al menos parcialmente, una decisión subjetiva. También intervienen invariablemente factores subjeti*ros en el proyecto de un equipo, la selección de personal, o en :a manera de ccimo se ha de formular una hipótesis y la alternativa que va a venir para contrastar la primera. Este importante problema se discutirá con algún detalle en el capítulo 8). Tam- bien entra un elemento de subjetividad ‘siempre que definimos términos tales como “bueno” o “mejor”, en relación con los criterios de decisión -por ejemplo, en el capítulo 12, trataremos el caso de la línea recta que “mejor” ajusta un conjunto dado de pares de datos. Sobre todo, 10s juicios subjetivos son inevitables cuando se trata de establecer valores efectivos sobre los distintos riesgos que uno mismo corre. En otras palabras, es imposible ser completamente objetivo al especificar “premios” por estar acertado (o cerca de ello) y “castigos” por estar equivocado (o muy alejado de lo correcto). Si se solicitara de un científico un juicio sobre la seguridad de una pieza de un equipo, ¿cómo podría dar un valor exacto de la po- sibilidad de no haber cometido un error, si tal error pudiera llevar a la pérdida de vidas humanas?

Ahora bien, independientemente de que la inferencia estadística se trate o no, desde el punto de vista de la teoría de la decisión, depende en gran medida del cálculo de probabilidades. Llegaremos al contenido de la Estadística como una ciencia, desarrollando cada idea estadística en lo posible, a partir de un fundamen- to probabilístico, y aplicando cada idea a problemas de Física o Ingeniería tan

Page 11: ingenieria

ESTADISTICA E INGENIERIA 3

pronto como lo hayamos desarrollado. Los métodos que usaremos para proponer y resolver estos problemas, se pueden denominar métodos ckísicos, por no tener en cuenta, fornzaZmente, los ,factores subjetivos mencionados antes. Sin embargo, deberemos recordar continuamente al lector que dichos factores existen Y, siempre que sea posible, indicaremos la influencia que tienen en la decisión final. La sub- jetividad juega un papel muy importante en la elección entre Varios métodos esta- dísticos, o entre fórmulas que se hayan de emplear en un caso dado, en la decisih del tamaño de una muestra, en la especificacih de las probabilidades que se pue- den aceptar en los errores posibles, etc. Este método de exponer la Estadística presenta SUS problemas en la forma que con tanto éxito ha contribuido al desarro- 110 de la Ingeniería, así como al de las Ciencias naturales y sOCialeS en 10s clltimos afios.

1.2 Estadistica e ingenieria

Hay pocas actividades en las que el impacto del reciente progreso de la Esta- distica se haya dejado sentir con mhs fuerza que en la Ingeniería y la direccicin industrial. En efecto, es difícil sobreestimar las contribuciones de la Estadística a los problemas de producción, al uso eficiente de materiales y mano de obra, a la investigación básica y al desarrollo de nuevos productos. Lo mismo que en otras ciencias, la Estadística se ha convertido en una herramienia vital para el ingenie- ro, y por consiguiente, se han hecho necesarios ciertos conocimientos de Estadística sin los que el ingeniero no podría apreciar, entender o aplicar gran parte del tra- bajo desarrollado en su campo.

En este texto, pondremos especial atención en las aplicaciones a la Ingeniería. pero sin dejar de referirnos a otros temas, dando as¡ al lector una idea de la gran generalidad de la mayoría de las tCcnicas estadisticas. Veremos que el mismo m& todo estadístico empleado para determinar el coeficiente de dilatacih de un me- tal, sirve también para saber el tiempo medio que tarda una secretaria en hacer un trabajo dado, o la longitud media de una iguana adulta. Análogamente, el metodo empleado para comparar las características de dos motores sirve para comparar la eficacia de dos mCtodos de enseñanza. las cualidades de dos fertilizantes o el interés del publico hacia dos tipos de programas de televisicin.

En contraste con la generalidad de la mayoría de las ticnicas estadísticas. existen también casos específicos en los que por las circunstancias de los campos de aplicacicin es necesario desarrollar mCtodos especiales. Así la prediccicin econ6- mica ha traído como consecuencia la creaclcin de nlCtodos especiales usados en el análisis de series de datos financieros: el problema mCdico de establecer las dosis críticas, ha conducido a lo que se ha llamado "mCtodo del probit": para problemas de "tests" psicolcigicos, se ha empleado el andisis de factores. etc. En lo que res- pecta a la Ingeniería, estudiaremos tres campos que han requerido el empleo de tCcnicas especiales. El capítulo 5 contiene una introduccidn a la 1/1tvsr;gacitilr ope- rutivu, una nueva tecnolog,a que se caracteriza por la aplicacicin de tkcnicas cien- tíficas (incluyendo Cilculo de probabilidades y Estadística) a los problemas refe-

Page 12: ingenieria

4

rentes a las operaciones de un "sistema" considerado como un todo. Este método se aplica a la conducción de una guerra, a la dirección de una empresa, a la ma- nufactura de un producto y a otros muchos casos. Por supuesto, se ha de hacer notar que este capítulo, así como los dos que se mencionan en el próximo párrafo, son 6nicamente una introducción a los temas tratados en ellos. Existen libros de- diccdos enteramente a cada uno de los temas.

En el capítulo 15, trataremos someramente los métodos especiales empleados en los problemos de estabilidad de la calidad, incluyexlo el problema de controlar la calidad (establecerla y mantenerla) en la producción en masa, la determinación de límites de tolerancia, y algunos ejemplos de inspección de muestras. Finalmen- te, en el capítulo 16, presentaremos algunas técnicas especiales elaboradas para satisfacer las necesidades de seguridad y confianza requeridas en los productos extremadamente complejos de la tecnología de la era del espacio.

Page 13: ingenieria

2.1 Espacios de muestras

En Estadística, recibe el nombre de experirne/rto cualquier proceso de obser- vaci6n. Un experimento puede consistil., por ejemplo, en el simple proceso de ob- servar si una conexión soldada está rota o no lo está: también puede consistir en determinar cuál es la proporción de un conjunto de amas de casa (considerado como muestra) que prefiere la marca X a la marca Y ; o bien un experimento mucho más complicado, consiste en determinar la masa del electrón. Los resulta- dos de cualquiera de estas observaciones, ya se trate de simples respuestas, “sí” o “no”, o de lecturas de instrumentos, etc., se denominan wsdtndos de los expe- rimentos respectivos. La totalidad de los resultados posibles de un experimento recibe el nombre de espacio de twccstrm o espacio rmestr‘crl del experimento y se denota por la letra S.

Cuando se trata de problemas en los cuales se presentan incerteras ligadas a distintos resultados, es conveniente considerar los resultados del experimento, c l e - rne/?tos del espacio muestral, como puntos de un espacio geonrktrico de una o va- rias dimensiones. Por ejcmplo, si- un experimento consiste en observar una co-

5

Page 14: ingenieria

6 PROBABILIDAD

nexión soldada, ésta puede estar en buen estado (lo que denotaremos con el nil- mero O), o puede estar rota (lo que denotaremos con el número 1) y entonces, el espacio de muestreo es unidimensional, como se ve en la figura 2.1. Si en un cir- cuito hay dos conexiones soldadas, habrá cuatro casos posibles, como se ve en el espacio de muestreo bidimensional de la figura 2.2. En esta representación, cada coordenada corresponderá a una de las uniones y pondrán tomar los vqlores de O ó 1, En general, si UD circuito tiene 12 conex.iones saldacfas, habra 2n c&s posibles, que se representarán como puntos en un espacio n-dimensional. Es interesante notar que los espacios de muestreo usados en estos ejemplos para describir la inspección de conexiones soldadas, sirven igualmente para analizar los resultados de otros experimentos; por ejemplo. el número de caras obtenidas al tirar n vece- s una mo- neda, marcando ahora las “cruces” por O y las “caras” por l .

Conexicn 2

- O 1

Fig. 2.1. Espacio de muestreo unidimensional

(0,l) * ( ! , I )

O - 1 = = 2 (0,O) L (1,O) Conexión 1 P

F I ~ . 2.3. Espacio de muestreo Fig. 2.2. Espacio de muestreo unidimensional bidimensional

La configuración geométrica empleada para representar los resultados de un experimento no es necesariamente única. En efecto, en el problema de las dos co- nexiones soldadas se hubiera podido considerar ‘como resultado el número total de conexiones rotas, y los resultados serían O, 1 y 2, tal como se indica en el espacio de muestrcls unidimensional de la figura 2.3. E1 punto 1 de esta figura corresponde a los dos puntos ( 1 , O) y (O, 1 ) de la figura 2.2. Análogamente, para n conexiones, el punto 1 de un diagrama análogo al de la figura 2.3, corresponderá a los n pun- tos ( I , O, O,. . , , O), (O, 1; O,. . ., O), . . ., (O, O,. . ., O , 1) de un diagrama ánslogo al de la figura 2.2). Generalmente, es deseable el empleo de espacios muestrales cuyos elementos no se puedan “subdividir’?, esto es, los elementos individuales de tal espacio no deben representar dos o más resultados que se puedan diferenciar en alguna forma. En otras palabras, se preferirán espacios muestraIes del tipo de los de las figuras 2.1 y 2.2 a los del tipo de la figura 2.3.

Con frecuencia, es conveniente clasificar los espzcios muestrales de acuerdo con el mimero de elemelztos que contienen. Los espacios de las figuras 2.1, 2.2 y 2.3, tienen, respectivamente, 2. 4 y 3 elementos, y todos son espacios muestrales finitos. Otros ejemplos de espacios finitos son: el usado para representar las tiradas de u n par de dados (tiene 36 elementos), ‘el usado para representar la elección de

Page 15: ingenieria

ESPACIOS DE MUESTRAS 7.

un presidente y un vicepresidente entre los 25 socios de un club (tiene 600 elemen- tos), y el usado para representar la clasificación de cinco aparatos de televisión con las calificaciones de “bueno”, “regular” y “malo” (tiene Y =’ 243 elementos, como se explicará más adelante).

Para presentar un problema en el que no .es suficiente up espacio muestral fi- nito, consideremos que, una persona inspecciona conexiones sqldadas y que nos in- teresa saber el número de los que tendrá que inspeccionar antes de hallar la prime- ra conexión rota. Esta podrá ser la primera, la segunda,. . ., la centésima,. . . , la millonésima, o más. Como no sabemos hasta qué valor se llegará en un ejemplo como éste, debemos tomar para nuestiro espacio de muestras el conjunto total de los números naturales. El núqero de elementos de este espacio muestral es infinito numerable.

Damos un paso más adelante, si se trata de medir la resistencia en ohms de una conexión soldada, pues el espacio de muestras estará formado por todos los puntos de una escala continua (un intervalo determinado de la recta numérica real). Los elementos de este -espacio no se pueden contar, esto es, no se puede es- tablecer una correspondencia biunivoca con el conjunto de números naturales. En general, se llamará espacip muestral discreto al que tenga un número finito o una infinidad numerable de elementos. Si los elementos (puntos) de un espacio muestral constituyen un continuo; por ejemplo, todos los puntos de la recta o de un segmento de recta, .o todos los puntos de un plano, etc.; se dice que el espacio es continuo. En el resto de este capítulo, sólo consideraremos espacios muestrales discretos y especialmente finitos.

En, muchas ocasiones, será dificil, -0. al menos pesado, determinar por enume- ración directa el número de elementos de un espacio finito de muestras. Para ilus- trar un metodo que a veces simplifica este trabajo, consideremos el siguiente proble- ma referente al lanzamiento de un coheti compuesto de tres slbsistemas: propula sión, dirección y fuselaje. Supongamos.que P, , P2 y P , representan las calificaciones de perfecto, bueno y malo, .respectivamente, ai comp6rtamiento del sistema de ,pro- pulsión; que GI y G, son las notaciones para indicar que el proyectil responde, o no .responde,i a 10s mandos; y que Al, A?-y A , representan respectivamente, que ell fuselaje no sufre daños, que una o más superficies de control resulta deteriorada, y que el fuselaje se rompa. Las .rfesultados !posibles se pueden representar ahora por medio de un diagrama ramificado como el de la figura 2.4. Siguiendo de iz- quierda a derecha una trayectoria a lo largo del diagrama, obtendremos uno de los resultados posibles, es decir, uno de los elementos particulares del espacio mues- tral de nuestro experimento. Evidentemente, el árbol del diagrama tiene“ 18 ramas diferentes, por lo que el espacio muestral tiene 18 elementog. Hubi6ram6s podido determinar también este número notando que hay tres ramas. P, que cada una de éstas tiene dos ramas G, y que cada G tiene, a su .vez, trdb ramas A. Entonces, habrá 3 . 2 . 3 =: 18 combinaciones de ramas .(o de trayectorias). Este resultado se puede generalizar por medio del siguiente teorema:

Page 16: ingenieria

0 PROBABILIDAD

Teorema 2.1. Si los conjuntos Al, A*, . . . , Ak contienen respectiva- mente n,, nz, , . ., nk elementos, entonces hay n , * n, - . . . . n k formas di- ferentes de seleccionar, en primer lugar, un elemento de Al , después, un elemento de A?, . . . , y , finalmente, un elemento de Ak.

Este teorema se puede probar construyendo un diagrama ramificado similar al de la figura 2.4. Para ilustrar el uso de este teorema, nos referiremos nuevamen-

Fig. 2.4. Diagrama ramificado

te a dos de los ejemplos de la página 7. Un club de 25 miembros puede hacer la elección de su presidente de 25 maneras distintas (es decir, cada uno de los socios) y, por consiguiente, la elección del vicepresidente tendrá 24 posibilidades distintas; luego, la eleccidn total se Fodrá hacer de 25 . 2 4 = 600 formas diferentes. En el ejemplo de los cinco equipos de televisión del problema que tratamos en párrafos anteriores, cada uno de los aparatos se puede considerar bueno, regular o malo, por lo que en total habrá 3 - 3 . 3 . 3 . 3 = 35 = 243 maneras distintas de clasificar- los. Nótese que, si hubikramos estado interesados únicamente en conocer cuántos televisores quedan dentro de cada una de las categorías, el eSpacio muestra1 con- tendría sólo 21 elementos (ver el problema 6 de la página 12).

2.2 suceso0

Las probabilidades esthn siempre asociadas al hecho de que ocurra, o no ocurra, un suceso; por ejemplo, el suceso de que en una muestra de 50 bolas de cojinetes de bolas, se encuentren 3 defectuosas; el de que una cubierta de coche dure por lo menos 20.000 millas antes de ser recauchutada; el de que en un panel telefónico se reciban 8 llamadas en un cierto periodo de tiempo; etc. Enton- ces, en relación con las probabilidades, se considerará como un suceso, a un resul-

Page 17: ingenieria

SUCESOS 9

tado individual o a un conjunto de resultados Cle un experimento. (El suceso de obtener exactamente cero caras al tirar cinco veces una moneda, es un ejemplo de un resultado individuai, mientras que el de obtener.'una'cara en el mismo núniero de tiradas es un ejemplo de un tonjurito de cinco resultad6s.) En otras palabras, consideraremos como suceso a un subconjunto de un adecuado espacio ntuestral. Para ilustrar mejor esto, supongamos :que un equipo está formado por dos "sub- equipos", que, a su vez, contienen 4 componentes el primero y 3 el segundo. Si nos

Número de defectos en el primer sub-equipo

Fig. 2.5. Sucesos en un',espacio de muestren

interesamos exclusivamente del número^ total de componentes defectuosas de cada subequipo (sin precisar cuáles de las componentes .son las defectuosas), el número de elementos del espacio muestra1 es 5 . 4 = 20,. que se pueden situar en un espa- cio bidimensional, como se ve en la figura 2.5.

Designemos ahora por R eí suceso de que el equipo'completo tenga una sola componente defectuosa, por T ei suceso en que en el equipo se presenten exacta- mente tres componentes defectuosas, y por U el suceso de que el primer subequipo tenga más componentes defectuosaupe el segundo.. Los ele,rngntos d.el espacio muedral que corresponden a estos tres sucesos se indican en la figura 2.5 p?r los conjuntos de puntos limitados por una'línea continua, una gunteada y una de tra- zos respectivamentq$.NÓtese que R y .T no tienen elemento3..comuneQ; o sea, se trata de sdcesos que .mutuamente se excluyen.

En muchos pbbiemas de Cálculo de' pro6abilidadq nos interesarán sucesos que son, a su vez, copbínaciones de das o más sucesos. Por ejemplo, ea el caso an- terior, nos puede interesar el suceso de< que el equipo wmpletb tenga"f ó 3 compo- nentes defectuosas, o el suceso de que el equipo completo tenga tres componentes defectuosas y al mismo tieinpo. que el primer subequipo tenga más componentes defectuosas que el segundo. Para 'tratar tales situaciones, definiremos la urlidn y la interseccibn de dos conjuntos. Formalmente, si A y B son dos sucesos cualesquiera

Page 18: ingenieria

10 PROBABILIDAD

del espacio S, su unicin, A U B, es el subconjunto de S que contiene todos los eie- mentos que están en A, en B, o en ambos. La interseccicin, A n B, es el subconjunto de S que contiene todos los elementos que están a la vez en A y B. Volviendo ahora a nuestro ejemplo, vemos que R U T contiene los elementos:

(O, 11, (O, 31, (1, 01, (1,2), @,1), (390)

mientras que R n T no tiene elementos. Denotando por al conjunto vacío o conjunto nulo, tendremos R rl T = a, que es la forma matemática de indicar que R y T son mutuamente excluyentes. Notemos también que R n U tiene un solo elemento (1, O) y que T n U contiene los elementos (2, 1) y (3, O).

Finalmente, nótese que los elementos (O, O), (O, I ) , (1, I ) , (O, 2), (1, 2), (2, 2), (O, 3) , (1, 3 ) , (2, 3) y (3, 3) pertenecen a S, pero no a U . El subconjunto formado por estos 10 elementos se llama complementario de U con respecto a S y se designa por U’. En general, el complementario A’ de un conjunto A en un espacio muestra1 S, es el conjunto formado por todos los elementos de S que no son elementos de A. El complementario de S con respecto a sí mismo es el conjunto nulo, o sea, S’ =O.

Fig. 2.6. Diagrama dc Venn

S (a) A es un subconjunto de B (b)A y B son mutuamente excluyentes

S

Figura 2.7

Page 19: ingenieria

SUCESOS 11

LOS espacios muestrales y 10s sucesos y, en particular, las relaciones entre sucesos, se pueden representar grsficamente por medio de los diagramas de Venn, como los mostrados en las figuras 2.6, 2.7 y 2.8. El espacio muestra1 S se represen- ta por un rectángulo, mientras que los subconjuntos o sucesos, por círcu\os! partes de circulos o combinaciones de ambos.

Por ejemplo, la figura 2.7(a) nos indica la relación “A es un subconjunto de B”, y la 2.7(b) “ A y B son disjuntos”.

Las operaciones n y U para conjuntos se pueden representar por diagramas de Venn, como se ve en la figura 2.8. Las operaciones con conjuntos que hemos

5

Fig. 2.R Operaciones con conjuntos

establecido, unidas a axiomas apropiados, dan lugar al Algebra de conjuntos, o 91- gebra Boole, como también se denomina. NO haremos un estudio formal de la misma, pero si justificaremos, con ayuda de los .diagramas de Venn, algunos teore- mas que se necesitan en el desarrollo del libro. Como un ejemplo, demostraremos

( A v B)’ = A’ n B’ que expresa que el complementario de la unión de dos conjuntos es igual a la in- tersecci6n de sus respectivos complementarios.’ Notemos, ante todo, que la regi6n sombreada de la figura 2.9(a) representa el conjunto (A U B)’ (compárese con el de la figura 2.8(b)).La región cuadriculada de la figura 2.9(b) se obtuvo som-

S S (al ( A U B ) ’ ( b ) A‘ n B’

Fig. 2.9 ( A U B)’ P A’ fl B’

Page 20: ingenieria

1.2 PROBABILIDAD

breando la región que representa A' con líneas en una direccih y, la que repre- senta B', con líneas en dirección opuesta. Esta región cuadriculada representa, en- tonces, la intersección de A' y B', y se puede ver que es idéntica a la regicin som- breada de la figura 2.9(a).

EJERCICIOS

1.

2.

3.

4.

5.

6.

l .

8.

Un fabricante de cubiertas de automóvil desea probar cuatro tipos de cubiertas con dibujos diferentes cn tres clases diferentes de supdicies de carreteras y a cinco velo- cidades distintas. ¿Cuántas carreras de prueba se deberán hacer? Up. experimentador tiene 4 recubrimientos protectores diferentes para aplicar a ambos lados de una lrimina de acero. Determinar de cuintos modos puede recubrir ambos la- dos de l a Iimina si: (a) los dos lados de la lámina se deben cubrir con el mismo material. (b) los dos' lados se pueden recubrir, sin que esto sea necesario, con el mismo material. (c) ambns lados se deben cubrir con diferentes materiales. Un cxperimcnto don6ste en tirar un dado y desputs lanzar una moneda si, y sdlo si, en el dado ha salido alguno de los números nones ( l . 3 y 5). Dibujar un diagrama ramifi- cado y contar el número de casos posibles. Construir un diagrama ramificado nara determinar el número de formas en que se pue- de tirar una moneda 4 veces seguidas, de tal manera que, a lo largo de la serie de tiradas, el número de caras sea siempre mayor o igual al niimero de cruces. Enumerando todos los casos posibles, verificar la afirmación de la página 8, de que hay 21 casos distintos, si en el ejemplo considerado sólo nos interesa conocer cuántos de los cinco aparatos de televisibn se ajustan a cada una de las tres especificaciones. En cada uno de los experimentos siguientes, decidir cuándo sería apropiado usar un es- pacio de muestreo finito, numerable o continuo: (a) Uno de los 12 vicepresidentes de una compaiíía va a ser elegido presidente. ( h j Se va a mcdir experimentalmedfk'cl coeficicbte dc dilatación de cierto tipo de ladri-

(c) Medidas de la intensidad de radiacicin por medio de un contador Geiger. ( d ) Un policía mide el contenido de alcohol en la sangre de un auinmovilista. ( e ) Se tira una moneda cierto número de veces hasta que aparece la primera cara. ( f ) En una ciudad sc,hace una inspxcibn de trhnsito para estimar el número de coches

Las seis personas siguientes han hecho una solicitud para ocupar un empleo: El Sr. An- drews, es casado, no juega al golf y n o tiene casa prirpia; el Sr. Bailey, es soltero. no juega al golf y ticne casa propia; el Sr. Clark. es casado, juega al golf y tiene casa pro- piaj,,el Sr@odds, es altero, juega al'.golf y no tienc casa propia; cl Sr. Bdi%r¿is, esti taka*, no juega al&lf y tiene casa propia: y el Sr. F o x . es soltero, jucga al &If y tic- ne @& propia. Un'o de est& aspirantes obtendrá e1 empleo y, por cjomplo, el SuccSo de quc éste se dé a un jugador de golf se denotará por {Clark, Dodds. Fox}. Indicar, de irna manera similar, los conjuntos que corresponden a los sucesos dc que el empleo se dé a: (i),.aIguien quc tenga casa propia.. : ,' ( b ) u%casado quc jucguc al golf. (e) u$;soltero que., no tengrr .*sa propia. (d) yn' jugpdor 4.c .gol&.casa¿l.p, o' shftcro. En relacifin con cY'pirrht¿ri?a 7, hdicar: (a) cl complcmcntario del donjunto dado cn el apartado (a). (b) la uni6n dc los conjuntos de los apartados (a) y ( h )

llos refractarios.

quc tienen defectos en los faros delanteros.

. .

Page 21: ingenieria

PROBABILIDAD 13

(c) la intersección de los conjuntos de los apartados (a) y (d). (d) la intenecci6n de los conjuntos de l o s apartados (b) y (c).

9. Un fabricante compra material , a cuatro vendedores diferentes que llamaremos 1, 2, 3 y 4. Refirihdonos a las 6rdenes de compra en dos días sucesivos, por ejemplo, se in- dicar& por (1, 4) el suceso de que el primer dia la orden se dio al vendedor ‘1, Y en el segundo día al vendedor 4. Si A representa el suceso de que el vendedor 1 t enp , al menos, una de las dos 6rdenes; B el de que el mismo vendedot tenga. a m h brdents; y C el de que los vendedores 1 y 3 no tengan ninguna orden, hagase unp lista de 10s elementos de: (a) cl espacio muestra1 completo. (e) A’ (b) A, o BU c, (0) B, (d A n B, ( 4 c, (h) A n C *

10. Usense diagramas de Venn para verificar que: (a) ( A n B)’ - A’ u B’, (b) A u ( A n B) = A, (e) ( A n B) u ( A n B‘) = A,

(0) A u ( B n c> - ( A u B) n ( A u a. (dl A U B = ( A f7 B) U ( A n B‘) U ( A n B),

2.3 PmbaMlidd En esta sección definiremos la probabilidad, empleando el concepto de fun-

ción de conjunto, o m& exactamente, función aditivu de conjunto. Como posible- mente el lector está m& familiarizado con funciones en las que los elementos del *

dominio Y “-1 recorrido son nbmerm, consideraremos primero un ejemplo muy

15

Fig. 2.10 Distribución de elementos en S

simple en que los elementos del dominio son conjuntos y los elementos del reco- rrido números reales. En otras palabras, estudiaremos una funcibn, es decir una correspondencia, que asigna números reales a los subconjuntos de un conjunto dado (por ejemplo, a los subconjuntos de un espacio muestral, si nos 0cupamOS de

Page 22: ingenieria

14 PROBABILIDAD

los resultados de un experimento dado). La función de conjunto que considerare- mos es aquella que asigna a cada subconjunto A de un conjunto finito dado, el número de elementos de A, lo que denotaremos por N ( A ) . SUpO~gamos, Pues, que una compañía tiene cincuenta empleados clasificados de acuerdo con SU estado civil (casado M , y no casados M ’ ) , y de acuerdo, también, con que se hayan gra- duado o no (G o G’):

La distribución de estos 50 empleados se muestra en el diagrama de Venn de l a figura 2.10, y utilizando este diagrama podemos ahora determinar el valor de N ( A ) para cada una de las 16 categorías (subconjuntos) en las que pueden ser clasificados los empleados. (En el ejercicio núm. 1 de la página 22, se pide al lec- tor que compruebe que, en efecto: existen 16 subconjuntos, incluyendo el conjun- io S formado por todos los empleados, y el conjunto vacío@.) Los ndmeros m.ar- cados en la figura 2.10 representan el número de empleados casados que no aca- baron sus estudios, el número de empleados casados que acabaron sus estudios, el número de empleados no casados que no terminaron sus. estudios y el número de empleados no casados que terminaron sus estudios, esto es:

N ( M I? G’) = 20, N ( M n G) = 10, N(” n G) = 5,

N(M’ A G’) =. 15

Para encontrar el numero de empleados casados, no tenemos más que añadir el número de empleados casados que son graduados al nlimero de empIeados casa- dos que no son graduados, con lo que obtendremos: ,

~ ( 2 1 1 ) . = N ( M n G) -+ N ( M n GI ) = 10 + 20 = 30

Análogamente, encontramos que el número de empleados que acabaron sus estudios es:

N ( G ) -- N(IM A G ) + N(2” n G) 10 + 5 = 15

y como N(S) = SO, donde S es el conjunto de los 50 empleados. obtenemos, por substraccih:

N(”) = 50 - 30 = 20 ,y N(G’) = 50 - 15 = 35

La función de Conjunto que hemos introducido en este ejemplo, se llama aditivq 10 que significa que el número que asignarnos a Ia unión de dos subcon- juntos que no tienen elementos comunes es igual a la suma de 10s números asigna- dos a los subconjuntos individuales.* Esta propiedad es la que nos permite G&X- lar el número de empleados casados, sumando el número de los empleados camios y graduados con el nilmero de los casados no graduados. Nótese que esta Propie- dad se aplica solamente a subconjuntos que’ no tienen elementos C O ~ ~ n e s . 10s cuales reciben e] nombre de subconjuntos disjuntos; como indicamos en la Pá- gina 8, los sucesos correspondientes a subconjuntos disjuntos se llaman S ~ X W S que

”+ Un ejemplo simple de función de conjunto que no es aditiva es aquelfa que asigna a cada subconjunto el cuadrado del ndmero de elementos que Contiene. ’

Page 23: ingenieria

PROBABILIDAD 15

nzutuamente se excluyen. Si se trata de dos subconjuntos A y B que puedan tener elementos comunes, emplearemos la fórmula más general:

1 N ( A U B ) = N(A) + N(B) - N ( A n B) que, aplicada .a nuestro ejemplo, nos da:

N(M u G ) = N ( M ) + N(G) - N(M n G) = 30 + 15 -, 10 = .35

para el número de empleados que estan casados, o que están graduados, o ambas cosas. Nótese que restamos el número de los casados y graduados porque fueron contados dos veces, la primera entre los empleados casados y, la segunda. entre los graduados. ,. Usando el concepto de función. aditiva de conjunto, definiremos la probabili-

dad de un suceso. Dado un espacio muestraí finito S y un suceso A en S, defini- mos P(Aj , a la que llamaremos probabilidad de A , como un valor de una fun- ción aditiva de conjunto P llamada fltncicin de prohahilidad. Para que una función de conjunto sea una funci6n de probabilidad debe satisfacer las tres condiciones siguientes:

Axioma 1. O I P ( A ) 5 1 para cada suceso A en S. Axioma 2. P ( S ) E 1.

Axioma 3. Si A y B son sucesos que mutuamente se excluyen en S, entonces P(A U B ) = P ( A ) + P(B). I )

~ El primer axioma establece que la función de probabilidad asigna a cada su- ceso A en S un número real comprendido entre O y 1, incluidos Cstos. El segundo axioma nos indica que al espacio muestral, como un todo, se le asigna el número 1, lo que expresa la idea de que la probabilidad de un suceso cierto es igual a 1. El tercer axioma nos dice que la función de probabilidad debe ser aditiva y, emplean- do la inducción matemática, se puede extender la aditividad a cualquier nlimero finito de sucesos que mutuamente se excluyen. En otras palabras. se puede demos- trar que

P(A1 u As u. . . U A,) = P(A1) + P(A2) + . . . + P(AJ donde A, , Al, . . . , A,, son sucesos que mutuamente se excluyen en S. (En la sec- ción 2.7 discutiremos cómo esta tercera propiedad se puede modificar cuando S no es finito.)

Las tres propiedades anotadas son axiomas de la teoría de probabilidades y no requieren demostración. Sin embargo, si esta teoria se aplica al mundo físico, podremos ver que estos axiomas corresponden a hechos reales, es decir, veremos que nos dan resultados razonables. Con este objeto, diremos algunas palabras de la llamada interpretacicin frecuencia1 de la probabilidad. De acuerdo con esta in- terpretación generalmente aceptada, consideraremos una probabilidad como una proporcicin o freeacetlcia relativa, a partir de utt gran ntínxyp,.de casos. Asi, si de- cimos: “la probabilidad de que un hombre de 50 años viva hasta 10s 65 es de

Page 24: ingenieria

16 PROBABILIDAD

0.72”, esto nos indica que, si las condiciones actuales no varían, el 72% de todos los hombres de 50 años vivirán hasta los 65; y si decimos: “la probabilidad de que una persona que entre a un supermercado compre un producto determinado es 0.25”, esto nos indica que el 25% de un gran número de personas que entre en el supermercado comprará dicho producto. Nótese que “la probabilidad de obtener cara con una moneda es OSO”, significa que haciendo un gran número de tiradas, la mitad de las veces saldrá cara y la otra mitad cruz. Sin embargo, esto no signifi- ca que necesariamente obtengamos 10 caras y 10 cruces al tirar’ 20 veces la mone- da, 6 50 caras y 50 cruces al tirarla 100, pero si una moneda no defectuosa se tira muchisimas ‘veces, se puede esperar que obtendremos aproximadamente el mismo número de caras que de cruces.

Para demostrar que los tres axiomas de probabilidad corresponden a las pro- piedades de las frecuencias, en la interpretación anterior, nos basta con observar que el porcentaje de las veces en que se presenta un suceso no puede ser negativo ni exceder a 1, y que un resultado u otro se presentará con un porcentaje de un 100% de las veces, esto es, con una probabilidad de 1. También, si A y B son sucesos que mutuamente se excluyen, el porcentaje de las veces que se presenta uno u otro es la suma del porcentaje de las veces en que se presenta uno y del porcentaje co- rrespondiente al otro. Si la proporción de votantes que están a favor de una ley es 0.42 y la proporción de abstenciones es 0.19, entonces 0.61 es la proporci6n de votantes que están a favor de la ley o que se han abstenido.

Antes de dar algunos ejemplos de funciones de probabilidad, es importantc aclarar que los tres axiomas no nos indican la manera de asignar las probabilida- des a los distintos resultados de un experimento, sino que restringen las formas en que esto se puede hacer. En la práctica, las probabilidades se asignan por la esti- mación de los resultados de las experiencias anteriores, por un análisis cuidadoso de las condiciones que rigen el experimento o haciendo la suposici6n común de que varios casos son equiprobables (es decir, que hay la misma probabilidad de que se presente cualquiera de ellos).

Los siguientes, son tres ejemplos de formas aceptables de asignar las probabi- lidades en un experimento en que hay tres casos posibles que mutuamente se ex- cluyen, A , B y C:

( 4 P(A) = 1/3, P(B) = 1/3, P(C) = 1/3

(b) P(A) = 0.57, P(B) = 0.24, P(c) = 0.19

( 4 P(A) = 24/27, P(B) = 2/27, P(C) = 1/27

( 4 P(A) = 0.64, P(B) = 0.38, P(C) -0.02

( 4 P(A) = 0.35, P(B) .= 0.52, P(C) 0.26

sin embargo,

no son aceptables porque contradicen los axiomas 1 y 2, respectivamente. Si un espacio muatral tiene n resultados, se puede demostrar que contiene 2“

subconjuntos, incluyendo el espacio completo y el conjunto vacio. Así, cuando

Page 25: ingenieria

PROBABILIDAD 1!

n =. 20, hay más de un millón de sucesos en S, y el problema de determinar las probabilidades para cada suceso resulta sumamente complicado, Afortunadamen- te, esto se puede simplificar considerablemente usando el siguiente teorema:

las probabilidades de .los. resultados individuales 'que constituyen A. Teorema 2.2. Si .A es un suceso de S, P ( A ) es igual a la suma de .

nen Ptira probar este teorema, sean El,, c2, . . . , E,, los n resultados que compo- A; entonkes, podemos escribir A = El Ú E z U . . . V E,. ,

Como las E'son casos individuales, se excluirhn mutuamente, y por la genera- lización del axioma 3, tendremos

Y(A) P(E1 V E2 U . . . U E.) = P(E1) + P(Ed + * . . + P(EJ

lo que completa la demostraci6n. Para ilustrar el empleo de este teorema, consideremos el ejemplo del proyectil

de la página 7. Los 18 casos posibles y sus probabilidades se muestran en la tabla que sigue. (Las probabilidades asignadas a cada uno de los casos se escogieron arbitrariamente en este ejemplo, pero de tal forma que los axiomas de probabili- dad se satisfagan. En la prktica, estas probabilidades se podrían estimar por los resultados de experiencias anteriores, o también por hipótesis adecuadas: véase la página 28.)

Probabilidad

0.336 0.096 0.048 0.084

0.012 0.168 0.048 0.024

0.024

Sucesos Probabilidad

0.042 0.012 0.006 0.056 0.016 0.008 0.014 0.004 0.002

De esta tabla, podemos Calcular la probabilidad P(C,) de que e1 proyectil res- ponda a los mandos, sumando las probabilidades de los 9 casos en que interviene el suceso G,, con Io que obtendremos

P(G1) = 0.336 + 0.096 + 0.048 + 0.168 + 0.048 + 0.024 . ,

+ 0.056 + 0.016 + 0.008 =. 0.800 Usando el teoremta 2.2, obtendremos sirnilarmente

P(A1) = 0.336 + 0.084 +"0.168 + 0.042 $0.056 + 0.014 = 0.700 P(P1) = 0.33b + 0.090 + 0.048 + 0.084 + 0.024 + 0.012 = 0.W r(rl n G,)' = 0.336 + 0.096 + 0.048 = 0.480

Page 26: ingenieria

18 PROBABILIDAD

el idtimo valor es la probabilidad de que el sistema de propulsi6n del proyectil tra- baje perfectamente y que el proyectil responda a los mandos. Para encontrar la probabilidad de que dos, O más, de los componentes del sistema operen imperfec- tamente. tenemos simplemente que sumar las probabilidades de todos los resulta- dos que tienen 2 6 3 subindices distintos de !, lo que nos da 0.212.

Otra ilustración nos da e! problema de la página 14 en eF que supondremos que uno de los 50 empleados va a ser elegido por sorteo para intervenir en un co- miti obrero patronal. Considerando que cada empleado tiene una probabilidad de’ 1/50 de ser elegido, es fácil verificar, por medio del teorema 2.2, que la probabi- lidad de que este cargo corresponda a un empleado casado es P ( M ) = 3/5, la pro- babilidad de que sea graduado es P(G) = 3/10, y la probabilidad de que el em- pleado sea casado, o graduado, o ambas cosas, es P ( M U G ) = 7/10. (Usando el teorema 2.2, cada una de estas probabilidades se obtiene sumando 1/50 tantas ve- ces como resultados individuales se presentan en el suceso respectivo.)

En este último ejemplo hubiéramos podido emplear también e! siguiente teo- rema yue se aplica a experimentos en los que todos los resultados individuales son equiprobables:

Teorenru 2.3. Si u11 experimento tiene n resultados posibles equipro- bubles y .si S de estos resultados son “favorables”, entonces la prohahili- dad de u11 resultado favorable es sjtr.

Este teorema se deduce inmediatamente del teorema 2.2 y de la generalización del tercer axioma de probabilidad. Así hubiéramos podido encontrar que la proba- bilidad de que salga elegido un empleado casado es

P ( M ) = w = 30 = 3/5 N ( S ) 50

y que la probabilidad .de que salga elegido un empleado casado y que sea gradua- do es

P(M n G ) = N ( M ~ G) 10

= 50 = 1/5

El teorema 2.3 es particularmente iltil en problemas de juegos de azar. en los que se supone, que si se ha barajado bien u n juego de cartas, cada carta tiene !a misma oportunidad de salir; que si una moneda se tira correctamente cada lado tiene también !a misma oportunidad: y que si un dado se tira correctamente, cada cara tiene las mismas posibilidades que las demás. Luego, la probabilidad de sacar un rey de una baraja ordinaria de S2 cartas es 4/52, la probabilidad de obtener cara al tirar una moneda es 1/2. y la probabilidad de sacar un nilmero impar en un dado es 3/6.

2.4 Algunos teoremas elementales

Usando los axiomas de probabilidad es posible desarrollar muchos teoremas que juegan un papel importante en !as aplicaciones. En primer lugar, considera- remos

Page 27: ingenieria

ALGUNOS TEOREMAS €LEMENTALES 19

Page 28: ingenieria

20 PROBABILIDAD

Notemos ahora en el diagrama de Venn de la figura 2.11 que

y también A v R - ( A n B) u ( A n B’) u (A’ n B )

A = ( A n B) u ( A n B‘) B = (A A B) U (A’ h B)

(El lector habra verificado estas importantes relaciones en las partes (c) y (d) del problema 10 de la página 14). Como es evidente que A n B, A n B’ y A’ n B se excluyen mutuamente, la generalización del axioma 3 nos da

P ( A u B ) = P ( A n B ) + P ( A n B’) + P(A‘ n B ) y después de sumar y restar P ( A n B ) , tendremos

~ ( n u B) = [ P ( A A B ) + P(A n B’)] + [P(A n B ) + P(A’ n B)] - P ( A n B) = I Y A ) + P(B) - P ( A n B )

Cuando A y B se excluyen mutuamente, el teorema 2.5 se reduce al axioma 3, ya que, en tal caso, P ( A n B ) = O. Por esta razón, llamamos al axioma 3 k y pur- ticular de adicih, mientras que el teorema 2.5 se llama ley general de adición. Para ilustrar el empleo de esta teoría, consideraremos nuevamente el ejemplo de1 pro-

Fig. 2.11 Partición de A U B

S

yectil y determinaremos la probabilidad de que el sistema de propulsión trabaje perfectamente, que el proyectil responda a los mandos, o ambas cosas. Llarnhreihos a esta probabilidad P(P, U G,), que se @odrá obtener a partir de Irt tabla de la página 18, sumando las probabilidades de todos aquellos casos en que aparecen al menos una de las letras P y G con e1 subíndice 1. Por otra parte;usando el teore- ma 2.5 y Jas probabilidades de la tabla, tendremos

P(P1 U GI) 7 0.600 .+ 0:800 - 0.480 = 0.920

Nótese que, si hubiesemos cometido el error de usar la ley particular de adición en este ejemplo, se hubiera obtenido el resultado absurdo de que la probabilidad buscada era 1.400.

Page 29: ingenieria

ALGUNOS TEOREMAS ELEMENTALES 21

EJERCICIOS

1. Hacer una lista de 10s 16 subconjuntos en que se pueden clasificar los 50 empleados del

2. Con respecto a la figura 2.10, hallar ejemplo de la pagina 14.

( 4 N(M U G’), (b) N (Jf’ U G) , (c) N [ ( M n WI.

3. Entre 100 estudiantes de ingeniería, 15 estudian para ingenieros químicos, 60 esan es- tudiando el ciclo preparatorio para entrar a la escuela de ingeniería, y 5 de los que es- tudian el ciclo preparatorio van a estudiar ingeniería química. &‘u6ntos de estos estu- diantes cumplen con las condiciones siguientes? (a) No estan estudiando para ser ingenieros químicos. (b) No estudian cursos preparatorios. (c) E s a n estudiando para ser ingenieros químicos, estudian cursos preparatorios, o am-

(d) Estudian cursos preparatorios pero no van a ser ingenieros químicos. (e) N o estudian cursos preparatorios y van a ser ingeaieros químicgs. (f) No estudian cursos preparatorios y no van a ser ingenieros químicos.

4. Un distribuidor tiene 75 autombviles, de los cuales los de (A) tienen tracci6n delantera. los de ( B ) son compactos, y los de (C) tienen transmisión automfttica. Usando la infor- mación dada en la figura 2.12, hallar:

(8) NU), (r) w m m c > , @) N(B), (g) u 4 ,

(d) n B), (9 N U ‘ U B’ U C), ( 4 N ( A n (3, 6 ) NtB n ( A u C)I.

bas cosas.

(c) N(C)J (h) N(B U (3,

5. Un experimento presenta exactamente cuatro casos distintos: A , B. C y,D. Indicar en que . casos las probabilidades asignadas son aceptables. (a) P(A) = 0.36, P(B) = 0.18, P(C) = 0.21, P(D) = 0.25, (b) P(A) -- 0.29, P(B) = 0.35, P(C) = 0.18, P(D) = 0.15, (c) P(A) 0.43, P(B) 0.17, P(C) -0.08, P(D) J 0.49, (d) P(A1 17/80, P(B) = 11/40, P ( Q = 1/2, P(D) = 1/80.

i. En el espacio muestra1 ilustrado en la figura 2.5, ‘denotaremos por (i, j) el resultado en el que hay i componentes defectuosos en el primer subequipo, y j en el segundo (i = O, 1, 2, 3, 4; j = O, 1, 2 y 3). Suponiendo que la probabilidad del caso (O, O) es 1/2 y las probabilidades de los resultados restantes son inversamente proporcionales a i + j, número total de componentes defectuosas en el equipo completo, hallar la proba- bilidad de cada resultado en el espacio de muestreo.

(a) El primer subequipo tiene, a lo mis, una componente defectuosa. (b) El segundo subequipo tiene por lo menos dos componentes defectuosas. (c) El equipo completo tiene como mkximo una componente defectuosa.. (d) El segundo subequipo tiene mhs componentes defectuosas que el primero.

. En el ejemplo de la phgina 18, se supuso que cada uno de los 50 empleados tenía la misma probabilidad de entrar en el comit6 obreropatronal. Si, en lugar de ello, supone-

’. Con los resultados del problema anterior, encontrar las probabilidades siguientes:

Page 30: ingenieria

22 PROBABtLlDAD

mos que un empleado que se gradub tiene probabilidad doble que el que no lo terminh, encontrar: ( a ) P ( M ) , ( b ) P ( G ) , fc) P ( M 17 G j , y ( d ) P ( M U G ) .

9. En la tabla de la página 18, determinar:

c Fig. 2.12 Problema 4

S

10. AI tirar dos dados defectuosos, ¿cuál es ]a probabilidad de que los nfimeros sumen (a) 7, ( b ) 11, (c) 7 ó 11, ( d ) 2, 3 3 127

11. Con una baraja de S2 cartas, determinar la probabilidad de sacar (a) una reina negra, ( b ) una carta roja, (c) un cinco, un seis O un siete, ( d ) un as negro o un rey rojo.

12. Para un sorteo de lotería se lenden números del uno x1 10000. ¿CuAl es la probabilidad de que el número premiado sea divisible entre 20?

13. Supongamos que uno de 10s automóviles del problema 4 sufra daños durante una tor- menta. Considerando probabilidades iguales, determinar la probabilidad de que el coche dañado: ( a ) Sea compacto. ( b ) Tenga tracción delantera. (c) Sea un compacto sin transmisión automática. ( d ) No sea compacto, pero tenga transmisión automhtica y tracción delantera.

14. Si A y B son sqcesos que mutuamente se excluyen, P ( A - ) = 0.20 y P ( B ) = 0.55, hallar:

(a) (c) P ( A n B), (b) P ( A U B), (dl P(A’ n B’) .

15. Sean P ( A ) = 0.30, P ( B ) = 0.78 y P ( A 17 B ) = 0.16, encontrar: ( 4 F(A U B) , (C) P(A’ u B’)J (b) P ( A n B’), (d) P(A’ n B).

16. La probabilidad de que se presente, al menos, uno de los tres sucesos A , B y C, está dada por:

Page 31: ingenieria

PROBABILIDAD CONDICIONAL 23

Compn5bar esta fórmula con las probabilidades indicadas en la figura 2.13.

Fig: 2.13 Problema 16 17. En el control de calidad de una producción en masa de ladrillos de viilrio, la probabili-

dad .de que un inspector I encuentre: un ladrillo rajado es, 0.0025, uno con burbujas de aire 0.0020, uno decolorado 0.0020, uno rajado y con‘burbujas de aire 0.0006, uno raja- do y decolorado 0.0005, uno con burbujas de aire y decolorado 0.0004, y uno con estas tres imperfecciones 0.0001. LGuril es la probabilidad de que encuentre un ladrillo con una de estas tres imperfecciones por lo menos?

Sugerencia: Veanse los apartados (c) y (d) del problema 10 de la página 4.

son admisibles ninguna de las siguientes asignaciones de probabilidades: (a) P(A) = 0.4, P(B) = 0.4, P ( A U 0 = 0.2,

18. Demostrar que ( a ) P ( A ) 2 P ( A fl Bj, y (b) P ( A ) i P ( A U B ) .

19. Supuesto que A , B y C son sucesos que mutuamente se excluyen, .explicar por qué no

(b) P(A) = 0.7, P(B) 0.1, P ( 8 n c) = 0.3,

(c) P ( A ) = 0.6, P ( A n B’) = 0.5.

2.5 Probabilidad condicional En la forma en que hemos definido la probabilidad, sÓ10 podremos .habls de

ella con relación a un espacio Wuestral S dado. La probabilidad de que un ingenie- ro tenga un salario de 10 O00 dólares o más, no tiene sigrlificado, a menos que es- pecifiquemos si nos referimos a toda una nación, a una industria en particular, a una fábrica dada, etc., y además, que precisemos cómo se hace la selección. Entonces, cuando usamos el símbolo P ( A ) para indicar la probabilidad de A , realmente nos estamos refiriendo a la probabilidad de A con respecto a algún espacio muestra1 dado, S. Como el precisar S no siempre es. evidente, y como hay problemas en que nos intresa la probabilidad de A con respecto a más de un espacio de, muestreo, usarems’la notaci6n P ( A 1 S) para ackirar a ,quC espaeio S nos referimos ‘en pgr- tkular. Diremos’ que P(A 1 S) es “la $robabiZidad coniiicional de A con ‘respecto a S”, y, por consiguiente, cualquier probabilidad será una probabilidad condiciorial.

. .

Page 32: ingenieria

24 PROBABILIDAD

Naturalmente que se empleará la notaci6n simplificada P ( A ) cuando se sobreentien- de el espacio S de referencia y no haya lugar a dudas.

Para ilustrar algunas ideas referentes a probabilidades condicionales, considera- remos una vez más el conjunto de 50 personas ,algunas casadas y algunas que son graduadas como muestra la figura 2.10. Suponiendo probabilidades iguales, vimos en la página 19, que la probabilidad de que una persona graduada sea elegida para el comité obreropatronial es P(G) = 3/10;. veamos ahora si esta probabilidad cambia al saber que una persona casada ha sido elegida. Para encontrar P(G 1 M ) , no tene- mos más que analizar el espacio muestral reducido M , de la figura 2.14, y suponer

Fig. 2.14 Espacio de muestreo reducido

que cada uno de los 30 empleados casados, entre los que hay 10 que son graduados, tienen la misma probabilidad de ser elegidos. Así, usando el teorema 213 se obtiene

Nótese que si dividimos el numerador y el denominador de la 6ltima expresidn por N (S), tendremos

y se puede ver que la probabilidad condicional buscada es la razón de la probabili- dad de que la persona elegida sea graduada, tomada con respecto al espacio mues- trai reducido M , a la probabilidad de que dicha bersona pertenezca a M , tomada con respecto al espacio muestral S.

Considerando eSfe ejemplo desde otro punto de vista, podemos decir que, eon respecto al espacio de muestreo total S, se tiene

P ( G A M ) = N ( G A M )

- 5

suponiendo, como antes, Que cada uno de los 50 empleados tiene la misma pobabi- lidad de ser elegido para el comité. Así, las probabilidades de que la persona :legida, sea o no sea graduada, supuesto que es casada, deben estar en la raz6n 1:2 Como

Page 33: ingenieria

PROBABILIDAD CONDICIONAL 25

deben dar 1, te-

1 P(G' I M) = 5 2 P(d I M ) = - 3 * y

lo que concuerda con el resultado obtenido anteriormente. Esto explica tambítn por qué tuvimos que dividir por P ( M ) cuando escribimos

en la página 26. AI dividir por P ( M ) , o lo que es lo mismo, multiplicar por l / P ( M ) , estamos tomando en cuenta el factor de proporcionalidad que hace que la suma de las probabilidades en el espacio muestra1 reducido sea igual a 1. De acuerdo con lo anterior, daremos la siguiente definición formal:

Si A y B son dos sucesos cualesquiera de S y P ( B ) # O, la probabilidad condicional de A con respecto a B está dada por

Para 'ilustrar' esta definición, supongamos que se va a mandar una orden desde la Costa Este de &.U. a Los Angeles, pasando por Chicago. De experiencias pasadas se ha estimado que la probabilidad de que la orden llegue a tiempo a Chicago es 0.80, y la probabilidad de que habiendo llegado tarde a Chicago, llegue a tiempo a Los Angeles, es 0.10. Suponiendo que la orden llegue tarde a Chicago, queremos de- terminar la probabilidad de que llegue a tiempo a Los Angeles. Si L' representa la llegada a tiempo a Los Angeles y C la llegada tarde a Chicago, tenemos P(C) = 1 - 0.80 = 0.20, P(L n C ) = 0.10 y, por lo tanto,

f'(L I c> = o% = 0.50 o 10

Una consecuencia inmediata de nuestra definicidn de probabilidad condicional es el teorema siguiente, que recibe el nombre de ley general de multiplicación:

Teorema 2.6. *Si A y B son dos sucesos cualesquiera en S, se tiene

P(A n B ) = P(A).P(B I A') si P ( A ) z o = P(B)-P(A I B ) si P(B) + O

Sa segunda de estas relaciones se deduce de la definición de probabilidad cdn- dicioral, multiplicando ambos miembros por P ( B ) ; la primera se ha obtenido inter- camliando las letras A y B en la misma definici6n y multiplicando después los dos mienhros por P ( A ) . Nótese que la definición de P ( B I A ) y P ( A I B j ' presupone que #(A) # O y P ( B ) + O, respectivamente.

?ara ilustrar el uso del teorema 2.6 supongamos se trata de determinar la pro- &

Page 34: ingenieria

26 PROBABILIDAD

babilidad de hallar dos bombillas seguidas defectuosas al elegirlas sucesivamente.en un lote de 500, entre las que hay un total de 25 defectuosas. Suponiendo la igualdad de probabilidad es cada una de la elecciones de una bombilla entre las del lote, la probabilidad de que en la primera elección se encuentre una bombilla defectuosa es 25/500 y, la probabilidad en la segunda, 24/499, dado que en la primera se halla una bombilla defectuosa. Sustituyendo estos valores, obtenemos la probabilidad bus- cada, que es (25/500).(24/499) = 612495.

Volvamos ahora al ejemplo del proyectil para el que las probabilidades de cada caso están dadas en la tabla de la página 18. Determinaremos ahora la probabilidad de que el proyectil responda a los mandos, supuesto que el sistema de propulsih trabaje correctamente. Empleando los datos de la tabla, obtenemos

y es interesante notar que este es el mismo valor que obtuvimos antes para P(G,). Ello significa que la probabilidad de que el proyectil responda a los mandos es la misma, independientemente de que el sistema de propulsión trabaje o no correcta- mente; en otras palabras, el funcionnrniento correcto de los mandos es independien- te de las características del sistema de propulsión. En general, si A y B son dos SU=- EOS un espacio muestra1 S, decimos que A es independiente de B si, y sólo si, P ( A I B ) = P ( A ). Empleando el teorema 2.6, podemos demostrar fácilmente que, si A es independiente de B, entonces B es independiente de A; es decir, P ( A I B ) = P ( A ) implica P ( B 1 A ) = P ( i ) , supuesto que P ( A ) # O. En este caso, diremos sim- plemente que A y B son independientes.

En el caso especial en que A y B son independientes, el teorema 2.6 nos da la siguiente ley especial de rnultiplicacidn:

Teorema 2.7. Si A y B son sucesos independientes, entonces, P ( A n B ) = P(A) * P ( B )

Aplicando esta regla, vemos que, por ejemplo, la probabilidad de obtener dos Caras en dos tiradas sucesivas de una moneda es ( I 12) . (1/2) = 1/4 y que la probabili- dad de obtener dos ases sucesivos en una baraja de 52 cartas es (4/52) . (4/52) = 1/169, siempre que se reponga la primera carta en la baraja, antes de sacar la se- gunda.

La ley especial de multiplicación se puede generalizar para aplicarla a nás de dos sucesos independiente: si tres, o más, sucesos son independientes, la probdilidad de que todos ellos ocurran está dada por el producto de sus respectivas probabilida- des. De hecho, esta ley es la que usamos al determinar las probabilidades de la ta- bla de la página 18, suponikndolas independientes y haciendo P ( P 1 ) = 0.60,

0.20 y P ( A a ) = 0.10. Subsistuyendo estos valores, se ohtuvo P ( P 2 ) 0.30, P(P:+) = 0.10, P(G,) 0.80, P(G2) 0.20, P ( A , ) = 0.70. P ( l 2 ) ==

P(P1 A GI A A I ) = P(P~).P(G~).P(AI) (O.GO)(0.80)(0.70) 0.336

P(Pa A Gt n Az) = P(Pa)*P(GZ).P(Az) = (0.10)(0.20)(0.20) = 0.004 y las otras 16 probabilidades de ¡a página 18.

4

Page 35: ingenieria

REGLA DE BAYES 27

2.6 Regla de Bares

La ley general de multiplicación es útil en la solución de muchos problemas en que el último resultado de un experimento depende de los resultados que se presen- tan en varias etapas intermedios. Supóngase, por ejemplo, que estamos interesados en conocer cómo trabajan los reguladores de voltaje instalados en una fábrica por dos abastecedores, B , y B,, estando en la proporción de 3 a 1 el número de los ins- talados por B, y B.2. En otras palabras, la probabilidad de que cualquier regulador de voltaje recibida por la planta, provenga del abastecedor B,, es 3/4, y la probabili-' dad de que provenga del B, es 114. Supóngase, además, que el 95% de los regulado- res de B, y el 80% delos de B, trabajan de acuerdo con las especificaciones exigidas. Quisiéramos saber cuál es l a probabilidad del suceso A, de que un regulador cual- quiera recibido en la fábrica trabaje de acuerdo con las especificaciones.

Partiendo'de que A = (A n B, ) U ( A n B2) y de que (A f l 23,) y ( A n B,) se excluyen mutuamente (ver figura 2.11, poniendo B, y B , en lugar de B y B' res- pectivamente), la ley particular de adición nos da

P ( A ) = P ( A A B1) + P ( A n B2) si ahora aplicamos la ley general de multiplicación a P ( A n B,) y P ( A n B 2 ) , ob- tenemos

P(A) = P(&).P(A I BI) + W n ) P(A I &)

Substituyendo las probabilidades dadas P ( B , ) = 3/4, P(B, ) = 1/4, P(A I B,) = 0.95, y P(A I B2) = 0.80, se tiene

P ( A ) = Q(0.95) + i(0.80) = 0.9125

que es la probabilidad buscada de que uno cualquiera de los reguladores de voltaje recibidos cumpla con las especificaciones. '

En este ejemplo particular hay 2 alternativas en la etapa intermedia, los abaste- cedores B , y B,. En general, si hay n alternativas mutuamente excluyentes B,, BZ, . . . B, en la etapa intermedia, pqdemos hallar la probabilidad del resultado final, sute- so A , por medio de la fórmula * '

+ + llamada algunas veces regla de eliminación. Esta situación se puede visualizar cons- truyendo un diagrania ramificado como el mostrado en la figura 2.15, donde la pro- babilidad del resultado final A esta dado por la suma de los'productos de las prdba- bilidades correspondientes a cada una ,de las ramas individuales. Como ilustración, supongamos que hay tres abastecedores en nuestro ejemplo y que las probabilida-

* Los símbolos + se usan para hacer resaltar fórmulas o expresiones importantes que,de otra fornl'g,'no se distinguirían como partes de teoremas o definiciones.

Page 36: ingenieria

28 PROBABILIDAD

des son las mostradas en la figura 2.16. Entonces, la probabilidad de que un regula- dor cumpla las especificaciones es

P ( A ) = (0.60)(0.95) + (0.30)(0.80) + (0.10)(0.65) = 0.875

Estudiaremos ahora un problema muy relacionado con el anterior. Suponghmos que queremos determinar la probabilidad de que un regulador provenga del abaste-

Fig. 2.15 Regla de eliminación Fig. 2.16 Regla de eliminación

cedor B3, cuando se sabe que cumple con las especificaciones. Refiriéndonos a la fi- gura 2.16, usaremos la misma información que antes, pero ahora buscamos P ( B , 1 A ) en lugar de P ( A ) . Para resolver este problema, escribimos

y substituimos

respectivamente, en el numerador y el denominador, de acuerdo con la ley general de.multiplicación y la regla de eliminación. Asi, obtendremos la fórmula

P(B3 1 A ) = P(B3) . ,P(A I Ba)

Z P(Bi) . P ( A I B J i - 1

que expresa la probabilidad buscada en función de las probabilidades dadas. Substi- tuyendo los valores, de la figura 2.i6, tendremos, finalmente,

P'B3 I A ) = (0.60)(0.95) + (0.30)(0.80;, + (O0.lO)(0.65) (O . lO)(O.G5 -

= 0.074

Nótese que la probabilidad de que un regulador provenga de B, disminuye de 0.10 a 0.074, una vez que sabemos que trabaja de acuerdo con las especificaciones.

Page 37: ingenieria

El m6todo empleado para resolver este último ejemplo se puede generalizar obteniéndose la fórmula siguiente, llamada regla de Bayes:

Teorema 2.8. Si B, y Bz, . . ., B, son sucesos que se excluyen mutua- mente, de los cuales uno necesariamente debe ocurrir, esto es, $ p ( ~ ~ ) = 1, entonces, i - 1

para r = 1, 2,. . ., ó n.

Esta regla nos da una fórmula para encontrar,la probabilidad de que el “efecto” A haya sido “causado” por el suceso B,. Así, en nuestro ejemglo, hallábamos la pro- babilidad de que un regulador de voltaje aceptable fuera suministrado por el abaste- cedor B3. Las probabilidades P(Bi) se llaman probabilidades “a priori” de las “cau- sas” Bi, y, en la pdctica, es generalmente dificil asignarles valores numéricos. Duran- te muchos años se desconfió de la regla de Bayes porque se usaba haciendo la supo- sición, frecuentemente errónea, de que las probabilidades a priori eran todas igua- les. Esta. dificultad se ha eliminado, ya que las probabilidades P(Bi) pueden deter- minarse por separado en cada caso, analizando la naturaleza del problema, prefe- rentemente basándonos In experiencias pasadas. Volveremos a tratar este problema en el capítulo 8, donde daremos un ejemplo de inferencia Bayesiana

Demos ahora otra ilustración de la regla de Bayes: supondremos que una ofici- na tiene cuatro secretarias que manejan, respectivamente, el 20, 60, 15 y 5% de los archivos de todos los informes gubernamentales. .Las probabilidades de que estas secretarias los traspapelen son, respectivamente, 0.05, 0.10, 0.10 y 0.05 y se trata de encontrar la probabilidad de que se culpe a la secretaria núm. 1 de un informe tras- papelado. Substituyendo estos valores en la fórmula de la regla de Bayes, obtenemos

’ _ > ’ 0.20) (0.05 p(B1 ’ A) (0.20) (0.05) + (O.SO)(O!lO) + (O.I?5) (0.10) + (0.0!5)(0.05)

= 0.114 ES interesante notar que, aunque sólo el 5% de los informes manejados por la secre- taria núm. 1 se han traspapelado, alrededor del 11 % del total de los informes tras- papelados son de su responsabilidad.

EJERCICIOS 1. Refiriéndonos a la figura 2.10, hallar P(M I G ) y P ( M 1 G’) : sup6ngase que, originalmen-

te, cada uno de los 50 empleados tenían la misma probabilidad de ser elegidos. 2. Si en el ejemplo de la p&gina 27 se da también P ( L ) = 0.60, hallar la probabilidad de

que un envío’haya llegado tarde a Chicago, sabiendo que llegó ir tiempo a Los Angeles. 3. Con respecto al ejercicio 1 3 de la pagina 24 y la figura 2.12, hallar las probabilidades de

’ que el autom6vil daiiado: (a) Sea un compacto, sabiendo’que tiene tracción delantera. (b) Tenga transmisión automhtica, sabiendo que es compacto. ’

Page 38: ingenieria

30 PROBABILIDAD

(c) Tenga tracción delantera o transmisión automática, sabiendo que es compacto. ( d ) Sea un compacto con transmisión automática, sabiendo que no tiene tracción de-

(e) No sea compacto, sabiendo que tiene traccibn delantera y transmisión automática. ( f ) No sea compacto, sabiendo que tiene tracción delante, transmisión automática, o am-

lantera.

bas cosas. 4. En relación con las probabilidades dadas en la figura 2.13, determinar:

( 4 P ( A I B): (e) P(A i B U C), (b) P ( B I e), P ( A I B n O, (c) P ( A n B I Q, (g) P ( A n B n c I B n c), ( 4 w u c I A’), (h) P ( A n B n c I B u c).

5. Empleando 10s resultados del problema 6 de la página 22, hallar la probabilidad de que: ( a ) El equipo completo tenga dos componehtes defectuosas, sabiendo que el primer sub-

( b ) El primer subequipo tenga al menos dos componentes defectuosas, sabiendo que el

(c) El equipo completo tenga al menos.tres componentes defectuosas, sabiendo que el

h. La probabilidad de que una construcción se acabe a tiempo es 17/20, la probabilidad de que no haya huelgas es 3/4, la probabilidad de que- la construcción se acabe a tiempo, partiendo del supuesto de que no haya huelgas, es 14/15. Hallar la probabilidad de que: ( a ) La construcción se termine a tiempo y que no haya huelgas. (b) No haya huelgas, partiendo del hecho de que la construccibn se terminó a tiempo.

7. Una urna contiene 40 bolas blancas y 10 negras. Si se sacan dos bolas al azar (con igua- les probabilidades), determinar la probabilidad de que las dos sean’blancas si: ( a ) La primera se vuelve a meter antes de sacar la segunda. ( b ) Se saca la segunda sin haber metido la primera.

8. ¿Cuál es la probabilidad de sacar 3 ases seguidos de una baraja de 52 cartas, si aquellos no se vuelven a meter en la baraja después de haber sido sacados? ,

9. Supóngase que la probabilidad de que los Dodgers de Los Angeles ganen la Liga Ngcio- nal es 0.25 y la de que la ganen los Gigantes de San Francisco e s 0.20. Además, la proba- bilidad de que el equipo de la Liga Nacional gane la Scrie Mundial es 0.45, 0.55 6 0.35, dependiendo esto de que el equipo sea, respectivamente, los Dodgers, los Gigantes, u otro cualquiera de la misma Liga. ¿Cuál es.la probabilidad de-que el equipo de la Liga Nacio- nal gane la Serie Mundial?

10. En el problema 2 anterior, hallar la probabilidad dr: que el envío citado en él. llegue a tiempo a Los Angeles, sabiendo que llegó a tiempo a Chicago. [Sugerencia: Emplee la re- gla de eliminación.]

equipo tiene una componente defectuosa. ,’

equipo completo tiene tres.

primer subequipo tiene más defectos que el segundo.

1 I . En la ilustración de la página 29 encontrar P ( B , 1 A ) y P ( B , 1 A ) . 12. Sabiendo que un equipo de la Liga Nacional ganó la Serie Mundial, emplear las proba-

bilidades del problema 9 anterior para determinar la probabilidad de que los Dodgers hayan ganado la Liga Nacional.

13 . La probabilidad de que un accidente dd aviación debido a fallas estructurales se diagnos- tique correctamente es 0.85 y 1a.probabilidad de que un accidente no debido a estas fallas se diagnostique incorrectamente, atribuyendolo a fallas estructurales, es 0.35. Si. el 30% de todos los accidentes de aviaci6n se deben a fallas estructurales, hallar la probabilidad de que el accidente se deba a fallas de este tipo, sabiendo que el diagnóstico lo atribuye a ellas.

14. Un corredor usa un auto Corvette en el 50%) de las carreras en que participa; un Jaguar, en el 30%; un Alfa Romeo, en el 20% restante. De las 25 carreras en que ha corrido, un Corvette ha ganado 5; de las I5 que ha corrido con un Jaguar, ha ganado 4; y de las 10

Page 39: ingenieria

ESPACIOS DE MUESTRE0 MAS GENERALES 31

que ha corrido con Alfa Romeo, tambiép ha ganado 4. Usando estQs números Para esti- mar las respectivas probabilidades, ¿cuál es l a probabilidad de que este corredor gane Su prbxima carrera?

15. Suponiendo que el corredor del pfoblema 14 gane la carrera, ¿cuál es la probabilidad de que ,haya corrido en un Corvette?

2.7 Espacios de muestre0 m i s generales

Hasta aquí, hemos discutido la teoría de probabilidades tal como se aplica a es- pacios muestrales finitos. Esta restricción se ha hecho para simplificar nuestra intro- duccian a la teoría; sin embargo, esto no implica ,que existan diferencias esenciales con las aplicaciones referentes a los espacios muestrales continuos o infinitos nume- rables. En esta sección trataremos varios ejemplos de ta!es espacios, indicando en cada caso qtiC modificaciones se debe' hacer a la teoría para definir las.funciones de probabilidad. '

Para dar un ejemplo de un experimento que se analiza más fiicilmente en un es- pacio muestra1 discreto pero infinito, supongamos'que nos interesa el nfimero de de- fectos (tales como soIdaduras o roturas) en 100 m de alambre. Es evidente que el espacio.de'muestreo es discreto y consta de casos o resultados posibles que se p u b den poner en correspondencia con los nilmeros O, 1, 2,. . . Como'no .bo¿lemos en- contrar un número N tal que el ndmero máximo de defectos en los 100 m de alam- bre no exceda a N, si11 que este nlimero sen arbitrario, el espacio será infinito nu- merable.

Para construir funciones de probabilidad en un espacio infinito cbmo el descri- to, se modificará el axioma 3 de la manera siguiente, para incluir también la unión de una infinidad numerable de subconjuntos:

Axioma 3'. Si A, , A , , As , . . . es una sucesibrr fiirita o infinita de SU- cesos .que'se excluven mlttuamente en S , entonc&:

Un ejemplo de función de probabilidad que cumple con los axiomas 1, 2 y 3' se ob- tendría suponiendo, en la ilustración anterior, que la probabilidad de que hubiera x defectos en 100 metros de alambre fuera

para x = O, 1, 2,. . . (la letra griega X, lambdu es una constaote positiva). Como las probabilidades son no negativas y, además, probaremos que su suma es uno, la fun- ción de probabilidad dada cumple evidentemente con el axioma uno.'Para demostrar que también lo hace con el agoma ,2, nos bastará 'verificar que P ( S ) , = 1, por lo que, usando el axioma 3', tendremos

Page 40: ingenieria

32 PROBABILIDAD

Como la suma infinita anterior es el desarrollo en sene de Maclaurin de ex, se con- cluye que P ( S ) = 1. La función de probabilidad de este ejemplo tiene muchas apli- caciones importantes, como se verá en los capítulos 3, 5 y 16.

El problema de definir probabilidades referentes a espacios muestrales continuos es algo más complicado. Por ejemplo, supongamos que ocurre un accidente en una carretera cuya longitud es de 200 kilómetros y nos interesa conocer la probabilidad de que el accidente ‘-?ya sucedido en determi:t>do lugar, o en un tramo fijado de la carxetera. Los resultados de este experimento se pueden considerar como los puntos de un continuo, tal como el intervalo de los números de O a 200. Se puede tomar como probabilidad de que el accidente. ocurra en cualquier intervalo de longitud L igual a L/200, con L. medido en kilómetros. Nótese que esta asignación arbitraria de la probabilidad cumple con los axiomas 1 y 2, ya que todas las probabilidades son no negativas y menores, o iguales, a uno, y P ( S ) = 200/200 = 1. Por supuesto, esta- mos considerando solamente sucesos representados por intervalos que forman parte del segmento de línea de O a 200. Usando e1 axioma 3’, podemos obtener también las.probabilidades de sucesos que no sean intervalos, pero que se puedan represen- tar por la unión de varios intervalos finitos o de una infinidad numerable de inter- valos. Así, para dos intervalos de longitudes L, y L, que no se superpongan, tendre- mos la probabilidad:

LI + Ls 200

y para una sucesión infinita de intervalos L,, Lz, LB,. . . , que no se superpongan, ten- dremos la probabilidad:

L l + L z + L a + . . . 200

Nótese que la probabilidad de que un accidente Ocurra en cualquier punto .dado es igual a O, puesto que podemos considerar un punto como un intervalo de longi- tud O. Sin embargo, la probabilidad de que el accidente ocurra en un‘intervalo muy corto es positiva; por ejemplo, para un intervalo de un decímetro de longitud, la probabilidad es 9.5(

Al ddinir una función de probabilidad en un espacio continuo, usaremos otra vez los axiomas 1, 2 y 3’ pero restringiremos el significado del término ‘suceso”. En lo que se refiere a la práctica, esta restricción no tiene consecuencias: simplemen- te, no se asignarán probabilidades a algunos conjuntos de puntos de naturaleza com- plicada, como son los que no se pueden expresar como uniones o intersecciones de un número finito o de una infinidad numerable de intervalos. La función de probabi- lidad empleada en el ejemplo .anterior, es efectivahente un caso especial: y es similar en naturaleza’ a la función considerada en un espacio discreto con prdbabilihades iguales. En el capítulo 4 se darán otros ejemplos de funciones de probabilidad en es- pacios muestrales continuos.

Page 41: ingenieria

, .

DISTRIBUCIONES 3 I DE PROBABILIDAD'

" 3.1 Variabies'apatorias 1 .

En Ia mayoría de los experimehtos estamos. interesados' únicamente' en una descripción numérica particular (o en descripciones numéricas), I de los casos que 'se presentan. Por ejemplo, en la inspecci6n de productos manufactdrados nos interesará sblo el n6mero t6faI de unidades defectubsas y no lanaturaleza de Ids'defectos; al estudiar la composicidn de'una aIeaci6n trataremos de determinar el dorc,entaje de cromo presente, sin importamos los dedibs elementos.que intervienen; en fa pruqba enL carretera de un automóvil buscaremos el consumo medio de'combustible en va- rios terrenos, sin analizar otras características del funcionamiento del mísli.lo.

Para ilustrar de manera' mis concrgtg 'esta' idea.'consideiaremos 'nuevamente e1 ejemplo del disparo del proyectil y los 18 'cisos indicados eh'la p@na 18. Suponga- mos ahora, quelo Únicó que nos interesa es el número total de,su&sistepqs qye fallan en vuelo. Repitiendo la lista de.los elementos del 'espacio muestra¡ y :us proiiabilida- des, pero áiiadiendo ahora una-cólumna que'rios d t el número de subsistemas que

, I fallan. obtenemos la tabla siguiénte:* . . 4 .

1 * . . , . , I . , t ' , ;

, . . * Suponemos que un subsistema falla.si su funcionamiento no es perfecto.

33

Page 42: ingenieria

34 DISTRIBUCIONES DE PROBABILIDAD

Suceso Proba- bilidad

0.336 0.096 0.048 0.084 0.024 0.012 0.168 0.048 0.024

Nimero de

fallos

O 1 1 1

1 2 2

Nimero Proba- de bilidad fallos 0.042 2 0.012 3 0.006 3 0.056 1 1

' 0.016 2 0.008 2 0.014 2 0.004 3 0.002 3

Nótese que sólo uno de estos casos corresponde a la ausencia de fallos, 5 correspon- den a casos en los que falla un subsistema, 8 corresponden a fallos en dos subsiste- mas, y 4 a fallos en tres subsistemas. Empleando la ley especial de adición, vemos que la probabilidad de que falle exactamente un subsistema es

P(1) = 0.096 + 0,048 + 0.084 + 0.168 + 0.056 = 0.452

Análogamente, obtenemos los valores de la tabIa siguiente:

Fallos I 2 3 0.452 0.188 0.024

Los numeros O, 1, 2 y 3 de esta tabla son valores de la variable uleatoriu que descri- be el número de subsistemas que faIfan. Observemos que a cada caso del espacio muestral corresponde un valor x de esta variable aleatoria y sólo uno. Luego, una variable aleatoria se puede considerar como una función definida en el conjunto de elementos de un espacio muestral. Notemos además, que para hal1,ar la probabilidad que,tom,a una variable aleatoria en cualquier valor de su recorrido, solamente hemos de hakr uso he la función 'de probabilibad definida sobre los ,elementos del esaacio muestral y del axioma 3 o> del 3'. (Se supope, aquí lo, mismo que en el resto del ca- pítulo, que los espacios muestrales son finitos o infinitos numerables:) Entonces po- demos deffnir otra función,!que asocia a &da valor de una variable aleatoria'la pro- babilidad de .que la variable tome este valor. Esta funciiin, de la cual la tabía anterior es un ejemplo, se llama función d e probabilidad 0, 'también, ley de probabilidad. Tales funcione define? una distribucicin de probabilidad., Para indicár las funciones de probab,iliaad se usarán, los símbolos f(x), e(.), 4(z), g ( y ) . .~

Siempre que sea posible, trataremos de definir las funciones de probabilidad por medio de'ecuaciones; en .ocasiones será necesario 'dar una tabla que indique la; co- rrespondencia entre los valores tomagos por la variable aleatoria y las proljabilida- des ligadas a ellos. Por ejemplo, se puede comprobar fácilmente que la ecuación

f(z) = 1/2 para z = O, 1

Page 43: ingenieria

VARIABLES ALEATORIAS 35

da la función de probabilidad del número de "caras" obtenido al lanzar al aire una moneda: por otra parte, sería dificil dar una expresión de la función de probabilidad del número ,de subsistemas que fallan en el ejemplo del proyectil.

Observemos también que, si ffx) es. un valor de una función d e probabilidad; se deben cumplir las ,propiedades siguientes:

(1) f(~) 2 O para todas las x,

(2) z f ( 4 = 1.

. . ,

toda x

Esto se deduce del hecho de que f(x) es una probabilidad y de que la suma de las probabilidades en el espacio muestra1 completo debe'ser igual a 1. .

Generalmente es útil visualizar las .distribuciones de probabilidades por medio de grzlficas como las de las figuras 3-1 y 3-2. La primera de éstas recibe el nombre de histopamu Las alturas de los rectángulos son proporcionales a las probabilida- des correspondientes y sus bases están puestas una a continuación de la d ra , de tal forma que no haya huecos entre los rectángulos que representaahs valor- sucesivos de la variable aleatoria. La grafica de la figura 3.2 se llama diagrama de barras y las alturas de los rectángulos son, nuevamente;*proporcionales a las probabilidades co- rreqxmdientes.

0.5 c

Fig. 3.1 Histograrna

0.5 I-

. . Fig. 3.2 Carta de. barras

J . .

I .

Como veremos más adelante, existen muchos problemas en los que no sólo nos interesa la probabilidad"f(x) de que el valor de una variable sea x, sino también la probabilidad de que el valor de una variable aleatoria sea menor o igual que x. In- -dicando esta probabilidad por F ( x ) , la función que asigna un valor F ( x ) !a cada x del conjunto d l valares de la variable aleatoria, se denomina funridn de probabilida- des rofales o funcitin de distribucicin. En el ejemplo dekfxoyectil. tendremos

X 1 , 2 F(z) 1 O.& O.?f3$ 0.976 l.Oq0 , . '

1.

3

Page 44: ingenieria

36 DISTRIBUCIONES DE PROBABILIDAD

3.2 Distribucibn binomial

Muchos problemas de estadistica se refieren a situaciones conocidas como “pruebas’ repetidas”. Por ejemplo, si deseamos conocer la probabilidad de que uno de 5 remaches se corte en un ensayo de tensidn, de que 9 de 10 tubos de vacío du- ren al menos 1 O00 horas, de que al menos 60 unidades de las 75 que forman un en- vío estén en buen estado, en cada caso estamos tratando con un niunero de “prue- bas” y nos interesa la probabilidad de obtener un cierto número de “casos favo- rables”.

Si n represew el número de pruebas y x el n w e r o d e casos favorables, los problemas de este tipo se pueden resolver utilizando la llamada distribución bino- mid, ya que se satisfacen las condiciones siguientes:

Hay solamente dos casos posibles en cada ensayo, llamados arbitrariamente casos “favorables” y “desfavorables”, sin inferir de esto que un caso favora- ble sea necesariamente un caso deseado. (Por ejemplo, la aparicidn de una unidad defectuosa en una mspeeidn puede considerarse como un caso “fa- vdrable.) La probabilidad de un caso “favorable” es constante en todas- las pruebas; se denotará por la letra p , y por lo tanto, la probabilidad del caso “desfavo- rable” será 1 - p . Hay n pruebas, siendo n una constante dada. Las n pruebas son independientes.

Por supuesto, si qo se cumplen estas condiciones, el problema tendrá que re- solverse con otro tipo :diferente de distribucibn de probabilidades adecuado., al caso.

Empezaremos haliando la probabilidad de encontrar x casos favoratiies en n pruebas en un orden dudo. Denotando los casos favorables y los desfavorables res- pectivamente por las letras A y B, consideraremos la sucesión

A A . . . A B B . B < , L”--J L - . “ L d

x n - x

formada por x cdsos favorables, seguidos por n -x casos desfavorables. Por la hi- pótesis que’hicimos de’independencia, la probabilidad de esta sucesión es el produc- to de las probabilidades de los casos individuales; hay x factores p, n - x factores 1 - p . y por consiguiente, la probabilidad es pz(l - p)””. Nótese que se habría obtenido un resultado idéntico a partir de cualquiera otra sucesión que tuviera x casos favorables y n - x Casos~desfavorables en un orden dado. En este caso, tam- bién hubiera habido x factores p, y n - x factors 1 - p, y lic, probabilidad buscada sería también su producto.

Para obtener 1a.probabilidad de x casos favorables. y TI -,x casos desfavorables en cuaZquier orden, tendremos que sumar las probabilidades de,todas las sucesiones que tengan x casos favorables y n - x casos desfavorables en algún orden. Como cada una de estas sucesiones tienen la probabilidad pz(l - p)”-=, sólo tendremos que hallar el número de tales sucesiones y multiplicar este niimero por pz(l - p)’”“. Nótese que esta cantidad está multiplicad&’ por el número de formas en que las x

Page 45: ingenieria

DISTRIBUCION BINOMIAL 37

letras A pueden e s t a distribuidas en lqs n pruebas. Para encontrar este mimero, su- pongamos de momento que las A se pueden distinguir: entonces, podremos dar a cada una un subíndice y designarlas con Al, AB, . . . , A,. Comenzando por A l , la podemos hacer corresponder a cua!quiera de las n pruebas, es decir, la podemos fijar en n formas diferentes. A continuación, podremos hacer lo mismo con A 2 en n - 1 formas diferentes,. A , en n - 2, . . ., y finalmente A , en n -x + 1. .De acuerdo con el teorema 2.1, todas estas A se pueden distribuir entre las n pruebas de n(n- 1) (n - 2) . . . (n -x -t 1)' formas diferentes. SE ahora omitimos los subín- dices, 'vemos que las diferentes a a a c i o n e s que hemos considerado no son todas distintas. Por .ejemplo, A,BA,A,B, A1BAsA2B, A,BA,AiB, AkBA,,A,B, A,BA,A;B y A3BA2A1B, nos dan ABAAB. Engeneral, las x letras A con subindices se pueden ordenar entre ellas de x(x - 1) e . . . . 2 . 1 modos diferentes, de acuerdo con el teo- rema 2.1, y por lo tanto estas ordenaciones de las A con subíndices nos conducen a una sola, una vez que se han suprimido los subindices. Entonces, el número. de mo- dos en que las x letras A se pueden distribuir entre las n pruebas está dado por

n(n - l)(n - 2) . . . - (n - z + 1) z(z - 1). . . . * 2 - 1

que ,con notacibn factorid se puede escebir n! /x! (n - x) !* Se sucede & esto que en las hipótesis indicadas en la página 39, la probabilidad de x casos favorables en n pruebas está dada por

+ %n, P) = - ,&)I n! p"(1 - p)"-= paraz = O, 1,. . . ,n +

La función de probabilidad definida ,por esta ecuación se llama ley binomial. De hecho, esta ecuación define una familia de funciones de probabilidad en la que cada una de ellas se caracteriza por valores dados de los parámetros IZ y p .

Para dar un ejemplo de aplicación de la ley binomial, supongamos que se quie- re encontrar la probabilidad de que exactamente 9 de los 10 tubos de vacío duren al menos 1 O00 horas, supuesto que la probabilidad de que cualquiera de estos tubos dure un mínimo de 1 O00 horas, es 0.80. Aceptando que las condiciones 'en que se basa la ley binomial se verifican, y substituyendo n = io y p = 0.8;0, obtenemos

b(9; 10,O.k) = m (0.80~u(0.20)' = 0.268 lo! . , I

Para hallar Ia probabílidad de que por lo menos'9 de tales tubos duren un mirlimo de 1 OOO'horas. tendremos únicarnente que utilizar la ley especial de adición ' ' '

b(9; IO, 0.m) + b(ío;$, o b 2 = 0.2~8 + 0.107, = 0.375 , . ,

Page 46: ingenieria

38 DISTRIBUCIONES DE PROBABILIDAD

La probabilidad de que, a lo más, 8 de esos tubos duren un minimo de 1 O00 horas, está dada por la suma

II

b(z; 10,O.SO) 2=0

pero, en lugar de evaluar cada una de las 9 probabilidades que aparecen en esta suma, es más fácil hallar la probabilidad de que al menos 9 tubos duren un minimo de 1 O00 horas y restar de, 1 este resultado. Entonces tendremos 1 - 0.375 = 0.625.

Si n es grande, el cálculo de las probabilidades binomiales puede resultar pesa- do: en tal caso, es conveniente emplear aproximaciones numéricas o tablas especia- les. El National Bureau of Standards ha tabulado valores de la ley binomial y la co- rrespondiente función de distribución para valores de n desde 2 hasta 49 y H. G. Ro- mig para valores de 50 a 1 0 0 (véase la bibliografía al final del libro). La tabla I al final da los valores de

2

B(s; n, p ) = Z b ( k ; n, p ) paraz = O, 1,2, . . . , n

para n desde 2 hasta 20 y p = 0.05, 0.10, 0.15, . . . , 0.50. Hemos preferido tabular la función de probabilidades totales en lugar de los valores de b(x; n, p ) porque los valores de B(x; n, p ) son los que se emplean más frecuentemente en las aplica- clones estadísticas. Nótese, sin embargo, que los valores de b(x; n, p ) se pueden ob- tener usando la tabla I, partiendo de las identidades indicadas en las partes .(c) y (d) del teorema 3.1 que aparece a continuación. Obsérvese, también, que los valo- res de B(x; n, p ) no se pueden obtener directamente de la tabla I cuando p es ma- yor de 0.50, pero se pueden obtener etqpleando la identidad dada en la parte (b).

k=O

Teorema 3.1

La primera de estas identidades se puede comprobar substituyendo en ambos miem- bros las expresiones correspondientes dadas por la ecuación que define la distribu- ción, binomial; la segunda identidad se deduce de (a) y de la definición de función de distribución; la tercera identidad se deduce directamente de la definición de fun- ción de distribución; y la cuarta, por substitución de las partes (a) y (c). El lector deberá verificar en detalle estas identidides al resolver los problemas 5 y 6 de la página 45.

Para ilustrar el empleo de la tabla I y las identidades (a) y (c) del teorema 3.1, supongamos que, de un envío muy grande de tubos de vacio, la probabilidad de que falle uno cualquiera de ellos es .0.20. Suponiendo, además, que se cumplen las con- diciones de una ley binomial, la probabilidad de que a lo m& fallen 3 tubos en una muestra de 20 está dada por

Page 47: ingenieria

DlSTRlBUClON BINOMIAL 39

B(3; 20,0.20) = 0.4114 La probabilidad de que fallen 5, o más, tubos en una muestra de 16 es

16 ’ 2 b(z; 16, 0.20) = 1 - B(4; 16, 0.20) = 1 - 0.7982 = 0.2018 2=5

La probabilidad de que e~actamet?tc 12 tubos no faIIer7 en u m muestra de 15 es b(12; 15,0.80) = b(3; 15,0.20) = 0.2502

Y la probabilidad de que fallen exuctamente 5 tubos de 18, está dada por b(5; 18,0.20) = B(5; 18, 0.20) - B(4; 18, 0.20)

= 0.8671 - 0.7164 0.1507

Ilustraremos ahora el empleo de las identidades (b) y (d) del teorema 3.1, para lo que supondremos que la probabilidad de que un automovilista no tenga acciden- tes en un periodo dado, es 0.75. Entonces, la probabilidad de que n~enos de 16 de 20 automovilistas no tengan accidentes es

B(15; 20,0.75) = 1 - B(4; 20, 0.25) = 1 - 0.4148 = 0.5852

y la probabilidad de que no tengan accidentes exactamente 12 de 15 automovilis- tas, es

b(12; 15,0.75) = B(3; 15,0.25) - B(2; 15,0.25) = 0.4613’- 0.2361 = 0.2252

Para ilustrar el empleo de la ley binomial en un problema de tomar decisiones, supcingase que un fabricante asegura que su proceso de produccicin no da más de 1096 de piezas defectuosas y que la decisicin de aceptar o rechazar esta afirma- cicin debe hacerse tomando como base un envío de 20 piezas, entre las cuales S son defectuosas. Para justificar la decisicin. determinaremos primero la probabilidad de hallar 5, o más piezas defectuosas en una muestra de 20, cuando el porcentaje “ver- dadero” de piezas defectuosas es 0.10: es decir, la probabilidad de que una pieza inspeccionada resulte defectuosa es O. 1 O. Como obtenemos

20

5 b(z; 20, 0.10) = 1 - B(4; 20, 0.10) = 0.0432 +=5

que es un valor muy pequeño, es razonable rechazar la afirmación del fabricante. (Nótese que esta probabilidad habría sido aun menor si hubieramos empleado un valor de p menor de 0.10.) Si la muestra hubiese contenido s610 3 piezas defectuo- sas, hubiera sido mucho más difícil llegar a una decisión. La probabilidad de en- contrar, 3, o más, piezas defectuosas en una muestra de 20, es 0.3230, cuando la probabilidad de que una pieza cualquiera sea defectuosa es 0.10, Este hubiera sido difícilmente calificable como “suceso raro” y no justificaría rechazar la afirmacicin del fabricante.

Page 48: ingenieria

40 DISTRIBUCIONES DE PROBABILIDAD

Una propiedad interesante de las distribuciones binomiales se ilustra en las fi- guras 3.3, 3.4 y 3.5. Primero, si p = 0.50, la ecuación de la distribución binomial se convierte en

b(x ; n, 0.50) = (0.50)" n!

z!(n - x)! y b(x; n, 0.50) = b(n-x; n, 0.50): esto es, el histograma de una distribución bino- mial con p = 0.50 es simétrico, tal como se observa en la figura 3.3 para el caso especial en que n = 5.

O I 1

1 t I =L 5

Fig. 3.3 Distribucih binómica simétrica

b (x; 5,0.20)

Fig. 3.4 Distribucibn binjmica oblicua Fig. 3.5 Distribución binbmica oblicua positiva negativa

Page 49: ingenieria

DlSTRlBUClON BINOMIAL 41

Ahora, si p es menor de 0.50, se ve que es más probable que x sea pequeño que grande comparado con n; análogamente, el caso contrario se presenta cuando p es mayor de 0.50, tal como se ilustra en las figuras 3-4 y 3-5, que representan los histogramas de las distribuciones binomiales con M = 5 y p = 0.20 y p = 0.80, res- pectivamente. Una distribución de probabilidad cuyo histograma es semejante al de las figuras, se dice que es sesgadu; siendo sesgadu positiva si la “cola” larga se en- cuentra a la derecha como en la figura 3-4, y sesgada negativa si se encuentra a la izquierda, como en la figura 3-5.

EJERCICIOS 1. Supóngase que se asigna una probabilidad de 1/20 a cada caso del espacio de muestrco

de la figura 2.5. Hallar la distribución de probabilidad del número total de componentes defectuosas en el equipo completo.

2. Un experimento consiste en tirar 3 veces una moneda. Si denotamos los casos por H H T , T H T . . ., (donde la H indica una “cara y la 1’ una cruz), y suponemos que los 8 casos son igualmente probables, determinar la distribución de probabilidad del número total de “caras”.

3. Si una variable aleatoria puede tomar los valores x = O, 1, 2, 3, 4 y 5, indiquese cuáles de las funciones de los siguientes apartados definen una distribución de probabilidad:

(8) f(z) = 1/6 para toda X

(b) f(z> = z/15 para toda X

(c) f(x> = 9/50 para toda .x

4. Se supone que

I($) = k(1/V define una distribución de Probabilidad de una variable aleatoria, que toma los valores X = 0,1.2, ..., hallar k y tambih una expresión para la funciiin de probabilidades totales F ( x ) correspondiente.

5. Comprobar las partes ( a ) y (b) del teorema 3.1 de la página 41. 6. Comprobar las partes (c) y ( d ) del teorema 3.1 de la página 41. 7. Comprobar que

b(z + 1; 71, P l = P(n - 4 wz; 71, P) (1 - P)(s + 1)

para x = O,1,2 ,..., It - 1. 8. Usar la fórmula del problema 7 para calcular las probabilidades de la distribuciik bino-

mial con = 5 y p = 0.30, y dibujar su histograma. Verificar los rcsultados en la tabla 1: 9. Empleando la tabla I, hallar

(a) B(5; 15,0.40), (d) b(8; 12,0.70),

(b) b(5; 15,0.40), (e) Z b(k; Z O , O . l O ) , 20

k-5

(c) B(8; 12, 0.70), D

k-3 (f) z b(k; 9,0.80).

10. Usando la tabla 1, hallar

Page 50: ingenieria

42 DlSTRlBUClONES DE PROBABILIDAD

(a) B(8; 18, 0.45), (d) b(9; 10,0.90),

(b) b(S ; 18, 0.45), (e) Z b(k; 10,0.30), 10

k-3 4

k = 2 (c) B(9; 10, 0.90), (f) ;5: h(k; S, 0.40).

11. La probabilidad de quc un automóvil que recorre la longitud completa de un camino tenga un accidcntc, es 0.05. Hallar l a probabilidad de que, entre 17 autom6viles que re- corren el camino, tengan accidentes: ( a ) exactamcnte 1 ( h ) como máximo 3 ( c ) dos. o m8s

0.85. Hallar la probabilidad de que de 20 tubos ( a ) Resistan exactamcntc 17 ( b j Resistan por lo menos 15 (c) No resistan al menos 3

13. Un fabricante asegura que, como máximo un 10‘4 de su producto es defectuoso. Para probar esta afirmacibn, se inspeccionan 18 unidades y solo al miximo hay 2 defectuosas, se aceptari la afirmación del fabricante. Hallar la probabilidad de que ésta se acepte, si la probabilidad efectiva de que una unidad salga defectuosa es

12. La probabilidad de que cierto tipo dc tubo de vacío resista una prueba determinada es

(a) 0.05,

(b) 0.10, ( e ) 0.15,

(d) 0.20.

3.3 Distribución hipergeométrica

Supongamos una muestra de n unidades obtenida de un lote de N unidades, en el cual a unidades son defectuosas. Esta muestra se ha obtenido del lote extrayen- do sucesivamente las unidades de tal forma que, después de cada extracción, cual- quiera de las unidades que permanecen en el lote tienen la misma posibilidad de quedar incluidas en la muestra. Luego, en la primera extracción, la probabilidad de obtener una unidad defectuosa es a / N , pero, en la segunda extracción, sdo seguiría siendo a /N .si l u prin7cra unidad sacada se volviera a meter. En otras palabras, la probabilidad de extraer una unidad defectuosa en la segunda extracci6n es (a - I ) / ( N - 1) 6 a / ( N - l) , s e g h que la primera unidad sacada sea, o no, defectuosa. L a hiptitesis mímcro 4 que hicitnos paru la distrihncitin binomial será vúlida rinica- Jnerlfe .si despue‘s de cada extraccich se repone lu~urlidnd en el lote. En la práctica, este caso se presenta raramente, por lo que tendremos que buscar una nueva distribu- ción de probabilidad, llamada distrihucidn hipergeon&rica, que se aplicará a situa- ciones como la indicada.

Para resolver este problema de “muzstreo sin remplazamiento”, nos referimos al resultado obtenido en ia página 40, que nos dice que un sLibconjunto de x obje- tos se pueden seleccionar de

Page 51: ingenieria

DlSTRlBUClON HIPERGEOMETRICA 43

modos diferentes, partiendo de un conjunto de iz objetos. Esto se probó al tratar el problema de la distribución de x casos favorables en IZ pruebas, es decir, al escc- ger subconjuntos en los cuales se presentan x casos favorables. Consideramos a

como un coeficiente binomial, y también es el "niímero de combinaciones de 0 11 objetos, de los que se toman x".

Volviendo ahora al problema de encontrar la probabilidad de obtener x uni- dades defectuosas en una muestra de 12, tomadas sin remplazamiento, r.otemos, en

primer lugar, que el espacio muestra1 de este experimento tiene (3 casos Fosibles,

que son las formas en que un subconjunto de I? objetos se puede seleccionar partien- do de un conjunto de'N objetos. Además, las x partes defectuosas se pueden seleccio-

nar de las ci partes defectuosas de maneras, las I Z - x unidades no defectuoras

de la muestra se pueden seleccionar, a su vez, de las N - a unidades no defectuosas del lote. de (" - u)maneras, y de acuerdo con el teorema 2.1, el total de ]a Inucs-

tra se podrá seleccionar de ( z ) (I:--:) maneras. Suponiendo que cada una de

las (:) muestras tiene la misma probabilidad de ser seleccionada, lo que es q u i -

valente a la hipcitesis que hicimos en el primer párrafo de esta seccihn, la probabi- lidad de obtener x casos "favorables" en 12 tentativas sin rempjazamiento es

(3 n - x

Page 52: ingenieria

44 DISTRIBUCIONES DE PROBABILIDAD

para simplificar el cálculo de probabilidades de este tipo, se pueden usar tablas de coeficientes binomiales o tablas de los logaritmos de los factoriales, que se pueden encontrar en cualquier manual de tablas matemáticas.

Ncitese que, si hubiésemos cometido el error de usar una distribución biromial con n = 10 y p = 5/20 = 0.25 para calcular la probabilidad de encontrar dos uni- dades defectuosas, el resultado habría sido 0.282, considerablemente menor que la probabilidad encontrada. El tamaño de la muestra n = 10 es bastante grande, com- parado con el tamaño del lote N = 20 en este ejemplo, y el efecto de no reemplazar las unidades ha sido bastante notable. Sin embargo, si el tamaño de la muestra hubiese sido pequeño, comparado con el del lote, la composición del lote no habría cambiado mucho al sacar una muestra y, entonces, sería razonable esperar que la distribucicin binomial con p = u/N nos hubiera dado una buena aproximación. Para aclarar este punto, supongamos que el lote contenga 100 unidades en lugar de 20, y que 1/4, es decir 25 de estas unidades, sean defectuosas. La probabilidad exacta de sacar una muestra de tamaño 10 con dos unidades defectuosas sería en estas condiciones

La aproximación de 0.282 dada por la distribución binomial con = 10 y p = 0.25 es ahora bastante cercana a la probabilidad real.

En la mayoria de los problemas prácticos, el tamaño de la muestra es peque- ño en comparaci6n con el del lote, y la distribución binomial ROS da una buena aproximación de la distribucicin hipergeométrica. De hecho, se puede demostrar que h(x; I?, u, N ) se aproxima a b(x; n, p ) cuando N + co y - = p permanece constante. Una buena regla práctica es utilizar la distribucicin binomial como apro- ximacicin de la hipergeomitrica solo si N 2 10 n.

Aunque hemos usado un problema de inspección de muestras para introducir la distribucicin hipergeomktrica, esta tiene muchas otras adicaciones. Por ejemplo. puede utilizarse para hallar la probabilidad de que 3 de 12 amas de casa prefieran el detergente A al B, si estas amas de casa se han seleccionado entre 200 de las cua- les 40 prefieren efectivamnte la marca A a la B. Se puede emplear también en CO-

nexi6n con problemas de escoger diamantes industriales, de los cuales algunos tienen cualidades superiores a los otros; en conexión con problemas de muestre0 referen- tes a devoluciones en declaraciones de impuestos, donde (I de N devoluciones tienen deducciones que son dudosas; etc.

a N

3.4 Distribución de Poisson

Consideremos ahora otro problema que se puede resolver por medio de la dis- tribución binomial. Supongamos que inspeccionamos una longitud L de alambre de

Page 53: ingenieria

DlSTRlBUClON DE POISSON 45

acero esmaltado, para encontrar las imperfecciones que tiene, tales como rebabas, rasgaduras, roturas, etc. Supondremos que, para cada intervalo pequeño de longitud AL, la probabilidad de una imperfección a AL, donde a (alfa) es una constante que depende de la calidad del alambre, y A L es suficientemente pequeño para que se puedan despreciar la probabilidad de hallar dos, o más, imperfecciones en dicho intervalo. Nos interesa la probabilidad de encontrar x imperfecciones en una longi- tud L de alambre.

Supóngase que hay n intervalos de longitud AL, esto es, n.AL = L, y además que la presencia de una imperfección en cualquier intervalo dado, es independiente de la presencia de imperfecciones en cualquiera de los otros intervalos. Podemos considerar, entonces, que los n intervalos forman una sucesión de n pruebas in- dependientes con una probabilidad constante a AL de que se presente una imper- fección en una cualquiera de las pruebas. Se deduce en consecuencia que la proba- bilidad de hallar x imperfecciones en una longitud n . A L de alambre es

b ( z ; n, a AL) = (a hL)"(l - a AL)"" para z = O, 1, . . . , n Como la hipótesis de que sea despreciable la probabilidad de encontrar más de una imperfección por intervalo, sólo es aceptable si AL es muy pequeño, hallemos ahora el límite al que se aproxima la probabilidad anteriormente indicada cuando AL .--) O. Este nos dará la probabilidad buscada de encontrar x imperfecciones en una longi- tud L del alambre considerado.

(3

Substituyendo por AL y simplificando la expresión resultante para b(x; n, a AL), obtenemos

- - n(n - l ) ( n - 2) * . . . * (n - x + 1) (aL)z (1 - $)"" x !n"

(1 - t)(l - n -) 2 - . . . - -

x! .

Si ahora hacemos n +- w, obtenemos

esto

y, por lo tanto, la probabilidad binomial se aproxima a

e= para x = O, 1,2, . . . X!

Page 54: ingenieria

46 DISTRIBUCIONES DE PROBABILIDAD

Esta es la distribución de probabilidad que buscabamos de obtener x imperfeccio- nes en una longitud L del alambre del tipo considerado, y corresponde a la fami- lia de las llamadas dislribuciones de Poisson. Substituyendo aL por el parámetro (mico X, la ecuación general de una distribución de Poisson es

+. f(s; X) = e-x - para x = O, 1, 2, . . . + X" X!

Como esta distribución se define sobre un espacio muestra1 infinito numera- ble, es evidente, por la forma como se introduce que poniendo X = np, nos dara una buena aproximación de la distribución binomial cuando r z es grande y p pequeña. Como ilustración, compararemos O(2; 100, 0.05) con f(2;5), donde X = n.p = 100 (0.05) = S. Substituyendo en las expxesiones correspondientes, tenemos

b ( 2 ; 100,0.05) = ('T) (0.05)2(0.95)98 = 0.081

f(2; 5 ) = e-6 - = 0.084 52 2!

y es interesante notar que el error es menor que 0.003. Una regla práctica aceptable es usar la distribucicin de Poisson para hallar probabilidades binomiales si 17 2 20 y p 50.05. (Si n 2 100, la aproximación es excelente, mientras sea 71p I 10.)

La tabla I1 del Final del libro nos da los valores de las probabilidades F(z; X) =

2: f(k; X) para valores de X desde 0.02 a 25, en una escala de incrementos va-

riables k = O. Ilustraremos el uso de la tabla, suponiendo que w p = 3.6 en el caso de la distribución del n6mero semanal de ausencias en el departamento de conta- bilidad de un negocio. Para encontrar la probabilidad de que a lo, más 5 emplea- dos se ausenten durante cierta semana, usamos la aproximación de Poisson con X = 3.6 y encontramos, en la tabla IT, que

X

.k = O

P(5; 3.G) = 0.844

AI usar esta aproximación, supusimos que el ndmero de empleados era muy grande y que la probabilidad de ausexia de cualquier empleadb era muy pequeña. Tam- biCn queda implícita la suposición de que la ausencia de cualquiera de los empleados es independiente de la presencia o ausencia de cualquier otro, aunque en este proble- ma esta suposición podría no ser cierta.

La tabla I1 se puede utilizar para determinar valores de f(x; X), usando una identidad aniioga a la (c) del teorema 3.1, o sea,

f(z; X) F ( x ; X) - F ( x - 1; X)

Empleando esta identidad y restando valores sucesivos de F ( x ; X), se han ob- tenido 10s valores de la distribución de Poisson mostrados en la figura 3.6 para A = 2. Nótese que esta distribución es sesgada positiva, efectivamente, como conse-

Page 55: ingenieria

DlSTRlBUClON DE WISSON 47

cuencia de la discusión que se hizo en la página 44, resulta claro que las distribu- ciones de Poisson han de ser sesgadas positivas para cualquier valor de X > O.

0.3 - 0.271 0.271

0.2 - 0.180

- 0.090

- 0.135 I_

0.1 0.036

X

Fig. 3.6 Distribucih de Poisson

1.

2.

3.

4.

5.

6.

7.

8.

EJERCICIOS

Una urna contiene 15 bolas, de las cuales 10 son rojas y 5 blancas. Si se sacan 6 sin volverlas a meter, hallar la posibilidad de que haya ( a ) Dos bolas blancas y 4 rojas, ( b ) A lo más, 2 canicas blancas, (c) AI menos, 4 canicas rojas, (d) Al menos, 2 canicas rojas. Ciertos componentes de un proyectil se envían en lotes de 25. Se seleccionan 3 compo- nentes de cada lote y, si ninguno de ellos tiene defectos, se acepta. el lote. ¿,Cuál es la probabilidad de que se acepte el lote si contiene ( a ) 5, ( b ) 10, (c) 15 ó ( d ) 20 com- ponentes defectuosas? Una compañía dec.taxis tiene 12 Chevrolets y 3 Fords: Si 5 de estos taxis se encuentran en el taller de reparación y las avcrias que pueden existir en un Chevrolet se presentan con la misma frecuencia en un'Ford &cuál es la probabilidad de que: (a) ¿Tres de los taxis sean Chevrolet y 2 Ford? ( b ) ¿Al menos 3 sean. Chevrolet? (c) &Los 5 sean de la misma marca? En la página 48 se indicó que los valores de €a distribución hipergeomktrica se pueden obtener aproximtidamente, c,on los valores de la distribucibn binomial en determinadas ocasiones. Verificar esto, comparando h (1; 5,20,101)) con b(1; 5,0.20). Repetir el .ejercicio 2, tomando las probabilidades aproximadas obtenidas con probabili- dades binomiales, haciendo n = 3 y p = 0.20, 0.40, 0.60 Y 0.80, respectivamente. Anali- cese la bondad de estas aproximaciones. Comprobar que en la distribución de Poisson

f (x + 1; A) - x f b ; N 2 + 1

.para$ = O, 1, 2,. . .. Usar la fúrmula del ejercicio 6 para calcular los valores de la distribución de Poisson con = 2 para x = 0,1,2,. , . y 9 y dibujar el histograrna de esta distribuciún. Verifi- car los resultados en la tabla 11. Usando la tabla IT, encontrar

Page 56: ingenieria

48 DISTRIBUCIONES CE PROBABILIDAD

(b) f (9; 1%

10. En la página 49 se indic6 que, a veces, los valores de la distribución binomial tienen valores aproximados semejantes a los de la distribución de Poisson. Verificar esto, com- parando b(4; 50,O.lO) con f(4;5).

11. En la inspección de una placa de estaño producida por un proceso electrolítico con- tinuo, la probabilidad de picaduras e imperfecciones en un intervalo de tiempo muy pequeño At es (0.2) At, midiéndose el tiempo en minutos. ¿Cuáles son las probabilidades de que se produzcan, O,] y 2, imoerfecciones en un tiempo de 5 minutos?

12. El número de averias semanales de una computadora es una variable aleatoria que tiene una distribución de Poisson con X = 0.4. ¿Cuál es la probabilidad de que la computado- ra trabaje sin averias durante dos semanas consecutivas?

13. El número de rayos gama emitidos por segundo por una substancia radioactiva es una variable aleatoria que sigue una distribucidn de Poisson X = 5.6. Si un instrumento de medida se bloquea cuando hay más de 12 rayos por segundo, ¿Cuál es la probabilidad de que el instrumento se bloquee durante un segundo dado?

14. El número de huracanes que llegan a la costa oriental de Estados Unidos por año, es una variable aleatoria que sigue una distribución de Poisson con X = 1.9. Hallar la probabilidad de que en un año dado el número de huracanes sea (a) cero, (b) exacta- mente 3, (c) dos, o más.

3.5 Media y varianza de una distribuci6n de probabilidad

En la sección 3.2, introdujimos una característica importante de las distribu- ciones de probabilidad (o de sus histogramas correspondientes): la simetría y el sesgo de una distribución. En la figura 3.7 se muestran otras dos importantes carac- terísticas. En esta figura están representados los histogramas de dos distribuciones binomiales, una con los parámetros n = 4 y p = 1/2 (parte no sombreada) y la otra con n = 16 y p = 1/2 (parte sombreada). Esencialmente, estas dos distribu- ciones difieren en dos aspectos. La primera está “centrada” alrededor del valor de x = 2, mientras que la segunda lo está alrededor de x = 8, por lo que diremos que las dos difieren en su ZocuZizaci6n. Otra diferencia entre las dos distribuciones es que el histograma de la segunda está más extendido, es decir, las probabilidades representadas por los rectángulos son más “dispersas”, por Io que diremos que las dos distribuciones difieren en variacibn. En esta seccidn introduciremos dos de las medidas más importantes que determinan la localización y la variación de una dis- tribución de probabilidades; las llamaremos media y variancia. Refiriendonos, por el momento, a la primera distribución de la figura 3.7, se puede ver fácilmente que las probabilidades para x .= 0,1,2,3 y 4, son, respectivamente, 1/16, 4/16, 6/16, 4/16 y 1/16. Luego, podemos decir que, cabe esperar el x = O

Page 57: ingenieria

MEDIA Y VARIANZA DE UNA DlSTRlBUClON DE PROBABILIDAD 49

1

0.4

0.3

o. 2

O. t

C

1

Fig. 3.7 Distribuciones con medios y varianzas diferentes

durante 1/16 del tiempo, el x = 1 durante 4/16 del tiempo,. . . el x = 4 durante 1/16 del tiempo, cuando se repiten las pruebas y que el valor de esta variable alea- toria en promedio es

0(1/16) + 1(4/16) + 2(6/16) + 3(4/16) + 4(1/16) = 2

Nótese que este es el valor que usamos en el párrafo anterior como “centro” de la distribución. Este promedio ‘es lo que llamaremos media de la distribución de pro- babilidad.

En general, la media de una distribución, cuando f(x) es la función de probabi- lidad se define por la ecuación.

y se denota por la letra griega B (mu). Esta magnitud mide el “centro” de una dis- tribución de probabilidad en el sentido de un promedio, o, mejor aun, como un ten- tro de gravedad. Notemos que la fórmula anterior B es, de hecho, el momento de Pri- mer orden con respecto al origen de un sistema discreto de masas f(x) colocado a lo largo de una línea recta a distancias x del origen. En este caso no tenemos que dividir por Zf(x) como se hace usualmente con la coordenada x de un centro de gravedad, ya que esta suma, por definición, es igual a 1.

Volviendo ahora a’la segunda distribución de la figura 3.7, podríamos encontrar SU media substituyendo las probabiIidades adecuadas en la f6rmula anterior. Sin embargo, si reflexionamos un momento, podemos ver que hay la mitad de la$ opor- tunidades de que presente un caso favorable, y la mitad de que no se presente en

t o d a X

Page 58: ingenieria

50 DISTRIBUCIONES DE PROBABILIDAD

cada prueba, hay 15 pruebas y, por lo tanto, es razonable esperar en promedio 8 casos favorables en 16 pruebas. Análogamente, se podria razonar teniendo en cuenta que si una distribucihn binomial tiene los parámetros n = 200 y p = 0.20, cabria esperar un caso favorable durante un 20% del tiempo y, por lo tanto, en promedio 200 (0.20) = 40 casos favorables en 200 ensayos. Este razonamiento se puede ex- tender a cualquier distribución binomial, y podemos probar que la medin de la dis- tribucititz binomial de parámetros n y p está dada por

* p = n.p Substituyendo la expresión que define b(x; n, p) en la fórmula de P , obtenemos

donde la suma comienza con x = 1, ya que el primer sumando es cero para x = O. Si ahora hacemos y = x - ! y nz = n - 1, tendremos

m m!

I.r = np 20?, ! (m - y)! p"(1 - p)"-"

y en esta illtima suma podemos reconocer fácilmente la de todos los tirminos de la distribución binomial de parámetros m y p. Luego, la suma será igual a 1 , y de aquí que P = np .

El resultado obtenido se aplica, por supuesto, solo a distribuciones binomiales, pero, dada otra forma de distribucicin especial, podemos, de una manera semejante, encontrar una fórmula apropiada que exprese la media en función de los paráme- tros de dicha distribuci6n. Para la distribuci& hipergeort1t:trica de parúmetros n, a, y N , tetldrelnos

* p = n . - a N *

Y , para la distribucidn de Poisson de parámetro X, se ha116

* p = A

Usando metodos semejantes al empleado para encontrar la fórmula de la media de la distribución binomial, el lector deberábprobar estos resultados en los proble- mas 5 y 6 de la phgina 60. Nótese que, en el caso de la distribución de Poisson, tam- bién hubieramos podido demostrar que p = A recurriendo al proceso de paso al límite por el que la distribución de Poisson se obtuvo a partir de la binómica.

Considerando nuevamente las dos distribuciones de la figura 3.7, debemos notar que para la primera distribución hay una gran probabilidad de que obtengamos

Page 59: ingenieria

MEDIA Y VARIANZA DE UNA DlSTRlBUClON DE PROBABILIDAD 51

que seria el promedio de las desviaciones de la variable aleatoria respecto de la media. Desgraciadamente:

= p - p . ~ j ( z ) = p - p = O toda x

luego tal expresión es, siempre, igual a cero. Sin embargo, como lo Único que nos interesa realmente es la magnitud de las desviaciones x - B (y no sus signos), po- dríamos tomar el promedio de los va?ores absolutos de las desviaciones. Esto, nos daría, también, una medida de la variación, pero, por motivos puramente teóricos, es preferible trabajar con los cuadrados de las desviaciones respecto de la media. Estas cantidades nunca pueden ser negativas y su promedio nos indicará la disper- sión de una distribución de probabilidad. Por consiguiente, definiremos la vurianta de una distribución cuando f(x) es la función de probabilidad, por

donde (sigma) es la letra minúscula S griega. Esta medida no está expresada en las mismas unidades (o dimensiones) que los valores de la variable de azar; pero podemos corregir este inconveniente, tomando su raíz cuadrada, y así queda definida la desviacicin ti20 (o stándard) por

Para ver cómo la desviación tipo mide la dispersión de una distribución de pro- babilidades, calcularemos u para las dos distribuciones de la figura 3.7. Habiendo demostrado anteriormente que Ia media de la primera distribución es igual a 2. su variancia sera '

2 = (O ,- 2)2(1/l(i) + ( I - 2)'(4/16,' + (2 - 2)2(6/16) f (3 - 2)'(4/!6) f (4 - '4'(1116)

y por lo tanto, la desviación tipo seri u = 1. Análogamente, pará l a segunda dis- tribución u = 2, y podemos ver que la distribucicin con mayor dispersicin tiene tam- biin la mayor desviacicin tipo.

Dada una distribución de probabilidad, siempre podremos calcylpr u2 substi- tuyendo las' probabilidades f(x) correspondientes en la fórmula que define la va- riancia. Lo mismo que en el caso de la media, este trabajo se puede simplificar considerablemente al tratar con tipos especiales de distribuciones. Por ejemplo, la

= 1

Page 60: ingenieria

52 DISTRIBUCIONES DE PROBABILIDAD

variancia de una distribución binomial con parámetros n y p está dada por la fórmula

+ u2 = n . p - ( l - p ) + No probaremos esta fórmula aquí, pero aplicándola a las dos distribuciones de

l a figura 3.7, que son binomiales con parámetros n = 4, p = 1/2, y n = 16, p = 1/2, respectivamente, vemos que sus variancias son 1 y 4; lo cual concuerda con los va- lores obtenidos anteriormente.

Substituyendo las expresiones adecuadas para las probabilidades f(z), pode- mos ver que la variancia de la distribución hipergeométrica con parámetros n, N y a está dada por

y, la variancia de la distribución de Poisson, con parámetro X por

+ u2 = X + Cuando definimos la variancia de una distribución de probabilidad, el lector

habrá pensado, seguramente, en la fórmula empleada en Física para definir los mo- mentos de segundo orden, o momentos de inercia. Efectivamente, en estadística es costumbre definir el momento de orden k respecto del origen por

P; = 2 Zk *f(4 toda x

y el momento de orden k respecto a la media por

Así, el medio P es el momento de primer orden respecto del origen y la variancia u2 es el momento de segundo orden respecto de la media. Se usan momentos de or- den mayor en Estadistica para análisis más detallados de distribuciones de probabi- lidad. Por ejemplo, el momento de tercer orden respecto de la media (dividido por u3 para hacer esta medida independiente de la escala de medidas) se usa para ana- lizar la simetría y asimetría de una distribución; el momento de cuarto orden res- pecto de la media (dividido entre u4) se emplea para analizar el “apuntamiento” (es decir, la forma más o menos puntiaguda de la curva). Para determinar mo- mentos respecto de la media, usualmente es más fácil expresarlos en función de los momentos respecto del origen, y calcular estos. Para momentos de segundo or- den, tenemos la fórmula:

que el lector deberá probar en la parte (a) del problema 12 de la página 60. La parte (b) del mismo ejercicio contieqe una fórmula semejante para expresar p3 en función de los momentos respecto de la media

Page 61: ingenieria

TEOREMA DE CHEBYSHEV 53

3.6 Teorema de Chebyshev

Anteriormente en este capítulo, se han expuesto ejemplos para mostrar como la desviación tipo mide la variación de una distribución de probabilidad, O sea, cómo registra la concentración de probabilidad en la vecidad de la media. Si Q es yequefia, hay una gran probabilidad de obtener valores prciximos a la media: S i a es grande, hay una gran probabilidad de obtener valores alejados de la media. Formal- mente, esta idea se expresa en el siguiente teorema:

Teorema 3.2 (Teorema de Chebyshev). Si una distribución de probabilidades tiene la media P y la desviación tipo a, la probabilidad de obtener un valor que se desvíe de la media una cantidad mayor que k veces la desviación tipo, es me- nor que l / k 2 . Simbdicamente.

P(lz - pl > ka) < 1/h2

Para probar este teorema, consideremos una distribución cualquiera definida por una función de probabilidad f(x), con media P, y variancia 2. Dividiendo la suma que define la variancia en tres partes, como se indica en la figura 3.8, tenemos

= z (z - c o Y ( 4 + 2 - P > Y ( 4 + 2 (z - d Y ( 4 R1 R¶ R,

donde R1 es la región en la que x < p - Ka, R , es la región en la que p - ku 5 x 5 p + ka, y R , es la región en Ia que z > cc + ka.

Como (x - P) f (x) no puede ser negativa, la suma anterior en la región R, tampoco será negativa y, al suprimirla la suma de los sumandos correspondientes a R , y R , será menor o igual que az, es decir,

Pero, x - p < -ha en la región Rl, y I - ~r > kuen la región RS, por lo que, en cualquier MSO, 1x - pl > ka; luego, en ambas regiones (z - p)2 > k2$. Si ahora reemplazamos (x- P ) ~ en cada sama por k2 u2, que es un número menor que. (x - P) obtenemos la desigualdad

y esto completa la demostración del teorema 3.2.

Page 62: ingenieria

54 DISTRIBUCIONES DE PROBABILIDAD

Para obtener otra forma de la desigualdad de Chebyshev, como se llama a veces la desigualdad del teorema 3.2, notemos que el suceso ]x - P!I kg es el comple- mento del suceso ]x - P I > ku ; luego,

* P(jz - pl 5 ku) > 1 - l/k2

que establece que la probabilidad de obtener un valor dentro del intervalo limitado por k veces la desviación tipo a partir de la media en uno y otro sentido es mayor que 1 - I/k2.

f (XI

V *-

4 R2 *3

Fig. 3.8 Regiones de: teorema de Chebyshev.

Desde un punto de vista teórico, la característica más importante del teorema de Chebyshev es que se aplica a cualquier distribución de probabilidad para la que existan P y u. En lo que respecta a las aplicaciones, sin embargo, esta generalidad es su mayor defecto, ya que sólo nos da una cota superior (lo que, en general, es Una información muy pobre) de la psobabilidad de obtener un valor que se desvie de la media más de k, la desviación tipo. Así, en general, podemos asegurar que la probabilidad de obtener un valor que se desvíe de la media más de dos veces la desviación tipo, es menor que 0.25, mientras que la probabilidad exacta correspon- diente de una distribución binomial con parámetros n = 16 y p = 1/2, es 0.021. Análogamente, podemos asegurar, en general, que la probabilidad de obtener un valor que se desvíe de la media más del triple de la desviación tipo es menor que 0.112, mientras que la probabilidad exacta correspondiente a la distribución de Poisson con parámetro X = 9, es 0.0024.

Un importante resultado teórico se obtiene aplicando el teorema de Chebyshev a la distribución binomial. Substituyendo p = np y u = d n p ( 1 - p ) , obtenemos

P(lz - np( > k d n p ( 1 - p ) ) < 1/kZ O

Page 63: ingenieria

TEOREMA DE CHEBYSHEV 55

después de dividir ambos términos de la desigualdad dentro del paréntesis por 11.

Si ahora substituimos por k 2'1- odtenemos,, n

de donde,

para cuaIquier e > O. Esta escuacicin expresa la ley cl>bil de los grarlcles r1rín7eros, que dice: a nleclidn que el tamalio de la muestra cwce, la pmhahilidad de que la razo'n entre el mi~nero de casos favorables y el nl ín~rro total de casos difiera de p en nuis de utla cot7sta~te positiva arbitraria, tie~lclc a cero. Nótese que, de aquí, no se puede concluir que para un FI grande el mimero efectivo de casos favorables se encuentre pr6ximo a P = np. De hecho, se puede demostrar que, aunque la proba- bilidad de que la proporcih de casos favorables difiera poco de p . se aproxima a 1, al crecer 17, la probabilidad de que el nrinfero de casos favorables difiera poco de n p se aproxima a cero.

EJERCICIOS

I . Una distribución de probabilidades tiene los valores g ( 0 ) - 16/31. g(1 i = 8/31. g ( 2 ) ==

4/31, g(3) -- 2/31 y g(4) = 1 /31 . Encontrar p y 0:. 2. Dada una distribuciiln binomial de parimetros /I 5 y p O 30, hallar ,' y u? (a) di-

rectamente dq sus dcfiniciones, utilizando las probabilidades de la Tabla I . y. ( b ) usando las fórmulas especiales de las piginas S4 y 56.

3. Dada una distribucihn hipergeométrica de parimetros r r =- 3, n = 4 y N ~ - S. determi- nar ,U y u2 (a) directamente de sus definiciones. y ( h ) crnpleando las fhrmulas especiales de las piginas 54 y 56.

4. Dada una distribución de Poisson de parametros x = 0.2. hallar p y u ( a ) dircctamcntc de sus definiciones, utilizando las probabilidades de la Tabla 11, y ( b ) usando las fhrmu- las especiales de las piginas S4 y 56.

5. Verificar que la media de una distribuci6n hipcrgcométrica de parimctros I!, A y N , csti dado por p = n . I .Sugcrcr~cict: empléese la identidad

N

r=O ( y ) ( k s. J = ("'Z h. Probar que la media de 1a.distribuciOn dc Poisson de parimctro x esti dado par p - h. 7. Encontrar la media y la varianCia.de la distribuciiln de probabilidades dada por f(.\-) -i

I/,/, con x = 1 , 2, . . ., f r . [SugcJrc.!icicr: La suma de los r r primeros enteros positivos es 1/2rz(rr -i 1 ) , y la suma de sus cuadrados 1 /6rr ( I I 4 1 ) (2rr + 1 ) 1 .

8. Construir una tabla. mostrando: ( i ) los límites superioris dados por cl tcorcma de Che- hyshev para las probabilidadcs de obtener valorcs difcrcntcs de la rncdia que dificran en más de 1, 2 y 3 desviaciones tipo. (ii) las probabilidades exactas correspondientes dc

Page 64: ingenieria

56 DISTRIBUCIONES DE PROBABILIDAD

una distribucih binomial de parámetros n = 16 y p = 1/2. ( i i i ) las probabilidades exactas correspondientes de una distribución de Poisson de parámetro = 9.

9. Usar el teorema de Chebyshev para encontrar una cota inferior de la probabilidad de que el número de caras obtenido en 16 tiradas de una moneda no defectuosa esté entre 2 y 14, inclusive. ¿Cuál es la probabilidad correspondiente exacta?

10. Emplear el teorema de Chebyshev para encontrar una cota superior a la probabilidad de que una variable aleatoria que sigue la distribución de Poisson de x = 16, tome un valor menor que 8 o mayor que 24. ¿,Cuál es la probabilidad exacta correspondiente?

11. Emplear el teorema de Chebyshev para determinar el mcnor valor del parámatro Iz de una distribuci6n binomial para la que podemos asegurar con una probabilidad mayor o igual que 0.90> que

<0.1

3.7 Distribución multinomial

Una generalización inmediata de la distribución binomial aparece cuando cada prueba puede tener más de dos casos posibles. Esto ocurre, por ejemplo, cuando el producto de un fabricante se clasifica en superior, medio, o inferior: cuando las cali- ficaciones de un estudiante se juzgan dindole una letra A, €3, C , D O F; O cuando un experimento se juzga terminado con éxito, terminado sin éxito, O inconcluso. Para tratar esta clase de problemas con completa generalidad, consideraremos el caso en que hay n pruebas independientes, permitiendo cada prueba k casos mutuamente eXClUyentes cuyas probabilidades respectivas son p , , pz, . . . , p k (con 2 pi = 1) . Lla-

mando a estos casos de primera clase, de segunda clase, . . . y de k-ésima clase, nos interesa la probabilidad f(x,, x., . . . , x k ) de obtener xt casos de la primera clase,

x2 casos de la segunda clase, . . . y xk casos de la k-é;ma clase, con 2 xi = n. Em- pleando razonamientos similares a los utilizados al establecer la ecuación de la dis- tribución binomial en la sección 3.2, se puede demostrar que la probabilidad busca- da está dada por

k

i - 1

k

a = 1 para x1 = o, 1, . . . , n, pero sujeto a la restricción de ser ,Z xi = n. La distribución

de probabilidad cuyos valores están dados por estas probabilidades, se llama distri- bución multinomial y es de observar que, para los distintos valores de las xi, las probabilidades están dadas por los términos correspondientes del desarrollo polinó- mico de (p i + p z + . . . -I- p k ) n .

Como ilustración, supongamos la probabilidad de que cierto tipo de bombillas

Page 65: ingenieria

DlSTRlBUClON MULTINOMIAL 57

EJERCICIOS

1. Un dado se tira ocho veces. ¿CuA1 es la probabilidad de obtener 3 doses, 2 cuatros, 1 cin- co y 2 seises?

2. Los ladrillos de vidrio defectuosos se clasifican en una fábrica de acuerdo con que tengan roturas .estan decolorados, o ambas cosas. Si las probabilidades respectivas son 0.50. 0.40 y 0.10, hallar l a probabilidad de que seis de entre diez de estos ladrillos tengan roturas. tres estén decolorados y uno presente ambos defectos.

3. Si las probabilidades de que un accidente de un avilin produzca daños menores, gravcs o mortales al piloto, son, respectivamente. 0.20. 0.50 y 0.10, hallar la probabilidad de que. en seis accidentes, el piloto sufra daños mortales en tres de ellos, no sufra daños en uno y sufra daños graves en dos.

Page 66: ingenieria

41 DENSIDADES DE PROBABILIDAD

4.1 Variables aleatorias continuas

Cuando introdujimos el concepto de variable aleatoria en el capitulo 3, la pre- sentamos como una funci6n con valores reales definida en el espacio muestra1 de un experimento. esto es, en el conjunto de todos los casos posibles del experimento. En l a pagina 34 ilustramos esta idea, dando el nilmero de subsistemas que fallaban cn el experimento del proyectil. asignando los nilmeros O, 1, 2 ci 3 Qsegiln el Caso) a los 18 casos posibles del experimento. Cuando las variables aleatorias pueden to- mar valores en una escala continua, es decir, si son continuas, el procedimiento es prkticamcnte el mismo. Los casos de un experimento estin representados ahora. por los puntos de un segmento de recta o de una recta, y el valor de una variable alea- toria es un nilmero asignado convenientemente a cada punto, por medio de alguna regla, convenio o ecuacicin. Cuando el valor de una variable aleatoria se da directa- mente por una medida o por una observacicin, generalmente no tiene importancia la diferencia que puede existir entre el valor de la variable, la medida que obtuvimos, y el caso que se presenta en el experimento, o sea, el punto correspondiente en el eje real. Así, si un experimento consiste en determinar qui fuerza se requiere para rom-

58

Page 67: ingenieria

VARIABLES ALEATORIAS CONTINUAS 59

per una probeta dada en un ensayo de tensidn, el resultado, por ejemplo, 138.4 li- bras, es el valor de la variable aleatoria de la que nos ocupamos. No hay una nece- sidad real. en este caso, de agregar que el espacio muestra1 del experimento está formado por todos (o parte de ellos) los puntos del eje real positivo.

Para extender el concepto de probabilidad al caso continuo, supongamos que se sabe que x, fuerza necesaria para romper una probeta dada en un ensayo de tensión, se encuentra entre las dos constantes positivas a y h. Además, suFongamos que se divide el intervalo entre u y h en 11 subintervaIos iguales de amplitud AT, que cada uno de los cuales contiene uno de los puntos x,, x-. , . ., x,!, y que la probabilidad de que la fuerza de nuestro ensayo de tensicin quede en el subintervalo que co:ltie:x xi está dado por f(x;) . Ax. Entonces, la probabilidad de que la fuerza necesaria para romper la probeta se encuentre entre a y b , o sea, l a probabilidad de que X,

valor de la variable aleatoria que estudiamos. tome un valor cualquiera en el inter- valo entre a y h. está dada por

n

i = l .?‘(a _< z 5 b) = 2 f(.J * A X

Ahora, si f es una funcicin integrable definida para todos los valores de la varia- ble aleatoria considerada (x 2 O en este caso), definiremos la probabilidad de que el valor de la variable de azar caiga entre a y h, haciendo Ax -+ O, es decir.

+ P(a I x 5 b ) = f f(x) dx + Nuestra definicicin de probabilidad en el caso continuo, presupone, entonces, la

existencia de una función f que, integrada desde una constante a a otra constante h (con b 2 u) d i la probabilidad de que la variable aleatoria tome LIII valor en el intervalo de u a h. Notemos que el valor f(x) de f no nos da la probabilidad de que la variable aleatoria tome el valor x; et7 el caso de twiahlrs cot7ti11z~z.~, lar probnhili- dades estátl dudas por itltcRralcs, y no por los valores de f. La probabilidad de q u e la variable aleatoria tome efectivamente el valor x se podría obtener considerando. en primer lugar. la probabilidad de que tome un valor en el intervalo comprendido entre x - Ax y x + Ax. Si hacemos Ax -+ O, rej;ulta evidente que l a probabilidarl de yur la variahle continua tome cualquier ~dor dudo x, cs ccro. Consecuencia inmediata es que no importa si incluimos o no los extremos del intervalo de a a h. es decir, que

zya 5 x 5 b ) = [’(a 5 x < b ) = P(a < x 5 b ) = P ( a < x < b )

El que sea cero la probabilid,ad de que una variable aleatoria continua tome cualquier valor dado x. no debe sorprendernos. De hecho, nuestra definición de pro- babilidad para variables continuas es un buen modelo para tratar con medidas u observaciones. Debido a las limitaciones en nuestra habilidad para medir, los datos cxoerimentales nunca parecerftn provenir de un espacio de muestre0 continuo. Así. aunque las temperaturas se pueden considerar como puntos de una escala continua. en realidad cualquier medida de temperatura representará un intervalo de dicha es- cala. Si anotamos una medida de temperatura de 74.8O C., Io que realmente indi-

Page 68: ingenieria

60 OENSlIjADES DE PROBABILIDAD

camos es que la temperatura se encuentra en el intervalo de 74.75 a 74.85O C., y no que sea exactamente 74.8000. . . Es importante añadir que cuando decimos que hay una probabilidad cero de que una variable de azar tome cualquier valor dado x, esto t w significa que sea in?posihle obtener dicho valor x. En consecuencia, una pro- babilidad cero no implica la imposibilidad lógica en el caso continuo. Pero esta cuestión no tiene importancia en nuestro estudio, pues sólo nos ocupamos de pro- babilidades relacionadas con intervalos, y no referentes a puntos.

Hay una interesante analogía entre la función f empleada para definir las pro- balidades de variables aleatorias continuas y la densidad p de una substancia. Con- sideremos una varilla de longitud L construida de tal forma que su densidad a una distancia x de u n extremo sea p (x), expresada en gramos masa por centímetro cilbico y supongamos que tiene una sección transversal uniforme de un centímetro cuadrado. Entonces, si cortamos una lámina deIgada de esta varilla desde x a :I' + Ax su masa será aproximadamente. p ( x ) Ax gramos masa. Cuando A.7 "-f O la aproximación p ( x ) A x de la masa de la lámina cortada irá siendo cada vez mejor aunque en el límite cuando AJ: 4 O, la masa de Ia lámina tenderá hacia cero. Debido a s u analogía a una tal función p, de densidad, llamaremos a la fun- ción f, cuya existencia admitimos al extender nuestra definici6n de probabilidad a las variables continuas, futrcicit1 de densidad de probabilidades, o simplemente, den- sidad de probablidacl. Sólo podemos hablar de masa si integramos la función de densidad entre límites apropiados, e igualmente solo podremos hablar de probabili- dad s i hacemos la correspondiente integración de la densidad de probabilidad.

Como una densidad de probabilidad integrada entre dos constantes a y b, nos da la probabilidad de que una variable aleatoria tome un valor entre esos límites, f no una función real cualquiera integrable. Sin embargo. si imponemos las condicio- nes de que

(1) f(z) 2 O para toda x dentro del dominio de f,

(2) J - !(x) tlx =: 1 "1)

se podri demostrar que los axiomas de probabilidad (con la modificación discutida en la sección 2.7) se cumplen. Nótese la similitud entre estas propiedades y las indi- cadas en la pagina 38 para las distribuciones de probabilidad.

Como en el caso de variables discretas, llamaremos F ( x ) a la probabilidad de que una variable aleatoria tome un valor menor o igual que x, y denominaremos a tal funcicin F furzcititz de I~r-or',~bilirladcs totales, y más simplemente, Juncititz de dis- tribtrcicin de la variable aleatoria. Por consiguiente, si una variable aleatoria con va- lores x tiene la densidad de probabilidad f, los valores de su función de distribución serán

+ + De esta definición, se sigue inmediatamente que

Page 69: ingenieria

VARIABLES ALEATORIAS CONTINUES 61

y, de acuerdo con el teorema fundamental del Cálculo integral,

siempre que esta derivada exista.

cuya-función de densidad de probabilidad esté dada por Para ilustrar los conceptos introducidos, consideremos una variable aleatoria

2e+ para x > O f(z) = { 0 paraz 5 0

Nótese que, aunque la variable aleatoria no puede tomar valores negativos, he- mos, extendido artificialmente el dominio de f para incluir todos los números reales. Esta es una práctica que ejercitaremos frecuentemente en este libro. También, de la gráfica de esta función, mostrada en la figura 4.1, es evidente que tiene una discon-

O 1 2

Fig. 4.1 Gráfica de una función de densidad

tinuidad en x = O; sin embargo, en realidad, una función de densidad de probabili- dad no necesita ser continua en todos sus puntos, sino sólo se necesita que sea integrable entre dos límites dados a y b (con b 2 u).

Dejamos al lector la demostración de que la función anterior satisface las dos condiciones de la página 60 y que, por consiguiente, puede ser considerado como función de densidad de probabilidad de alguna variable de azar. Vamos ahora a en- contrar algunas probabilidades relacionadas con esta variable. La probabilidad de que tome un valor entre I y 3 es

P(1 5 x 5 3) = /: 2e-2xdx = e-% - e a = 0.133

y la probabilidad de que tome un valor menor de 1 es

P(x 5 1) = /o 2 c 2 " ax = 1 - e-2 = 0.865 1

Page 70: ingenieria

62 DENSIGADES DE PROBABILIDAD

Por supuesto, esto concuerda con el valor obtenido anteriormente. TambiCn deberá notarse que esta funcl6n tie distribución es FIO decreciente y que F ( - 00 ) = U y F ( PJ ) 1. Se muestra fhcilmente que estas propiedades son comunes a todas las funciones de distribucicin.

Reemplazando por integralcs las sumas, definiremos el monzento k-Psimo res- pccto de.( origctz de u n a densidad de probabilidades, por

En particular, el momento de segundo orden respecto, de la media se denomi- n a r & nutvamente va!imcia y se denotar& por $; como antes, la variancia nos me- diri la concentraci6n (o la dispersiOn) dc una densidad de probabilidad ( o su gr i - fica), cn e! sentido de q u c da el redor medio del cLtadrado de las desviaciones a partir dc la media. Aplicando esta forma al problema anterior, vemos que el medio es

p = km x.2e-23dx = - 1 2

y que la variancia es

Se hubiera podido obtener con m8s facijidad la variancia de esta densidad de probabilidad calculando en primer lugar los dos primeros momentos respecto del origen y substituyendo despuis en la f6rmula

g2 = @; - @2

En el ejercicio :cis clue sigue, el lector deber5 probar que esta formula sirve tambiCn para el caso continuo.

Page 71: ingenieria

GlSTRlBUClON NORMAL 63

EJERCICIOS

1.

2.

3.

4.

5. 6.

7. 8. 9. 1 o.

Verificar que la funcidn dada en la pigina 66 es cfectivamente una densidad de proba- bilidad. Dada

para O < z < 1

( a ) k de tal forma que esta función sea una densidad de probabilidad i b ) P ( 1 / 4 < S < 3 / 4 )

( d ) P ( x > 0.8) (e) F ( x ) . [Sugerencia: F ( x ) se debe dar separadamente para x I O, O < .Y < I , y

Dada la densidad de probabilidad

( c , P j s < 1/2)

x ? 1.1

- x) para0 < 5 < 1 hallar

( a ) k tal que esta función sea una densidad de probabilidad. (b) F ( s ) . 1 Sugerencia: F ( x ) debe darse por separado para x 5 O, O < S < 1, y

(c) Integrando la densidad de probabilidad, ( d ) usando F j x ) Dada la densidad de probabilidad f(x) = k / (I + xz) para- r ~ i < x < 00, hallar k Comprobar que la identidad c2 = p i - p2 es válida para cualquier densidad de probabi- lidad en la que existen estos momentos. Hallar p y u2 para la densidad de probabilidad del problema 2. Hallar p y C T ~ para la densidad de probabilidad del problema 3. Hallar p y d para la densidad de probabilidad del problema 4. Demostrar que, para la densidad de probabilidad del ejercicio 5, /.ti y por lo tanto, U*,

no existen.

x 2 1 . I hallar P ( 1 / 4 < x < 1 /2 )

4.2 Distribución normal En la sección 3.4 introdujimos la distribución de Poisson como una forma

límite de l a distribución binomial cuando TL + 00 ji p --$ O siempre que tzp perma- nezca fijo en el valor X. Posteriormente, usamos la distribución de Poisson para aproxinaar la distribución binomial cuando n es suficientemente grande y p suficien- temente pequeña. Como hay muchas aplicaciones de la distribución binomial en las

Page 72: ingenieria

64 DENSIDADES DE PROBABILIDAD

que n es grande, pero p no es lo suficientemente pequeña para utilizar la aproxima- ción de Poisson, será útil investigar la forma límite de la distribución binomial cuando n --f mientras p permanece fija. Desgraciadamente, hay un obstáculo para esto, porque P = np y u2 = n p (1 - p ) aumentan ambos sin límite cuando 7~ -+ 00. Para salvar esta dificultad, haremos una simple transformación, que es la reduccio’n de la variable aleatoria o forma canónica (también se dice “estandarización” de la varia- ble aleuforia). Si una variable aleatoria toma los valores x y tiene una distribución con media P y variancia 2 , la correspondiente variable aleatoria concentrada y re- ducida toma los valores

z = - X - P U

y su distribución tiene como media cero y como variancia la unidad. Para probar esto, supongamos que la variable original sea discreta, con la probabilidad f(x) de que tome el valor x y que la media y la variancia de la distribución de la variable centrada y reducida sean pz y U:. Entonces tenemos

p . = 2 - . f (x) X ” P

todax u

1 = - [p - p.13 = o

U

= - z (1: - d 2 - f ( X ) 1

u2 toda x

1 U2

- ” . u 2 = 1

Este resultado es válido igualmente para variables continuas, lo que se prueba

Volviendo ahora a la distribución binomial, encontramos que los valores de la cambiando las sumas por integrales.

variable aleatoria centrada y reducida correspondiente están dados por

y. refiriendonos a esta variable, vamos a establecer el siguiente teorema: Teorema 4.1. Si x es un vctlor de una variable aleatoria con distrihucicin hino- mid de parún?etros n y p , y si

entonces, !u forma linde de la juncitin de distribucitin de esta variable aleatoria centrada y reducida cuando n ”+ m estú dada por

Page 73: ingenieria

GlSTRlBUClON NORMAL 65

N6tese que, aunque x toma solo los valores O, 1, 2.... 1 7 , en el límite cuando n -+ m la función de distribución de la variable centrada y reducida es continua, y la función de densidad correspondiente está dada por

Llamamos a tsta detuidad m~rrnal centrada y rcdllcida o ley de probabilidad n o r t n d centrada y reducida, y brevemente, ley nomal reducida. Su media es igual a cero, su variancia es igual a uno, y es simttrica con respecto a z = O, como se puede ver en su gráfica de la figura 4.2. La probabilidad de que una variable alea- toria que tiene densidad normal reducida tome un valor entre a y b está dada por

1 = [ e-W dz d2*

Como tales integrales no se pueden evaluar por métodos exactos, obtenemos estas probabilidades, empleando tablas especiales. La tabla 111 de la página 398 es una tabla de las áreas entre el eje horizontal y la curva de distribución normal re- ducida. es decir, los valores tabuladosson los de

para z = 0.00. 0.01, 0.02 ,... 3.49. Para hallar P(a I z 5 b), donde z es el valor de la variable con distribución normal reducida, usamos la ecuación

P(a 2 2: 5 b) = F(b) - F(a) Por ejemplo, de la tabla I11 se deduce inmediatamente que

P(0.35 5 z 2 1.65) = F(1.65) - F(0.35) = 0.9505 - 0.6368 0.3137

Hg. 4.2 Curva normal standar

Page 74: ingenieria

66 DENSIDADES DE PROBABILIDAD

Si a o b son negativos, podemos emplear la identidad

+ F ( - z ) = 1 - F ( z ) + que resulta directamente de la simetría de la distribución normal reducida, (vlanse también el ejercicio 2 de la página 74). Por ejemplo,

P ( - 1.59 5 z 5 2.07) = F(2.07) - F ( - 1.59) = F(2.07) - [l - F(1.59)] = 0.9249

Y P(-3.29 < z < -0.98) [l - F(0.98)] - [l - F(3.29)]

= F(3.29) - F(0.98) = 0.1630

Invirtiendo el proceso de reducción de la ley normal, se puede demostrar que, si z es el valor de una variable aleatoria que tiene distribución normal reducida,

x = u ' z -1- 1.1 que es equivalente a z = __ - ") es el valor de una variable aleatoria

cuya densidad est5 dada por ( U

que es la forma gcneral de la distribucicin normal. En la seccicin 4.4 probaremos que los parrimetros P y u2 de esta distribucihn, son, de hecho su media y su va- riancia.

L a distribución normal es importante en Estadística no s61o poryue da uaa buena aproximación de la distribución binomial con valores grandes de Y?, sino tam- biln porque ademris, nos da una buena aproximación de las distribuciones de da- tos encontrados en aplicaciones. Se han observado experimentalmente, que la m q o r parte de los errores de medida y una gran variedad de observaciones físicas, tienen, aproximadamente, distribuciones normales. En el capítulo 7 daremos algunos funda- mentos tekricos mis amplios de la distribucicin normal, lo que explicarh su frecuen- te aparición en la naturaleza.

Si queremos hallar la probabilidad de que una variable aleatoria con distrihu- ci6n normal de media ~r y variancia u2 tome un valor entre a y h, shlo tendremos que calcular la probabilidad de que una variable con distribucirin normal reducida tome un valor entre '2 y Así,

U U

P ( a < z < b ) = F ( b ~ ") - F ('7) donde F ( + ) y I.' (y) ' - " puede obtenerse de la tabla I l l . C'omo ilustracitin,

supongamos que la distnhuci6n de los dihmetros de los cojinetes de bolsa de cierto envío. sea aprox'imadamente, normal con una media 1.1 = 0.500 cm y una desviacicin tipo u:- 0.010 cm. Entonces, si u n cojincte es utilizable cuando su diimetro se en-

Page 75: ingenieria

DlSTRlBUClON NORMAL 67

cuentra entre 0.490 y 0.515 cm, la probabilidad de obtener un cojinete utilizable de dicho envío es

P(0.490 5 z 5 0.515) = F ( o.o1o 0.515 - 0.500) - (0.490 - 0.500) 0.010

= F(1.50) - F ( - 1.00) = 0.7745

Luego, aproximadamente el 777: de estos cojinetes se puede considerar como utilizables.

Volvamos ahora al problema para el que introdujimos originalmente la distri- bucirin normal, esto es, el de aproximar la distribución binomical cuando n es gran- de y p no es lo suficientemente pequeña para usar la aproximación de Poisson. En primer lugar, tratamos de hallar la probabilidad de obtener, copo máximo 15 dio- dos defectuosos en un lote de 100, suponiendo, a partir de informaciones anteriores, que la proporción de diodos defectuosos producidos es 0.20. Suponiendo que se cumplen las hipótesis establecidas para la distribución binomical, la respuesta exac- t a de este problema es

15 z b(z; 100,0.20) = B(l5; 100,0.20) z=o

. . 16.5

Fig. 4.3 Aprcxirnaci6n normal a la distribución binómica

Como la tabla I no incluye valores de rz tan grandes como 100, aproximare- nos esta probabilidad utilizando la distribución normal con la media p = t z p = 100 (0.20) = 20 y variancia u2 = n p (I - p ) = 100(0.20)(0.80) 16. Observemos. :n la figura 4.3, que estamos aproximando la suma de las Breas de los 16 primeros

Page 76: ingenieria

68 DENSIDADES DE PROBABILIDAD

rect6ngulo (CorreEpondientes a x = O, 1, 2. . ., 15) del histograma de la distribucidn hinomical por medio del Brea sombreada de la curva continua que aparece en la figura. Sin consecuencia, debemos hallar el Brea bajo la curva nomal que usamos como aproximacicin, no entre O y 15, sino entre - 0.5 y 15.5, o, lo que práctica- mente es lo mismo. entre - y 15.5. Haciendo esta corrcccitin de corztirllridatl, obtenemos

B(l.5; 100,0.20) N F 15.5 - 20

= F(-l.l3) = 0.1292 que se encuentra muy pr6ximo al valor exacto B(15; 100, 0.20) = 0.1255. La mis- ma clase de aproximacicin se puede usar para la probabilidad de que x sea exacta- mente 15 en el ejemplo precedente. Haciendo la correccitin de corrtinuidad, rcpre- sentando en este caso el suceso x = 15 por el suceso equivalente 14.5 5 x 5 15.5. obtenemos

b(15; 100,O.") = F ( ' y ) - .( 4 ) 15.5 - ''O 14.5 - 20

= F("L.13) - F(-1.38)

= 0.0454

lo cual estri muy cerca del valor exacto b(1S; 100, 0.20) --. 0.481. N6tese que, sicm- pre que la distribucicin normal se emplea para aproximar la distribucicin bin6mica. cada x se substituye por el intervalo correspondiente de x - 1 / 2 a A + 1 /2. Esta es la c,orwcci(>r1 de continuidud a la que nos hemos referido en los ejemplos anteriores.

Page 77: ingenieria

OTRAS DENSiDADES DE PROBABILIDAD 69

verificar la identidad P(a 5 Z 5 b) dada en la página 72.

h. Dada una variable aleatoria con distribución normal con p = 100 y u = 20, hallar la probabilidad de que tome un valor (a , menor que 97.3, ( b ) mayor que 110.0, (c) entre 112.1 y 115.8, ( d ) entre 95.6 y 104.4, fe) entre 81.3 y 92.9, ( f ) menor que 87.3 o mayor que 108.5.

llar la probabilidad de que tome un valor ( a ) mayor que 17.0, (d) menor que 9.2 o mayor que 15.7. i b ) menor que 11.3, (c) entre 10.1 y 14.9,

p = 0.40, usa una distribucibn normal apropiada para aproximar la probabilidad, (a) P j s = 10).

y comparar con los valores correspondientes de l a tabla I.

(a ) mis de 220 ‘‘caras”, ib ) cualquier número de “caras”, desde 185 a 21 5 inclusive?

10. Si se tira 600 veces un dado, hallar la probabilidad de que el número observado de seises difiera dcl número esperado en más de 15.

11. La probabilidad de que cierta clase de componentes se estropee en 1 000 horas, o antes, es 0.25. Utilice la aproximación normal para hallar la probabilidad de que menos de 30 de entre 100 de estos componentes se estropeen en 1 000 horas, o antes.

12. Para cierto trabajo, se especifica que se deben emplear arandelas con un diámetro inte- rior de 0.250 t 0.005 pulgadas. Si los diámetros interiores de las arandelas hechas por ciertos fabricantes se distribuyen normalmente con p = 0.251 y u = 0.003, ¿qué porcen- taje de estas arandelas cubren las especificaciones?

13. Un estudio demostrb que los tiempos de vida de cierta clase de baterías de autornóvii se distribuyen normalmente con una media de 1248 días y una desviación tipo de 185 días, Si un fabricante desea garantizar sus baterías por 36 meses (se tomarán meses de 30 días), ¿,qut‘ porcentaje de baterías deberán ser czmbiadas, estando aún en vigor la garantia?

7. Dada una variable aleatoria con distribucibn normal de media 12.8 y variancia 6.25, ha-

8. Si S es un valor de una variable aleatoria con distribucibn binomial con n = 20 y

( b ) P j x I 1 2 ) ,

9. Se arroja 400 veces una moneda no defectuosa. ¿Cuál es la probabilidad de obtener,

4.3 Otras densidades de probabilidad

E n la aplicación de la Estadística a problemas de Física e Ingeniería, encontra- remos muchas densidades de probabilidad diferentes de la distribución normal. Entre Cstas están las distribuciones t. F y chi-cuadrado, las distribuciones de muestre0 fun- damentales que introdbciremos en el capítulo 7 y las distribuciones exponencial y de Weibull, que aplicaremos a problemas de seguros y vida en el capitulo 16. En esta sección, discutiremos tres distribuciones continuas, la distribucicin uniforme, la dis- tribucitin logaritmica norma!, y la distribucicin gamma, con el doble propósito de jar más ejemplos de densidades de probabilidad y de establecer un fundamento para iplicaciones futuras.

Page 78: ingenieria

70 DENSIDADES DE PROBABILIDAD

La distrihucith uniforme, con parhmetros a y f i , se define por la ecuacirin: 1; para a < x < p f(.) = B -

por otra parte

y su grlifica se muestra en la figura 4.4 N6tese que todos los valores de x, dcsrle CY

hasta /3, son ”igualmente posibles” en el sentido de que la probabilidad de que x se encuentre en un intervalo de anchura Ax contenido completamente en el inter- ~ a l o entre CY y 0, es igual a Ax/ ( /3 - a ). independientemente de la localiza- ci6n exacta del interva!o.

Fig. 4.4 Funci6n de densidad uniforme

Para dar un ejemplo físico que puede tener una distribucicin uniforme, supon- gamos que una rueda de una locomotora tiene radio Y y que x es la situaci6n de tin

punto en su circunferencia medido sobre Csta desde un punto de referencia O. Cuan- do se aplican los frenos, a l g h punto hará contacto con el riel, deslizándose sobre él, y habd un gran desgaste en ese punto. En aplicaciones sucesivas de los frenos. será razonable suponer que x es un valor de una variable de azar con distribución uniforme en la que Q = O y B = 2 7 Y. Si esta suposición fuese incorrecta, esto es, si algunos puntos de la rueda hicieran contacto más frecuentemente que otros, la rueda acabaría por presentar “partes aplanad,as” o se ovalaría por el desgaste.

La distrihucitin logaritmica normal se presenta en la prhctica siempre que en- contramos una variable aleatoria tal que su logaritmo tiene una distribución normal. Esta función de densidad de probabilidad está dada por:

por otra parte donde “In x” es el logaritmo natural de x. En la figura 4.5 se muestra una gráfica de la distribucibn logaritmica normal con a = O y p = 1, y en ella se puede ver que esta distribución es sesgada positiva.

Page 79: ingenieria

OTRAS DENSIDADES DE PROBABILIDAD 71

f

Fig. 4.5 Función de densidad logaritmica normal

Para encontrar la probabilidad de que una variable aleatoria de distribución lo- gasitmica normal tome un valor entre a y b (O < a < b) , escribimos

Cambiando variables al hacer y =In x, y por consiguiente, dy = dx, ob- tenemos

y podemos ver que esta probabilidad es igual a la probabilidad de que una variable aleatoria con distribución normal con P = a! y u = p tome un valor entre In a y In 6. Luego.

P ( a < x I b ) = F (In - bp- - F (7) h a - CY

donde F ( z ) es la probabilidad de que una variable aleatoria con distribucicin normal reducida tome un valor menor o igual que’z.

Como ejemplo de aplicación de la distribución logarítmica normal, supóngase que una serie de experimentos ha demostrado que la ganancia de corriente de cier- tos transistores (la cual es proporcional al logáritmo de Z<,/Zi, razcin de la corriente de salida a la corriente de entrada) sigue una distribución normal. Si la ganancia de corriente se mide con unas unidades tales que se iguala a In (Z<,/Zi), y si está distribuida normalmente con P = 2 y U? = 0.01. ‘entonces, ‘la probabilidad de que Zo/f;, .que tiene ahora una distribucicin logaritmica normal; tome un valor entre 6.1 y 8.2. está dada por

Page 80: ingenieria

72 DENSIDADES DE PROBABILIDAD

= P(1.0) - F("2.0)

= 0.8183

Varias densidades de probabilidad importantes que estudiaremos más adelante son casos especiales de la distribucicin gamma, cuya ecuación está dada por

por otra parte donde r(a) es un valor de la funci(in gamma, definida por

rya) = /b" za-1e-Z c~z

Integrando por partes, tenemos

q C r ) = (a - l)r(a - 1)

para cualquier a > O, y, por consiguiente, r(a) = (a - l)! cuando a es un en- tero positivo.

En la figura 4.6 se muestran varias gráficas de distribuciones gamma y se ve que son sesgadas positivas. De hecho, la oblicuidad decrece al aumentar a para cualquier valor fijo de 0.

La distribución especial gamma con a = 1 se llama distribucidn exponencid y se utilizci como una ilustración en la página 61 con p = 1/2. La distribución ex-

1-

I

O 1 2 3 4 5 6 7 x

Fig. 4.6 Fuciones de densidad gamma

ponencia1 se emplea en problemas de tiempos de espem, esto es, las intervalos de tiempo entre la aparición de dos fenómenos por cierta clase y la estudiaremos con más detenimiento en los capitulos 5 y 16.

Page 81: ingenieria

MEDIAS Y VARIANZAS DE DISTRIBUCIONES ESPECIALES 73

4.4 Medias y varianzas de distribuciones especiales

En esta sección deduciremos fórmulas para determinar la medida y la variancia de las distribuciones introducidas en las últimas dos secciones. Primero, vamos a demostrar que los parámetros P y u2 de la distribución normal dados en la página 66, son, efectivamente la media y la variancia de esta distribución. De acuerdo con la definicih de media, tenemos que la media de la distribución normal es

que, haciendo z = (x - P) / u, 1 7z

se transforma en

/Im (zu + p)e-Z*/2 dz

Como el integrando de la primera integral es una función in?par, la integral de - 03 a Q) es igual a cero: la segunda integral es p veces el área entre el eje horizon- tal y una curva de distribución normal reducida y, por lo tanto, igual a p .1= p. De esta forma, hemos demostrado que el parámetro ir de la ecuación de la distribución normal es, efectivamente, la media de esta distribución. En el ejercicio 6 de la página 75, el lector deberá demostrar, por medios semejantes, que el parimetro u2 en la ecuación de la distribución normal es la variancia.

Valviendo ahora a la distribucicin unifornze, encontramos, por substitución di- recta, que su media es

Para hallar la variancia de esta distribución, haremos uso de la formula a2 = & - p2, y obtendremos.

que, haciendo y = In x, se convierte en

Page 82: ingenieria

74 DENSIDADES DE PROBABILIDAD

Esta integral se puede resolver completando el cuadrado en el exponente y- (y - a ) 2 / 2 p 2 , obteniendo así un integrando que tiene la forma de una densidad nor- mal. El resultado final, que el lector deberá verificar en el problema S de la página S 1 es

= ea+B2/2

Análogamente, pero de una manera más larga, los cálculos nos llevan a u2 = e2a+P(eP* - 1.)

que es la variancia de l a distribución logaritmica normal. En relación con el ejemplo de la página 78, la media de la distribución logaritmica normal con (Y = 2 y

= 0.1, es p = ez+(O.O1)/2 = 7.4

y su variancia es

u2 3 e4+(0.01)(eO.01 - 1) = 0.56

La media y la variancia de la distrihucicirt gamma se obtienen usando la función gamma y las propiedades especiales de ésta que mencionamos en la página 72. Para la media obtenemos

Por métodos, semejantes, se puede demostrar que la variancia de la distribución gamma esta dada por

u2 = ap como la distribucicin expotretrciul se definió como caso especial de distribución gamma en la que a = 1, vemos que, para esta distribución,

1 = u = p

EJERCICIOS

1. Hallar la función de distribucibn corespondiente a la densidad uniforme de la P&ina 70. 2. Si una variable aleatoria tiene una distribución logaritmica normal cona = -2 Y B = 2,

hallar: ( a ) La media y la desviaci6n tipo de esta distribución (b) La probabilidad de que esta variable torne un valor entre 4.5 Y 9.8.

probabilidad de que tome un valor entre 1.8 Y 11.1 3. Si una variable aleatoria tiene una distribución gamma con a = 2 Y 0 3, hallar

4. Probar que T ( a ) = (a - l)r(a - 1). 5. Hallar la funcih de distribuclh correspondiente a la densidad exponencial

Page 83: ingenieria

DENSlCiAD DE PROBABILIDAD CONJUNTA DE VARIAS VARIABLES 75

6.

7.

8.

9.

10.

11.

12.

13.

por otra parte

Utilizar el resultado para hallar la probabilidad de que una variable aleatoria con esta distribución tome valores mayores que 2s. Verificar que el parámetro u2 de la expresión de la densidad normal de la página 66 es efectivamente, su variancia. Comprobar que la densidad normal tiene un máximo relativo en x = p y puntos de inflexíh en x = p t u. Verificar la expresibn dada en la pBgina 74 para la media de la distribución logaritmica normal. VeriEiuar que para la distribución gamma definida en la pagina 72 la variancia está dada por u2 = a*O2. Una variable aleatoria tiene una distribución beta, si su densidad está dada por

- x)@" p a r a 0 < x < 1 por otra parte

donde CY > O y p > O. Hallar k para el caso especial en que cy = 12 y @ = 2. Hallar. además, p y a2 para esta distribución beta especial. Una variahle aleatoria tiene una distribución de Weibull si su densidad esti dada p w

k-x@-le-a' para x > O f ( 4 = {o por otra parte

Hallar k, p y u2 en función de o! y p. En cierta área, el consumo diario de electricidad (en millones de kilowatt-hora) se pue- de tratar como una variable aleatoria con distribución logaritmica normal con o = 3 "2 y p = 1/2. Si la planta motriz que abastece esta Area tiene una capacida diaria dc 10 millones de kilowatt-hora, ¿Cuál es la probabilidad de que este abastecimiento sea insuficiente en un dia dado? Supongamos que las vidas de servicio de ciertas unidades semiconductoras tienen una distribución de Weibull con parámetros o = 0.005 y = 0.50 (ejercicio 11). Si 10 de estas unidades se ponen a prueba, determlnar la probabilidad de que al menos S estén en servicio satisfactorio al cabo de 40.000 horas.

4.5 Densidad de probabilidad conjunta de varias variables

Hay muchos experimentos en los que la descripción de los casos que pueden pre- sentarse está dada por los valores de varias variables aleatorias. Por ejemplo, pode- mos medir la altura y el peso de un individuo; el volumen, presión, y temperatura de un gas; o el espesor, color y resistencia a la compresión de una pieza de vidrio. Si x,, x., ... . x k son los valores de k variables aleatorias, diremos que una función f con valores ,reales /(xl, x2. . dk), es Ia demidad de probabilidad corljutzta corres- pondiente a dichas variables, si la probabilidad de que al _< x1 _< b l . up < x2 _< b,, . . . y ak '2 z k 5 bk está dáda por la integral múltiple.

o1 Ib' . m . . jbb . f (X1, ab 22, . . . , xk) dxl dx2 . . . dXk

Page 84: ingenieria

76 DENSIDADES DE PROBABILIDAD

Nótese que, si f(xl, xz, . . ., Xk) 2 0 para todos los Valores de xl, XZ. . ., X k

para los que la densidad de probabilidad está definida, y

esta definición es compatible con los axiomas de probabilidad modificados que vi- mos en la sección 2.7.

Designando por F ( x l , x2, . . ., xk) la probabilidad de que la primera variable aleatoria tome un valor menor o igual que xi, la segunda menor o igual que x:, . . . , y la k-ésima menor o igual que Xk, diremos que tal funci6n F es la funcicin de diS- tribucicin conjutltu de las k variables.

variables dada por Como ilustración, consideremos la densidad de probabilidad conjunta de dos

f(x1, x21 = 2z1-3z3 para x1 > O , x2 > O

en el resto La probabilidad de que la primera variable tome un valor entre 1 y 2 mientras

que l a segunda lo hace entre 2 y 3, está dada por

\23 Ge-2zl-3n dxl dxz = (e” - e-4)(e-6 - e-9)

= o.ooo3 y la probabilidad de que la primera variable tome un valor menor que 2, mientras la segunda tiene uno mayor que 2, está dada por

/o” /2” 6e-2z1-3zr dzl dxz = (1 - e-4)e-6

= 0.0025

Además, la función de distribución conjunta de este par de variables está dado por

F(z1,22) = { ff’ 6e-2u-3u du dv para z1 2 O , x2 2 O

O por otra parte

F(x1,xz) = {I: - e-2z1)(1 - e-3z9 para $1 2 O, x2 2 O por otra parte

De acuerdo con la definición de independencia dada en el capitulo 2, diremos que las k vuricrhles deutorius son (estocasticamente) independientes si, y d o si,

F(z l , 2 2 , . . , xk) = Fl(x1) *FZ(zz). . ‘F(xk)

para todos los valores de x,, x-, . , . mi,. para los que están definidas las funciones, siendo Fi(x i ) para i = 1, 2, . . . k el valor correspondiente de la función de distri- bución de la variable aleatoria i-ésima. Inmediatamente se deduce de esta definición que. si k variables son independientes, cualquier valor de la densidad de probabili- dad conjunta de la6 k variables es igual al producto de los valores de las densidades de probabilidad de las variables individuales. En otras palabras,

Page 85: ingenieria

DENSIDAD DE PROBABILIDAD CONJUNTA DE VARIAS VARIABLES 77

f ( X 1 , . * * , X k ) = f l ( X l ) . f i ( X 2 ) - . . . * f k ( X k )

donde fi (xi) para i = 1, 2, . . . k es el valor correspondiente de la densidad de pro- babilidad de la i-ésima variable. En el ejemplo numérico considerado, nótese que las dos variables son independientes.

En general, la densidad de probabilidad de la i-ésima variable se puede obtezer a partir de la densidad conjunta integrando respecto todas las demás variables, o sea,

Llamaremos a fi(xi) densidad marginal de la i-ésima variable. Por ejemplo, en el anterior la densidad marginal de la primera variable está dada por

para xl > O, y f , (x,) == O en el resto. El siguiente. es otro concepto de importancia al tratar con k variables aleatorias.

Si una varidble aleatoria toma el valor g(xl, x?, . . . xk) cuando las k variables alea- torias toman los valores xl, xz, . . . Xk, entonces, el promedio, o media, de la prime- ra variable se define por la Integral

Por eje~nylo, si nos inreresa el valor promedio del producto de las dos variables del problema numérico antes citado, obtenemos

EJERCICIOS 1. Dos variables aleatorias tienen la densidad conjunta dada por

4xy pgra O < x < 1; O < y < 1 9) = {o en el resto

(a) Hallar la probabilidad de que 0 5 .I: 5 1/2 Y 1/8 5 Y 5 li4. (b) Hallar la probabilidad de que y > X.

2. Dos variables aleatorias tienen la densidad conjunta dada por

f(x, Y) = {o k(x2 + y*) para O < c < 3, 1 < y < 6 cn el resto

( a ) Hallar k. ( b ) Hallar la probabilidad de que 1 < x < 2 y 2 < g < 4. (c) Hallar la probabilidad de que 2 5 x 5 3. ( d ) Hallar la probabilidad de que x + > 5.

3. Tres variables dc azar ticncn la densidad de probabilidad conjunta dada por

Page 86: ingenieria

78 DENSIDADES DE PROBABILIDAD

( a ) Hallar k . ( b ) Hallar la probabilidad de que L < g y z < 1. (c) Hallar la probabilidad de que z > 3.

( a ) Encontrar una expresión para l a función de distribución de la primera variable. !b) Encontrar una expresión para la función,de distribución de la segunda variable. (c) Demostrar que las dos variables son independientes.

( a ) Hallar una expresidn para l a función de distribución de la primera variable. ( b ) !fallar una expresión para la función de distribución de la segunda variable.

4. Con respecto a la densidad conjunta del ejercicio I ,

5. Con respecto a la densidad conjunta del problema 2,

(c) Demostrar que las dos variables son independientes. h. Un par de variables tienen “distribución normal circular” si su densidad conjunta está

dada por

para --m < %I < 30 y --so < x2 < m . (a, Si PI = 1, p? = -3, y u = 10, utilice la tabla 111 para determinar la probabilidad

de que ”14 < x1 < 16 y--Y < x2 < 15. (b) Si p1 = 11.2 = Oy u = 4, hallar la probabilidad de que (x,, xz) este contenido en la

región entre los círculos .r: + .ri = 4 yr: + .r$ = 16.[Suyerencia: Usar coordenadas polares. ]

7. Una bomba dirigida hacia un punto que sirve de blanco, tiene un área de destrucción con radio de 400 pies (122 m). Empleando el blanco corno origen de un sistema de coorde- nadas rectangulares, sup6ngase que las coordenadas Íx, y ) del punto en que hace impacto la bomba son los valores de un par de variables de azar que tienen una distribución nor- mal circular con = ~2 = O y u = 250 pies. (Ver problema 6) . ¿Cuál es la probabili- dad de que el blanco sea destruido‘!

8. Con respecto a la densidad conjunta del problema 1, hallar el valor promedio de la va- riable aleatoria cuyos valores estin dados por g(s, y) = z + y.

9. Con respecto a la densidad conjunta del problema 2, hallar el valor promedio de la va- riable aleatoria cuyos valores estin dados por g(.c + y) = xzy.

10. Si las medidas de altura y anchura de un rectingulo tienen la densidad conjunta,

io en el resto

hallar la media y la variancia de la distribución correspondiente del área del rectángulo.

Page 87: ingenieria

APLICACIONES A LA 5 INVESTtGAClON OPERATIVA

5.1 Introduccith

El desarrollo en las últimas décadas ha traído como consecuencia el fIorecimien- to de una nueva tecnologia que es en parte Matemática, en parte Estadística, en par- te Ingeniería y en parte algo nuevo. Se ha denominado lnvestigacidn operativa y se puede definir como la aplicación de las técnicas científicas modernas a problemas que tratan de la operación de un sistema considerado en su conjunto -por ejem- plo, el desarrollo de una guerra, la dirección de una empresa, la producción de un artículo, la planificación econ.ómica, etc.

Entre los temas de estudio incluidos normalmente bajo el título de Investiga- ción operativa, encontramos temas tales como la manera de tomar decisiones “cien- tíficas”, la teoria de los juegos, la programación lineal, la teoría de los procesos de azar, los métodos para tratar los problemas de inventario, localización, transporte, Y otros. En este breve capítulo estudiaremos algunos de estos métodos como aplica- ciones particulares de la teoria desarrollada en los caDítuloS anteriores.

79

Page 88: ingenieria

80 APLICACIONES A LA INVESTIGACION OPERATIVA

5.2 La esperanza matemática y la toma de decisiones

Muchos problemah de cie:ncia. ingeniería y direccitin de negocios son de tal in- dole que los resultados (o consecuencias dz las acciones tomadas) esta11 sujetos al azar. Supongamos. por ejemplo. que. en la fabricdcicin de cierto producto. el costc) u!litario es de S 13. una unidad en buen estado, se puede vender en $ 17. la probabi- lidad de producir una unidad defectuosa es 0.20. -y una unidad defectuosgw pierde totalmente. Luego. considerando 1 0 s beneficios. cada unidad fabricada representa una ganancia de $ 5 o una perdida de 12 (o sea. ur.a ganancia de - $ 12).

Esta informaci6n. en sí. no nos permite decidir si conviene o no fabricar el pro- ducto. pero nos ayudar5 en una decisicin de este tipo.

Notemos. por ejemplo. que alrededor del 80'; de las unidades representan una ganancia de !$ 5. y alrededor del 20') de las unidades representan una perdida de 5 12, en consecuencia. a la larga. hay una ganancia media de j(0.80) - 12(0.30) =

b 1.60 por unidad. Hemos obtenido este valor multiplicando cada caso posible (la ga- nancia de S dcilares o la pérdida de 12) por la probabilidad correspondiente, y Ilama- tnos a este resultado t d o r c~.sperudo del beneficio o. simplemente, beneficio esperado. Comparando el metodo de medir tal valor esperado con la definicicin de !J que vi- mos en la pagina 49. observamos que cl t~rlor rsprrudo (le uttu l*nriahlr alentorin es .virlrplctlwtzte ltr tnrrlitr de s u tlistrihucicit1 ~ I P prohuSilidurles

Para dar otra ilustracitin del c5lculo de u n valor esperado. supongamos que una Iirma de ingenieros tiene la tarea de preparar una propuesta para u11 contrato de investigacitin: el costo de la preparacih de la propuesta es $ 5 000. y se supone conocido que los beneficios brutos potenciales de !$ 30,000, !$ 20300. !$ 10,000 6 $ 0. tienen probabilidades de 0.20. 0.50. 0.20 y 0.10. respectivamente, en el supuesto de que la propuesta se acepte. Partiendo de que la probabilidad de que se acepte la propuesta es 0.30. vemos que hay una probabilidad de (0.30) (0.20) = 0.06 de ob- tener u n beneficio neto de $ 25.000 $ 30.000 (menos el costo de la propuesta). Aná- logamente, las probabilidades de obtener beneficios netos de $ 15.000 y de $ 5,000 son. respectivamente, (0.05) (0.30) = 0.15 y (0.20) (0.30) y 0.06. mientras que la probabilidad de una pcrdida de S 5,OOO es (0.10) (0.30) 4~ 0.70 -L 0.73. teniendo presente la posible eventualidad de que la proposicicin no se acepte. Entonces, nos encontramos en la situacidn descrita en la tabla siguiente:

(25,000)(0.06) + (15,000)(0.15) + (5000)(0.06) - (5000)(0.73) = $4'00

Si es. o no, prudente arriesgar $ 5.000 para obtener una utilidad esperada de N 400, no es cuesticin estadística. Si una compañía tiene capital y sdo puede ha- cer unas pocas propuestas de este tipo, el 73'; de oFortunidades de perder S 5,000 puede haLer de esto una aventura nada atractiva. Por otra parte, si una compañia

Page 89: ingenieria

LA ESPERANZA MATEMATICA Y LA TOMA DE DECISIONES 81

tiene un capital muy fuerte y prepara muchas de estas propuestas, puede tener senti- do aceptar el riesgo. por la promesa de la devolucitin esperda del 8% de la inver- sicin inicial.

En el ejemplo que sigue, se usan los valores esperados para determinar las con- diciones bptimas de un problema típico de inventario. Supongamos que se conoce. por experiencias pasadas, que la demanda diaria de cierto producto perecedero tiene la siguiente distribucitin de Probabilidad

Número de orden I 3 4 5

Probabilidad ’ 1 0.05 0.12 0.20 0.24 0.17 0.14 0.08 I

El costo de cada unidad es de $ X (incluyendo el costo de su transporte y almace- namiento), y se vende a 5 SO, y si una unidad permanece en el glmacén. pasado un día representa su perdida total. A partir de esta informacicin, se trata de determinar cuántas unidades deberán almacenarse cada dia para que e/ beneficio esperado sea illú.xifllo.

Con tres unidades almacenadas, el beneficio en dólares es. obviamente, 150 me- nos 105 = 45. ya que hay una probabilidad de 1.00 de que la demanda sea de tres unidades o más. Con cuatro unidades almacenadas, hay una probabilidad de 0.05 de que exactamente tres unidades puedan ser vendidas, una probabilidad de 0.95 de que la demanda sea de cuatro o más y. por consiguiente. hay un beneficio espe- rado de

150(0.05) + 200(0.95) - 140 57.50

Análogamente, con cinco unidades hay una probabilidad de 0.05 de que exac- tamente se vendan tres unidades, una probabilidad de 0. 12 de que se veldan exacta- mente cuatro unidades. una probabilidad de 0.83 de que la demanda sea de 5 9

o más y. por consiguiente. el beneficio esperado es

150(0.05) + 200(0.12) + 250(0.83) - 175 = 64.00

Continuando de esta manera, podemos ver que el beneficio esperado con seis unidades es $ 60.50, con siete unidades $45.00, etc.: por lo que el beneficio esperado alcanza su máximo cuando hay cinco unidades en el almacén (viase también el ejercicio 6 de la página 83).

En años recientes, los valores esperados (la esperanza matemúticu, como tam- biOn se llama) han venido .ocupando una posición cada vez más importante en la toma “científica” de decisiones. Como hemos indicado en el ejemplo de la pági- na 80, no sirven como criterio Único para tomar decisiones, pero dan una informa- ción muy importante para tomar las decisiones de una m’anera racional. Como ótra nueva aplicación, observemos cúmo se pueden utilizar los valores esperados para seleccionar la acción más ventajosa de un conjunto continuo de alternativas. Supon- gamos que un ingeniero puede escoger la velocidad del trabajo de una máquina troqueladora automática de manera que haga r operaciones por hora, pero ocurre

Page 90: ingenieria

82 APLICACIONES A LA INVESTIGACION OPERATIVA

que la proporción de operaciones defectuosas p aumenta con r. Hay una utilidad de $ 1.00 por cada operación efectiva de la máquina, y una pérdida de $20.00 por cada operación defectuosa, y sabemos, por experiencias pasadas, que, para un núme- ro fijo r de operaciones por hora, la distribucih de probabilidad correspondiente al número p de operaciones defectuosas es, aproximadamente,

(O.OO1)rpo~oolr-l para O < p < 1 por otra parte

Con el objeto de encontrar la velocidad r que da mayor utilidad, determinare- mos primero el beneficio esperado por hora para un valor dado de r, utilizando la fórmula de P de la página 62 en lugar de la dada en la página 49. Para valores fijos de r y p , el beneficio horario es

(l.OO)r(l - p ) - (20.00)rp = r ( l - 21p)

por lo que, para r fija, el beneficio esperado por hora es

/d r (1 - 21p)f(p) d p = /d r(1 - 21p)(o.o01)rp0.~1~--1 d p

1000~ - 20r2 1000 + r

Finalmente, derivando con respecto a r e igualando a cero la expresión resul- tante, el beneficio esperado horario tiene un máximo cuarldo r = 25 y, para esta velocidad de troquelado, el beneficio esperado es de 12.10 $ por hora.

Hay esencialmente dos limitaciones prácticas para aplicar los métodos de toma de decisión ilustrados en esta sección: primero, debemos tener la posibilidad de asig- nar “valores contables” a los distintos casos que se pueden presentar, y segundo, de- bemos tener la información adecuada sobre las probabilidades correspondientes a dichos casos. El problema de asignar valores contables a los diferentes casos puede ser mucho más complicado que en los ejemplos citados. Por ejemplo, un oficial de la Fuerza Aérea tuvo que tomar la decisión de cuántos bombarderos se debían man- dar contra un blanco determinado; fue muy difícil dar valores contables para la des- trucción del blanco y para la pérdida de un bombardero y su tripulación por la ac- ción del enemigo. Para el valor contable del bombardero y su tripulación, fue nece- sario tener en cuenta los costos de gestión y entrenamiento, además del inestimable costo de la vida humana.

También, puede ser igualmente difícil la especificación de las probabilidades para los diversos casos. En el ejemplo anterior, postulamos cierta distribución para la proporción de operaciones defectuosas con una velocidad r. En la práctica, se hubiera requerido un gran ncmero de experimentos para descubrir tal distribución y, aún asj, sólo se hubiera conseguido una estimación (o una aproximación). Aun- que la experiencia pasada se puede aprovechar frecuentemente para estimar las dis- tribuciones de probabilidad (como hemos hecho en muchos.de nuestros ejemp!os), hay ocasiones en que esto conduce a caer en juicios subjetivos. Por ejemplo, e3 el

Page 91: ingenieria

LA ESPERANZA MATEMATICA Y LA TOMA DE DECISIONES 83

problema de la página 80, que trata de la propuesta de investigación, resulta extre- madamente difícil estimar la probabilidad de que una propuesta determinada se acepte. Esto no depende únicamente de la calidad de la propuesta, sino de muchos otros factores desconocidos, tales como la calidad y el número de propuestas de competidores, así como de la política seguida For la empresa a la que se presenta el proyecto. La estimación de 0.30, en nuestro ejemplo, es puramente subjetiva, ba- sándose sólo en el “sentimiento” de algún ejecutivo por su propia experiencia. Aun- que estas estimaciones de probabilidades no carecen de valor (presentándose en la misma situación y con la misma información) dejan abierta la posibilidad de que diferentes individuos lleguen a diferentes decisiones “ciptimas”.

EJERCICIOS

1. Un lote de 50 partes, entre las cuales hay 8 defectuosas, se Pone en venta ’Tal Como ’ sin permitir ninguna inspección. Si una parte defectuosa representa una Pérdida total de su precio de $ 12.50, y una parte en buen estado se puede revender a $ 14.509 Les conve- niente comprar una de dichas partes (seleccionándola al azar)?

2. En un sorteo de lotería habrh cinco premios consistentes en: $1,000 el primero, $500 el segundo, $300 el tercero y $100 el cuarto y el quinto. Si se venden 1,500 boletos, ¿Cu&l es el valor de cada uno?

3. La siguiente es una variante de un problema clasico del dlculo de probabilidades, Dos personas apuestan $ 8 cada una para jugarlos a “volados”. El ganador (que se llevará todo el dinero) sera el que gane 3 de 5 tiradas de la moneda. Por alguna razón, el juego se suspende después de la primera tirada, la cual fue ganada por el jugador A. (a) Dibujar un diagrama ramificado para demostrar que, después de haber ganado la

( b ) ¿Cómo deberln repartirse el dinero los dos jugadores, después de esta primera .tirada? 4. Si dos equipos de beisbol son igualmente eficientes, las probabilidades de que la Serie

Mundial termine en 4, 5, G ó 7 juegos, son, respectivamente, 1/8, 1/4, 5/16 y 5/16. ¿Cuál es la duración esperada (en número de juegos) de esta Serie Mundial?

5. Probar cierta parte de una máquina cuesta $ 50. Si en la máquina se instala una de estas partes defectuosas, la reparación costara $ loOO. ¿Sed ml conveniente instalar la parte sin probarla si se sabe que el 3% de todas las componentes producidas son defectuosas? $3 el porcentaje es del 656?

6. En el ejemplo de la plgina 81, verificar que los beneficios esperados para 6 y ’r unidades, soh, respecdivamente, $60.50 y $45.00.

7. Un comerciante puede comprar un? unidad en $2.10 y venderla en $4.50. Las probabili- dades de una demanda de O, 1, 2, 3, 4, ó “5, o niá$' unidades, son respectivamente, 0.05, 0.15, 0.30, 0.25, 0.15 y 0.10. Calcular los beneficios esperados, almacenando O, 1.. 2. 3. 4 6 5 unidades y determinar cuantas se deben almacenar para lograr el mziximo beneficio esperado.

8. Se emplean n vendedores para una campaña de ventas de puerta en puerta, el volumen bruto de ventas en miles de dólares se puede considerar como una variable aleatoria de distribución gamma con parametros a = 1W&y p = 1/2. Si los costos de ventas por vendedor son de $ 5 OOO, jculntos vendedores se deberin,emplear para lograr un maximo de utilidad?

9. IJna persona ha observado, por prop/a experiencia, que la oferta mínima para ufi trabajo de construcción se puede c w e r a r ‘como una variable aleatoria de densidad uniforme,

primera tirada, la probabilidad de ganar del.jugador A es 11/16.

Page 92: ingenieria

84 APLICACIONES A u\ INVESTIGACION OPERATIVA

(O por otra parte

donde C es su propia estimación del costo de la obra. ¿Que porcentaje debe añadir a su costo estimado, al someter s u oferta, lograr un mlximo en su utilidad esperada?

10. Una compañia alquila una computadora por períodos de f horas, a raz6n de $400 la hora El número de veces que la computadora se estropea durante r horas es una variable

I aleatoria de distribución de Poisson con X = (O.L() t , y si este número de fallos es x, cues- ta $ 5 0 . ~ 2 volverla a poner en marcha. ;Cbmo debe seleccionar la compañía el tiempo I,

para lograr el máximo de beneficios esperados? [Sugerencia: Usar los resultados de la seccibn 3.5. ]

5.3 Procesos aleatorios

Hablando en general, el término ‘‘proceso aleatorio” se emplea en relación con procesos fisicos que están completa o parcialmente controlados por cierta clase de mecanismo de azar. Se aplica a series de tiradas sucesivas de una moneda, a medi- das repetidas de la calidad del producto de un fabricante sacado de una línea de montaje, a las vibraciones de alas de aviones, al “ruido” en señales de radio, y a otros muchos fenómenos. Lo que caracteriza estos procesos es su “dependencia del tiempo”, es decir, el hecho de que ciertos sucesos se presenten o no (según sus posi- bilidades) a intervalos regulares de tiempo o en un intervalo continuo del mismo.

En esta sección trataremos de procesos que se desarrollan en un intervalo con- tinuo de tiempo, tales como la presencia de imperfecciones en la fabricación conti- nua de una pieza de tela, la medida de radiaciones con un contador Geiger, la llega- da de llamadas telefónicas a un panel de conmutación o el paso de automóviles por un punto’ de coatrol electrónico. La distribución de Poisson, descrita en la sección 3.4, nos da una teoría matemática apropiada para muchos de estos problemas. Va- mos a generalizar las hipótesis hechas en aquella sección; para ello, consideraremos que se estudian ciertos sucesos y que la probabilidad de que ocurran en un intervalo de tiempo At muy pequeño está dado por a . A t . Supondremos, además, que la pro- babilidad de que se presenten más de una vez el suceso en un intervalo de longitud A¿ es igual a cero, y que el que ocurra, o no, el suceso durante el intervalo de t a t + A¿ no depende de lo que haya pasado antes del instante t. Repitiendo el razo- namiento de la página 4S, deducimos de estas hipótesis que la distribución de pro- babilidad del número de veces que se presente el suceso durante un intervalo de tiempo, de longitud T, está dada por

f(x> = e-aT(a?’)z

X! para x = O , 1, 2 , 3 , . .:

Esta es la distribución de Poisson con media CYT, y de aquí podemos deducir que CY se puede interpretar como el número medio de veces que se presenta el suce- so por unidad de tiempo. Un proceso de azar que satisfaga estas hipótexis recibe el nombre de proceso de Poisson con parámetro (Y.

Page 93: ingenieria

PROCESOS ALEATORIOS 85

Aunque originalmente introdujimos la distribucih de Poisson para dar una aproximación de la distribución binómica, la hemos usado en algunos de los ejerci- cios de la página 48 relacionados con procesos aleatorios continuos. Así fue en los problemas que trataban ‘$e las imperfecciones en un ’proceso electrolítico continuo, de los fallos de un computador, de las radiaciones gamma emitidas por substancias radioactivas, y de la presencia de huracanes en la costa Este de los Eitados Unidos.

En los problemas de procesos aleatorios es importante considerar el tiempo t entre dos veces sucesivas en que se presenta el suceso estudiado. En virtud de la naturaleza casual dé1 proceso, t es un valor de una variable aleatoria y debe tener algún tipo de densidad de probabilidad en un proceso aleatorio continuo. Para ha- llar esta densidad en un proceso de Poisson, observamos, en primer lugar, que la premisa: “el tiempo de espera entre la presencia de dos sucesos consecutivos es ma- yor que t” es equivalente a esta otra: “el nlimero de veces que s~ presenta un suceso desde el instante O hasta el instante t es igual a 0” Luego, si en un proceso de Pois- son F ( t ) nos indica la probabilidad de que el tiempo de espera sea igual o menor que t, tenemos,

1 - F ( t ) = - e-Uf(at)O

O !

O F ( t ) = 1 - e-”’

Derivando con respecto a t (ver página 61), vemos que la densidad del tiempo de espera entre la presencia de dos sucesos consecutivos esta dada por la distrihu- cibn exponencial , . ,

que ya habíamos introducido en la página 73. La media de esta distribución es p = l/a; luego el tiempo medio de espera entre dos sucesos sucesivos es 1/a, lo cuaI está de acuerdo con el hecho de que a sea el número medio de sucesos por unidad de tiempo.

Una aplicación mpy interesante de un proceso de Poisson y de una distribucidn exponencial del tiempo de espera, se encuentra en los problemas de colas, en los que la llegada para unoservicio constituye un proceso de Poissop, mientras que el tiem- po requerido para realizar el servicio’ tiene una distribución exponencial. Esta teo- ría puede aplicarse a los clientes que llegan a una cafeteria, los barcos o camiones que esperan para ser descargados, los aviones que deben aterrizar en un aeropuer- to, etc., también se puede aplicar a los casos que esperan para ser ventilados ante un tribunal penal. En muchos de estos problemas nos illteresaqán cosas tales como la longitud’ proydio de la cola ‘‘O línea de espera”, la probabilidad de que exacta- mente x clientes estén esperando para recibir servicio 0 que estén siendo servidos, el tiempo medio que pasa un cliente esperando hasta ser servido, y otros.

Para ilustrar un problema de colas de este tipo, supondremos que la llegada de automóviles a una estación de gasolina con una sola bomba, es un proceso de Pois-

Page 94: ingenieria

86 APLICACIONES A LA INVESTIGACION OPERATIVA

son con un promedio de llegadas de O! automóviles por hora, y que estos pueden ser despachados a un promedio de ,8 por hora, siguiendo el tiempo requerido para dar el servicio una distribución exponencial. Además, supondremos que es O la probabi- lidad de que llegue un automóvil y se dC un servicio completo durante un intervalo pequeiio At. (En lo que sigue, supondremos también que (Y < p, esto es, que el nú- mero medio de llegadas por unidad de tiempo es menor que el número medio de ser- vicios que se pueden completar por unidad de tiempo.)

Nos interesará P ( k ) , probabilidad de que haya k automóviles en la estaci6-1 para cualquier valor del tiempo. Si k = O, no hay automóviles en la estación; or lo que ninguno estará esperando para recibir servicio; pero si k > O hay k - 1 en

Tiempo t Tiempo t t A t

Fig. 5.1 Diagrama ramificado en problemas de colas

la “linea de espera”. Para encontrar P ( k ) , obtendremos primero un conjunto de “re- laciones de recurrencia” que expresen P ( k ) en función de P(k - 1) y P ( k - 2). Para obtener estas relaciones, hallaremos la probabilidad de que no haya automóvi- les en la estación ( k = O) en el instante t + At. Si k = O en el instante t + At, por la hipótesis de que las llegadas siguen la ley de Poisson, los únicos valores que pueden tener k en el instante t son O y 1. Si k = O en el instante t , no habrán llegado nuevos automóviles en el intervalo de I‘ a t + At (con probabilidl - a- At), pero si k =I en el instante t , se habrá completado un servicio en este intervalo (con probabilidad @.At). Empleando la regla de eliminación de la página 27, con- cluimos yue

P(0) P(O)(l - a * A t ) + P(l)p.At O

P(1) = ‘y P(0) P

Page 95: ingenieria

OTRAS DENSIDADES DE PROBABILIDAD 71

Fig. 4.5 Función de densidad logarítmica normal

Para encontrar la probabilidad de que una variable aleatoria de distribución lo- garitmica normal tome un valor entre a y b (0 < a < b ) , escribimos

Cambiando variables al hacer y =In x, y por consiguiente, dy = r1 dx, ob- tenemos

y podemos ver que esta probabilidad es igual a la probabilidad de que una variable aleatoria con distribución normal con p = (Z y u = tome un valor entre In a y In 6. Luego.

P ( a < x < b ) = F rhp- - "> - F (7) l n a - a

donde F ( z ) es la probabilidad de que una variable aleatoria con distribución normal reducida tome un valor menor o igual que z.

Como ejemplo de aplicación de la distribución logarítmica normal, supóngase que una serie de experimentos ha demostrado que la ganancia de corriente de cier- tos transistores (la cual es proporcional al logaritmo de Z(,/Z;, razhn de la corriente de salida a la corriente de entrada) sigue una distribución normal. Si la ganancia de corriente se mide con unas unidades tales que se iguala a In (l( , / l i) , y si está distribuida normalmente con P = 2 y 02 = 0.01. entonces, la probabilidad de que fC4/f;, que tiene ahora una distrihucicin logaritmica normal, tome un valor entre 6.1 y 8.2. está dada por

Page 96: ingenieria

72 DENSIDADES DE PROBABILIDAD

= F(l.O) - F ( - 2 . 0 )

= 0.8185

Varias densidades de probabilidad importantes que estudiaremos más adelante son casos especiales de la distribucicin gamma, cuya ecuación está dada por

f(z) = i' @ " U 4 - xa-:e-z /P x > o , a > o , p > o

LO por otra parte donde r(a) es un valor de la funcicin gamma, definida por

Integrando por partes, tenemos = (a - l ) q a - 1)

para cualquier a > O, y, por consiguiente, TI@) = (a - l)! cuando (Y es un en- tero positivo.

En la figura 4.6 se muestran varias gráficas de distribuciones gamma y se ve que son sesgadas positivas. De hecho, la oblicuidad decrece al aumentar a para cualquier valor fijo de 0.

La distribución especial gamma con a = 1 se llama distribucidn exponencial y se utilizó como una ilustración en la página 61 con /3 = 1/2. La distribución ex-

1-

I

O 1 2 3 4 5 6 7 4

Fig. 4.6 Fuciones de densidad gamma

ponencia1 se emplea en problemas de tiempos de espera, esto es, los intervalos de tiempo entre la aparición de dos fenómenos por cierta clase y la estudiaremos con más detenimiento en los capítulos 5 y 16.

Page 97: ingenieria

MEDIAS Y VARIANZAS DE DISTRIBUCIONES ESPECIALES 73

4.4 Medias y varianzas de distribuciones especiales

En esta sección deduciremos fórmulas para determinar la medida y la variancia de las distribuciones introducidas en las últimas dos secciones. Primero, vamos a demostrar que los parámetros P y u2 de la distribución normal dados en la página 66, son, efectivamente la media y la variancia de esta distribución. De acuerdo con la definición de media, tenemos que la media de la distribución normal es

que, haciendo z = (x - P) /U, se transforma en

a

Como el integrando de la primera integral es una función impar, la integral de - 00 a 00 es igual a cero; la segunda integral es p veces el área entre el eje horizon- tal y una curva de distribución normal reducida y, por lo tanto, igual a p .1= p. De esta forma, hemos demostrado que el parámetro P de la ecuación de la distribucitjn normal es, efectivamente, la media de esta distribución. En el ejercicio 6 de la página 75, el lector deberá demostrar, por medios semejantes, que el parlimetro u2 en la ecuación de la distribución normal es la variancia.

Volviendo ahora a la distribuciútz unifornze, encontramos, por substitución di- recta, que su media es

Para hallar la variancia de esta distribución, haremos uso de la fórmula Z = - p2, y obtendremos.

que, haciendo y = In x, se convierte en

Page 98: ingenieria

74 DENSIDADES DE PROBABILIDAD

Esta integra1 se puede resolver completando el cuadrado en el exponente y- (y - a)2/2p, obteniendo así un integrando que tiene la forma de una densidad nor- mal. El resultado final, que el lector deberá verificar en el problema S de la página 81 es

= p + B W

Análogamente, pero de una manera más larga, los cálculos nos llevan a 02 = e2~+BZ(&* - 1)

que es la variancia de la distribución logaritmica normal. En relación con el ejemplo de la página 78. la media de la distribución logaritmica normal con a = 2 y 0 = 0.1, es

p = $+(0.01)/2 = 7.4 y s u variancia es

a2 e4+(0.01)(eO.O1 - 1) = 0.56

La media y la variancia de la distribucitirz gumma se obtienen usando la función gamma y las propiedades especiales de ésta que mencionamos en la página 72. Para la media obtenemos

Y después de hacer y = x/P y, por consiguiente, dy = dx/& obtenemos

Por métodos, semejantes, se puede demostrar que la variancia de la distribución gamma está dada por

a2 = a02

como la distribucich exponencid se definió como caso especial de distribución gamma en la que CY = 1, vemos que, para esta distribución,

EJERCICIOS

1. Hallar ]a función de distribución corespondiente a la densidad uniforme de la P&ina 70. 2. Si una variable aleatoria tiene. una distribución logarítmica normal cona = -2 y b = 2,

hallar: ( a ) La media y la desviacibn tipo de esta distribución (b) La probabilidad de que esta variable tome un valor entre 4.5 Y 9.8.

probabilidad de que tome un valor entre 1.8 y 11.1 3. Si una variable aleatoria tiene una distribución gamma con a = 2 Y b 3, hallar

4. Probar que II(a) = (a - l)I'(a - 1). 5. Hallar la funci6n de distribuclón correspondiente a la densidad exponencial

Page 99: ingenieria

DENSIDAD DE PROBABILIDAD CONJUNTA DE VARIAS VARIABLES 75

por otra parte

Utilizar el resultado para hallar la probabilidad de que una variable aleatoria con esta distribución tome valores mayores que 2p.

6. Verificar que el parámetro u2 de la expresión de la densidad normal de la página 66 es efectivamente, su variancia.

7. Comprobar que la densidad normal tiene un máximo relativo en x = p y puntos de inflexibn en x = p & u.

8. Verificar la expresión dada en la Mgina 74 para la media de la distribución logaritmica normal.

9. Verificar que para la distribución gamma definida en la página 72 la variancia está dada por u2 = ( y a p 2 .

10. Una variable aleatoria tiene una distrihucidn beta, si su densidad está dada por

j ( x ) = {;-x" (1 - x)@-1 para O < z < 1 por otra parte

donde CY > O y /3 > O. Hallar k para el caso especial en que CY = 12 y p = 2. Hallar, además, Q y oz para esta distribución beta especial.

11. Una variahle aleatoria tiene una distribucidrt de Weibull si su densidad está dada p ~ r

f (x) = {o k . z f l - 1 e - d para z > O por otra parte

Hallar k, p y o2 en función de OL y 0. 12. En cierta área, el consumo diario de electricidad (en millones de kilowatt-hora) se pue-

de tratar como una variable aleatoria con distribución logaritmica normal con CY 3 '2 y P = 1/2. Si la planta motriz que abastece esta área tiene una capacida diaria dc 10 millones de kilowatt-hora, ¿Cuál es la probabilidad de que este abastecimiento sea insuficiente en un día dado?

13. Supongamos que las vidas de servicio de ciertas unidades semiconductoras tienen una distribución de Weibull con parámetros CY 0.00.5 y 8 = 0.50 (ejercicio 11). Si 10 de estas unidades se ponen a prueba, determlnar la probabilidad de que al menos 8 estén en servicio satisfactorio al cabo de 40.000 horas.

4.5 Densidad de probabilidad conjunta de varias variables

Hay muchos experimentos en los que la descripción de los casos que pueden pre- sentarse está dada por los valores de varias variables aleatorias. Por ejemplo, pode- mos medir la altura y el peso de un individuo; el volumen, presión, y temperatura de un gas; o el espesor, color y resistencia a la compresión de una pieza de vidrio. Si xl, x2, .-. . xk son los valores de k variables aleatorias, diremos que una función f con valores reales f (x,, x2. . .Xk), es la densidad de probabilidad conjunta corres- pondiente a dichas variables, si la probabilidad de que al < x1 < b , . a2 5 x2 < bp, . . . y ak 5 Xk 5 bk esta dada por la integral múltiple.

Page 100: ingenieria

76 DENSIDADES DE PROBABILIDAD

Nótese que, si f(xl, x2, . . ., Xk) 2 O para todos los valores de xl, XZ. . ., xk para los que la densidad de probabilidad está definida, y

esta definición es compatible con los axiomas de probabilidad modificados que vi- mos en la sección 2.7.

Designando por F ( x l , x?, . . ., xk) la probabilidad de que la primera variable aleatoria tome un valor menor o igual que x l , la segunda menor o igual que x?, . . . , y la k-ésima menor o igual que Xk, diremos que tal función F es la funcibn de dis- tribucich conjunta de las k variables.

Como ilustración, consideremos la densidad de probabilidad conjunta de dos variables dada por

f b l , 22) = (,_,x1-3=* para x1 > O, x2 > O

en el resto La probabilidad de que la pl'imera variable tome un valor entre 1 y 2 mientras

que la segunda lo hace entre 2 y 3, está dada por

= 0.0003 y la probabilidad de que la primera variable tome un valor menor que 2, mientras la segunda tiene uno mayor que 2, está dada por

= 0.0025

Además, la funci6n de distribucich conjunta de este par de variables está dado por

F(Z1, ZZ) = {/ox' 1; 6e-2u-3u du dv para z1 2 O , x2 >_ O O por otra parte

- e-2=1)(1 - e- -39 para XI >_ O, 2 2 2 O por otra parte

De acuerdo con la definición de independencia dada en el capítulo 2, diremos yue las k vuricrhles deutorias son (estocasticamente) independientes si, y sdo si,

F(Z1, 22, . Z k ) = Fl(Zl).F2(ZZ) * . - ' F ( 2 k )

para todos los valores de x,, x2, . . , mi,. para los que están definidas Ins funciones, siendo F i ( x ; ) para i = 1 , 2, . . . k el valor correspondiente de la función de distri- bución de la variable aleatoria i-ésima. Inmediatamente se deduce de esta definición que. si k variables son independientes, cualquier valor de la densidad de probabili- dad conjunta de las k variables es igual al producto de los valores de las densidades de probabilidad de las variables individuales. En otras palabras,

Page 101: ingenieria

DENSIDAD DE PROBABILIDAD CONJUNTA DE VARIAS VARIABLES 77

f(Z1, . . . , Z k ) = fl(Z1) 'f2(52) * . . . 'fk(Xk)

donde fi(Xi) para i = 1, 2, . , . k es el valor correspondiente de la densidad de pro- babilidad de la i-ésima variable. En el ejemplo numérico considerado, nótese que las dos variables son independientes.

En general, la densidad de probabilidad de Ia i-ésima variable se puede obtener a partir de la densidad conjunta integrando respecto todas las demás variables, o sea,

Llamaremos a fi(xi) densidad marginal de la i-ésima variable. Por ejemplo, en el anterior la densidad margina1 de Ia primera variable está dada por

f1(z1) = /d" 6e-2zl-3n dxe = 2e-2z1

para x I > O, y f, (xl) == O en el resto. El siguiente. es otro concepto de importancia al tratar con k variables aleatorias.

si una variable aleatoria toma el valor g(xl, xer . . . .yk) cuando las k variables ales- tOriaS toman los Valores xl, &, . . . &, entonces, el promedio, 0 media, de la prime- ra variable se define por la Integral

Por ejeinplo, si nos interesa el valor promedio del producto de las dos variables del problema numérico antes citado, obtenemos

EJERCICIOS 1. Dos variables aleatorias tienen la densidad conjunta dada por

4xy pára O < x < 1, O < y < 1

( a ) Hallar la probabilidad de que 0 5 .x 5 1/2 Y 1/8 5 21 5 1iJ. ( b ) Hallar la probabilidad de que y > x.

2. Dos variables aleatorias tienen la densidad conjunta dada por

+ y*) para O < c < 3, 1 < y < 6 en el resto

( a ) HalIar k. ( b ) Hallar la probabilidad de que 1 < x < 2 y 2 < y < 4. (c) Hallar la probabilidad de que 2 5 x 5 3. ( d ) Hallar la probabilidad de que x + y > 5.

3. Tres variables de azar ticncn la densidad de probabilidad conjunta dad;i por

Page 102: ingenieria

78 DENSIDADES DE PROBABILIDAD

( a ) Hallar k . ( b ) Hallar la probabilidad de que 2 < y y ,z < 1. (c) Hallar la probabilidad de que z > 2.

(a , Encontrar una expresión para la funci6n de distribución de la primera variable. (b) Encontrar una expresión para la función de distribución de la segunda variable. (e) Dcmostrar que las dos variables son independientes.

( a ) Hallar una exprcsión para la función de distribución de la primera variable. ( b ) Hallar una cxprcsión para la función de distribución de la segunda variable. (c ) Demostrar que las dos variables son independientes.

dada por

4. Con rcspecto a la densidad conjunta del ejercicio 1,

5. Con respecto a la densidad conjunta del problema 2,

6. Un par de variables tienen “distribución normal circular” si su densidad conjunta está

para --m < 2 1 < m y --m < z2 <OO. ( a ) Si = I , pz = “3, y u = 10, utilice la tabla I11 para determinar la probabilidad

de que -14 < z1 < 16 y--S < x2 < 15. (b) Sip1 = p~ = Oy u = 4, hallar l a probabilidad de que (x1, x2) est6 contenido en la

rcgi6n entre los circulos x: + = 4 y 2: + 2;; = 16.[bugerencia: Usar coordenadas polares. I

7. Una bomba dirigida hacia un punto que sirve de blanco, tiene un &rea de destrucción con radio de 400 pies (122 m ) . Empleando el blanco como origen de un sistema de coorde- nadas rectangulares, supjngase que las coordenadas (x, y ) del punto en que hace impacto la bomba son los valores de un par de variables de azar que tienen una distribución nor- mal circular con ~1 = pz = O y u = 250 pies. (Ver problema 6 ) . ¿Cuál es la probabili- dad de que el blanco sea destruido?

8. Con respecto a la densidad conjunta del problema 1, hallar el valor promedio de la va- riable aleatoria cuyos valores están dados por g(z, y) = z + y.

9. Con respecto a la densidad conjunta del problema 2, hallar el valor promedio de la va- riable aleatoria cuyos valores están dados por g(.c + y) = $y.

10. Si las medidas de altura y anchura de un rectángulo tienen la densidad conjunta,

[O en el resto

hallar la media y la variancia de la distribución correspondiente del área del rectángulo.

Page 103: ingenieria

5.1 Introducci6n

El desarrollo en las últimas décadas ha traído como consecuencia el florecimien- to de una nueva tecnología que es en parte Matemática, en parte Estadística, en par- te Ingeniería y en parte algo nuevo. Se ha denominado Investigación operativa y se puede definir como la aplicación de las técnicas científicas modernas a problemas que tratan de la operación de un sistema considerado en su conjunto ”por ejem- plo, el desarrollo de una guerra, la dirección de una empresa, la producción de un articulo, la planificación económica, etc.

Entre los temas de estudio incluidos normalmente bajo el título de Investiga- ción operativa, encontramos temas tales como Ía manera de tomar decisiones “cien- tíficas”, la teoría de los juegos, la programación lineal, la teoría de los procesos de azar, los métodos para tratar los problemas de inventario, localización, transporte, Y otros. En este breve capitulo estudiaremos algunos de estos métodos como aplica- ciones particulares de la teoría desarrollada en los caDítulos anteriores.

79

Page 104: ingenieria

80 APLICACIONES A LA INVESTIGACION OPERATIVA

5.2 La esperanza matemhtica y la toma de decisiones

Muchos problema> de ciencia. ingeniería y direccihn de negocios son de tal in- dole que los resultados ( o consecuencias dz las acciones tomadas) estan s1ljetos al a7ar. Supongamos. por ejemplo. que. en la fabricacibn de cierto producto. el costo u!litario es de 5 12. una unidad en buen estado. se puede vender en $ 17. la probabi- lidad de producir una unidad defectuosa es 0.20. y una unidad defectuosa se pierde totalmente. Luego. considerando los beneficios. cada unidad fabricada representa una ganancia de $ 5 o una perdida de 5 12 ( o sea. uca ganancia de - $ 12).

Esta informacicin. en si. no nos permite decidir si conviene o no fabricar el pro- ducto. pero nos ayudara en una decisicin de este tipo.

Notemos, por ejemplo. que alrededor del 8Oc; de las unidades representan una ganancia de $ 5. y alrededor del 2OCi de las unidades representan una perdida de

12. en consecuencia. a la larga, hay una ganancia media de j(0.80) - 12(0.20) =

b 1.60 por unidad. Hemos obtenido este valor multiplicando cada caso posible (la ga- nancia de 5 dcilares o la pCrdida de 12) por la probabilidad correspondiente, y Ilama- [nos a este resultado vulor rspcrudo del beneficio o. simplemente, beneficio esperado. Comparando el metodo de medir tal valor esperado con la definicicin de P que vi- mos en la página 49. observamos que cl vtrlor rsperudo tic. utrn \.nriuhle alcatorin cs .s i tnplet~t~t~tt~ ltr rnetliu (IC s u distrihucich tic. probnhilidarles

Para dar otra ilustracicin del clilculo de u n valor esperado. supongamos que una lirnia de ingenieros tiene la tarea de preparar una propuesta para u n contrato de investigacicin: el costo de la preparacicin de la propuesta es $ 5 000. y se supone conocido que los beneficios brutos potenciales de $ 30,000, $ 2OilOO. $ 10,000 ci $ O. tienen probabilidades de 0.20, 0.50. 0.30 y 0.10, respectivamente, en el supuesto de clue la propuesta se acepte. Partiendo de que la probabilidad de que se acepte la propuesta es 0.30. vemos que hay una probabilidad de (0.30) (0.20) = 0.06 de ob- tener un beneficio neto de S 25,000 S 30.000 (menos el costo de la propuesta). Aná- logamente. las probabilidades de obtener beneficios netos de $ 15,000 y de $ 5,000 son. respectivamente, (0.05) (0.30) = 0.15 y (0.20) (0.30) - 0.06, mientras que la probabilidad de una pkrdida de 5 5,000 es (0.10) (0.30) i- 0.70 = 0.73, teniendo presente la posible eventualidad de que la proposicicin no se acepte. Entonces, nos encontramos en la situacicin descrita en la tabla siguiente:

y encontramos que el Iwrwficio trrlo.rspc~rrrtlo es

(25,UU0)(0.06) + (15,000)(0.15). + (5000)(0.06) - (5000)(0.73) = $400

Si es. o no. prudente arriesgar !$ 5.000 para obtener una utilidad esperada de S 400, no es cuesticin estadística. Si una compañía tiene capital y scjlo puede ha- cer unas pocas propuestas de este tipo, el 73'6 de oportunidades de perder !$ 5,000 puede hacer de esto una aventura nada atractiva. Por otra parte, si una compañia

Page 105: ingenieria

LA ESPERANZA MATEMATICA Y LA TOMA DE DECISIONES 81

tiene u n capital muy fuerte y prepara muchas de estas propuestas, puede tener senti- do aceptar el riesgo. por la promesa de la clewlucitin esperurla del 8% de la inver- sicin inicial.

Erl el ejemplo que sigue. se usan los valores esperados para determinar las con- diciones óptimas de un problema típico de inventario. Supongamos que se conoce, por experiencias pasadas, que la demanda diaria de cierto producto perecedero tiene la siguiente distribuci6n de probabilidad

Número de orden I 3 4 5 6 7 8 9

Probabilidad I 0.05 0.12 0.20 0.24 0.17 0.14 0.08

El costo de cada unidad es de $ 3 5 (incluyendo el costo de s u transporte y almace- namiento). y se vende a d 50, y si una unidad permanece en el .almacén. pasado un dia representa su pérdida total, A partir de esta información, se trata de determinar cuántas unidades debergn alnlacenarse cada día para que el beneficio esperflrlo sea mú.xin?o.

Con tres unidades almacenadas. el beneficio en dólares es, obviamente, 150 me- nos 105 = 45, ya que hay una probabilidad de 1.00 de que la demanda sea de tres unidades o más. Con cuatro unidades almacenadas, hay una probabilidad de 0.05 de que exactamente tres unidades puedan ser vendidas, una probabilidad de 0.95 de que la demanda sea de cuatro o más y. por consiguiente. hay un beneficio espe- rado de

150(0.05) + 200(0.95) - 140 = 57.50

Análogamente, con cinco unidades hay una probabilidad de 0.05 de que exac- tamente se vendan tres unidades. una probabilidad de 0.12 de que se vendan exacta- mente cuatro unidades, una probabilidad de 0.83 de que la demanda sea de 5 3

o más y. por consiguiente. el beneficio esperado es

150(0.05) + 200(0.12) + 250(0.83) - 175 = 64.00

Continuando de esta manera, podemos ver que el beneficio esperado con seis unidades es $ 60.50, con siete unidades d 45.00, etc.: por lo que el beneficio esperado alcanza su máximo cuando hay cinco unidades en el almacén (véase también el ejercicio 6 de la página 83).

En años recientes, los valores esperados (la esperanza matemática, como tam- bién se llama) han venido ocupando una posición cada vez más importante en la toma “científica” de decisiones. Como hemos indicado en el ejemplo de la pági- na 80, no sirven como criterio Único para tomar decisiones, pero dan una informa- ción muy importante para tomar las decisiones de una manera racional. Como otra nueva aplicación, observemos cbmo se pueden utilizar los valores esperados para seleccionar la acción más ventajosa de un conjunto continuo de alternativas. Supon- gamos que un ingeniero puede escoger la velocidad del trabajo de una máquina troqueladora automática de manera que haga r operaciones por hora, pero ocurre

Page 106: ingenieria

82 APLICACIONES A LA INVESTIGACION BPERATIVA

que la proporción de operaciones defectuosas p aumenta con T. Hay una utilidad de $ 1.00 por cada operación efectiva de la máquina, y una pérdida de $20.00 por cada operación defectuosa, y sabemos, por experiencias pasadas, que, para un núme- ro fijo r de operaciones por hora, la distribución de probabilidad correspondiente al número p de operaciones defectuosas es. aproximadamente,

(O.OO1)rpo.ooll-l para O < p < 1 por otra parte

Con el objeto de encontrar la velocidad r que da mayor utilidad, determinare- mos primero el beneficio esperado por hora para un valor dado de r, utilizando la fórmula de P de la página 62 en lugar de la dada en la página 49. Para valores fijos de r y p , el beneficio horario es

(l.OO)r(l - p ) - (20.00)rp = r(1 - 21p)

por lo que, para r fija, el beneficio esperado por hora es

IOOOr - 207-2 1000 + r

=

Finalmente, derivando con respecto a r e igualando a cero la expresión resul- tante, el beneficio esperado horario tiene un máximo cuando r = 25 y. para esta velocidad de troquelado, el beneficio esperado es de 12.10 $ por hora.

Hay esencialmente dos limitaciones prácticas para aplicar los métodos de toma de decisión ilustrados en esta sección: primero, debemos tener la posibilidad de asig- nar “valores contables” a los distintos casos que se pueden presentar, y segundo, de- bemos tener la información adecuada sobre las probabilidades correspondientes a dichos casos. El problema de asignar valores contables a los diferentes casos puede ser mucho más complicado que en los ejemplos citados. Por ejemplo, un oficial de la Fuerza Aérea tuvo que tomar la decisión de cuántos bombarderos se debían man- dar contra un blanco determinado; fue muy difícil dar valores contables para la des- trucción del blanco y para la pérdida de un bombardero y su tripulación por la ac- ción del enemigo. Para el valor contable del bombardero y su tripulación, fue nece- sario tener en cuenta los costos de gestión y entrenamiento, además del inestimable costo de la vida humana.

También, puede ser igualmente dificil la especificación de las probabilidades para los diversos casos. En el ejemplo anterior, postulamos cierta distribución para la proporción de operaciones defectuosas con una velocidad r. En la práctica, se hubiera requerido un gran número de experimentos para descubrir tal distribución y, aún así, sólo se hubiera conseguidc. una estimación (o una aproximación). Aun- que la experiencia pasada se puede aprovechar frecuentemente para estimar las dis- tribuciones de probabilidad (como hemos hecho en muchos de nuestros ejemp!os), hay ocasiones en que esto conduce a caer en juicios subjetivos. Por ejemplo, e3 el

Page 107: ingenieria

LA ESPERANZA MATEMATICA Y LA TOMA DE DECISIONES 83

problema de la página 80, que trata de la propuesta de investigación, resulta extre- madamente difícil estimar la probabilidad de que una propuesta determinada se acepte. Esto no depende dnicamente de la calidad de la propuesta, sino de muchos otros factores desconocidos, tales como la calidad y el ndmero de propuestas de competidores, asi como de la política seguida For la empresa a la que se presenta el proyecto. La estimación de 0.30, en nuestro ejemplo, es puramente subjetiva, ba- sándose sólo en el “sentimiento” de algún ejecutivo por su propia experiencia. Aun- que estas estimaciones de probabilidades no carecen de valor (presentándose en la misma situación y con la misma información) dejan abierta la posibilidad de que diferentes individuos lleguen a diferentes decisiones “óptimas”.

EJERCICIOS

1. Un lote de 50 partes, entre las cuales hay 8 defectuosas, se Pone en venta *Xa1 Como esta sin permitir ninguna inspección. Si una parte defectuosa representa una @rdida total de su precio de $12.50, y una parte en buen estado se pucdc revender a $14.503 ¿es conve- niente comprar una de dichas partes (seleccionándola al azar) ’?

2. En un sorteo de lotería habrh cinco premios consistentes en: $1,000 el primero, $500 el segundo, $300 el tercero y $ 100 el cuarto y el quinto. Si se venden 1,500 boletos, ¿Cuál es el valor de cada uno?

3. La siguiente es una variante de un problema clásico del dlculo de probabilidades. Dos personas apuestan $ 8 cada una para jugarlos a “volados”. El ganador (que se llevará todo el dinero) será el que gane 3 de 5 tiradas de la moneda. Por alguna razón, el juego se suspende después de la primera tirada, la cual fue ganada por el jugador A. (a) Dibujar un diagrama ramificado para demostrar que, después de haber ganado ]a

( b ) ¿Cómo deberiin repartirse el dinero los dos jugadores, después de esta primera tirada? 4. Si dos equipos de beisbol son igualmente eficientes, las probabilidades de que la Serie

Mundial termine en 4, 5, 6 ó 7 juegos, son, respectivamente, 1/8, 1/4, 5/16 y 5/16. ¿Cuál es la duración esperada (en número de juegos) de esta Serie Mundial?

5. Probar cierta parte de una máquina cuesta $50. Si en la máquina se instala una de estas partes defectuosas, la reparación costarii $ loOO. ¿Será má conveniente instalar la parte sin probarla si se sabe que el 3% de todas las componentes producidas son defectuosas? ¿Si el porcentaje es del 6%?

6. En el ejemplo de la piigina 81, verificar que los beneficios esperados para 6 y 7 unidades, son, respeativamente, $60.50 y $45.00.

7. Un comerciante puede comprar un3 unidad en $2.10 y venderla en $4.50. Las probabili- dades de una demanda de O, 1, 2, 3, 4, 6 “5, o miis” unidades, son respectivamente, 0.05, 0.15, 0.30, 0.25, 0.15 y 0.10. Calcular los beneficios esperados, almacenando O, 1. 2, 3. 4 b 5 unidades y determinar cuántas se deben almacenar para lograr el mPximo beneficio esperado,

8. Se emplean IZ vendedores para una campaña de ventas de puerta en puerta, el volumen bruto de ventas en miles de dólares se puede considerar como una variable aleatoria de distribución gamma con parámetros (Y = 1OO&y @ = 1/2. Si los costos de ventas por vendedor son de $ 5 000, jcuiintos vendedores se deberiin emplear para lograr un miiximo de utilidad?

9. IJna persona ha observado, por propia experiencia, que la oferta mínima para un trabajo de construcción se puede considerar como una variable aleatoria de densidad uniforme,

primera tirada, la probabilidad de ganar del jugador A es 11/16.

Page 108: ingenieria

84 APLICACIONES A LA INVESTIGACION OPERATIVA

(O por otra parte

donde C es su propia estimación del costo de la obra. ¿Que porcentaje debe añadir a su costo estimado, al someter su oferta, para lograr un mfiximo en su utilidad esperada?

10. Una compañía alquila una computadora por períodos de t horas, a raz6n de $400 la hora E1 número de veces que la computadora se estropea durante t horas es una variable aleatoria de distribución de Poisson con X = (0.8)f, y si este número de fallos es x, cues- ta $ 5 0 . 9 volverla a poner en marcha. ;(?hmo debe seleccionar la compañia el tiempo r , para lograr el máximo de beneficios esperados? [Sugerencia: Usar los resultados de la secciún 3.5.1

5.3 Procesos aleatorios

Hablando en general, el término “proceso aleatorio” se emplea en relación con procesos físicos que están completa o parcialmente controlados por cierta clase de mecanismo de azar. Se aplica a series de tiradas sucesivas de una moneda, a medi- das repetidas de la calidad del producto de un fabricante sacado de una línea de montaje, a las vibraciones de alas de aviones, al “ruido” en señales de radio, y a otros muchos fenómenos. Lo que caracteriza estos procesos es su “dependencia del tiempo”, es decir, el hecho de que ciertos sucesos se presenten o no (según sus posi- bilidades) a intervalos regulares de tiempo o en un intervalo continuo del mismo.

En esta sección trataremos de procesos que se desarrollan en un intervalo con- tinuo de tiempo, tales como la presencia de imperfecciones en la fabricación conti- nua de una pieza de tela, la medida de radiaciones con un contador Geiger, la llega- da de llamadas telefónicas a un panel de conmutación o el paso de automóviles por un punto de control electrónico. La distribución de Poisson, descrita en la sección 3.4, nos da una teoria matemática apropiada para muchos de estos problemas. Va- mos a generalizar las hipótesis hechas en aquella sección; para ello, consideraremos que se estudian ciertos sucesos y que la probabilidad de que ocurran en un intervalo de tiempo A¿ muy pequeño está dado por a . A t . Supondremos, además, que la pro- babilidad de que se presenten más de una vez el suceso en un intervalo de loagitud At es igual a cero, y que el que ocurra, o no, el suceso durante el intervalo de t a 1 + At no depende de lo que haya pasado antes del instante t. Repitiendo el razo- namiento de la página 45, deducimos de estas hipótesis que la distribución de pro- babilidad del número de veces que se presente el suceso durante un intervalo de tiempo, de longitud T, está dada por

f(X> = e-aT(aT)L.

X ! para X = O , 1, 2, 3, . . .

Esta es la distribución de Poisson con media CYT, y de aqui podemos deducir que CY se puede interpretar como el número medio de veces que se presenta el suce- so por unidad de tiempo. Un proceso de azar que satisfaga estas hipótcis recibe el nombre de proceso de Poisson con parámetro a.

Page 109: ingenieria

PROCESOS ALEATORIOS 85

Aunque originalmente introdujimos la distribución de Poisson para dar una aproximación de la distribución binómica, la hemos usado en algunos de los ejerci- cios de la página 48 relacionados con procesos aleatorios continuos. Así fue en los problemas que trataban de las imperfecciones en un proceso electrolítico continuo, de los fallos de Un computador, de las radiaciones gamma emitidas por substancias radioactivas, y de la presencia de huracanes en la costa Este de los Estados Unidos.

En los problemas de procesos aleatorios es importante considerar el tiempo t entre dos veces sucesivas en que se presenta el suceso estudiado. En virtud de la naturaleza casual del proceso, t es un valor de una variable aleatoria y debe tener algún tipo de densidad de probabilidad en un proceso aleatorio continuo. Para ha- llar esta densidad en un proceso de Poisson, observamos, en primer lugar, que la premisa: “el tiempo de espera entre la presencia de dos sucesos consecutivos es ma- yor que t” es equivalente a esta otra: “el número de veces que s~ presenta un sucexo desde el instante O hasta el instante t es igual a 0” Luego, si en un proceso de Pois- son F(t ) nos indica la probabilidad de que el tiempo de espera sea igual o menor que t, tenemos,

1 - F( t ) = - e-ac ( at)O

O! O

Derivando con respecto de espera entre la presencia cicin exponencial

F ( t ) = 1 - e--Ort a t (ver página 61), vemos que la densidad del tiempo de dos sucesos consecutivos está dada por la distrihu-

que ya habíamos introducido en la página 73. La media de esta distribución es p = l / a ; luego el tiempo medio de espera entre dos sucesos sucesivos es l / a , lo cual está de acuerdo con el hecho de que a sea el número medio de sucesos por unidad de tiempo.

Una aplicación muy interesante de un proceso de Poisson y de una distribución exponencial del tiempo de espera, se encuentra en los problemas de colas, en los que la llegada para un ‘servicio constituye un proceso de Poisson, mientras que el tiem- po requerido para realizar el servicio tiene una distribución exponencial. Esta teo- ría puede aplicarse a los clientes que llegan a una cafetería, los barcos o camiones que esperan para ser descargados, los aviones que deben aterrizar en un aeropuer- to, etc., también se puede aplicar a los casos que esperan para ser ventilados ante un tribunal penal. En muchos de estos problemas nos interesarán cosas tales como la longitud promedio de la cola ‘‘O línea de espera”, la probabilidad de que exacta- mente x clientes estén esperando para recibir servicio o que estén siendo servidos, el tiempo medio que pasa un cliente esperando hasta ser servido, y otros.

Para ilustrar un problema de colas de este tipo, supondremos que la llegada de automóviles a una estación de gasolina con una sola bomba, es un proceso de Pois-

Page 110: ingenieria

36 APLICACIONES A LA INVESTIGACION OPERATIVA

son con un promedio de llegadas de (Y automdviles por hora, y que estos pueden ser despachados a un promedio de p por hora, siguiendo el tiempo requerido para dar el servicio una distribucih exponencial. Además, supondremos que es O la probabi- lidad de que llegue un automóvil y se dC un servicio completo durante un intervalo pequeño At. (En lo que sigue, supondremos también que a i p, esto es, que el nú- mero medio de llegadas por unidad de tiempo es menor que el número medio de ser- vicios que se pueden completar por unidad de tiempo.)

Nos interesará P ( k ) , probabilidad de que haya k automóviles en la estaciól para cualquier valor del tiempo. Si k = O, no hay automóviles en la estación; or lo que ninguno estará esperando para recibir servicio; pero si k > O hay k - 1 e?

Fig. 5.1 Diagrama ramificado en problemas de colas

la “línea de espera”. Para encontrar P ( k ) , obtendremos primero un conjunto de “re- laciones de recurrencia” que expresen P ( k ) en función de P ( k - 1 ) y P ( k - 2). Para obtener estas relaciones, hallaremos la probabilidad de que no haya automóvi- les en la estación ( k = O) en el instante t + At. Si k = O en el instante t + At, por la hipótesis de que las llegadas siguen la ley de Poisson, los únicos valores que pueden tener k en el instante t son O y 1. Si k = O en el instante t , no habrán llegado nuevos automóviles en el intervalo de t a t + At (con probabilidl - a . A t ) , pero si k =I en el instante t , se habrá completado un servicio en este intervalo (con probabilidad B-Al) . Empleando la regla de eliminación de la página 27, con- cluimos yuc

P(0) = P(O)(l - a . A t ) + P ( l ) B . A , t O

P(1) = cy P(0) B

E n general, la situación se puede representar por el diagrama ramificado mos- trado en la figura 5.1 y la regla de eliminación nos da la relación de recurrencia si- guientc:

Page 111: ingenieria

GRAFlCAS DE DISTRIBUCIONES DE FRECUENCIAS 103

sea simétrico o que la distribución detamaños de sombreros de hombre en EE.UU. tenga dos máximos.

Las distribuciones totales o acumulativas se representan generalmente por me- dio de ojivas. Una ojiva es semejante a un polígono de frecuencias, con excepción de que marcamos las frecuencias acumulativas en las fronteras de clases, en lugar de las frecuencias ordinarias en las marcas de clase, Los puntos resultantes se unen, nuevamente, por segmentos de recta, como se muestra en la figura 6.4, que repre-

Indices de solución de hierro

Fig. 6.4 Ojiva

senta la distribución de frecuencias totales del tipo “menor que” de los indices de solución de hierro.

Las ojivas tienen siempre la forma aproximada de una S maNscula, quedando el tamaño relativo de las dos colas de la S determinado por la simetría o falta de simetría de la distribución. Si una distribución sigue, aproximadamente, la forma de una curva normal, es posible convertir’ la S en una “línea recta”, utilizando, para ello, una escala vertical especial llamada-escala de probabilidad. Esta escala se ha construido de tal forma. que cualquier distribucidn normal de frecuencias totales aparece como una línea- recta. En el comercio, se puede encontrar un papel espe- cial denominado papel cundriculado de probabiiidad aritmética: tiene una escala aritmkttica (nrdinaria)y una escala de probabilidad (ver figura 6.5). En la figura 6.5 se ha marcado la grifica de la distribuciónm porcentaje total del tipo “menor que” de los indices de solución de hierro marcados sobre iesteftipo d t papel. Nótese que los porcentajes totales están marcados en las fronteras de clase correspondientes.

El papel cuadriculado de probabilidad se puede usar directamente con datos sin agrupar, para comprobar la “riormalidad” de éstos. En. tal caso; comenzamos por ordenar las observaciones de acuerdo con su tamaño y, si hay n observaciones,

marcamos w 100 6 por .ciento en la escala vertical corres- pondiente a‘ la mayor observación i-Csima (ver el problema .16 de la phgina 108). Si

(1002 - 50) ?& . ,

Page 112: ingenieria

104 TRATAMIENTO DE DATOS

0.095 1 L 0.295 0.495 0695 0.895 1.095 1.295 1.495

Indices de solución de hierro

Fig. 6.5 Gráfica de prcjbabilidad normal-datos agrupados

t? es grande, no es necesario marcar todos los puntos; será suficiente marcarlos de cinco en cinco, o de diez en diez, para verificar que los datos caen aproximadamente en una linea recta, esto es, verificar que su distribución sigue, aproximadamente, la forma de una distribución normal. En la figura 6.6 se muestra una gráfica de proba- hilidades de los datos de indices de solución de hierro no agrupados en la que se marcan las observaciones de 10 en 10, comenzando con la primera y al mismo tiem- po, mayor observación. Es evidente, observada esta gráfica. que los datos siguen aproximadamente una distribución normal.

En vista de la simetría de la,distribución normal, la media de la misma que aproxima la distribución de los indices de solución de hierro, puede obtenerse vien- do en la escala horizontal de.la figura 6.5 ó 6.6. el índice de la solución de hierro que corresponde al SO'/. de la escala vertical. E n la figura 6.6, obtenemos 0.80. TambiCn podemos encontrar aproximadamente la desviación típica de esta distribu- cicin, tomando la diferencia entre los indices de solución correspondientes a 84% y 507;. en la escala de probabilidad. Usando la gráfica de la figura 6.6, obtene- mos 0.24.

Debe entenderse que el uso de papel cuadriculado de probabilidad, que se hu- biera podido llamar papel cuadriculado de probabilidad normal, es un artificio apro-

Page 113: ingenieria

GRAFICAS DE DISTRIBUCIONES DE FRECUENCIAS 105

ximado (y altamente subjetivo) para verificar si una distribución si@-e la fo rm de una curva normal. Sólo separaciones grandes y obvias de la línea de esta gráfica son evidencias reales de que los datos no siguen una curva normal.

Algunas veces, Se emplean otras escalas especiales para hacer las gráficas de distribuciones de frecuencias totales. Por ejemplo, si se espera que un conjunto de

Indices de soluci6n de hierro

Fig. 6.6 GrAfica de probabilidad normal-datos no agrupados

datos siga una distribución logaritmica normal, el papel cuadriculado deberi tener una escala logaritmica. Este papel también se encuentra en el mercado. Otras varias escalas han sido construidas. para. verificar que los datos siguen otra distribución teórica. , .,

Page 114: ingenieria

106

EJERCICIOS

TRATAMIENTO DE DATOS

1. Los pesos de ciertos embalajes se dan aproximándolos a la decima de libra más próxima; el menor y el mayor son, respectivamente, 15.1 y 30.9. Construir una tabla con 8 clases iguales en las que se puedan agrupar estos pesos. Dar el intervalo de clase, los límites de clase, las fronteras de clase y las marcas de clase.

2. El tiempo que tarda en quemarse un combustible d l i d o para cohete, se da aproximan- do al milisegundo m8s cercano. El valor menor y el mayor son, respectivamente, 4850 y 5072. Construir una tabla con 6 clases iguales en las que se puedan agrupar estos va- lores. Dar el intervalo de clase, los límites, fronteras y marcas de clase.

3. Los valores de la tabla siguiente son 100 medidas (en libras por unidad) del peso de la capa de estaño de

0.23 0.35 0.26 0.16 0.38 0.30 0.33 0.31 0.29 0.26 0.12 0.32 0.28 0.22 0.30 0.25 0.37 0.20 0.26 0.40

una placa estañada electrolíticamente:

0,20 0.29 0.28 0.25 0.32 0.30 0.17 0.40

0.27 0.41 0.42 0.24 0.32 0.18 0.25 0.35 0.24 0.29

0.23 0:32

0.32 0.27 0.30 0.21 0.31 0.29 0.36 0.27 0.44 0.31

0.31 0.14 0.33 0.30 0.34 0.25 0.28 0.22 0.23 0.37 0.19 0.31 0.25 0.34 0.32 0.28 0.36 0.21 0.28 0.33

0.36 0.29 0.23 0.38 0.26 0.18 0.30 0.34 0.33 0.39

0.25 0.33 0.32 0.30 0.27 0.33 0.38 0.27 0.W 0.35

0.29 0.21 0.34 0.2s 0.30 0.22 0.25 0.35 0.48 0.33

Agrupar estos valores en una distribución que tenga un intervalo de clase de 0 . 0 5 y cons- truir un histograma.

4. Convertir la distribución del ejercicio 3 en una distribución total del tipo “menor que” y dibujar su gráfica.

5. Convertir la distribución total del ejercicio 4 en una distribucih de porcentaje total y, haciendo su gráfica en papel de probabilidad aritmktica, ver si es razonable aproximar esta distribucih a una distribución normal.

6. L a tabla siguiente corresponde a los ingresos durante 1963 (en d6lares) de 80 familias que viven en

1920 6250 8750 7400 2320 6430 5160 1380 4190 6430

una comu 11750

1200 2500 5620 1790. 2460 3810 8640 5400 9650

nidad. rur 1420 4710 2460 8800 2110 3 100 5 120 1520 2200 4040

al : 7350 9200 4500 6770 3240 4560

10600 5330 6370 5920

12800 7860 3620 5840 1470 3750 4540 6200 4320 2510

2800 1760 5110 3490 6400 5920 7950 3900 4110 8790

9450 2650 4720 6750 6900 5500 3870 4790 1580 2580

6850 5210

4900 1700 3780 7410

11250 5090 7600

,9700

agrupar estos valores en un número conveniente de clases iguales y construir un poligo- no de frecuencia.

7. Convertir la distribucijn del ejercicio 6 en una distribución de porcentaje total del tipo “menor que” y hacer su ojiva.

8. Marcar la distribución de poruentaie total del ejercicio 7 cn papeles cuadriculados aritmt- tic0 y logarítmico. ¿Qué conclusiones se pueden sacar de estas gráficas con respecto a la

Page 115: ingenieria

GRAFICAS DE DlSTRlBUClONES DE FRECUENCIAS 107

forma de la distribucidn? (Si no se puede obtener papel logaritmico, marcar los logarit- mos de las fronteras de clase en papel aritmktico.)

9. Las siguientes son 15 medidas. del esfuerzo de compresión de ciertas piezas de acero (en libras por pulgada cuadrada) :

40,150 65,100 49,500 22,400 38,200 60,400 43,400 26,350 31,200 55,600 47,250 73,200 35,900 45,250 52,400

Dibujar los datos directamente en papel de probabilidad aritrndtica y analizar si siguen una distribución normal.

10. Las siguientes son las velocidades (en millas por hora) de 120 automóviles que pasan por un punto de vigilancia con radar en una carretera:

64 82 60 86 63 56 69 43 60 42 53 107 50 35 77 47 62 81 72 79 75 I 64 57 86 59 55 65 76 51 75 67 52 87 49 65 46 75 64 62 85 93 54 81 76 57 64 91 73 98 85 78 96 84 60 90 84 60 73 67 50 72 52 95 70 48 59 62 37 65 76 45 70 63 60 41 88 66 67 78 73 54 75 66 50 49 99 76 68 80 48 82 69 70 72 79 57 74 74 70 73 65 72 54 75 74 58 69 73 55 80 53 71 103 65. -74 . . S7 63 69 65 58

Agrupar estos valores en una tabla de frecuencias y dibujar su histograrna.

del tipo “menor que” y dibujar su ojiva.

aritmttica e interprete el resultado.

rollos de tela:

11. Convertir la distribución obtenida en el ejercicio I O en una distribución de porcentaje total

12. Dibujar la distribucibn total del problema 11 en papel cuadriculado , d e probabilidad

13. Los siguientes son los nQmeros .de imp,erfecciones observadas en 50 muestras tomadas de

2 0 4 4 1 4 0 3 2 0 . o 1 1 1 0 1 2 4 1 1 1 6 2 2 5 3 4 0 4 ’ 0 o o 3 o 1 4 ’ 2 1 ’ 2 0 3 1 3 4 2 0 5 6 3 ‘ 2

( a ) Agrupar est98 dato6 en una tabla de fmuencias,,mostrando cuantas veces se presen-

( b ) Construir una distribucibn total del tipo ‘‘O mas” y dibujar su ojiva. 14. Las distribuCiQnm de f r e c m i a polr-#Orfa~. 80 suelen representar por medio de grhfi-

cas circulares que coorieten en dividir un círculo en sectores proporcionales en tamaño a las frecuencias con PW @tan diatribuidoe los datos en las diferentes categorías. Construya una grhfica de cate tipo pBn tepwantar 18 siguiente distribucibn:

ta cada uno de los nameroe.

Clewirr & i s h Nlimrro de grados conferidos _I ~ tn#enieifa 37,808 ’

Matemiticas F 1.437 Química 7,603

Geolq ia 2,428 Geografía 973

Fioica ’ 4,308

¿.cuál Podría ser un buen título para esta gráfica?

Page 116: ingenieria

108 TRATAMIENTO DE DATOS

15. El pictogramu de la figura 6.7 ilustra el hecho de que, en cierta área, el ingreso familiar medio se ha doblado de $ 3000 en 1950 a $ 6000 en 1960. i D a este pictograma una idea clara del aumento actual en los ingresos familiares? Si no es así, indicar cómo deberá modificarse.

1950 I960

Ingreso familiar medio

Fig. 6.7. Ingreso familiar medio

IfÍ. Dada un conjunto de observaciones .y1, S,. . . . x,, definimos su disftibucidrt tom/ o ucumulafiva empiricu como una función cuyos valores F ( x ) son iguales a la proporci6n de obscrvaciones menores o iguales que x. (a! Dibuiar la gráfica de la distribución total empírica de las 15 muestras del ejcrcicio 9. (1): ('omprobar que el método de ajustar curvas, usado en la página 112 ( la verificacidn

de "normalidad" de los datos no agrupados) se generaliza marcando los pujlfos me- dim de los escalones de la distribuci6n total empirica.

17. Convertir la distribución de los indices de solucijn de hierro de la pigina 106 en una distribución que tenga las clases 0.10-0.29, 0.30-0.89, 0.90-1.29 y 1.30-1.49. Dibujar dos histogramas de esta distribución, uno en que las frecuencias de clase se den por las altu- rus de los rectángulos y otro en que las frecuencias de clases estén dadas por las úreus de los rectángulos. ¿Por qué la primera gráfica da una idea bastante errada?

6.3 Medidas descriptivas

En la sección 3.5 introdujimos los conceptos de medii y variancia de una dis- tribución de probabilidad como parámetros que determinan su centro y su disper- sión. En esta sección, definiremos las medidas correspondientes para describir un conjunto de datos o su distribución.

Dado un conjunto de )I medidas u observaciones, x , , x-. . . . x,,, hay diferentes modos de describir alrededor de qué centro se agrupan (es decir, su localización central). Los métodos más empleados son los que hacen uso de la media mi fmi - tica y f a mediana, aunque también se emplean otras clases de "promedios" con fi-

Page 117: ingenieria

MEDIDAS DESCRIPTIVAS 1 o9

n 2 x i

n

Nótese que hemos indicado la media de las x con Z Y no como P, símbolo 1 ~ -

do para la media de una distribución de probabilidades (o densidad de probabili- dad). Seguiremos la práctica general de emplear letras latinas para denotar'descrip- cienes de datos reales y letras griegas para distribuciones teóricas. También, 'es inte- resante notar que la fórmpIa antepior nos daría la media de la distribución de 'una variable aleatoria que tomara los valores xi con probabilidades iguales de 1/n.

Algunas veces, es preferible usar la mediana como una medida descriptiva del centro o localización de un conjunto de datos. Esto es particularmente cierto si que- remos reducir todos los cálculos a un mínimo, o si deseamos eliminar el efecto de los valores extremos (muy grandes o muy pequeños). La mediana de n observacio- nes x,, x2. . . . x,,, se puede definir poco más o menos, como el valor "central". una vez que los datos se han ordenado con arreglo a su tamaño. Más precisamente. si las observaciones se ordenan por tamaños, y n es un número impar, la mediana es 21

valor de la observación numerada": si n es un número par, la mediana se defi-

ne como la media (promedio) de las observaciones cuyos números son 5 y 7 . Entonces, la mediana de las cinco observaciones 5, 4, 2, 7, 3 "es cuatro (el valor de l a observacion que ocupa el tercer lugar, comenzando por la mayor). y la mediana de las 6 observaciones 7, 2, 5, 9, 4, 6 es 5.5 (la media entre la tercera ycuarta ohser- vaciones, comenzando por la mayor).

La media y la mediana dan cada una un nilmero simple que representa u n con- junto entero de datos: la media es, generalmente, utilizada en problemas de estima- ción y otros problemas de inferencia estadística. Una razón intuitiva para preferir la media es que la mediana no utiliza toda la información contenida en las observa- ciones. Otra razón es que la mediana está sometida, en general, a mayores fluctua- ciones, es decir, puedc variar más de una muestra a otra. Este importante concepto de "variabilidad de las muestras" se estudiará en detalle en el capítulo 7. I

Para dar un ejemplo en el que la mediana da una dcscripcitin mejor que la me- dia. supongamos que un contratista de personal dice que el salario medio anual pa- gado a los ingenieros en su firma es $ 15 000. Esto da la impresión de que dicha fir- ma es un buen lugar para trabajar, Sin embargo, en un exlamen mas detallado, se ve que es una compañía pequeña que paga $ 5 O 0 0 a cada ingeniero de los 4 que tiene, además del dueño, que recibe $55 OCXM. Luego, la distribucicjn de ingresos es muy asimktrica, 10 que significa que su media de S 15 000 realmente no es una represen- taci6n ittil, mientras que la mediana de $ 5 o00 es al menos, representativa de Io que un ingeniero joven puede ganar en dicha firma.

n + l

n n + 2

Page 118: ingenieria

110 TRATAMIENTO DE DATOS

L a varianciu de n observaciones x,, x., . . . xn, mide, esencialmente, el prome- dio de sus desviaciones elevadas al cuadrado a partir de la media x, y se define por la f6r.mula

+ + Existen diferentes razones para usar el divisor n - 1 en lugar de 11. Primero,

stilo IZ - 1 de las desviaciones. desde la media, xi -5, son independientes, ya que su suma de todas. siempre es igual a .cero (ver el ejercicio 1 de la página 123). En otras palabras, n - 1 de las desviaciones a partir de la media determinan automá- ticamente la ndsima. Otra razón es que consideramos las x como valores tomados por una variable aleatoria, y al dividir por n - 1 en la fórmula de s2 la varianza resulta una estimaci6n mejor de 8 , variancia de la distribución de esta variable alea- toria. Ampliaremos este asunto en los capítulos 8 y 9.

De acuerdo con la terminología de los capítulos 3 y 4 definimos la desviacidn típica de 11 observaciones x,, x?, . . . X,, como la raíz cuadrada de su varianza, es decir,

+ + Nótese que, si hubiésemos dividido por rz en lugar de n - 1, la fórmula resul-

tante se habría podido emplear para la desviación típica de la distribución de una variable aleatoria que tomara los valores xi con probabilidades iguales a l / n .

La desviación típica y la variancia son medidas de la variacicin absoluta, o sea, que miden la oantidad real de variación presente en un conjunto de datos y depen- cien de la escala de medida. Para comparar la variación en vaiios conjuntos de datos, será conveniente, en general, utilizar medidas de variaciones re[utivns. Con este ob- objeto se usa el llamado coeficiente de vuriucitin

4 CT.' = 5 * 100 S + Notemos que esta medida, que da la desviación típica como un porcentaje de la

media, es independiente de la escala de medida. Luego, si un conjunto de datos tie- ne 5 = 12.0 y s = 1.5, el coeficiente de variacidn es CV = 12.574: en otras pala- bras, la desviación típica es 12.5% de la media.

En esta sección, nos hemos limitado a la media, la mediana, la varianza y la desviación típica. Por supuesto, habrá muchas otras formas de describir un conjun- to de datos. Por ejemplo, si queremos determinar un valor por debajo del cual haya el 2.576 de los datos, cakulamos el primer cuurtil (2,: si queremos determinar un va- lor por encima del cual se encuentren el 5% de los datos, calculamos el noventa y cinco percentif P!,5; etc. El cálculo de tales medidas se discutirá detalladamente en la sección 11.2. También tendremos ocasión de usar otras medidas de variabilidad. ta-

Page 119: ingenieria

CALCULO DE I Y S 111

les como el recorrido de una muestra (el valor máximo menos el mínimo), una desviuciún promedio, o un recorrido intercuartil. Cuando es necesario, se aplican nuevos métodos para la descripción estadistica.de los datos.

6.4 Cdlculo de R y S

En esta sección, discutiremos métodos para calcular Z y S, a partir de datos en bruto (no agrupados) y de datos agrupados. Los métodos que emplearemos están desarrollados particularmente para calculistas de oficinas, y son, al mismo tiempo. rápidos y exactos.

El cálculo de Z a partir de datos no agrupados, no presenta problema: s610 te- nemos que sumar los valores de ías observaciones y dividir por n. Por otra parte, el cálculo de S' es algo más complicado si utilizamos directamente la fórmula de la página 109. En su lugar, usaremos la forma algebráicamente equivalente

+ - n(n - 1)

+ que tiene la doble ventaja de necesitar menos trabajo y dar una exactitud mayor. En el ejercicio 3 de la página 114, el lector deberá demostrar que esta fórmula es equi- valente a la de la página 109). La disminucibn en trabajo resulta del hecho de que con tal fórmula no tenemos que calcular las desviaciones respecto de la media: el aumento en exactitud se debe a la disminución del numero de divisiones y restas, y a que éstas sólo se realizan en los dos idtimos pasos del cálculo. Otra ventaja de la fórmula anterior es que sólo hace falta utilizar las observaciones una vez, poniendo cada valor de x en una tabla, elevándolo al cuadrado y acumular las sumas necesa- rias de las .Y y de sus cuadrados en una sola operación. Como ilustración. vamds a hallar la media y la desviacibn típica de las siguientes 20 pérdidas de peso (en gramos) de ciertas bolas de un molino de bolas:

0.094 0.108 0.114 0.132 0.128 0.117 0.099 0.093 0.105 0.119 0.126 0.122 0.125 0.115 0.007 0.113 0.109 0.111 0.130 0.120

Usando una máquina de calcular de mesa, vemos que la suma de estos valores es 2.277 y que la suma de sus cuadrados es 0.261919. En coqsecuencia.

- 2.277 z = - = 0.1138 20

Y 20(0.261010) - (2.277)' = o.ooo1412

$2 20.19

je donde S = 0.01 19. Nótese que. al realizar las sumas necesarias, lo hicimos con odos los decimales, redondeando sdo al final del cálculo al nílmero de decimales lue teníamos en la tabla original, añadiendo uno más.

Page 120: ingenieria

112 TRATAMIENTO DE DATOS

Los cálculos que hemos realizado en el ejemplo se pueden simplificar aun más c i f rado primero las observaciones. Por una transformación lineal, podemos elimi- nar los puntos decimales multiplicando cada pérdida de peso por mil; entonces po- demos hacer de menor tamaño los números y trabajar más fácilmente, restando (ar- bitrariamente) 93 a cada valor. En lugar de los datos originales tenernos ahora 13s valores codificados.

1 15 21 39 35 24 6 0 12 26 33 29 32 22 4 20 16 18 37 27

2 cuyos valores Ilamarzmos u. Calculando la media y la desviación típica de las u por el mismo método que usamos antes, obtenemos como suma de las u 417 y de sus cuadrados 11,377 y, por consiguiente,

ü = 20.85, S: = 141.2, S,, = 11.1)

Para pasar de los valores codificados a los reales, observemos que las x y las u están relacionadas por la ecuación

~i = 1000~; - O8 6 x i = 0.001~; + 0.093

El álgebra elemental nos muestra entonces, que Z = 0.001;ii + 0.093 y S: = (0.001)2s~, donde si y S; son, respectivamente, las varianzas de las x y las u. Se deja al lector verificar que, substituyendo a = 20.85 y S,, = 11.9, en estas fórmulas se ob- tienen los valores antes calculados de Z = 0.1138 y sz = 0.0119. En el problema 5 de la página 114, el lector deberá verificar que, en general, cuando se tienen datos cifrados de tal forma que

xi = C ' U i $- a

las fórmulas correspondientes para la media y la varianza son

+ - z = c . ü + a y = c.s,, + Para calcular 5 y s a partir de datos agrupados, tendremos que hacer algunas

hipótesis sobre la distribucicin de los valores dentro de cada clase. Si representamos todos los valores de una clase por su correspondiente marca de clase, la suma de las x y la suma de sus cuadrados se pueden escribir

+ +

+ +

Page 121: ingenieria

CALCULO DE X Y 8 113

Como ilustracidn, volveremos a la tabla de frecuencias de los indices de solu- ción de hierro de la página 98. Poniendo las marcas de clase xi en la primera co- lumna, las frecuencias fi en la segunda y los productos xifi y zYi en la tercera y cuar- La columna, obtenemos.

Xi fi X i f i d f i

0.195 3 0.585 0.395 13 5.135 0.595 17 10.115 0.795 32 25.440 0.995 23 22.885 1.195 7 8.365 1.395 5 6.975

0. 114075 2.U28325 6.018425

20.224800 22.770575 9.996175 9.730125

100 79.500 70.882500

Substituyendo n = 100 y las sumas necesarias en ias fórmulas de if y S, tenemos - 79.500 '

X = - = 0.795 100 r ,

Y 82 = lOO(70.8825) - (79.5)' = o.o78 100.99

Estos cálculos fueron muy tediosos y los hicimos únicamente para dar al lector una idea de las simplificaciones que se pueden lograr por medio del cifrado; en este caso, cifrando las marcas de clase. El cifrado que utilizamos en relacidn con las dis- tribuciones ha de servir para representar las marcas de clase por medio de enteros sucesivos y, de preferencia, con el O cerca del centro de la distribucidn o cerca de la clase que tiene frecuencia más alta. Cifrando las marcas de clase de nuestra dis- tribución por -3, -2, -1, O, 1, 2, 3, y designando estas marcas de clase cifradas. por la letra u, la tabla anterior se reduce a , .

U¡ fi ' l6ifi 7L:j-i

-3 3 -9 27 -2 13 - 2G 52 -1 17 - 17 17

O a2 ir O 1 23 23 23 2 7 14 28

100 O 192

3 5 15 , .., 45

Y la media y la varianza de las u son ' ü = o

8: = lOO(192) - (O)' = :

100.99

Page 122: ingenieria

114 TRATAMIENTO DE DATOS

como el cifrado que utilizamos es tal que xi = (0.20)ui + 0.795, las dos fórmulas de la página 112 nos dan Z = 0,795 y S: = 0.078, que concuerdan con los resulta- dos obtenidos anteriormente. En general, si c es el intervalo de clase de una distribu- ción y x,, es la marca de clase a la que hemos asignado el valor O en la nueva escala, el cifrado estará dado por xi = c . ui + x,,, y, por consiguiente, las fórmulas de la media y la desviación típica son

+ z = c.’ii+zo y s z = c.su +

EJERCICIOS

n

i = l 1. Demostrar que z (xi - E ) = O.

2. Los siguientes son los números de trabajadores que han faltado en cierta fábrica en 10 días consecutivos de trabajo: 12, 17, 24, 15, 16, 8, 13, 21, 30 y 14. ( a ) Hallar la media. ( b ) Hallar la mediana. (c) Hallar S, empleando la fórmula de la página 109. ( d ) Hallar 3, empleando la fórmula de la phgina 11 1.

página 109

gran tamaño, medidas en grados Fahrenheit:

3. Demostrar que la fjrmula para s2 dada en la página 11 1 es equivalente a la dada en la

4. Las siguientes son 20 lecturas de temperatura tomadas en varios puntos de un horno de

( a ) Hallar Z. ( b ) Hallar la varianza. (c) Hallar el coeficiente de variación.

demostrar que 5. Si los datos de un problema están cifrados por la fórmula xi = cui 4- a (ver Página 112),

6. Repetir el ejercicio 4, utilizando el cifrado u = ( d 5 ) - 80 y comparar los resultados. 7. Calcular Z y S de los datos del ejercicio 9 de la pagina 107. 8. Calcular Z y S de los datos sin agrupar del ejercicio 13 de la pagina 108. 9. Utilizando la agrupación obtenida en el ejercicio 13 de la pagina 116, calcular Z y S, Y

10. Con los datos del problema 3 de la página 114, calcular Z partiendo de los datos sin agru-

11. Utilizando la agrupación obtenida en el ejercicio 3 de la pagina 106 calcular s. 12. Utilizando la agrupacibn obtenida en el problema 10 de la pagina 107 calcular la media

y la desviación normal de las 120 velocidades. 13. Si k conjuntos de datos constan, respectivamente, de PI,. n2 . . . Ilk observaciones y tienen

las medias Z1, Zz, . . . , &, el promedio total de todos los datos esta dado por la fórmula

comparar con los resultados del ejercicio 8.

par y de los datos agrupados y comparar los resultados.

Page 123: ingenieria

CALCULO DE f Y S 115

(a) Los salarios medios anuales pagados a directivos de alto nivel en tres compañías son $24,000, $ 32,000 y $29,000. Si los n h e r o s de directivos respectivos s w 6, 15 y 9, hallar el salario medio pagado a los 30 directivos.

( b ) Compruebe la fórmula anterior.

medias ponderadas: 14. La Mrmula del problema 13 es un caso especial de la fórmula siguiente para determinar

k Z wixi - i - 1

XW = - k

i - 1 I: w i

donde )vi es un peso que indica la importancia relativa de la i-ésima observacih. Usar esta fórmula para determinar el costo medio por caja de almuerzo, si un proveedor pre- para 1 500 cajas para el día de campo de los empleados de una compañía, haciendo 800 cajas a un costo de $ 1.20 cada una, 500 cajas a $0.95 cada una y 200 cajas a $1.10 cada una.

Page 124: ingenieria

7.1 Población y muestras

El empleo del término "población" en Estadística viene de la época en que esta ciencia se aplicci principalmentc al estudio de fenómenos económicos y sociales. Actualmente, se aplica a cualquier conjunto o colección de objetos, reales o con- ceptuales, y principalmente a conjuntos de números, medidas u observaciones. Por ejemplo, si nos interesa determinar el númcro medio de aparatos de tele- visión por casa, en los Estados Unidos, el total de estos números, uno por casa, cons- tituye la población estudiada. Análogamente, la población de la cual los inspectores extraen una muestra para determinar alguna cualidad característica de un producto manufacturado, puede ser la medida correspondiente de todas las unidades de un lote dado: y dependiendo de los objetivos d e la inspección, puede consistir, también, en la medida de todas las unidades fabricadas.

En algunos casos, como el anterior de los aparatos de televisión, la población es finita; en otros, como la medida de todas las unidades, pasadas, presentes y futu- ras que puede hacer una fábrica, la población debe considerarse infinita. Igualmente, los resultados obtenidos en una serie de tiradas en el juego de "cara y cruz", se con-

116

Page 125: ingenieria

POBLACION Y MUESTRAS 117

siderarán como una muestra de una población hipotéticamente infitlira formada por todas las tiradas posibles.

Las poblaciones se describen frecuentemente por las distribuciones de SUS valo- res y es práctica común referirse a la población en términos de su distribución. (Para poblaciones finitas, nos referimos a la distribución real de sus valores: para pobla- ciones infinitas, nos referimos a la correspondiente distribución de probabilidad, o a la densidad de probabilidad.) Por ejemplo, nos podemos referir a un número de ti- radas con una moneda como una muestra de "población binómica", o a ciertas me- didas como muestra de "población normal". De aquí en adelante, al hablar de una "población f(x)", nos referiremos a una población tal que sus elementos tienen una distribución de frecuencias, una distribucicin de probabilidad, o una densidad, con va- lores dados por f (x).

En una población infinita, es imposible observar todos sus valores y. muchas veces, en una población finita resulta poco práctico o antiecónomico observarla en- teramente. Por este motivo, es necesario, en general, emplear una muestra, una par- te de la población, e inferir, de su análisis, resultados que pertenezcan a toda la po- blacicin. Tales resultados sólo serán iltiles si la muestra es, en alguna forma, "repre- sentativa" de toda la poblacicin. No sería razonable, por ejemplo, esperar generaliza- ciones M e s sobre los ingresos familiares en 1964 en Estados Unidos. tomando como base datos correspondientes sólo a propietarios de casas, Análogamente. es difícil esperar resultados correctos al pretender generalizar los resultados obtenidos por una llanta que sólo se ha probado en caminos suaves. Para tener la seguridad de que una muestra es representativa de la población de la que se ha obtenido, y para crear 1 i 1 ~ estructura en la que podamos aplicar la teoría de la probabilidad a problemas de muestras, limitaremos el uso del termino "muestra" a las llamadas n1w.rtru.r &u- torius. Las muestras aleatorias se definen, para poblaciones finitas, en la forma si- guimte:

(JII ( . c > t l j t ( t l t c j r t o olnerva(iot1c.s x,, .x2, . . . x,, constituye U I I U t m r r s t t u trleatoria da tunruiio 11, puru uttu pohlacitin finita de tanraiio N , .si sc e.r(~?:'e do tul forttlu quc cada subconjunto (le n alett1etrto.s entre los N de la poí&wi~;tt. t i o w /u n r i s n l c c pro- babilidad de ser oscvgido.

Nótese que esta definición de azar pertenece esencialmente a la manera conw los valores de la muestra son seleccionados. Esto es vrilido tambikn para la definici6n siguiente de muestra aleatoria para una poblacirin infinita:

Un conjunto t i c of~sPr~~ac'iot?C.s x , , x2, . . . x,, cwrstitrryc u t 1 u tttml.jtr(1 u?cutoria de tamatio 1 1 de la poblucititl f(x) si: ( 1 ) Cuda xi 0.7 1111 valor de llttu rwiuble alwtoria cuya distribrr(i(il1 pstJ eluda

por f (x) . (2) Estas 11 variuhlcs ulcutorius S O I I itltlppc'ttrlio1tP.s.

Hay varios modos de asegurar la selecci6n de una muestra que sea. al menos aproximadamente, aleatoria. Cuando se trata de una poblacibn finita. podemos nu- merar los elementos de la misma y despuk seleccionar una muestra con la ayuda

Page 126: ingenieria

118 DlSTRlBUClON DE MUESTRAS

de una tabla de números aleatorios (véase la discusión de la página 92) . Por ejem- plo, si una población tiene N = 500 elementos y queremos seleccionar una muestra aleatoria de tamaño n = 10, podemos usar tres columnas elegidas arbitrariamente en la tabla VI1 para obtener 10 números diferentes de 3 dígitos menores o iguales que 500, los cuales serán los números de los elementos que se incluirán en la mues- tra. Si el tamaño de la población es grande, el empleo de números aleatorios puede resultar laborioso y, en ocasiones, prácticamente imposible. Por ejemplo, si queremos probar una muestra de 5 casos tomados de entre los muchos miles almacenados en los depósitos del ejército, resultará demasiado difícil numerar todos los casos. hacer una selección por medio de los números aleatorios, y después sacar los 5 que hayan sido seleccionados. En una situación como ésta, no nos queda más remedio que ha- cer la selección relativamente al azar, esperando que no se violen seriamente las hi- pótesis básicas de la teoría estadística.

Al tratar con poblaciones infinitas, la situación es diferente, ya que no podemos numerar físicamente sus elementos; pero se debe hacer todo lo posible para aproxi- mar las condiciones de azar, empleando medios artificiales. Por ejemplo, al seleccio- nar una muestra de una línea de producción, posiblemente estaremos en condiciones de lograr una e!ección al azar, escogiendo una unidad cada media hora: al hacer una tirada de "cara y cruz", trataremos de tirar la moneda de tal forma que ningún lado salga favorecido intencionalmente, etc. El uso apropiado de sistemas mecánicos o artificiales para seleccionar ejemplos de azar se debe preferir a los criterios humanos, ya que es extremadamente difícil eliminar las predisposiciones inconscientes al hacer cualquier tipo de selección.

Aún con la selección cuidadosa de sistemas artificiales, es muy fácil cometer graves errores en la selección de una muestra de azar. Para ilustrar algunas de estas fallas, supongamos que debemos seleccionar troncos que son llevados por una correa de transporte de velocidad constante hasta una serrería, y que la selección se hace para obtener una muestra aleatoria de sus longitudes. Un sistema para selecc: lonar las muestras que, a primera vista, puede parecer conveniente, consiste en medir los troncos que pasan por un punto dado al final de cierto número de intervalos de 10 minutos. Sin embargo, un estudio más cuidadoso demuestra que este método fa- vorece a los troncos más largos, puesto que éstos requieren más tiempo para pasar por el punto. Entonces, la muestra no está tomada completamente al azar, ya que los bloques más largos tienen más oportunidad de ser incluidos. Otro error común en la selección de muestras es el de tomarlas de una población equivocada O de una pobremente especificada. Como indicamos anteriormente, debemos poner el máximo inter& en obtener una muestra a partir de la que podamos generalizar nuestro resul- tados y, en el ejemplo de los ingresos familiares anterior, esto no será posible si to- mamos nuestra muestra entre propietarios de casas. Análogamente, si queremos de- terminar el efecto de las vibraciones en un elemento de una estructura, debemos pre- cisar la banda de frecuencias que nos interesa, y hacer las pruebas sólo entre las fre- cuencias seleccionadas al azar de dicha banda.

El propósito de la mayoría de las investigaciones estadísticas es generalizar la información contenida en muestras aleatorias a la población de la cual obtuvimos

Page 127: ingenieria

DlSTRlBUClON MUESTRAL DE LA MEDIA ( 0 CONOCIDA) 119

las muestras. En particular, estamos ordinariamente interesados en el problema de hacer inferencias acerca de los pmrimetros de las poblaciones, tales como la media 1.1

y la desviacicin típica U. Al hacer estas inferencias, generalmente usamos estadísticos, tales como Z y S, o sea, cantidades calculadas a partir de la observación de muestras. Como la seleccicin de una muestra aleatoria está regida, en gran parte, por el azar, los valores obtenidos de estos estadísticos tambien lo estarán. El resto de este capi- tulo lo dedicaremos a una discusión de distribuciones muestrales, es decir, distribu- ciones que describen las fluctuaciones casuales de las estadísticas calculadas a partir de muestras aleatorias.

7.2 Distribución muestra1 de la media (u conocida)

Supongamos que una muestra aleatoria de n observaciones se ha tomado de cierta poblaci6n y que hemos calculado Z; con objeto de estimar la media de la po- blación. Debe aclararse que, si tomamos una segunda muestra de azar de tamaño n en esta poblacihn, resultará poco razonable esperar un valor identic0 de Z, y si hemos tomado varias muestras, probablemente no habrá dos Z iguales. Las diferen- cias entre estos valores se atribuyen, generalmente al azar y esto origina importan- tes cuestiones referentes a su distribucidn, y en concreto, a la extensión de tales fluc- tuaciones casuales.

Para introducir esta cuestión de manera experimental. haremos un experimento sencillo en el que se toman 50 muestras aleatorias de tamaño tI = 10 de una pobla- ción que tiene distrihuci&1 uniforme discreta.

f(z) = 1; para x = O , 1, 2 , . . . , 9

(0 por otra parte Un modo conveniente de obtener estas muesrras es utilizar una tabla de nú-

meros aleatorios, como la tabla VII, haciendo que cada muestra sea un conjunto de 10 digitos consecutivos tomados de columnas escogidas arbitrariamente. Las me- dias obtenidas en esas S0 muestras son

4.4 3.2 5.0 3.5 4.1 4.4 3.6 6.5 5.3 4.4 3.1 5.3 3.8 4.3 3.3 5.0 4.9 4.8 3.1 5.3 3.0 3.0 4.6 5.8 4.6 4.0 3.7 5.2 3.7 3.8 5.3 5.5 4.8 6.4 4.9 6.5 3.5 4.5 4.9 5.3 3.6 2.7 4.0 5.0 2.6 4.2 4.4 5.6 4.7 4.3

y la siguiente es una tabla de frecuencias que muestra la distribucicin de estas medias:

E Frcmutrcim

2.0-2.9 2 3.0-3.9 14 4.0-4.9 19 5.0-5.9 12 6.0-6.9 3

50

Page 128: ingenieria

120 DlSTRlBUClON DE MUESTRAS

Es evidente, del histograma que representa esta distribución en la figura 7.1, que la distribución de las a: tiene aproximadamente forma de campana aunque la población misma tiene una distribución uniforme. Esto nos lleva a la cuestión de si este tipo de resultado es el resultado típico y el que se debe esperar en terminos generales; en otras palabras, ¿Debemos obtener una distribución similar si tomamos 100 muestras, 1000 muestras, o más? Para respondernos, debemos investigar la dis- tribución muestra1 teórica de Z que, en el ejemplo dado, nos proporcionaría las pro- babilidades de obtener 3 cntre 2.0 y 2.9, entre 3.0 y 3.9,. . . . entre 5.0 y 6.9, y quizás

2oc

Fig. 7.1 Distribución de muestras del medio experimental

valores menores que 2.0 o mayores que 6.9. Aunque podríamos calcular efectiva- mente estas probabilidades, sin embargo, es suficiente referirnos a algunos teoremas generales sobre distribuciones de muestras. El primero de ellos, anunciado romo si- gue, nos da expresiones para la media y la varianza de las distribuciones mues- trales de 2:

Teorema 7.1 Si una muestra u!eatoria de tamaiio n se toma de una poblacicin que tiene la media p y la varianza 02, entonces, Z es un valor de una varia- hle uletoria cuya distribucitin tiene la media P. Para muestras de poblaciones infinitas, la 1.nrian:ct de esta distribucicin es d / n ; para muestras de pobla- cicin finitas de tamaiio N , la varianza es - . - u2 N - n

n- N - 1

Llamando pz a la media de la distribución muestra1 de Z, probaremos primero para el caso continuo que pcl~ = p. (La demostración para el caso discreto sigue pasos idénticos, poniendo sumas c en lugar de los signos de integral.) Usando la defini- ción de l a página 77, tenemos

Page 129: ingenieria

donde f(x,, x.,. . .x7,) es el valor de la densidad conjunta de las variables aleatorias cuyos va!ores constituyen la muestra aleatoria. Usando la hipótesis de aleatoriedad, podemos escribir

y ahora tenemos

Como cada integral, excepto la que tiene el integrando xi f(xi) es igual a 1. y la que tiene elintegrandoxi f(xi) es igual a p , obtenemos, finalmente,

y esto completa la demostración de la primera parte del teorema. Para probar que, para muestras aleatorias de poblaciones infinitas. u;, va-

rianza de la distribución muestra1 de f , es igual a d / n , haremos la hipótesis sim- plificadora de que p = O. Como el lector podrá comprobar en el problema 9 de la página 136, esto JW implica ninguna pérdida de generalidad: de hecho, establecimos un resultado semejante en la página 112, que nos demostró que la adición de una constante a cada valor no afecta Ia desviación típica (o la varianza) de un conjun- to de datos. Usando la definición de la página 77, tenemos

y haciendo uso de

obtenemos

donde 2 Z se extiende para todas las i y j desde 1 hasta 11, sin incluir los tCrminos

en que i = j. Usando nuevamente !(x,, x., . . . xPL) = f(x,)f(x,) . . .fcxtl). podemos escribir cada una de las integrales múltiples anteriores como un producto de inte- grales simples, siendo cada una de estas últimas que tiene un integrando de la forma f(x), igual a 1. Entonces, obtenemos:

i P'i

y como cada integral de la primera suma es igual a u2 mientras que cada integral de la segunda es igual a O, tenemos, finalmente:

Page 130: ingenieria

122 DlSTRlBUClON DE MUESTRAS

Esto completa la demostración de la segunda parte del teorema. No conproba- remos el resultado correspondiente para muestras aleatorias de poblaciones finitas,

pero haremos notar que en la fórmula resultante para u: el factor __ N - es. apro-

ximadamente, 1 (y se puede omitir para la mayoría de las aplicaciones prácticas). a menos que la muestra constituya una porcicin grande de la poblaci6n. Por ejemplo. si se saca una muestra de azar de tamaño 10 de una poblaci6n de tamaño 1000. el

factor ~

N - n , llamado también factor de correccicin para poblaciones finitas, es N - 1 aproximadamente igual a 0.99 l .

Aunque no resulta muy sorprendente el que la media de la distrihucit.:ln m w s - tral teórica de Z sea igual a la media de la población, el hecho de que >u varian- za sea d / n , para muestras aleatorias de poblaciones infinitas, es interesante e im- portante. Para hacer resaltar sus implicaciones. aplicaremos el teorema de Cheby- shev a la distribución muestral de 3, poniendo Z en vez de x y u/& en vez de u en la densidad dada en la página 54. Así obtenemos.

N - I

y haciendo ku/.\/k = t, resulta

Luego. para cualquler e > U, dado, la probabilidad de que Z difiera de p en me- nos de E se puede hacer arbitrariamente cercano a I , escogiendo n lo suficiente- mente grande. En un lenguaje menos riguroso. cuanto mayor sea el timañ0 de la muestra, más se aproximará 5 a la media de la poblacicin. En este sentido, podemos decir que Z se va haciendo cada vez más digna de confianza como una estimación de p a medida que crece el tamaño de la muestra. Esta confianza se mide también por la expresi6n u/<;, llamada tambiCn errror típico de la media. Nótese que esta medida de confiabilidad de z disminuye proporcionalmente a la raíz cuadrada de tI;

por ejemplo. es necesario cuadruplicar el tamaño de la muestra para reducir a la mitad la desviación típica de la distribución muestral de la media. Esto indica también lo que se podría llamar una “ley de retornos que disminuyen” en lo con- cerniente al aumento del tamaño de la muestra. Usualmente, no conviene, desde un punto de vista práctico, tomar muestras excesivamente grandes, pues el trabajo y los gastos extras no compensan la ganancia en confiabilidad. Por ejemplo, si aumentamos el tamaño de una muestra de 25 a 2 500, los errores a los que estamos expuestos se reducen solo por el factor 10.

Volvamos ahora a la distribución muestral experimental de la página 177 y comprobemos en cuanto se aproximan, la media y la varianza a los valores espe-

Page 131: ingenieria

DISTRIBUCION MUESTRAL DE LA MEDIA (UCONOCIDA) 123

rados de acuerdo con el teorema 7.1. Como la población de la que obtuvimos las 50 muestras de tamaño 10 tiene por media

9 1 p = 2 ' z . - = 4 . 5

z r O 10 y por varianza

9 1 a* = 2 (X - 4.5)'- = 8.25

2=0 10 el teorema 7.1 nos da como media esperada PZ = 4.5 y como varianza a; = 8.25/10 = 0.825. Calculando la media y la variancia a partir de la tabla de frecuencias de la página 119. obtenemos z3 = 4-45 y S: = 0.939, que son bastante aproximados a los valores teóricos.

El teorema 7.1 nos proporciona únicamente información parcial sobre la dis- tribuci6n muestral teórica de la media. En general, es imposible determinar tal distribución exactamente sin conocer la forma real de la población. pero sí es po- sible Ja distribucibn límite para n 3 m de un estadistico relacionada estrechamente con Z suponiendo solo que la población tiene una varianza finita d. El estadístico a la que nos hemos referido es el medio t ipificdo y Iwlucido.

Z-/.L z=- U/&

que es la diferencia entre Z y p dividida entre la desviación típica de. la distribucicin muestra de Z. Con referencia a este estadístico, tenemos el siguiente'teorema llamado teorema del límite central:

Teorema 7.2 Si Z es la media clc ulw muestra aleuforia de tanmío n tomda en una pohlacitin que. tiene la media p y Iu vurianciu finita a2, tv~toncrs os el

Z - p z=- U/&

valor de una variable aleutoriu cuya funticin de rlistrihucicin st) uprosimcr N 1u de la distribucicin nornxd cmtruda y reducida c~uando n 3 00. En este texto, no probaremos el teorema anterior. pero, al mel?os. se puede

hacer una, verificacibn parcial (experimental). marcando la distribucih de porcen- tajes totales correspondiente a la' distribución de la figura 7.1 en papel de probabi- lidad aritmética. Como se puede ver en la figura 7.2, los puntos siguen aproxima- damente una línea recta lo que significa que para n = 10, la distribución muestral de f para este ejemplo sigue con bastante aproximacicin el patrón de una distribu- ción normal. En la práctica, la distribución normal ya nos da una excelente aproxi- mación de la distribución muestral de J cuando II es de 25 a 30. sin ninguna clase de restricciones en la forma de la poblacicin. Como vemos en nuestro ejemplo. la distribución muestral de Ltiene la forma general de una distribucibn normal incluso para muestras de tamaño 10 en distribuciones uniformes discretas. y esto es cierto. en general, siempre que la forma de la distribución de poblacl6n no sea demasiado

Page 132: ingenieria

124 DlSTRlBUClON DE MUESTRAS

sesgada. Se puede demostrar que la distribución muestra1 de J es exactamente nor- mal [independientemente del tamaño de la muestra), cuando la muestra se obtiene de una poblacicin normal.

Para ilustrar el teorema 7.2. supongamos una muestra aleatoria de tamaño 100 que se toma de los diámetros interiores en ciertas longitudes de tubos continuos. Si

90

95

90 -

80

70

60

50-

.- 4-

1 O

.- E 40 u

3 0 t " 20

joL 5 2 1.95 2

T

o .d

A / /

-7" I

Fig. 7.2 Verificación experimental del teorema del límite central

la media y la desviacicin típica de esas medidas son, respectivamente, p = 34.1 y u = 1.5 pulgadas, deseamos conocer la probabilidad de que la media de la mues- tra se encuentre entre 34.0 y 34.3 pulgadas. Según el teorema 7.2, tendremos que ha- llar el área de la curva normal entre

34.0 - 34.1 z =

34.3 - 34.1 = 1.5/10 = -0.67 y z = 1.5/10

y, buscando estos valores en la tabla 111, obtenemos una probabilidad de 0.6568. No- temos, además, que, si 5 se hubiera resultado mucho mayor de 34.1, tal como 34.5. se debería dudar seriamente de que la muestra proviniera de una poblaci6n con p = 34.1 y v = 1.5. La probabilidad de obtener una media tan grande (un valor de z mayor que 2.67) es' solamente 0.0038.

Page 133: ingenieria

DISTRIBUCION MUESTRAL DE LA MEDIA ( u CONOCIDA) 125

EJERCICIOS

1. Un inspector examina cada décima pieza que sale de una linea de montaje. Hacer una lista de algunas de las condiciones en las que este método no daría una muestra aleatoria.

2. En 1932, el Literary Digesr predijo la elección presidencial en los Estados Unidos por muestras aleatorias obtenidas de los directorios telefónicos y de su lista de suscriptores. La predicción fue incorrecta en gran medida; explicar por qué.

3. Una organizaclón investigadora de mercados desea saber la aceptacibn de un producto nuevo en 5 de los 50 estados de la Unión Americana. Utilizar números aleatorios (tabla VTI) para hacer esta selecci6n.

4. Tomar 30 hojas de papel y marcar cinco de ellas con - 5 y la misma cantidad con 5, cuatro con - 4 y otras tantas con 4, tres con - 3 y otras tantas con 3, dos con - 2 y otras tantas con 2, una con - 1 y otra con 1. (a ) Si cada hoja tiene la misma probabilidad de ser tomada, hallar las probabilidades

de obtener - 5, - 4, - 3, . . . 4 , 5, y encontrar la media y la varianza de esta distribucih

( b ) Seleccionar 50 muestras de tamaño 10 de esta población, sin reemplazamiento en la extracción de cada muestra, y calcular sus mcdias.

(c ) Calcular la media y la varianza de las 50 medias obtenidas en la parte (b). (d) Comparar los resultados obtenidos en la parte (c) con los valores correspondientes

esperados de acuerdo con el teorema 7.1 (Nfjtese que ,U y u4 se obtuvieron. en la parte (a) .)

5. Repetir el ejercicio 4, pero seleccione cada muestra con reemplazamiento, es decir, se de-

6. Utilizar números aleatorios para tomar l U 0 muestras aleatorias de tamaño 5 de la pobla- vuelve cada papel sacado y revolviendo todos antes de sacar la otra muestra.

ció infinita que tiene la distribucih.

X f ( 4

1 0.08 2 0.17 3 0.50 4 0.17 5 0.0s

(a ) Calcular las 1 0 0 medias, agruparlas y determinal la media y la desviacibn típica dc

(bj Comparar los resultados obtenidos en l a parte ( a : con 10 valores correspondientes su distribución.

esperados de acuerdo con el teorema 7.1. 7. Sea la población infinita cuya dístribucihn esti dada por

X f ( 4

1 O. 25 2 O. 25 3 O. 25 4 0.25

hacer una lista con las 16 muestras posibles de tamaño 2 y usar esta lista para construir la distribución de 5i para este tipo de muestras. Verificar que la media y la varianza de esta distribución de muestras son idénticus d los valores correspondientes esperados al utilizar el teorema 7.1.

Page 134: ingenieria

126 DlSTRlBUClON DE MUESTRAS

8. Probar que pa = p para muestras aleatorias de poblaciones discretas. 9. Si x es un valor de una variable aleatorla continua y y A- at- L h, demostrar que

( 4 pU = w r + b, (b) úi = a2ua,”.

10. Se torna una muestra aleatoria de tamaño 64 de una publaci6n infinita con media p = 122 y varianza u2 = 144. Usar el teorema del límite central para encontrar la probabili- dad de obtener una Z mayor que 114.5.

11. Se torna una muestra aleatoria de tamaño 1 0 0 de una poblacihn infinita con media = 53 y varianza u2 =- 400. ¿Cui1 es la probabilidad de obtener una 3 entre S y 56?

12. Un proceso de ligado por alambres está controlado si el esfuerzo medio de tracci6n es de 10 libras. Se sabe que las medidas del esfuerzo de tracción están distribuidas normal- mente con desviación típica de 1.5 libras. Se toman muestras aleatorias periódicas de tamaño 4 y. si la media de una muestra es menor que 7.75 libras, se considera el proce- s o fuera de control. Haga lo5 comentarios que considere pzrtinentes.

13. Si las medidas del peso específico de un metal se pueden considerar como una muestra de una poblacihn normal que tiene una desviación típica de 0.05, ¿Cuál es la probabili- dad de que la media de una muestra aleatoria de tamaño 16 quede desplazada en 0.02 a l o más‘!

14. La media de los pesos de 400 varones adultos que residen en cierta comunidad se usa para estimar el peso promedio “verdadero” de todos los adultos que viven en la co- munidad.Si la desviacibn típica de medidas de esta clase, sabemos que es de 18 libras, ¿,C‘t161 es la probabilidad de que esta estimaci6n sea incorrecta en mis de 2.5 libras?

7.3 Distribución muestra1 de la media (u desconocida)

El uso de la teoría de la sección anterior requiere que se conozca la desvia- ción típica U de la población. Si n es grande, podemos usar tambiCn esta teoría cuan- do U n o se conoce, substituyendo U por la desviación típica S de la muestra. En lo que se refiere al estadistico ‘2 - . se sabe muy poco sobre su exacta distribu-

ción para valores pequeños de 17, a menos que se haga la hipótesis de que la muestra proviene de una pohlacitin normal. Cuando así ocurre, podemos probar el siguiente teorema:

s / d n

Teorema 7.3 S; 5 es la media. de una muestra a!eutoriu de tamafio n tornada de u ~ a poblatfcin normal con media p y varianza u2? entonces,

c s el valor de una variable a!eatoriu que tiene una distrihucicin t de Student * de púrametro v = t1- I Este teorema es mús general que el teorema 7.2, en el sentido de que no es ne-

cesario conocer u por otra parte, es menos general que el 7.2, puesto que requiere la hipótesis de ser normal la población.

* La distribucii~n 1 de Student se investigb por primera vez en 1908, por W. S. Gosset, quien public6 sus estudios bajo el seud6nimo de “estudiante”, por que sus patronos no permi- tían la publicacinn de investigaciones.

Page 135: ingenieria

DlSTRlBUClON MUESTAAL DE LA MEDIA ( O DESCONOCIDA) 127

Como se puede ver en la figura 7.3, la forma general de una distribucidn t es similar a la de una distribución normal-ambas tienen forma de campana y son si- mdtricas con respecto a la media. Como la distribución normal tipificada, la distri- bución t tiene media cero, pero su varianza depende del parámetro Y, llamado nú- mero de pxzd0.s de libertad. La varianza de la distribución t es mayor de 1, pero se

Fig. 7.3 Distribuciones normal standar y estudiante r

aproxima a este valor cuando n 4 00. Se puede demostrar que la distribucicin t con Y grados de libertad se aproxima a la distribución normal tipificada cuando Y -+ a .

La tabla IV de la página 373, contiene valores seleccionados de tu para distin- tos valores de v, donde ta es tal que el área bajo la curva de distribución t (toma- da a la derecha) es igual a a. En esta tabla, la columna de la izquierda está for- mada por los valores de Y, los valores que encabezan las columnas son áreas a de la cola derecha de la curva de la distribución t y las entradas son valores de tu (véa- se tambiCn la figura 7.4). No es necesario tabular los valores de tu para a > 0.50, como se desprende, de la simetría de la distribución t ya que tl-, = - t u ; así el valor de t que corresponde al áred de la cola de la izquierda de a es -tam

Nótese que, en la fila del final de la tabla IV, las entradas corresponden a los valores de 2 que cortan las colas del lado derecho del área a bajo la curva normal

f ( f ) ( v grados de libertad)

O t t Fig. 7.4 Valores tabulados de r

Page 136: ingenieria

128 DlSTRlRUClON DE MUESTRAS

tipificada. Empleando la notación z , para un valor de z que cumple tal condición se puede ver, por ejemplo, que z.025 = 1.96 = t.ozs para v = 00. Hubiéramos po- dido esperar este valor, puesto que la distribución t se aproxima a la normal tipi- ficada cuando u -+ 00. De hecho, observando que 10s valores de t, para 29, o más, grados de libertad están muy cerca de los valores correspondientes de z,, conclui- mos que la distribuciún normal tipificadu nos da una buena aproximación de la dis- tribucidn t paro muestras de tamaiio 30, o más.

Ilustraremos el empleo de la distribución t, suponiendo que un fabricante de alambre de acero asegura que la fuerza media requerida para romper una clase de alambre dada es 500 libras. Para probar esto, se toma una muestra de 25 partes de este tipo de alambre y se somete a tracción, la media y la desviación típica de las fuerzas necesarias para romper estas muestras son, respectivamente f = 465 libras y S = 55 libras Suponiendo que los esfuerzos de rotura se puedan considerar como una muestra aleatoria de una población normal con p = 500, el estadístico

es un valor de una variable aleatoria que tiene distribución t con v = 25 - 1 = 24 grados de libertad.

Ahora, de la tabla 1V encontramos que, para v = 24, la probabilidad de que t exceda a 2.797 es 0.005 si p = 500, de donde podemos concluir que la probabilidad de que t sea menor que - 2.797 es también 0.005. Como el valor obtenido en nues- tro ejemplo es t = - 3.18, nos encontramos ante dos alternativas: o bien, es cierto que p = 500 y hemos observado un suceso relativamente raro, o p no es igual a 500 (de hecho es menor que 500). Teniendo que hacer una elección, nos inclina- ríamos a aceptar la alternativa de que la fuerza promedio “real” requerida para rom- per esta clase de alambre es menor de 500 libras.

La hipótesis de que la muestra no venga de una población normal, no es una restricción tan severa como se puede considerar a primera vista. Estudios han de- mostrado que la distribución del estadístico

es, en general muy cercana a una distribución t , incluso para muestras de poblacio- nes no normales. En la práctica, es necesario asegurarse primero de que la pobla- ción de la que obtenemos la muestra es, aproximadamente, de forma de campana y no muy sesgada. Un método práctico de comprobar esta hipótesis es hacer una lista de las observaciones de un papel de probabilidad aritmética como el descrito en la página 104. [Si una gdfica de este tipo muestra una curva distinta de una linea recta, tal vez sea posible “alargarla” transformando los datos -por ejem- plo, tomando sus logaritmos o sus raíces cuadradas.]

Page 137: ingenieria

DlSTRlBUClON MiJESTRAL DE LA VARIANZA 129

7.4 Distribuci6n muestral de la varianza

Hasta ahora, S610 hemos discutido distribuciones muestrales de la media pero si hubieramos tomado las medianas, los recorridos o las desviaciones típicas de las 50 muestras mencionadas en la página 1 1 9, hubiéramos podido obtener de manera analoga muestras experimentales de estos estadísticos. En esta sección, analizaremos la distribución muestral teórica de .y2 para muestras aleatorias de poblaciones nor- males. Como s2 no puede ser negativa, debemos esperar que esta distribucicin mues- tral no sea una curva normal: y efectivamente se encuentra ligada a una distribu- ción gamma de parametros a = v/2 y @ = 2 (véase la página 72) llamada distri- bucio'n x cuadrado (chi-cuadrado.) Concretando se tiene

Teorema 7.4. Si s9 es la variancia de una muestra aleatoria de tamaño n toma- da de una población normal que tiene la varianza d,entonces.

2 - (n - lb2 x - u2

es un valor de una variable aleatoria que tiene la distribucicin x-cuadrado con el parámetro v = n - 1.

La tabla V de la página 374 contiene valores seleccionados de para distintos vaIores de v, llamado, de nuevo, ndmero de grados de libertad, donde d es tal que el área bajo la curva de la distribución x-cuadrado (tomada a la derecha) es igual

f (X2) ( I / grados de libertad)

Fig. 7.5 Valores tabulados de chi-cuadrada .

a a. En esta tabla, la columna de la izquierda contiene valores de v, los valores que encabezan las columnas son hreas de la coia derecha de la curva de la distri- bución x-cuadrado y las entradas son valores de d (vkase la figura 7.5). A dife- rencih de la distribución t, es necesario tabular valores de para a > 0.50, por- que la distribución x-cuadrado no es simétrica.

Page 138: ingenieria

130 DlSTRlBUCiON DE MUESTRAS

Para ilustrar el teorema 7.4, supondremos que una compañia de ciptica com- pra cristal para fabricar lentes, y que experiencias anteriores han demostrado que la variancia del índice de refracción de esta clase de cristal es 1.26-10-4. Para convertir el cristal en lentes de una longitud focal dada, es importante que las distintas piezas de cristal tengan, aproximadamente, el mismo índice de refracción; en consecuencia, supondremos que en envío de cristal de esta clase se rechaza si la variancia muestral de 20 piezas seleccionadas al azar excede a 2.00.10". Suponiendo, además, que los valores de las muestras se pueden tratar como si provinieran de una población nor- mal con u2 = 1.26.10-4, la probabilidad de que un envío se rechace erróneamente se puede determinar de la manera siguiente. En primer lugar, obtenemos

y después encontramos, en la tabla V, que, para 19 grados de libertad, X.& = 30.1. Entonces, la probabilidad de que un envio bueno se rechace erróneamente, por este criterio, es menor que 0.05.

Un problema relacionado muy de cerca con el de encontrar la distribución de la variancia muestral es el de encontrar la distribución de la razdn de las variancias de dos muestras aleatorias independientes. Este problema es importante porque aparece en pruebas en las que queremos determinar si dos muestras provienen de poblaciones que tienen variancias iguales. Si esto ocurre, las dos muestras tendrán, aproximadamente, la misma varianza; esto es, su razón será, aproximadamente, 1. Para determinar si la razón de dos varianzas de muestras es muy pequeña o muy grande, utilizamos el teorema siguiente:

Teorema 7.5. Si S; y S; son las varianzas de muestras aleatorias independientes de tamaños n , y nz, respectivamente, tomadas de dos poblaciones normales que tienen la misma varianza, entonces

La distribución F tiene los dos parámetros vl, que representa los grados de li- bertad de la varianza de la muestra del numerador, y VZ, que representa los grados de libertad de la varianza de la muestra del denominador; al referirnos a una dis- tribución F particular, damos, siempre en primer lugar, los grados de libertad del numerador. Como se necesitaría una tabla muy grande para dar los valores de F , correspondientes a muchas áreas a, de las diferentes colas de la derecha, y como a = 0.05 y a = 0.01 son los valores usados más comúnmente, nos limitamos en la tabla VI a dar los valores de F.oa y F.,,, para varias combinaciones de valores de v , y v2 (ver tambikn la figura 7.6).

Page 139: ingenieria

DlSTRlBUClON MUESTRAL DE LA VARIANZA 131

f (F) (v, Y V2 grados de libertad)

Niitese que el teorema 7.4, lo mismo que el teorema 7.5, requiere rz la hipótesis de que las muestras provienen de poblaciones normales. Como en el caso de la clis- tribución t, esta hipótesis, se puede debilitar un poco en la práctica efectiva sin al- terar materialmente las distribuciones muestrales respectivas. Una vez más, se su- giere el empleo de papel de probabilidad aritmética para investigar si es razonable tratar las muestras como si vinieran de poblaciones normales.

EJERCICIOS

1. Una muestra aleatoria de tamaño 16 proveniente de una población normal tiene medía 48 y desviación típica 5.2. Basando la decisión en el estadístico t , decir si es razonable indicar que esta informacih justifica la afirmación de que la media de la población es como mínimo 52.

2. Los tiempos durante los que está estropeado un computador (en horas) en cada uno de 5 me- consecutivos son: 28, 15, 19, 30, 23. Utilizar el estadístico t para verificar si es razonable la afirmacibn de que, en prornediu, se puede expresar que el computador esté fuera de servicio a lo más 20 horas por mes.

3. Un proceso de fabricación de muelles de compresión est& controlado si las longitudes li- bres de los resortes tienen una media de 2.5 centímetros. ~Qut: podemos decir de este proceso si una muestra de 10 de estos resortes tiene una media de 2.53 centímetros y una desviación típica de 0.02 centímetros?

4. Se rechazará la afirmación de que la varianza de una población normal es IT% = 64 si la variancia de una muestra aleatoria de tamaño 17 excede a 115.38. LCuAl es la probabili- dad de que la afirmación sea rechazada aun cuando u2 = 64?

Page 140: ingenieria

132 DlSTRlBUClON DE MUESTRAS

5. Se toma una muestra aleatoria de 27 observaciones de una población normal con varian- za u2 = 163 . Hallar la probabilidad aproximada de obtener una desviación típica de la muestra entre 3.0 y 5.2.

6. Si de una población normal tomamos dos muestras aleatorias independientes de tamaños n , = 21 y n2 = 20, determinar la probabilidad aproximada de que la variancia de la pri- mera muestra sea por lo menos el triple de la varianza de la segunda.

7. En el ejercicio 6, hallar la probabilidad de que cada varianza sea el triple de grande que !a otra.

8. La distribución t con un grado de libertad esta dada por

Verificar el calor correspondiente de t.os en la tabla IV. 9. La distribución X-cuadrado con 4 grados de libertad está dada por

Hallar la probabilidad de que la varianza de una muestra aleatoria de tamaño 5 prove- niente de una población normal con u = 10 exceda a 120.

10. La distribución F con 4 y 4 grados de libertad, está dada por

+ P)-4 F > O F < O

Si se toman muestras aleatorias de tamaño 5 de dos poblaciones normales que tienen la misma varianzz, determinar la probabilidad de que la razón de la varianza de la mues- tra mayor a la menor exceda de 2.

Page 141: ingenieria

8.1 Estimación puntual

En la página 11 9 establecimos que la inferencia estadística estudia los métodos en que se emplea la información obtenida de las muestras aleatorias para inducir, por generalización, caracteristicas de las poblaciones de las que se han obtenido las muestras. En la fprma clásica de Ia inferencia estadística, estos métodos están divi- didos en dos amplias zonas denominadas estimacih y contraste de hipótesis o test de hipótesis;+ estando dividida, a su vez, la estimación en: estimación puntual O de parámetrus, y estimacih de intervalos. Más recientemente, los métodos de inferen- cia estadística se han unificado bajo los conceptos generales de la teoria de la de- cisiún, es decir, bajo los conceptos generales de la manera de tomar decisiones en condiciones de incertidumbre. En esta sección discutiremos el problema general de la estimacibn puntual, aplichndola a la estimación de la media de población P, a partir de la media de una muestra aleatoria.

Se usa corrientemente el tbnnino “test”. En los ‘ultimos años se ha generalizado este término no sólo en ciencia estadística, sino en sicología, medicina, pedagogía, etc.

133

Page 142: ingenieria

134 INFERENCIAS REFERENTES A LAS MEDIAS

Básicamente, la estimación puntual se refiere a la elección de un estadístico, es decir, de un número calculado a partir de datos de una muestra (y quizá de otra informacicin), del cual se espera que permita estimar un parámetro estudiado, de la población con una “razonable aproximación”. Para explicar lo que queremos signi- ficar con razonable aproximación, caso no simple. haremos las siguientes considera- ciones. en primer lugar, el valor del parámetro es desconocido, y en segundo, el va- lor del estadístico se desconoce hasta que se obtiene la muestra. Entonces, sólo po- demos preguntarnos si, despues de nn muestre0 repetido, la distribución del estadís- tico tiene ciertas propiedades que permita considerarlo como una “aproximación”. Por ejemplo, sabemos, por el teorema 7.1, que la distribución muestral de z tiene la misma media que la poblaciin de la que se ha obtenido; luego, podemos esperar que las medias de muestras aleatorias repetidas, provenientes de una población dada. se concentren alrededor de :a media de esta poblaciin y no alrededor de cualquier otro valor. Formularemos, de m a manera más general, esta propiedad por medio de la siguiente definición:

Es decir, un estadístico e es centrado si, “en promedio”, se puede esperar que sus valores sean iguales al deí parámetro que se supone que aproximan

De manera general se puede decir, yue la propiedad de ser centrada es una de las más deseadas en la estimación de puntos. aunque no es esencial y! algunas veces. pierde su valor frente a otros factores. Un defecto del criterio que se conserve la media es que, en general, no proporciona un linico estadístico para un problema dado de estimación. Por ejemplo, se puede demostrar que, para muestras aleatorias de tamaño 2, la media (21 + x2)/2 y la media ponderada u” -- -k h22, donde a y h

son constantes positivas, son estimadores centrados de la media de la poblaciin, y también lo son la mediana muestral y el recorrido medio (el valor medio entre el mayor y el menor) si, además, suponemos que la población es simétrica. Esto nos sugiere que debemos buscar otro criterio para decidir cuál de varios estimadores cen- trados es el “mejor” para estimar en determinado parámetro.

Tal criterio resulta evidente cuando comparamos las distribuciones muestrales de la media y la mediana de muestras aleatorias de tamaño n tomadas de la misma población normul. Aunque estas dos distribuciones tienen la misma media, o sea, la media de la poblacicin p, y son simétricas y con forma de campana, sus vmianzas difieren. E n el teorema 7.1, se probó que, para poblaciones infinitas, la varianza de la distribución muestral de la media es .*/n, y podemos comprobar que, para la distribución muestral correspondiente de la mediana, su varianza es, aproxima- damente, l . j 7 . ~ ~ / n Por consiguiente, para cualquier muestra dada. es más posible que la media esté más cercana a p que la mediana. Esto no implica que siempre la media muestral esté. necesariamente, más cercana que la mediana: de hecho. en un problema dado no tenemos forma de saber cuál es realmente el m ’ as cercano.

a + b

Page 143: ingenieria

ESTlMAClON PUNTUAL 135

Esta importante propiedad, en la cual comparamos las varianzas de las distri- buciones muestrales de estadísticos, se formaliza por la siguiente definición:

Se dice que un estadístico S , es un’ estinzador centrado del parámetro 0 más eficiente que otro estadístico S2, si: (1) 6, y d2 son, ambos, estimaciones centrados de e. ( 2 ) La varianza de la distribucitin muestral (I& 81 es menor que la varian-

za correspondiente de 8,.

Hemos visto que, para muestras aleatorias de poblacionés normales; la media es más eficiente para estimars, que l a mediana: se‘ puede demostrar que, en la ma- yor parte de los casos de la práctica, la varianza de la distribución muestral de nin- gún otro estadístico es menor que la de la distribución muestral de la media. En otras palabras, en la mayoría de.los casos prbcticos, la media muestral es un estadís-

‘tico aceptable para estimar la media c de una población. (Existen otros criterios de asegurar la “bondad” de los métodos de estimación puntual. pero no los discutire- mos en este libro.)

Las propiedades especiales discutidas en esta sección son importantes, pero en ocasiones quedan superadas por otras consideraciones. Por ejemplo, si en un pro- blema es esencial considerar las informaciones colaterales, tanto como las directas, será necesario utilizar la siguiente clase de inferencia, llamada inferencia bayesiana. Un fabricante recibe componentes electrónicos de dos proveedores diferentes. El primero suministra el 8096 de los componentes y, después de una larga experiencia, se sabe que el 176 de sus componentes son defectuosas. El 20:; restante es suminis- trado por el segundo proveedor, cuyo porcentaje de partes defectuosas es 2ci.. Se toman 5 componentes de un lote almacenado por el fabricante y se encuentra uno de ellos defectuoso. La proporción muestral de partes defectuosas es 0.20 y, si no hubiera otra información disponible, tendríamos que aceptar este valor como una estimación de la proporción real de partes defectuosas en el lote, aunque la estima- ción está basada en una muestra muy pequeña. Para mejorar la estimación, emplea- mos ahora la información colateral concerniente a los dos vendedores y la regla de Bayes. Si B, representa el suceso de que el lote venga del primer proveedor, €3, el suceso de que el lote venga del segundo proveedor, y A el suceso de que una mues- tra de tamaño 5 incluya exactamente 1 parte defectuosa, tenemos P ( B , ) = 0.80. P(B?) = 0.20,

P ( A I B,) = e) (0.01)1(0.99)4 = 0.048

P ( A 1 B,) = (;) (0.0Z)1(0.9S)4 = 0.092

Y

Substituyendo estos valores en la f6rmula de la regla de Bayes (prigina 3 I ) , obtenemos

Page 144: ingenieria

136 INFERENCIAS REFEFENTES A LAS MEDIAS

(0.80) (0.048) ’ A ) = (0.80)(0.048) + (0.20)(0.092) = 0.68

y de aquí que P(B2 1 A ) = 0.32. Entonces, tenemos la siguiente distribución de pro- babilidad para p , proporción de partes defectuosas en el lote:

P probabilidad 0.01 0.68 0.02 0.32

La media de esta distribución es (0.01) (0.68) + (0.02) (0.32) = 0.013, y este valor nos da una estimación bayesiana de la proporción de partes defectuosas en el lote. Nótese que esta estimación combina la información colateral sobre las característi- cas ya conocidas de los dos proveedores con la evidencia directa.

8.2 Estimacldn de intervalos

Cuando usamos la media muestra1 para estimar la media de una población, sa- bemos que, aunque estamos empleando un método de estimación que tiene ciertas propiedades convenientes, las oportunidades de que la estimación sea exactamente igual a.p, son muy pocas. Por lo tanto, parece deseable acompañar a un estimador puntual de H como éste, de algún criterio que indique qué proximidad razonable se &be esperar entre el estimador y p. El error, z - p, es la diferencia entre el estima- dor y la cantidad que se supone que estima. Para examinar este error, emplearemos el hecho de que, para n grande,

2 - P

U/&

es un valor de una variable aleatoria que tiene aproximadamente una distribución normal tipificada. En consecuencia, podemos asegurar con una probabilidad de 1 - a que

o que

donde es tal que el área de la curva normal a su derecha es igual a 4 2 . Si, ahora, hacemos E igual a \x - P I , magnitud del error de estimación, tendremos

con una probabilidad de 1 - a. En otras palabras, si estimamos p por medio de una muestra aleatoria de tamaño n, podemos asegurar con una probabilidad de 1 - a

que el error, 12 - pl es menor que za/2-u/&, al menos para valores de n suficien- temente grandes.

Resolviendo la última desigualdad en n, tenemos

Page 145: ingenieria

ESTlMAClON DE INTERVALOS 137

y de aquí que si seleccionamos el tamafio de la muestra n, de tal manera que

podemos asegurar que una probabilidad de 1 - LY que el error de estimar P por medio de 3 es menor que E. Para poder usar esta fórmula en el cálculo del tamaño de la muestra necesaria para estimar P en un caso dado, es necesario que especifique- mos a, u y E. Entonces, no sólo debemos dar el error tolerable máximo E y la des- viación típica u,de la población, sino también. la probabilidad 1 - cr con que quere- mos asegurar que el error máximo sea menm que E. La desviación típica de la po- blaci6n se estima, generalmente, con datos similares anteriores, y algunas veces se deberi hacer una'conjetura plausible.

Como una ilustración,, supondremos que se desea determinar cuál ha de ser el tamafio de una muestra de bolas para molinos, a fin de poder estimar la pérdida media de peso en la operación con un error máximo de 0.10 gramos siendo la pro- babilidad de este error 0.90. Para U utilizaremos 0.68 gramos, un valor que, supues- tamente, se obtuvo en una muestra "piloto" de relativamente pocas observaciones. Substituyendo 2.06 = 1.645, u = 0.68, y E = 0.10 en la fórmula de n, obtenemos

y redondeando hacia arriba, encontramos que el tamaño de la muestra mínimo re- querido es 126.

Como los estimadores puntuales no puede esperarse efectivamente que coinci- dan con las cantidades que se supone que estiman, a veces es preferible substituirlos por estimador de intervalo, es decir, intervalos para los que podemos asegurar, con un grado de certeza razonable, que contienen el parámetro considerado. Para ilus- trar la construcción de tales intervalos. supondremos que tenemos una muestra alea- toria de tamaño n, donde n es grande, obtenida de una poblacibn que tiene la media desconocida p y la varianza conocida u*. En la doble desigualdad de la página 136, a saber,

que aseguramos con una probabilidad de 1 - (Y, podemos transformarla. por simple álgebra, en

Entonces, podemos asegurar con una probabilidad de I - (Y que el intervalo de

Page 146: ingenieria

138 lNFERENCtAS REFERENTES A L A S MEDIAS

contiene a P. Es corriente denominar un intervalo de esta clase como intervalo de confianza de P, con un coeficiente de confianza igual a 1 - CY.

En este punto, será conveniente ,reconsiderar el significado de la afirmación: "Podemos asegurar, con una probabilidad de 1 - a! que tal intervalo contiene a P." Si una muestra de azar de tamaño n = .1QO se toma de una poblacicin con D = 5.1- y obtenemos una media muestra1 21.6, un intervalo de confianza para P con coefi- ciente 0.95 queda determinado por 21.6 -+ 1.96. 4, es decir, el intervalo de

20.6 a 22.6. Como la media de la población dada puede o no estar contenida en este intervalo, parece muy razonable hablar de la probabilidad de un suceso como &e. De hecho, Io que esto significa realmente cuando se asegura que el intervalo de 20.6 a 22.6 es un intervalo de confianza con coeficiente 0.95 para la media de la población, es que, en muestras repetidas, el 95% de los intervalos de confianza ob- tenidos con la fórmula anterior contienen las medias de las poblaciones respectivas. Luego, aunque nunca sabremos si se encuentra realmente la media de población en el intervalo de 20.6 a 22.6 en el ejemplo dado, tendremos la seguridad de que el nzL;todo utilizado para obtener el intervalo es confiable un 9596, esto es, se puede esperar que va bien en un 95% de las veces.

La fórmula obtenida para un intervalo de confianza para P de 1 - a tiene el in- conveniente de que se necesita conocer la desviación típica de la población. Esto es una desventaja porque, en la mayoria de los problemas prácticos, no se conoce u: por lo tanto, en general no nos queda más que el pobre recurso de cambiar u por m a estimación, con la esperanza de que, al menos para muestras grandes, el inter- valo de confianza resultante represente una buena aproximación. Substituyendo u por la desviación típica S de la muestra, que tiene las propiedades convenientes como estimación puntual de U (ver capitulo 9), usamos el intervalo

5 1 d l 0 0

za/2 * -= < p < z " 2 4 2 * S

d n 8

como una aproximación de un intervalo de confianza para P de utfa muestra grande, con el coeficiente de confianza 1 - a.

Si es razonable suponer que estamos tomando muestras de una población nor- mal, es posible construir intervalos de confianza exactos para P , aun cuando D sea desconocido. Por el teorema 7.3, el estadístico

t = - z - p

es un valor de una variable aleatoria que tiene la distribución t de Student con 11 - 1 grados de libertad, donde p es la media de la normal de la cual se ha obtenido la muestra. Entonces, con tal2 tal como se definió en la piigina 127, te- nemos

S/&

Page 147: ingenieria

ESTlMAClON DE INTERVALOS 139

4

con una probabilidad de 1 - a, y esta ultima desigualdad nos proporciona exacta- mente un intervalo de confianza para p con coeficiente 1 - CY para muestras aleato- rias de cualquier tamaño n de una población normal. De acuerdo con la discusión de la phgina 128, esta fórmula se puede emplear en la práctica siempre que la mues- tra no presente ninguna separacidn notable de la normalidad.

Como ilustración, supondremos que en una muestra aleatoria de tamaño n = 16 la pérdida media de peso de las bolas de molino después de cierto periodo de ope- ración, fue de 3.42 gramos y la desviación típica de las pérdidas de peso, 0.68 gra- mos. Suponiendo una distribución normal, se obtiene un intervalo de confianza

Para P con coeficiente 0.99 dado por 3.42 t 2.947 . 0.68, o sea. el interva!o de 2.92 a 3.92. d l 6

EJERCICIOS 1. En un experimento de laboratorio, 50 estudiantes de ingeniería midieron por separado el

calor específico del aluminio, obteniendo una media de 0.2210 calorias por grado centi- grado y por gramo y una desviación normal de 0,0240. ¿,Qué podremos asegurar, con una probabilidad de 0.95, con respecto a la posible magnitud de error, si la media de la muestra se utiliza para estimar el verdadero calor específico del aluminio?

2. Utilizar los datos del problem2 1 para construir un intervalo de confianza con coeficiente 0.95 para el calor especifico verdadero del aluminio.

3. En un estudio hecho para determinar el tiempo medio necesario para el montaje de cierta pieza de una máquina, 40 trabajadores hicieron un promedio de 42.5 minutos con una desviación tipica de 3.8 minutos: (a) iQuC podremos asegurar con una probabilidad de 0.99 sobre el posible tamaño del

error, si z = 42.5 minutos se emplea como estirnacih del ticmpo promedio real necesario para hacer el trabajo?

(b) Usar los datos para construir un intervalo de confianza con coeficicntc 0.98 del tiempo promedio verdadero neccsarlo para montar la máquina.

4. ¿Con quC probabilidad podemos asegurar que la media de l a muestra dcl problema 3 está en un intervalo de un minuto alrededor del medio verdadero'?

5. Si queremos determinar las aptitudes mecánicas medias de un gran grupo de trabajadores. icuAl ha de ser el tamaño de una mucstra de los mismos para asegurar con una proba- bilidad de 0.95 que la media mucstral estc dentro dc una distancia de 2 puntos de la media real? Supóngase conocido Q = 16, detcrminado de cxpcricncias pasadas.

6. Un químico tomb 12 medidas del porcentaje de manganeso en una alcaci6n de fcrroman- ganeso (formada por hierro y manganeso) y obtuvo, una mcdia de X0.93';; y una dcsvia- ción típica de 0.36'&. ¿,Qué sc podrá decir. con una prohahilidad de 0.99. sobre la mag- nitud posible de su error, si usa 80.93r/n como una estimación de la media de la pobla- cis, de la que se obtuvo la muestra?

7. si 25 medidas del coeficiente de dilatación del niqucl tienen una mcbia dc 12.81 y una desviación típica de 0.04, construir un intervalt, de confianza c m coeficicntc 0.95 para el coeficiente de dilatacibn real. (Supondremos que las 15 medidas se pueden considerar como una muestra aleatoria de una poblacibn normal.)

8. Para comprobar el dihmctro de un. envio u n cierto tip11 de alamhrc. se midieron los diámetros de una muestra aleatoria dc 16 unidades. siendo 0.338 y 0.Oly pulgadas los

Page 148: ingenieria

140 INFERENCIAS REFERENTES A LAS MEDIAS

valores respectivos de la media y la desviación típica. Suponiendo que la muestra Se tomó de una población normal. hallar el error máximo cometido con un coeficiehte de confianza del 99 por ciento, al estimar que el diámztro medio verdadero es 0.338 pul- gadas. Construir, también, un intervalo de confianza con coeficiente 0.95 para el diáme- tro medio verdadero.

9. Hallar el mayor error que sería posible cometer con un coeficiente de confianza de 0.90 cuando se usa la media de una muestra aleatoria de 100 observaciones para estimar la media de una población que tiene una varianza de 1.21. Si la media de esa muestra es 5.68, construir un intervalo de confianza con coeficiente 0.90 para la media de la población.

10. Construir un intervalo de confianza con un coeficiente de un 99% para la cantidad media mensual de millas voladas por los ingenieros de ventas de una compañía, si una muestra de azar dc 20 facturas mensuales muestra una cantidad media de 6510 millas con una desviación típica de 1 I SO millas. ¿ .QII~ se puedc decir con una probahilidad de 0.99 sobre la magnitud posible del error con que se ha estimado esta media?

11. Una compañía financiera estima el importe medio de sus cuentas impagadas tomando una muestra aleatoria de 81 cuentas 110 pagadas. Si la media es de $9.87 y la desviación típica es $ 5.14, ;,cuál es la probabilidad de tener un error no mayor que $1.00 al estimar el importe medio de las cuentas no pagadas en $ 9.87.

12. Hallar el tamaño de la muestra necesario para asegurar con un coeficiente de confianza de 0.90, qpe, en el problema anterior, la media de la muestra no se aparta más de $0.25 de la media real.

13. Con referencia a la información dada en el ejercicio 8, encontrar el tamaño necesario de la muestra necesaria para tener una confianza del 95% al estimar el diámetro medio del envio de alambre con un error no mayor de 0.005 pulgadas. [Sugerencia: Primero esti- mar n 1 usando z = 1.96; luego usar t.(YLS con nl - 1 grados de libertad para obtener una segunda estimación n,; repetir este procedimiento hasta quc los dos últimos valores dc n así obtenidos sean iguales.]

14. Una pequeña población finita consiste en los números 3, 6, 9, 12 y 15.

( a ) Hacer una lista de todas las muestras posibles de tamaño 3 que se pueden tomar sin reposición en esta población.

(b) Calcular la media de cada una de las muestras de la lista de (a) y, asignando a cada muestra una probabilidad de 1/10, verificar que la media de esas 3 es igual a 9, es decir, a la media de la población.

15. Repetir ambas partes del ejercicio 14 con muestras aleatorias de tamaño 2 tomadas con reparación de la población finita dada. [Sugerencia: El total de las 15 muestras no tie- nen la misma probabilidad.]

16. Con respecto al ejercicio 14, hallar las medianas de las I0 muestras y comparar la va- rianza de la distribución de probabilidad de la mediana, obtenida asignando a cada muestra una probabilidad de 1/10, con la de la distribución de probabilidad correspon- diente para la media.

17. Habiendo tenido alguna experiencia en situaciones similares, tres especialistas de esta- dística estiman subjetivamente que la demanda promedio diaria de un instrumento de medida recientemente proyectado debe ser de p = 46, p, = 50 y p, = 55 unidades, respec- tivamente. Suponemos que la demanda diaria del nuevo instrumento tiene una desviación típica u = 24 y que una de las cantidades anteriores de p es correcta. A priori, se su- pone que los tres especialistas tienen las mismas probabilidades de haber acertado, esto es, sin niguna informaci6n directa damos a cada una de las respectivas estimaciones una probabilidad de 1/3. Si los datos obtenidos posteriormente sobre la demanda del instrumento en 100 días tienen una media mayor que 51.2, ¿qué probabilidad podemos

Page 149: ingenieria

CONTRASTE DE HIPOTESIS 141

asignar al suceso de que sea p = 50, usando una inferencia l~ayesiann? Mallar también las probabilidades correspondientes para p = 46 y p = 55, y utilizar la media de esta distribución de probabilidades de p como una estimacidn bayesiarla de la demanda pro- medio diaria del nuevo instrumento de medida

8.3 Contraste de hipótesis Hay muchos problemas en los que no nos ocupamos con el valor verdadero de

un parámetro; en cambio, nos interesa saber si el parámetro excede a un número dado, o si es menor, o si cae en un intervalo dado, etc. Más que estimar el valor de un parámetro, queremos decidir cuándo una afirmación (o afirmaciones) refe- rente a un parámetro es verdadera o falsa; esto es, queremos contrastar una hipóte- sis acerca de un parámetro, o someterla a un texto. Por ejemplo, en trabajo de Cgp- trol de calidad se puede tomar una muestra aleatoria para determinar si el “proceso medio” (para un tipo dado de medidas) permanece constante o si ha cambiado hasta un valor tal que el proceso ha quedado “fuera de control” y es necesario hacer reajustes.

Para ilustrar los conceptos generales que aparecen en este tipo de problemas de decisidn, supondremos que un fabricante asegura que un galón de su pintura puede cubrir en promedio 400 pies cuadrados, y que una agencia del gobierno desea probar la validez de esta afirmación. Supongamos, además, que, en una prueba con- ducida convenientemente, una muestra de 36 galones cubrieron, en promedio, 385 pies cuadrados cada uno. Este valor es menor que el promedio de 400 indicado por el fabricante, pero i z s lo suficientemente pequerío para rechazar la afirmactón? Es decir, Les razón evidente para emprender una acción contra el fabricante? ¿,No es posible que la diferencia se deba completamente a una casualidad y que la pintura sea tan buena como asegura el fabricante, habiéndose escogido una muestra cuya media haya sido menor de lo normal? *

Al contrastar la afirmación del fabricante, la agencia del gobierno se encara con el problema de establecer un criterio que le permita tomar las acciones más acer- tadas. Sin duda, si el área media verdadera cubierta por un galón de pintura es de 400 pies cuadrados, o más, no hay causa para ninguna accicin. Por otra parte, que margen se le puede permitir al fabricante si su producto no es tan bueno como é1 dice? ¿se debera emprender alguna acción ’en contra cuando’ la media verdadera (de área cubierta) P sea menor que 395 pies cuadrados, o cuando sea menor que 390 pies cuadrados, etc? Supóngase, por motiv6s de argumentaMn, que se decide que existe una amenaza a los bolsillos ‘de los consumidores si la pintura’cubre en pro- medio menos de 380 pies cuadrados por galón. Podemos considerar, entonces, al conjunto de todos los valores posibles de P (el conjunto de números reales positi- VOS) como dividido en las tres regiones mostradas en la figura 8-1. Si P se encuentra en el intervalo de rechazo, se debe tomar alguna acción contra el fabricante y sería un grave error no rechazar su afirmación; si B se encuentra en el intervalo de acep- tación, no hay ningún motivo para emprender una acción y sería un grave error si, por casualidad, la agencia rechazara la afirmación del fabricante: si P se encuentra

Page 150: ingenieria

142 INFERENCIAS REFERENTES A LAS MEGlAS

en el intervajo de indiferencia, es difícil decidir si se ha de emprender o no, acción y no hay error grave en ningún de los dos casos.

Si se pudiera conocer p realmente el problema de tomar decisión planteado a l a agencia del gobierno se resolvería por una simple referencia al criterio de la fi- gura 8.1. Como este no es el caso en el problema dado (o cualquier otra situación

Intervalo de Intervalo de Intervalo de rechazo indiferencia aceptación "a O 380 400

I I I P

Fig. 8.1 Intervalos de decisión

semejante), la decisión deberá basarse en los resultados de una muestra aleatoria, ordinariamente en la media z de la muestra. Es importante hacer notar que Z puede exceder a los 400 pies cuadrados aunque ,u sea menor que 380, y que Z puede ser men& que 380 aunque p exceda a 400. Esto expresa el hecho de que los errores on inevitables cuando las decisiones se toman apoyándose en los resultados de muestras aleatorias y, además, estos errores son de dos tipos diferentes. Los datos de la muestra pueden llevar al rechazo de la afirmación, aun cuando p esté en el iatervalo de aceptación, y pueden llevar a la acepción de la misma aun cuando P esté en la zona de rechazo. Esquemáticamente, podemos describir esta situacih Pot' medio de la siguiente tabla:

p se erz- p se en- cuentra en cuerztra en la zona de la zova de aceptación rechazo " " "

~e acepta la No hay Error afirmución error tipo I1

Se rechaza la 1 Error 1 No hay afirmación tipo I error

Nótese que si ,u está en el intervalo de indifereccia, no hay ningún error grave, cualquiera que sea la decisión tomada.

Para juzgar las ventajas de cualquier criterio de decisión, es esencial conocer las probabilidades de tener errores del tipo I y del tipo 11. Denotando estas probabi- lidades por a! y p, respectivamente, es decir:

a = P(Error tipo I) B = P(Error tipo 11)

es conveniente buscar un criterio para el cual LY y p tomen valores fijados previa- mente. Para ilustrar cómo se pueden calcular estas probabilidades para un criterio dado, supondremos (en nuestro ejemplo) que la agencia del gobierno toma una

Page 151: ingenieria

CONTRASTE DE HIPOTESIS 143

muestra de 36 latas de un galón de la pintura y decide rechazar la pintura si Z, media de las áreas cubiertas por los 36 galones, es menor de 385 pies cuadrados. Para simplificar el análisis, supondremos que la desviación tipica de las áreas cu- biertas por 1 galón de la pintura es U = 48 pies cuadrados. Ahora, a es la pro- babilidad de un rechazo erróneo, es decir, la probabilidad de que z < 385, dado que P -2 400. Entonces, LY no se puede determinar a menos que se especifique al- gún valor de P (mayor o igual que 400). Sin embargo, es fácil observar que la pro- babilidad de cometer un error tipo I con el criterio dado (rechazo si Z < 385) es máxima cuando P = 400. Efectivamente, podemos suponer el intervalo de acepta- ción como si sólo consistiera en el punto p = 400, en cuyo caso hay un solo valor posible de a, a saber, la probabilidad de obtener una z menor que 385 cuando

Para calcular este valor de a, consideraremos que la distribucidn muestral de Zsigue aproximadamente una distribución normal con media’400 y desviación tí- pica 48/v% = 8. Luego, a está dada por el área, bajo la curva normal tipificada a la izquierda de

/l = 400.

y es aproximadamente igual a 0.03. En lo que respecta a los errores del tipo 11, podemos argumentar de una forma

semejantes que p es un máximo cuando P = 380; esto es, para todos los valores del intervalo de rechazo (a 5 380) se obtiene un máximo en la probabilidad del error del tipo I1 cuando P = 380. Ahora, podemos considerar el intervalo de recha- zo como formado por el Único punto 1.1 = 380 y encontrar fl aproximando la dis- tribución de muestras de Z a una distribución ndrmal con media 380 y desviación tí- pica 48/* = 8. Luego, p está dada por el área bajo la curva normal tipificada a la derecha de

z = 385 - 380 = 0.625 8

y es aproximagamente igual a 0.27. Empleando el método y los supuestos anteriores, es posible calcular a y p

para probar la hipótesis H , de la forma 1.1 = po en contra de cualquier altemativa HI de la forma CL = wl. (En forma más específica en el proceso de decisión se im- plicaba a E , la distribución muestral de f se aproximó con una curva normal, y.el. tamaño de la muestra y el criterio de rechazo se especificaron.) Por otra parte, si a y p se deben especificar por adelantado, podemos utilizar métodos similares para determinar el tamaño n de la muestra y un criterio de desición apropiadp.

Otra posibilidad es especificar a y el tamafio n de la muestra por adelantado, en cuyo caso e1 criterio de decisión y 0 quedan determinados automhticamente. aunque se pueden emplear estadísticos diferentes de la z para contrastar la hip6tesis

referentes a medias .de población, el emplo de z conduce, generalmente,, al. menor valor de p para valores dados de a y n.

Page 152: ingenieria

144 INFERENCIAS REFERENTES A LAS MEDIAS

Para ilustrar cómo quedan determinados el criterio de contraste así como p , en una situación en la que n y (Y están dados, supongamos que en el ejemplo an- terior queremos contrastar la hipótesis p = 400 en contra de la alternativa ~.r = 380, siendo (Y = 0.05 y n = 36, y la hipótesis p = 400 deberá rechazarse si x < C , donde C es una constante que se deberá determinar. De la figura 8.2, vemos que

de donde C = 386.8. Luego si se rechaza la hipótesis ,U = 400 siempre que Z < 386.8 en una muestra aleatoria de tamaño 36, hemos asegurado automáticamente que 01 = 0.05. Para encontrar p con este criterio de contraste, procedemos como antes y en la figura S.2 podemos ver que

zg = 386.8 - 380 = o.8j

8 así que p = 0.198

Rechazar Ho Aceptar Ho I

Fig. 8.2 Errores Tipo I y Tipo 11

Al hacer el texto anterior la eleccih de H,, es decir, la elección de la hipótesis p l = 400, fue dictada por la afirmación del fabricante sobre el área promedio cu- bierta por un galón de su pintura; por otra parte, la elección de la hipótesis alterna- tiva H , 'se escogió arbitrariamnte. Hubiera sido interesante al ver lo que hubiera pa- sado a la probabilidad de aceptar H, si el criterio de contraste fuera el primero del párrafo anterior (a ! = 0.05 y n = 36), pero cambiando H , . Denotando la probabi- lidad de aceptar H , para un valor dado de p por L ( p ) , indicaremos primeramente que esta es la probabilidad de cometer un error tipo I1 para valores de p que deben ser rechazados, y que es también la probabilidad de no cometer un error tipo I para valores de p que deben aceptarse. En la figura 8.2, vemos claramente que podemos obtener Lb) determinando el área de la curva normal a la derecha de

z = 386.8 - y

8

Por ejemplo, para a = 370 obtenemos z = 2.10 Y L = (370) = 0.01 8, Y Para P = 410 obtenemos z = - 2.90 y L(410) = 0.998. Nótese que, para P = 400,

Page 153: ingenieria

CONTRASTE DE HIPOTESIS 145

obtenemos z = - 1.645 y L(400) = 0.95, lo que es igual a 1 - CY = 1 - 0.05 como era de esperarse. La gráfica de L(cc) para algunos valores Y, mostrada en la figura 8.3, se llama curva característica de operación o simplemente, curva OC (operating characteristic) del criterio de constraste. Nótese que la probabilidad de aceptar H, se hace menor a medida que P decrece.

Idealmente, nosotros podríamos rechazar la hipótesis H , ( P = 400) en favor de la alternativa H I ( p < 400) siempre que P fuera menor que 400, y aceptarla siempre que p fuese mayor o igual que 400. Luego, la curva OC “ideal” para con-

Fig. 8.3 Curva característica de operacion

trastar la hipótesis dada en contra de la. alternativa, es la curva dada por la línea de la figura 8.3. En la práctica, una curva OC sólo puede aprixamarse a tal curva “ideal”,.siendo mejor la aproximación a medida que el tamaño de la muestra sea ma- yor. Para comprobar cómo (“mejora” la curva OC al incrementar &. supondremos que en nuestro ejemplo. n = . 100. mientras los demás valores permqnecen fijos. Como la desviación típica de la distribución muestral, de z es ahora 4 S / f i o sea, 4.8, la linea divisoria del criterio de contraste estará dada por la solución de

que es igual a 392.1. Así que’ H , se aceptará si z > ‘392.1. L(IL) está dada por el Area de la curva normal a la derecha de

392.1 - p

4.8 2 =

Page 154: ingenieria

146 INFERENCIAS REFERENTES A LAS MEDIAS

y la curva OC resultante se muestra en la figura 8.4. Nótese que en la curva OC para n = 100 Qta más próxima a la curva OC “ideal”, que para n = 36, de tal forma que, al aumentar el tamaño de la muestra, obtenemos un texto que “discrimina” mejor entre I.( = 400 y los valores vecinos de P . De esta discusión aparece evidente que es imposible especificar al p y n por anticipado y construir después un test conveniente. En otras palabras, dando dos cualesquiera de las cantidades al fl Y n, la tercera queda determinada automáticamente.

Fig. 8.4 Efecto del aumento del tamaño de la muestra en la curva OC

Al contrastar una hipótesis H , de la forma p = pol donde Po es una constante determinada, utilizamos el test siguiente: rechácese H , si 2 < C, donde C queda de- terminada de tal forma que la probabilidad de cometer un error tipo I es igual a a.

El conjunto de valores de z que nos conducen al rechazo de H , en favor de la hi- pótesis alternativa, se llama regirin critica del test; en nuestro ejemplo, Qta fue el conjunto de todos los números reales menores que C. Si la hipótesis alternativa hu- biera sido de la forma p > pol la región crítica hubiera cambiado a la 2 > K , don- de K s e escoge de tal forma que la probabilidad de un error típico I fuera, otra igual a a. Empleando, ‘como antes a = 0.05, n = 36 y u =- 48, obtenemos ahora la curva OC mostrada en la figura 8.5; esta curva es !a simétrica especular de la figu- ra 8.3, siendo el eje de simetría, la recta vertical que pasa por P = 400.

Hasta ahora los tests que hemos discutido son tesfs de una cola; esto es, la hipótesis H , ha sido rechazada para valores de z que caen en una “cola” de su dis- tribución muestral. Si, ahora, consideramos la alternativa p # po, debemos rechazar H , para valores de z menores o mayores que P ~ , , y la región crítica resultante será de la forma Z < C , 6 z > C,. Aquí, C, y C2 se deberán escoger de tal forma que la probabilidad de un error tipo I sea igual a a. (Un test como éste podría presen-

Page 155: ingenieria

CONTRASTE DE HIPOTESIS 147

tarse, si el fabricante de pinturas estuviera preocupado al llenar sus botes con canti- dades o demasiado pequesus o demasiado grandes.) Si escogemos "colas iguales", de tal forma que los valores alternativos de P a la misma distancia a ambos lados

Fig. 8.5 Curva OG para, H , : p > m

de P, tengan la misma probabilidad de ser aceptados, y si fijamos la probabilidad de une error tipo I en (Y, entonces C, y C , se pueden obtener resolviendo las ecua- ciones

Por ejemplo, si queremos contrastar la hipótesis H,: P = 400, frente a la alter- nativa HI: P # 400, con (Y = 0.05, n = 36 y u = 48, obtenemos

de donde C, = 384.3 y C, = 415.7. Para ilustrar el cálculo de puntos de la curva OC para esta prueba de dos co-

las, trataremos de hallar L(420). Como se ven en la figura 8.6, esta probabilidad esta dada por el Brea bajo la curva normal tipificada entre

21 = 384.3 - 420 = -4.46

8 Y 22 = 415.7 - 420 = "o.54 8

y, por lo tanto, es igual a 0.295. Es evidente, por la simetría de la figura 8.6, que L(380) debe ser también igual a 0.295 y que, en general, la curva OC para este test de dos colas es simétrica con respecto a p ,= po con un valor múximo en L(p) =

Page 156: ingenieria

148 INFERENCIAS REFERENTES A LAS MEDIAS

Rechazar H, I Aceptar H, 1 Rechazar H,

Fig. 8.6 Errores Tipo I1 para pruebas de dos colas

1 - (Y. En la figura 8.7 se muestra la gráfica de la curva OC para el test de dos colas dado.

El propósito de este análisis ha sido el de introducir algunos de los problemas básicos que se presentan en el contraste de hipótesis estadísticas. Aunque los mé- todos presentados son objetivos esto es, dos experimentadores que analizan los mismos datos, bajo las mismas condiciones, llegaron a resultados idénticos su empleo implica algunas consideraciones arbitrarias o subjetivas. Por ejemplo, en nuestro problema “trazar la línea” que separe los valores satisfactorios de los no satisfactorios de l~, en 380 pies cuadrados, fue una decisión parcialmente subjetiva. Igualmente, emplear una muestra de 36 botes de un galón y rechazar la afirmación del fabricante para valores de z menores que 385 pies cuadrados, fue también una decisión parcialmente subjetiva. De modo equiva!ente, podíamos haber especificado valores de (Y y @, controlando así los riesgos CI los cuales estaríamos expuestos. La

Fig. 8.7 Curva OC de l a prueba de dos colas

Page 157: ingenieria

CONTRASTE DE HIPOTESIS 149

eleccidn de LY, probabilidad de un error tipo I, se podría basar en las COnSeCUen- cias que traería este tipo de error tales como, el costo del fabricante de tener un buen producto condenado, el posible costo de un litigio judicial posterior, el costo del fabricante de hacer ajustes innecesirios a su maquinaria, el costo del público al no tener a mano eI producto cuando lo necesitara, etc. La elección de P probabi- lidad de un error tipo 11, se podría escoger análogamente, basándose en las cam- cuencias de cometer esta clasc de error, tales como el costo del público al Pagar un producto inferior, los ahorros del fabricante en pintura, pero la pérdida en Prestigio, otra vez el costo de un posible litigio judicial, etc. Es obvio que resultara extrerfla- damente dificil asignar “valores contables” a todas estas eventualidades, Pero, de todas formas, deben ser consideradas, al menos indirectamente, al escoger 10s cri- terios convenientes para contrastar las hipótesis estadísticas.

En años recientes, se han hecho intentos de incorparar todos estos casos a una teoría formal denominada teoría de la decisicin. Aunque se han conseguido avances muy importantes, debemos reconocer que tal teoría no elimina la arbitrariedad o subjetivismo discutida anteriormente; sino que únicamente las incorpo’ra a la teoria. Esto significa que el uso de la teoría de la decisión requiere que asignemos valores contables a todas las consecuencias posibles de nuestras decisiones. Aunque esto tie- ne la ventaja de que el experimentador (o el ingeniero) sea más “consciente de los costos”, tiene, también, la desventaja de que es necesaria una información que muchas veces no puede ser obtenida.

En este texto discutiremos principalmente la teoría Neymann-Pearson, llamada tambien teoría clásica del contraste de’ hipótesis. Esto significa que consideraremos factores de costo y otros que son parcialmente arbitrarios y parcialmente whjeti- vos, sólo en la medida en que puedan afectar a la elección del tamaño de una muestra, la elección de una hipótesis alternativa, la elección de a! y p, etc.

EJERCICIOS

1. Determinar la probabilidad de un error tipo I si modificamos el criterio de la pagina 152 rechazando la afirmación del fabricante cuando Z < 390. Determinar también la pro- babilidad de un errar tipo II,.con el criterio modificado cuando p = 380, y compararla con el valor 0.27 obtenido en la página 143.

2. Con respecto al test de dos colas de la página 148, hallar los valores dc la curva OC para p = 410 y 430. Marcar estos valores junto con los de p = 400 y 420 dados cn el tex- ,

f o , y comparar los resultados con la curva OC mostrada en la figura 8.7. 3 Se desea contrastar la hipjtesis p = O frente la alternativa p > O sobre la base de una

muestra aleatoria de tamaño 9, obtenida de una pcblacih normal cuya varianza es u2 = 1. Si la probabilidad de un error tipo I es 0.05, ( a ) Verificar que la región de rechazo es z > 0.548. (b) Dibujar la curva OC después de determinar @ para p = 0.5, 1.0 y 1.5

4. Repetir el problema 3 para n = 25 y para n = 100, seleccionando en cada caso tres valores convenientes de p para obtener una buena gráfica general<de la curva OC?. Com- parar las dos curvas OC obtenidas en este ejercicio y la del ejercicio 3, dibujandolas en un solo sisttma de ejes.

Page 158: ingenieria

150 INFERENCIAS REFERENTES A LAS MEDIAS

5. Con respecto a los ejercicios 3 y 4, se desea contrastar la hipótesis p = O frente a la al- ternativa p = 0.30. ¿Cuál de los 3 tamaños de muestra s e d apropiado (al menos, aproxi- madamente), si no queremos que la probabilidad de un error tipo I1 exceda de O.10?

6. En el ejercicio 4, para cada tamaño de muestra establecer el valor alternativo de es necesario para que la probabilidad de cometer un error tipo I1 sea, aproximadamente, O. 15.

7. Se desea contrastar la hipótesis p = O frente a la alternativa p > O sobre la base de un tamaño de muestra ateatoria de 100, tomada de una población normal con varianza u2= 1. Si la hipótesis se debe rechazar cuando Z > 0.233, (a) Demostrar que a! = 0.01. (b) Dibujar la curva OC después de determinar fj para p = 0.1, 0.2, 0.3 y 0.4.

(a) La hipótesis se rechaza para Z > 0.196. (b) La hipótesis se rechaza para r > 0.128. En cada caso, escoger valores convenientes de p para calcular las probabilidades de co- meter errores tipo I1 y dibujar las curvas OC correspondientes. Comparar estas dos con la obtenida en el ejercicio 7, dibujando las tres en el mismo sfsterna de ejes.,

9. Queremos contrastar la hipótesis p = O frente a la alternativa p # O sobre la base de un tamaño de la muestra ateatoria de 25, proveniente de una población normal con va- rianza u*= l. Si a = 0.05, hallar el conjunto de valores de x para los que la hiFbtesis debe rechazarse y dibujar la curva OC para este criterio.

10. ¿Para que valor o valores alternativos de p en la curva OC obtenida en el ejercicio 9. la probabilidad de un error tipo I1 es, aproximadamente, 0.10?

11. Se desea contrastar la hipótesis p = po frente a la alternativa p = p~ (donde p1 > p a ) sobre la base de una muestra aleatoria de tamaiío n proveniente de una poblacijn nor- mal con varianza u2. (a) Si las probabilidades de cometer errores tipo I y tipo I1 tienen valores a y 8, asig- nados de antemano, demostrar que el tamaño de la muestra necesario para lograr este grado de precisión es

8. Repetir el ejercicio 7, cuando

(b) Usar la fórmula del inciso ( a ) para hablar n cuando U = 12, PO = 30, p1 = 32 a = 0.05, y /3 = 0.01.

8.4 Hipótesis referentes a una media

En esta sección consideraremos en una forma más general el problema de curl- trastar la hip6tesis de que la media de una población es igual a u¡; valor determi- nado frente a una alternativa conveniente; es decir, se ha de contrastar

Hoz p = BO

frente a una de las alternativas

HI: p < po, H I : p > po, 6 HI: p f 1.r0

y la región clítica que usaremos será de la forma Ze < C, Z > C, ó Z < C , 6 Z > C,, respectivamente. Como ninguna de estas hipótesis alternativas especifica un valor

Page 159: ingenieria

HlPOTESlS REFERENTES R.UNA. MEDIA 151

ÚniCO de p , es imposible calculag 0 (prob&ilidad de un error tipo Ii) para cual- quiera de estos tests y por lo tanto, es razonable describirlos como tests para decidic. si z es sigrtificativamente menor que po, significativamente mayor que po, o significa- tivamente diferentes de po.

Un test como éste; en el que la probabilidad de una falsa hipótesis H,, no se puede determinar de una manera única, se ‘ilama, coinúnmente; tesf de bpificacick?. La probabilidad cy de cometer un error’tipo I, llamada tambih nivel de diphfiw- cidn, se puede calcular, puesto que ~r queda. especificada de’ una manera única por H,, y el rechazo de H , es “seguro” en este sentido. Por otra parte, hay un peligro inherente en aceptar H , porque la Probabilidad de su falsa aceptación no se puede obtener. Por consiguiente, siempre que sea posible, se’escogerá la hipótesis H,, de tal forma que estemos dispuestos a un “juicio reservado” sobre su validez, a menos que.’haya una clara evidencia qui? conduzca a su iechazo. Por eda razón, H, se’ lla- mará hipdtesis nula y se considerará como un “hombre de paja” con’ el objetivo de determinar si se debe rechazar, o no ‘se debe.

La idea de establecer una hipótesis nula no es infrecuente ailn en campos dis- tintos de la estadística. De hecho; esto es exactamente lo que se %ace ante un tribu- nal, donde se considera inocente, al acusado mientras no se pmebe que es culpable, “dentro de una razonable duda”. La hipótesis nuh’establece que el acusado no es culpable, y la probabilidad expresada subjetivamente por la frase “dentro de una duda razonable” nos conduce al nivel de significaciijn de di el “piso ’de la prueba” entra siempre en el proceso con el sentido de que el acusado no es culpable, a me- nos que la hipótesis nula de inocencia quede claramente rechazada. Ndtese que esto no implica que haya quedado probada la inocencia del acusadd por el hecho de no encontrársele culpable, sino que solo implica que no se ha probado su culpabilidad. Por supuesto, como legalmente no podemos hacer un “juicio reservado,”, si no se establece la prueba de culpabilidad, el acusado quedará libre y actuamos como si la hipótesis nula de inocencia fuera aceptada. Notemos que esto es 19 que hacemos algunas veces en los tests de hipótesjs estadísticas cuando no ;los podemos dar el lujo de hacer juicios reservados.

Para establecer un paralelo entre este argumento y la clase de problemas prácticos en los que se aplican ordinariamente los tests de significación, considere- mos los ejemplos siguientes. Supongamos que hay que tomar una decisión sobre ‘a compra de una miquina soldadora automitica para hacer un trabajo que ante- .iormente era manual, y existe la idea de que la máquina será económica solo si 1 1 .

:I promedio de soldaduras defectuosas por cada ciento, es menor que S. Entonces. 10s encontramos ante una situación en la que es necesario un test de la hipcitesis iula H,,: p = 5, aunque no se nos ha dicho directamente la’ hipbtesis alternativa que ‘e ha de usar. Si el peso de la prueba se hace recaer sobre la máquina, será apro- liado contrastar H,, frente a la alter.mti\u e 1 1 u 1 1 scrrtitlo I I I I ~ I L I ~ C ~ ~ I I HI: p < S , ins- alando la máquina sólo si se puede probar estadísticamente que produce menos de ; soldaduras defectuosas.en cada 100. N6tese que, si CY. = 0.05. hay solamente un :$ de oportunidades de rechazar errcineamente H,, e instalar la máquina automfi-

Page 160: ingenieria

152 INFERENClAS REFERENTES A LAS MEDIAS

tica. Por otra parte, si el peso de la p w b a se hiciera recaer sobre el método exis- tente, la alternativa unilatera HI:, p > 5 será la apropiada. En este caso, H, se aceptará y la máquina automática se instalará a menos que s e a probado (por ejem- plo, con a = 0.05) que la máquina produce demasiados defectos. La selecci6n de qué alternativa unilateral se ha de utilizar, en esta situación y en otras semejantes, es un problema práctico ,J-@ que estadístico y depende simplemente de dónde he- mos decidido hacer recqer el peso de la prueba.

Para dar un ejemplo ' de alternativa en los dos sentidos o bilatera, supongamos que un envasador de jugos desea comprobar, si se ha envasado la cantidad correc- ta de jugo de fruta en sus latas de 20 onzas. Como las etiquetas dicen '"veinte onzas", este envasador no puede poner mucho menos de veinte onzas .por miedo a perder la clientela o a estar fuera cie la ley, y tampoco pude poner mucho más der.veinte onzas por miedo a perder una buena parje de su gqnancia. Entonces, nos encontra- mos ante una alternativa bilatera HI: p # 20, y el proceso de llenado de las latas no se cambiará, a menos que el peso medio de los contenidos en una muestra, sea significativamente diferente de veinte onzas.

Volviendo ahora al problema general del cóntraste de hipótesis nulas p = po,

vemos que este problema ya ha quedado resuelto en la sección 8.3, siempre que el tamaño de la muestra sea grande y la desvíación típica de la población sea conocida. En tal caso, la región crítica está dada por Z < C si la hipótesis alternativa es p < po, z> C, si la hipófesis ' alternativa es p > po, y Z < C, ó Z > C2, si la hi- pótesis alternativa es p # PO, y las fórmulas para determinar C, C, y C2 están da- das en las páginas 154 y 158. Un método equivalente pero más sencillo, para de- terminar la región crítica, es basarse) en el estadístico

'

+ + en lugar de 2. Si el nivel de significación es (Y, ,y za es, como antes, tal que el área a su derecha bajo la curva normal tipificada sea igual a u, las regiones criticas para contrastar H , p = po se,pueden expresar como 'se indica en la tabla siguiente:

REGIONES CRITICAS PARA CONTRASTAR' Zio: F pa

r ( rue;aR;k, p conocido) , Hipótesis alternativa

P<clo . .

Rechazar H o si

2 > 2, r>PO

2 < -2, i

t I 1,

Como ilustración,. volvamos al problema de la ,soldadora automática. La hipó- tesis nula es P = 5 y usaremos la alternativa P < 5, haciendo recaer el peso de la

Page 161: ingenieria

HIPOTESIS REFERENTES A UNA MEDIA 153

prueba en la soldadora automática. Supongamos que la decisión se ha de basar en una muestra de 64 conjuntos, cada uno de los cuales contiene 100 soldaduras, y que la media y la desviación típica de1 numero de soldaduras defectuosas por conjunto son, respectivamente, 4.8 y 1.2. Aunque en este momento no se conoce u , la mues- tra es lo suficientemente grande para aproximarla con S = 1.5 con lo que obtenemos

$4.8.- 5 z = *2,dz = - 1.33

_>

Si el nivel de significación es = 0.05, en la tabla I11 encontramos que el wlur criticb es -,z.05 = - 1.645; como el valor calculado de z no es menor que - 1.645, la hip6tesis nula no puede ser rechazada y, por lo tanto, decidimos qúe la máquina no debe ser instalada. (El lector deberá hacer una gráfica’de la curva OC de este test en , , el ejercicio 9 de la página 160.)

Si el tamaño de la muestra es pequeño y Q desconocido, no se puede utilizar el test que acabamos de describir. Sin embargo, si la muestra proviene de una pobla- ción normal (dentro de un grado razonable de aproximación), podemos emplear la teoría discutida en la sección 7.3 y basar el test de la hipótesis tlo: p = po en el es- tadistico

+ + Las regiones críticas resultantes se muestran en la tabla siguiente, en la que t , se de- fini6 en la phgiha 127 el Brea a su’ derecha bajo la curva de distribución t con n - l grados de libertad es igual a a ) .

Como ilustración,‘ volveremos a considerar el problema de decidir cuándo se debe cambiar el proceso de llenar botes de jugo de fruta, es decir, el problema en el que la hip6tesis nula P = 20 se debe contrastar frente a la alternativa AI # 20.

. . REGZONES CRITICAS PARA CONTRASTAR ]I0: p is w

(Población normal,’ U desconocida)

Rechazai. ‘Ho si . I

Hipótesis altertlalivcr

para n - 1 grc~d(ls de lihrrtgd

__. ; I ’

P < M t < -tu

P > w

1 < “ t , m # # M

1 > tu

6 1 > d / 2

Page 162: ingenieria

154 INFERENCIAS REFERENTES A LAS MEDIAS

Para decidir si se ha de ajustar el proceso, calculamos

y como excede a 2.797, valor de t.OOb con 24 grados de libertad (ver tabla IV), la hipótesis nula deberd ser rechazada. (Es difícil’dibujar la curva OC de esta test por- que la distribución muestral del estadístico del test no es la distribución t, a menos que sea P = 20. Sin embargo, en la Biometrika Table mencionada en la bibliografía hay una tabla especial de la que se pueden obtener las probabilidades necesarias.)

No obstante el resultado obtenido en esta prueba, el fabricante preferira no ajustar su maquinaria, ya que la pérdida debida a sobrellenar los botes con una pe- queña cantidad adicional será menor que el costo dz los experimentos de ajuste. Esto ilustra el hecho importante de que un resultado que es significativo estadísticamente. Muchas veces no es significutivo comercialn~rnte. En estas circunstancias. seria más apropiado contrastar la hipótesis nula P = 20 frente a una alternativa, tal como 11 < 19.95 ó P > 20.05,’si se nota que en algunos de los casos es necesario hacer un ajuste.

8.5 Hipótesis referentes a dos medias

AI tratar con medias de poblacicin, nos encontramos frecuentemente con el pro- blema de tomar decisiones sobre los valores relativos de dos, o más, medias. Dejare- mos ei problema general para resolverló en el capitulo 3. Esta sección la dedicare- mos a test referentes a la diferencia entre dos medias. Por ejemplo, si se han consi- derado dos tipos de acero para usarlos en ciertas vigas de estructuras metálicas, to- rnaremos muestras y decidiremos cuál es mejor, comparando sus resistencias medias; también, si se ha dado un test a u n grupo de ingenieros industriales y a otro de in- genieros civiles para juzgar el grado de perfección en sus trabajos, y trataremos de decidir sí la diferencia observada entre las medias de sus resultados es significativa o si se debe atribuir a la casualidad.

Formulando el problema con más generalidad, consideraremos dos poblaciones que tienen medias PI y p. y las varianzas U: y U$, y deseamos contrastar la hipó- tesis nula PI - p2 = 6, donde 8 es una constante especificada, suponiendo inde- pendientes las muestras aleatmias de tamaños. n, y n,. En forma andoga a los test que se refieren a una sola media, consideraremos tests de estas hipótesis nulas frente a cada una de las alternativas Ic, - PZ < 6, PI - 1c2 > 6, y - pz # 6. El test, por

ambas muestras son grandes y se conocen las varianzas de población. se podrá ba- sar en el estadístico

1

! sí mismo, dependerá de la diferencia entre las medias muestrales, - z2, y si

z = (2, - 2,) - 6

G I - zz

cuya distribuci6n muestral es (aproximadamente) la distribución normal. tipificada Aquí, uz,-z2 es la desviación tipica de la distribucicin muestral de la diferencia entre

Page 163: ingenieria

HIPOTESIS REFERENTES A COS MEDIAS ' : 1 55

das medias muestrales y sU.valor para muestras aleatorias de poblaciones infinitas se puede obtener del siguiente teorema que enunciamos sin demostración.

Teorema 8.1. Si las distribuciotm de dos variables alcatorias independieurcs tir- nen medias p1 y p~ y varianzas., a; y a& la distribucicin de su suma ( o tlifcl- rencia) tiene por media p1 + pz ( 6 11 - p2) y por variatrza u: + u;. Para encontrar la variama de la. diferencia entre, las medias de dos muestras

aleatorias independiente?. ,$e :tamaño n, y n2 provinientes de poblaciones infinitas, notemos primero que las varlanzas de las dos medias son:

, .

donde U? y U: son las varianzas de las poblaciones respectivas. Luégo. por el teo- rema 8.1:

y el estadístico del test se puede escribir como

+ +

En una forma análoga a la 'de la tabla de la pagina 153, las regiones criticas para contrastar la hipótesis nulaH,,: pl - pz = 6 será como sigue:

REGIONES CRITICAS PARA CONTRASTAR IIo: p1 -,pz 6 (Muestras grandes, UI y uz conocidasi

P I - c(2 > 8

P I - PZ # 6

Para ilustrar este tipo de test, supongamos que se'hace un test de eficiencia a 50 ingenieros industriales (Grupo- 1) y a 60 ingMieros civiles .(Grupo 2) y que los resultados son los siguientes:

Si deseamos cbntrastar, Coir un nivel de significaei6n de u n 0.05. si es significativa una diferencia observada de '2 puntos entre las dos medias si se puede atribuir a

Page 164: ingenieria

156 INFERENCIAS REFERENTES A LAS MEDIAS

la casualidad, la hipótesis nula y la hipótesis alternativa apropiadas son Ho: pI - p2 = O y H1: pl - p2 # O. De acuerdo con esto, ponemos 6 = O en la fór- mula de z y el estadistico del test es:

(Nótese que hemos aproximado las variankas de población con S? y S;, Io que es justificable, puesto que las dos muestras son suficientemente grandes.) Como el va- lor que obtuvimos para el estadistico’ del test se encuentra entre los valores críticos -1.96 y 1.96, la hipótesis nula no puede ser rechazada y, por lo tanto, concluimos que la diferencia observada entre las medias no es significativa con un nivel de un 0.05, o, en otras palabras, se puede atribuir a la casualidad.

Si una o ambas muestras son pequeñas y las varianzas de población son des- conocidas, podemos basar el test de la hipótesis nula Ho: pl - p2 = S en un esta- dístico t, conveniente siempre que sea razonable suponer que ambas poblaciones son normales con ul = u2. En estas condiciones, se puede comprobar que la distribu- ción muestra1 del estadístico

$1 - z,) - 6 t = sz, -4

es la distribución t con n, + n2 - 2 grados de libertad. En esta fórmula, e] deno- minador implica una “estimación conjunta” de la varianza de la población.

Para aclarar lo que significa “estimación conjunta” de la varianza de la pobla- ción, consideraremos primero el problema de estimar varianza de la distribución de la diferencia entre dos medias muestrales. Suponiendo que u? = u% (= u2), esta varianza está dada

y ahora estimamos u*“conjuntando’’ las dos sumas de desviaciones cuadráticas re- feridas a las respectivas medias muestrales. En otras palabras, estimamos 2 por medio de

donde 2 (2, - 21)2 es la suma de las desviaciones elevadas al cuadrado referidas a la media de Ia primera muestra, y 2: (x2 - z2)2 es la suma de las desviaciones elevadas al cuadrado referidas a la media de la segunda muestra. Dividimos por n 1 + n2 - 2, puesto que hay n , - 1 desviaciones independientes referidas a la media en la primera muestra, n2 - 1 en la segunda y, por lo tanto, obtenemos nl + n2 - 2 desviaciones independientes referidas a la media para estimar la va- varianza de la población. Substituyendo esta estimación de u2 en la expresión ante- rior de y después substituyendo la raíz cuadrada del resultado en el denomi- nador de la fórmda para t de la pagina 156 encontramos finalmente.

Page 165: ingenieria

HlPOTESls REFERENTES A ,DOS MEDIAS 157

para, el estadístico en que hemos ,basado la ,prueba. Las regiones críticas correspon- dientes para contrastar la hipótesis nula i r o : p1 - p2 = 6 se muestran .en la tabla siguiente: i “ , ,

(Poblaciones normales, u: = ut = u, u desconocida) REGIONES CRITICAS PARA CONTRASTAR H ~ : - p2 = 6

’.> Rechazar H, si para n1 +. ni - 2

alternativa grndos de libertad,

Pl - m < 6 1 < -t.

Para ilustrar este tipo de test, supongamos que una muestra de 10 vigas de acero provinientes de la laminadora A tienen una resistencia media a la tensión de 54 O00 psi (libras por pulgada cuadrada) con una desviación típica de 2100 psi, y que una muestra de 12 vigas de l& laminadora B tienen una resistencia media a la tensión de 49 O00 psi con una desviación típica de 1900 psi. Las vigas de la laminadora B cuestan menos que las de A, y estamos inclinados a comprar las de B, a menos que las de A resulten, al menos, 2000 psi más resistentes que las de E, en promedio. En consecuencia, se deberá contrastar la hipótesis nula H 0 : p A - p~ = 2000, frente a la alternativa unilatera H I : p~ - p B 3 2000, y escogeremos un nivel de significa- ción a = 0.01. El valor del estadístico del test es:

(51,000 - 49,000) - 3000 d9(2100)2 + 11 (1900)2

t = = 3.52

Y como excqle a 2.528, valor de para 20 grados de libertad, la hipótesis nula de- berá ser rechazada y 14s vigas se compararán a la laminadora A. (Nótese que, es- cogiendo la hipótesis alternativa ‘pA - p E > 2000, hemos situad& ;el peso de la pruebas en la laminadora A.)

En este último ejemplo, sin ‘detenernos en qomprobaciones y con cierta arbitra- riedad establecimos un test t rie dos muestr&, suponiendo tácitamente que las va- rianzas de la población eran iguales. Afortunadamente, el test ‘m es muy sensible a pequeñas diferencias en las varianzas de población por lo que el procedimiento usado es bastante justificable. Sin embargo, para %tener seguridad en lo que esta- bamos haciendo, debieramos primero haber examinado en qué grado se puede atri- buir a la casualidad la diferencia entre las varianzas de las muestras: un procedi- miento para precisar esto se expondrá en el capítulo 9.

Page 166: ingenieria

158 INFERENCIAS REFERENTES A LAS MEDIAS

Si la diferencia entre las varianzas de las muestras es grande, o si no es razo- nabie tratar las varianzas de población como si fuesen iguales, no podremos utilizar ei test t de dos muestras Sin embargo, hay varios mitodos alternativos que se pue- den emplear en su lugar, los cuales no requieren la supbsición de que sean iguales ias varianzas de población. Uno de estos, el test t de muestras apareadas, se aplica a dos muestras aleatorias del mismo tamaño que no necesitan ser independientes. Brevemente, el procedimiento consiste en trabajar con las diferencias de observacio- nes apareadas en las que el primer miembro de cada par proviene de la primera muestra y el segundo de la segunda muestra, y en usar el test t de una muestra descrita en la sección 8.4 para determinar si la media de las diferencias es significa- tivamente diferente de 6. A veces, como en el caso en que se hacen dos exámenes a cada una de n personas, el apareamiento es “natural”; en todos los otros casos será zieatorio.

Para ilustrar el test t de muestras apareadas, supongamos que tenemos que pro- bar la resistencia al desteñido de un tinte exponiendo al sol 8 piezas teñidas de va- rias clases durante un periodo determinado de tiempo. La reflexión a la luz para el mismo color del tinte se mide (en unidades arbitrarias) antes de la exposición al sol y después, y se considerará que el tinte no es resistente si la diferencia en los indices de reflexibilidad es significativamente mayor que 1. Los resultados obtenidos .3n este experimento son los siguientes:

Pieza 1 Pieza 2 Pieza 3 Pieza 4 Pieza 5 Pieza 6 pieza I Pieza 8

Antes de la Ilespués de la exposición exposición

*I x2

19 14 5 4

24 20 8 8

I O 9 11 9

7 5 16 15

Las diferencias entre estas observaciones apareadas son 5, I , 4, O, 1 , 2, 2, 1 , su media es 2.00 y su desviación típica 1.69. Suponiendo que las diferencias pueden ser tratadas como una muestra proviniente de una población normal con 6,) = 1, el estadístico del’test, para el test t de una muestra, tiene el valor:

t = 2.00 - 1 1.69/4/8 =

Si el nivel de significación es 0.05, hallamos que t.oa para 7 grados de libertad es igual a 1.895 y, por lo tanto, que la hipótesis nula no puede rechazarsc. Podemos concluir que el tinte es resistente al desteiíido o podemos reservar nuestro juicio hasta obtener más datos.

Aunque esta test t de muestras apareadas se puede emplear ‘para muestras de poblucicin normal independientemente de que las muestras sean independientes o las

Page 167: ingenieria

HIPOTESIS REFERENTES A GOS MEDIAS 159

vaviuntus de las poblaciones sean iguales, tiene dos ventajas. Primera, los tamaños de las muestras deben ser iguales y, segunda, hay una pérdida de información muy grande en el sentido de que la prueba se realiza como si sólo hubiera n observacio- nes en lugar de 212 observaciones. En el ejercicio 20 que sigue, se da un método alternativo que elimina estas desventajas cuando las muestras son independientes.

EJERCICIOS

1. La direccih de una factoría de comercialización de alimentos está considerando la insta- lación de un equipo nuevo para clasificar huevos. Si pl es el número promedio de hue- vos clasificados por hora por la máquina antigua y p2 el promedio correspondiente de la nueva máquina, la hipótesis nula que se desea contrastar es pl - pU.. = O, (a) ¿Qué hipótesis alternativa se deberá usar si el peso de la prueba se va a poner en el

nuevo equipo y el equipo antiguo se conservará a menos que la hipótesis nula sea rechazada?

( b ) ¿Qué hipótesis alternativa se deberá usar si el peso de la prueba se hace sobre la máquina antigua?

(c) ¿Qué hipótesis alternativa se deber& usar para que el rechazo de la hipótesis nula pueda conducir a la compra de la nueva máquina o a mantener la antigua?

2. Un productor de artículos de plástico inyectado encuentra que su inventario diario me- dio es de 1148 piezas. Se ha puesto en marcha una nueva política de mercados y se desea contrastar la hipótesis nula, de que el inventario diario medio permanezca sin cambios. Qué hipótesis alternativa debe usarse si: (a) ¿Se desea probar que la nueva política reduce el inventario? ( b ) ¿Si se desea conocer cuándo la nueva política cambia el inventario diario medio y

(c) ¿La nueva política debe permznecer en uso, a menos que se pueda probar Que causa

3. Una muestra aleatoria formada por las botas usadas por 50 soldados en una regijn de- sértica muestra una vida promedio de 1.24 años con una desviación típica de 0.55 años. En condiciones normales se sabe que esas botas tiene una vida promedio de 1.40 años. ¿Hay alguna razón para asegurar, con un nivel de significación de 0.05, que el USO de esas botas en el desierto causa la disminución en la vida promedio?

4. Una muestra de 9 medidas del porcentaje de manganeso en un ferromanganeso tiene una media de 84.0 y una desviacijn típica de 1.2. Suponiendo que la muestra se ha escogi- do al azar de una población normal, contrastar la hipbtesis nula de que el porcentaje verdadero sea 80.0 frente a la alternativa de que exceda a 80.0, con un nivel de signifi- cación de 0.05.

5. Un test de funcionamiento de 5 modelos de un motor experimental mostri, que funciona- ron, respectivamente, 20, 19, 22, 17 y I 8 minutos con un galhn de cierta clase de com- bustible. ¿Es esto evidencia suficiente con u11 nivel de significación de 0.01 de que los modelos no están funcionando con el promedio normal deseado de 22 minutos por ga- lón? ¿Qué suposiciones se deben hacer para efectuar este test'?

6 . Un procedimiento analítico rápido y sin gastos para determinar la cantidad de titanio acaba de ser desarrollado por Iln quimico. Para demostrar su exactitud, el descubridor presentó 50 determinaciones independientes, con una media de 0.0995ppm y una varian- za de 81.0.10-*. El material analizado por el nuevo procedimiénto se analizó después por un método muy exacto, pero muy tedioso, y se llegb al resultado de que el titanio del material era efectivamente, 0.0093 ppm. Utilizando un nivel de significacih de 0.05, decidir si hay alguna razhn para dudar de la exactitud del nuevo procedimiento.

cuándo no?

un incremento en el inventario?

Page 168: ingenieria

160 INFERENCIAS REFERENTES A LAS MEDIAS

7. Un laboratorio de pruebas desea contrastar si el promedio de vida de cierta herramien- ta cortante es de 2 O00 piezas, frente a la alternativa de que es de menos de 2000. ¿Qué conclusión se deberá sacar con un nivel de significación de 0.01, si 6 tests mcstraron como vidas de las heramientas 2010, 1980, 1920, 2005, 1975, y 1950 piezas?

8. Una muestra aleatoria de 100 llantas producidas por cierta fábrica duraron en promedio, 21 O00 millas con una desviación típica de 1 500 millas. ¿Se puede asegurar que la vida media verdadera de esta marca de llantas excede de 20000 millas? Utilizar ~y = 0.05,

9. Calcular algunas de las probabilldades necesarias y dibujar la Curva oc para el test usado como ejemplo en la página 164.

10. Dibujar la curva OC para el test descrito en el ejercicio 6. 11. Los diámetros de los ejes de rotor de un lote, tienen una media de 0.249 pulgadas y una

desviación típica de 0.003 pulgadas. Los diámetros interiores de unos cojinetes de otro lote tienen una media de 0.255 pulgadas y una desviación típica de 0.002 pulgadas. (a) ¿Cuáles son la media y la desviación típica de las tolerancias entre los qjes y los co-

jinetes seleccionados de esos lotes? ( b ) Si se seleccionan al azar un eje y un cojinete, ¿cuál es la probabilidad de que el

eje no entre en el cojinete? (Supóngase que ambas dimensiones siguen una distri- bución normal).

12. Una investigación de los méritos de dos tipos de baterías para bombillas de destellos de cámaras fotográficas demostró que una muestra de 100 baterías hechas por la compañia A tenía una vida media de 24 horas, con una desviación típica de 4 horas. Si una muestras de 80 baterías de la compañía B tuvo una vida media de 40 horas, con una desviación típica de 6 horas, ¿se puede concluir, con un nivel de significación de 0.05, que las baterías de la compañía B tienen una vida medin de 10 horas más por menos, que las de la compañía A?

13. Una compañía desea comparar las vidas de dos piedras utilizadas en un proceso de abra- sión y encuentra que el promedio de vida de 10 piedras de la primera clase es de 58 pie- zas, con una desviación típica de 6 piezas, y que la vida promedio de 12 piedras de la segunda clase es de 66 piezas, con una desviación típica de 4 piezas. Contrastar la hipó- tesis nula de que no hay diferencia entre el promedio verdadero de tiempos de vida de las dos piedras frente a la alternativa de que la segunda es superior. Utilizar CY = 0.01. ¿Qué suposición se debe hacer para poder realizar este test?

14. Los miembros de un equipo ¿e evaluación de armas quieren evaluar los méritos compa- rativos de dos tipos de proyectiles antitanques. Se disparan a su distancia máxima 10 proyectiles del tipo A, con un error medio en el blanco de 24 pies y una varianza de 16 pies. Luego se disparan 8 proyectiles del tipo B con un error medio de 30 pies y una varianza de 25. ¿Hay una diferencia significativa entre, los errores medios respecto del blanco de los dos tipos de proyectiles, con un nivel de 0.01? (Supóngase que el error respecto del blanco esta distribuido normalmente.)

15. Dos grupos de 50 estudiantes de cursos de postgraduados de ingeniería, seleccionados al azar, reciben enseñanza sobre una operación de montaje por dos métodos diferentes y después se les hace un test de aprovechamiento. El primer grupo promedia 120 puntos con una desviacibn tipica de 12 puntos, mientras que el segundo saca un promedio de 112 puntos con una desviacibn típica de 9 puntos. $i pI es el aprovechamiento medio verdadero de los estudiantes que aprendieron el primer mttodo y p:, el de los del se- gundo método, contrastar la hipótesis nula pl = p.., con un nivel de 0.05, frente a la alternativa bilateral p1 # pz.

16. Se afirma que la resistencia de un alambre eléctrico se puede reducir, como mínimo, en 0.050 ohms aleando el material. Se hacen 25 pruebas en alambre aleado y otras tantas en alambre sin aleación, dando los siguientes resultados:

Page 169: ingenieria

HIPOTESIS REFERENTES A DOS MEDIAS 161

Desviación

I Alambre aleado

Media típica 0.089 ohms 0.003 ohms

Alambre sin aleación 0.141 ohms 0.002 ohms

Empleando un nivel de significación de 0.05, determinar si es cierta la afirmación. 17. Se están haciendo tests de las características de muestras de 4 bolos de plástico y 4 de

madera, poniendo especial atención al número de tiradas que se pueden ha’cer antes de que aparezcan dentelladuras u otras imperfecciones. Los resultados ottenidos para los 4 bolos de plástico son 2650, 2770, 2480 y 2660 tiradas, mientras que los de los 4 bolos de madera son 1420, 1600, 1545 y 1395 tiradas. Si pL y p- son las medias verdaderas correspondientes a las dos clases de bolos, probar, con a = 0.01, si los bolos de plhstico duran en promedio 1 O00 tiradas más. ¿QuS suposiciones son necesarias para hacer este tets?

18. Para determinar la efectividad de un programa de seguridad industrial, se recogieron los siguientes datos sobre el tiempo perdido por accidentes ( los números dados son las medias de horns-hombre perdidas por mes en un período de un año).

Factoría Núm.

28.7 62.2 28.9 0.0 93.5 49.6 86.5 40.2 Después del programa 38.5 69.2 15.3 9.7 120.9 47.6 78.8 52.1 Antes del programa

1 2 3 4 5 6 7 8

Contrastar con un nivel de significación de 0.10, si el programa de seguridad fue efectivo en la reducción de pérdidas de tiempo por accidentes.

19. LOS datos siguientes se obtuvieron de un experimento proyectado para verificar las di- ferencias sistemhticas en las lecturas de presión arterial hechas por dos instrumentos di- ferentes:

Lectura con el Lectura con el instrumento A Instrumento B

Paciente 1 136 141 Paciente 2 Paciente 3 Paciente 4 Paciente 5 Paciente 6 Paciente 7 Paciente 8 Paciente 9 Paciente 10

115 142 140 123 147 133 150 138 147

I17 141 145 127 146 135 1 52 135 152

Utilizar un nivel de significación de 0.05 para contrastar sí hay una diferencia en el pro- medio verdadero de lectura obtenido con los dos instrumentos.

20. AI tratar con dos muestras aleatorias independientes provinientes de poblaciones nor. males cuyas varianzas no son necesariamente iguales, la prueba Smith-Sarterthwaite, que se indica a continuación, puede usarse para contrastar la hipótesis nula pl - = 8. El estadístico del test esta dado por

t ’ = i I___

3, - 2,) - 6

y su distribución muestra1 se puede aproximar por la distribuci6n t con

(Ei +

n1-1 ’ 7 t z - 1

Page 170: ingenieria

162 INFERENCIAS REFERENTES A LAS MEDIAS

grados de libertad. Utilizar este test para los datos del problema 14 y comparar la res- puesta con la obtetlida anteriormente.

21. Emplear la f6rrnula para I de la página 156 para constuir un intervalo de confianza para 6 al nivel de 1 - LY diferencia entre las medias de las dos poblaciones.

22. Emplear la f6rmula obtenida en el ejercicio 21 para construir un intervalo de confianza al nivcl de 0.95 para la diferencia entre Ins vidas medias dc las dos piedras abrasivas del problema 13.

Page 171: ingenieria

9 LAS VARIANZAS INFERENCIAS REFERENTES A

9.1 Estimación' de varianzas

En varias wasignes, en el capítulo anterior, estimamos la varianza de la pobla- ción por medio de una varianza de la muestra definida por la fórmula

n I: ( X i - 2)2'

. .

S2 = i - 1 ' . " n - 1

Substituimos s2 por u2 en el intervalo de confianza de ,u para muestras ,grandes en la página 148, en el test de muestras, grandes referentes a p en la página 153, y en test de muestras' grandes rkferentes a la diferencia entre dos pedias en la página 155. Para justificar este 'procedimiento, vamos, ahora, a compro6ar que S') es, de he- cho, una estimación no sesgadu,de d. E n otras palabras; demostraremos que la me- dia de la distribución muestra1 de s? es igual v2.

163

Page 172: ingenieria

164 INFERENCIAS REFERENTES A LAS VARIANZAS

Si / ( x l , X?,. . . 2,) es la densidad conjunta de los valores de la muestra xl, xq,. . . y X,,, según la discusión de la página 77, la media de la distribución muestral de s2 está dado por

= /-mm . . . /-mm 2 u.f(xl, x2, . . . , x,) dxl dxz . . . dx, , - I n - 1

Si ahora escribimos n n 2 ( X i - z)2 = z x; - n22

i = l i-1

e intercambiamos las operaciones de suma e integración, la expresión de la media de la distribución de S' es

Suponiendo, sin perdida de generalidad, que la media de la población p t s igual a cero, vemos que estas dos integrales últimas ya han sido calculadas en la página 122, donde se demostró que sus valores respectivos eran u2 yu2/n. Entonces, la me- dia de la distribución muestral de s? estará dado por

1 " z ue - - . - = - - - - n u2 nu2 U2 - u2

n - 1 i = l n - 1 n n - 1 n - 1

y esto completa la demostración de que sf es una estimación insesgada de u2. (Nó- tese que si hubiéramos dividido por n en lugar de hacerlo entre n - 1 al definir S',

el resultado habría sido una estimación sesgada y la media de su distribución mues-

tral habria sido 7 u'.) Aunque la varianza muestral es una estimación insesgada de u2, esto no im-

plica que la desviacicin típica de la muestra sea también una estimación insesgada de U ; de hecho, no lo es. Sin embargo, para muestras grandes, el sesgo es pequeño y es práctica común hacer una estimación de U con s. Junto con S, algunas veces se estiman, también, las desviaciones típicas de las poblaciones en función del recorrido R de la muestra, que qued6 definido anteriormente cam0 diferencia entre los valo- res mayor y menor de la muestra. Dada una muestra aleatoria de tamaño n prove- nienfe de'una pohlacitin normal, podemos demostrar que la distribrciqn muestral de R tiene la media deu y la desviación típica d3u, donde de y da son constantes que dependen del tamaño de la muestra, como se ve en la tabfa siguiente:

n - 1

Page 173: ingenieria

ESTlMAClON DE VARIANZAS 165

I 4 3 4 5 6 7 8 9 I dr 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078

.~

dr 0.853 0.888 0.g80 0.864 0.848 0.833 0.820 0.808 0.797

-

Asi pues, el estadístico Kid, es una estimación insesgada de u, y la, desviación típica de su distribución muestral esta dada por dsu/dn . Para muestras muy pequéñas (n 15 5), R/d2 nos da una estimación aproximadamente tan buena de u como S,

pero cuando crece el tamaño de‘ la muestra, es mlis eficiente el uso de s. Se emplea el recorrido para estimar U en problemas de coritroi de calidad, donde los tamaños de las muestras son, en general, pequeños, y en los que la facilidad de cálculo es un requisito importante. Esta aplicaciijn se discutirá detalladamente en el capftulo 15.

La estimación de intervalos para u ó uz se basa casi siempre en l a varianza muestral. Al tratar con muestras.aleatorias tomadas de poblaciones ttormales, utiliza- zamos el teorema 7.4, de acuerdo con el cual

(n - l)s2 a2

es un valor de. una variable aleatoria que tiene m a distribución X-cuadrado can rz - 1 grados de libertad. Entonces, si x? y xf cortan las Colas izquierda y derecha del área a / 2 bajo la curva de distribución X-cuadrado con n - 1 grados de liber- tad, podemos asegurar, con un grado de confianza de 1 - a, que

+ (n - l)s2 ( n - I)s2

x; < u2 <

X:: +

Si, ahora, tomamos la raíz cuadrada de cada miembro de esta desigualdad, obtene- mos el intervalo de confianza al nivel de 1 -a, correspondiente para u. Nótese que los intervalos de confianza anteriores, obtenidos tomando “colas iguales”, no dan los intervalos de confianza m h cortos para u2 y u, puesto que 18 distribución X-cuadra- do no es simétrica. De todas formas, se utilizan en,la mayoría de las aplicaciones para evitar cálculos complicados.

Para ilustrar la construcción de un intervalo de confianza para u 6 us, volvamos al ejemplo de la página 130 y supongamos que los indices de refracción de una muestra aleatoria de 20 piezas de cristal tienen una varianza de 1.20. , Para construir un intervalo de confianza al nivel de 0.95 para u2, encontramos en la ta- bla V que, para 19 grados de libertad,

x; = x575 = 8.907 y x; = xks’= 32.852

Page 174: ingenieria

166 INFERENCIAS REFERENTES A LAS VARIANZAS

Substituyendo estos valores junto con los de I E = 20 y S? = 1.20 . en la fórmu- la del intervalo de confianza anterior ,obtenemos

(19)(1.20-10-4) 19) (1.20. IO-') 32.852

ci 0.69. < u' < 2.56.

Tomando raíces cuadradas, encontramos que el intervalo de confianza al nivel de 0.95, correspondiente para u es 0.0083 < U < 0.0160.

El método que hemos analizado se aplica solamente a muestras aleatorias pro- vinientes de poblaciones normales (o al menos, muestras aleatorias provinientes de poblaciones que se aproximan suficientemente a las normales, por lo que el método nos dé una buena aproximación). Si el tamaño de la muestra es grande, se puede probar que, en condiciones muy generales, la distribución muestra1 de S se puede aproximar muy bien con una distribución normal que tiene u como media y ~/d/21( c.c)mn desbiaci6n típica. Entonces,

S - u z = - U / d %

es un valor de una variable aleatoria que tiene aproximadamente una distribucicin normal tipificada, y resolviendo la desigualdad

para u, obtenemos el siguiente intervalo de confianza de muestras grandes con una probabilidad I - a para u:

+

1.

2.

EJERCICIOS

Utilizar los datos del ejercicio 7 de la página 160 para estimar la desviacidn típica de los tiempos de vida de las herramientas cortantes dadas, en funcidn' de: (a) la desviación típica de la muestra, ( b ) el recorrida de la muestra. Comparar las dos estimaciones, expresando su diferencia en porcentaje de la primera. Las longitudes (en pulgadas), de 10 clavos producidos por cierta máquina, son las si- guientes:

1.14, 1.12, 1.11, 1.10, 1.16, 1.13, 1.18, 1.12, 1.11, 1.15 (a) Hallar el recorrido de esta muestra y emplearlo para estimar la desviación típica de

las longitudes de los clavos. ( b ) Comparar el recorrido estimado obtenido en la parte ( a ) con la desviacibn típica de

la muestra. LCOmc podemos usar eficazmente una clave en este caso para calcular S?

Page 175: ingenieria

HIPOTESIS REFERENTES A UNA VARlANZA 167

3. Usando los datos del problema 5 de la página 160. construir un intervalo de confianza al .nivel dc 0.95 para la desviacibn tipica de las longitudes del tiempo que el motor exper,¡- ntental funciona con un gal6n del combustible dado.

4. Cltilizando la f0rmuIa para muestras grandes dada en l a pigina 166 con el valor de S

obtenido en el problema 3. suhstituycndo a r3 hallar el tamaño de muestra mínimo nece- raritl para estimal u cntre - 1 . 0 . 0 0 5 con un grado de confiarza de (1.Y5.

5. Una muestra alentorta de 2.5 cjecutivos.gast6 en promedio 517.5.36 con una desviacicin tipl- ca de 316.94. en visltas a funcionarios. Hallar un intervalo de confianza al nivel de 0.95 para la desviacion ttpica verdadera dc estos gastos. utiltzando 'a ! la tCcnica de nluectras pequcfias hasada en l a distrihucibn X-cuadrado. (b 1 la técnica de muestras grandes basada en la distribucion normal. ('ompar;rr l o r dos

h. <'on el valor de S obtenido en el problema 2. construir un intcrvaln dc confianza al nikc l de 0.90 pars 6. ;,Que suposicion deberi hacerse con rcspecto a la pohlaci0n de las Inngitu- des de los clavos?

7. Si S O medidas del peso especifico del aluminio tienen una media dc 3.686 Y una desviacibn típica de 0.041. construir un intervalo de confianza a l nivel de 0.99 para l a desviaciirn tipi- ca verdadera de tales medidas.

X. Las medidas del indicc de rcfraccibn de 35 piezas de cristal para fines Optisos ticnu una desviaciOn tlpica de O . ( J I ? . Suponiendo quc l as medidas se pueden tratar como una muestrr! proviniente de una poblacicin normal. hallar los límites con un grado de 0.95 de confianza para u* por el mctodo exacto y por el método de muestras grandes. Comparar los rc- sultados.

intervalos de confianza.

9.2 Hipotesis referentes a uno varianza

En esta seccicin consideraremos el problema de contrastar la hipcitesis nula de que una varianza de poblacidn sea igual a una constante determinada. frente a una alternativa conveniente unilateral o bilateral: esto es. debemos contrastar

Page 176: ingenieria

1 68 INFERENCIAS REFERENTES A LAS V A R I A N Z A S

es un valor de una variable aleatoria que tiene distribucih X-cuadrado con - 1 grados de libertad, podemos emplear este estadístico X' para contrastar la hipótesis nula u* = n; como se muestra en la tabla siguiente:

En esta tabla, X: tiene la misma forma como se defini6 en la página 139. Nci- tese que se usan "colas iguales" para efectuar la prueba de dos colas, que no es, en realidad, el "mejor" procedimiento, puesto que l a distribución X-cuadrado no es simitrica.

Para ilustrar esta clase de test X-cuadr-do, supongamos que los espesores de una muestra de 15 dados cortados de una lámina de sílice tienen una desviación tí- pica de 0.64 mils y que el proceso para dar el espesor apropiado a las láminas sólo es aceptable si U , desviación típica de la población de los espesores de los dados, es a lo más 0.50 mils. Esto indica que debemos contrastar la hipótesis nula H,,: U = 0.50, frente a la alternativa H , : U > 0.50, y que lo debemos hacer con un nivel de significación de 0.05. Como esto es equivalente a contrastar la hipótesis nula u2 =

= 0.25 frente a la alternativa u2 > 0.25, el valor del estadístico del test ser5

Como no excede a 23.685, valor de xbs con 14 grados de libei-tad, la hipótesis nula no se puede rechazar; aunque la desviacicin típica muestral excede a 0.50, la eviden- cia no es suficiente para llegar a la conclusión de que el proceso para obtener el grosor laminar deseado es insatisfactorio.

Si la población de la que estamos tomando las muestras no es normal, pero el tamaño de la muestra es grande (la regla general será tomar n 2 30). la hipótesis nula H o : U = uu se puede contrastar ;,tilizando el estadístico

S - Un z=- Un/ 4%

cuya distribución muestral es, aproximadamente. la distribucicin normal tipificada. La linica diferencia en el test es que y zn reemplazan a x' y d.

Page 177: ingenieria

HIPOTESIS REFERENTES A DOS VARIANZAS 169

9.3 Hipdtesis referentes a dos varianzas

El test t de dos muestras para la diferencia entre dos medias, descrita en la sec- ción 8.5, requiere la suposición de que las varianzas de población sean iguales. An- tes de proceder con este test, será conveniente, por lo tanto, someter esta hipótesis a un test. En esta sección describiremos un test de la hipótesis nula N O : u? = U$ fren- te a una alternativa apropiada que se aplica a muestras aleatorias independientes to- madas de poblaciones normales. Como veremos en el capítulo 13, el test tiene mu- chas otras aplicaciones importantes.

Si, de dos poblaciones normales que tlenen la misma varianza, tomamos dos muestras aleatorias independientes de tamaños nl y n:, se deduce, del teorema 7.5, que el estadístico

es un valor de una variable aleatoria que tiene una distribución F con nl - 1. y n 2 - 1 grados de libertad. Entonces, si la hipótesis nula U? = U; es cierta, la razón de las varianzas muestrales S; y S: nos da un estadístico con el que se pueden basar el test de la hipótesis nula.

La región crítica para contrastar H,, frente a la hipótesis alternativa u? > (ri es F > F,, donde Fa como se definió en la página 130, es decir, corta la cola derecha de área CY bajo la curva de distribución F con n, - 1 y 1 7 ~ - 1 gwdos de libertad. Anhlogamente, la región crítica para contrastar H b frente a la hipótesis alternativa U: < U; es F < F1-, , y esto provoca ciertas dificultades, ya que la tabla VI s610 contiene valores correspondientes a las colas por la derecha de (Y = 0.05 y Q = 0.01. Un método es usar el recíproco del estadístico del test original y empleamos la re- lación

dada anteriormente en la página 131. Entonces basamos el test en el estadístico F = sf /s? y la región crítica para probar H o : u: = u: frente aH,:a? <u; queda de- terminada por F > F a , donde F, es el valor crítico apropiado de F con n 2 - l y 1 1 ~ - 1 grados de libertad. ..

Para la alternativa bilatera U? # U; la regicin critica ~ S F < F ~ - ~ / ( Ó F >. FmIa, donde F = S V S S y los grados de llbertad son 1 1 ~ - 1 y t12 - 1. En la práctica, modificaremos este test como en el párrafo anterior, de tal forma que podamos uti- lizar la tabla de valores de F correspondientes a las colas por la derecha de CY = 0.05 y CY = 0.01. Con este objeto, representemos por S$ la mayor de las dos va- rianzas muestrales, y por s: la menor, y los correspondientes tamaños de las mues- tras por nM y nm. Así, el estadístico del test quedará en la forma F = S;/& y la región crítica será la mostrada en la tabla siguiente:

Page 178: ingenieria

170 INFERENCIAS REFERENTES A LAS VARIANZAS

REGIONES CRITICAS PARA CONTRASTAR Ho: ut = a:

(Poblaciones normales)

Hipótesis Rechazar H, si del test alrerrtarivu

Esradistico

2 < x IJ? > a;

P > Fa(% - 1, n1 - 1) F = si/s:

F > Fa(% - 1, m - 1) F = &S%

‘4 jt 0; F = S $ / & I F > F , I ~ ( ~ M - 1, n, - 1)

El nivel de significación de estos tests es IY y los valores indicados entre parkntesis son los respectivos grados de libertad. Notemos que, como en el test X-cuadrado, se emplean “colas iguales” en test de dos colas por conveniencia matemática, aunque la distribución F no sea simétrica,

Para ilustrar un test F de una cola para la igualdad de dos variancias, supon- dremos que se desea determinar si, para dar el acabado a la lámina de silicio, es mejor hacerlo manualmente o con una máquina automática. Supondremos que, esen- cialmente, no hay dificultad para controlar el espesor medio de la lámina, cualquiera que sea el método empleado, y basaremos el test en la variabilidad del espesor de los dados encontrada en los dados cortados por los dos métodos. Si el peso de la prueba se sitira en el método automático (posiblemente porque ésta requiere equipo nuevo y caro), la hipótesis nula Ho: U; = U: deberá contrastarse frente a la alterna- tiva H I : U: > u:, donde los subindices 1 y 2 se emplean, respectivamente, para el mé- todo manual y el método automático. Si 31 dados acabados a mano tienen una va- rianza s? = 0.58 , mientras que 35 dados acabados a máquina tienen una varianza de si = 0.26 encontramos que el estadístico del test adecuado tiene, por valor

F = - L ” o 58 - 2.23 0.26

Comparando este valor con 1.79, el valor de F.,, ,(30, 34) obtenido en la tabla VI por interpolación lineal,+ concluimos que la hipótesis nula, deberá rechazarse, con un nivel de significación de 0.05, y la decisión será instalar el equipo automático.

Para ilustrar un test F de dos colas para la igualdad de dos varianzas, volvamos al problema de la página 156, en el que contrastamos si las resistencias medias de tensión de vigas de acero estructural hechas por los fabricantes A y B diferían en más de 2000 libras por pulgada cuadrada. En este ejemplo, hicimos un test t de dos muestras, aunque había una diferencia entre las varianzas de las dos muestras. Para justificar este procedimiento. emplearemos un test para ver si ri = U:, y para ello, contrastaremos la hip6tesis frente a la alternativa ,,$ # &, puesto que sólo nos inte- resa saber si estas varianzas son iguales, o no. Como:

* N6tese que realmente era innecesario interpolar en este caso, puesto que 2.23 excede a 10s dos F.a~(30, 30) Y Fm(30, 40).

Page 179: ingenieria

HIPOTESIS REFEfiENTES A 00s VARIANZAS 171

Utilizando a = 0.02, encontramos, en la tabla VI, que F.ol (9, 1 1 ) es igual a 4.63, de donde la hipótesis nula no puede ser rechazada. En otras palabras, era justificable emplear el test t de dos muestras en el ejemplo considerado.

EJERCICIOS

1. Con los datos del problema 4 de la página 159, contrastar la hipljtesis de que u = 1.5

2. Se han disparado 500 cargas de municiones y la tabla de frecuencias nos indica las pre- frente a la hiphtesis alternativa de que U < 1.5. Emplear 1y = 0.05.

siones en ei cañón resultantes en miles de libras por pulgada cuadrada:

presió11 e11 el cariúrz Frecuerrcia

48.0-49.9 50.0-51.9 52.0-53.9

56.0-57.9 58.0-59.9

54.0-55.9

21 94 133 155 82 16

Con base en esta informacihn. ;es razonlhle concluir que la desviaciím típica de estas presiones excede de 2.2 miles de libras por pulgada cuadrada'? Usar un nivel de significa- cidn de 0.05.

3. Contrastar la hipjtesis nula u = 0.01 pulgadds para los diimetros de ciertos pernos. si en una muestra aleatoria de tamaño 12, los diimetros de los pernos tuvieron una varianza de SI' = 0.000950. Utilice un nivel de significacion de 0.01.

4. Con los datos del ejercicio 2 de la página 166 contrastar la hi*Itesis nula de o2 =

0.0CKl3 frente a la alternativa de que u2 > = O.OW3. utilizando un nivel de significa- ci6n de 0.01.

5. En el ejercicio 8 de la página 160. contrastar la hipdtesis nula de que u = 1750 para el número de millas obtenido para el tipo de llantas. Usar (Y .- 0.05 y la hipBtcsis alter- nativa U < 1750.

6. Los datos de experiencias anteriores indican que la varianza de las mcdidas hechas en cs- tampados de láminas de metal por un grupo experimentado de inspcctorcs de control de calidad es 0.16 pulg". Tales medidas. hechas por un inspector sin experiencia. pucdcn te- ner una varianza demasiado grande (por eiemplo. por SU falta de habilidad para lccr adc- cuadamcnte los instrumentos) o demasiado pequeña (posihlemcnte porquc las medidas muy grandes o muy pequeñas se hayan dcscartado). Si un nuevo inspector mide I 0 0 es- tampados con una varianza de 0.11 pulgz, contrastar con un nivel de significacihn dc 0.05 si el inspector esti haciendo medidas satisfactorias.

7. En el problema I7 de la página 16 1. verificar si es razonahlc afirmar que hay una variabi- litlad nlayor en las vidas de los bolos de plástico que. en las de los de madera. Usar (y = 0.05.

Page 180: ingenieria

172 INFERENCIAS REFERENTES A LAS VARIANZAS

8. Justificar el uso de un test t de dos muestras en el problema 14 de la página 160, con- trastando la hip6tesis de que las dos poblaciones tienen varianzas iguales. Usar un nivel de significacih de 0.02.

9. En el ejercicio 16 de la página 160, contrastar la hipStesis nula de que u1 = u2 . frente a la alternativa bilatera ul # u2 con (Y = 0.02. Aquí, u1 4 u2 son las desviaciones típicas de las dos poblaciones de las que se han obtenido las medidas de las resistencias de los cables eléctricos.

10. Se comparan dos técnicas diferentes de iluminacihn midiendo l a intensidad lumínica en posiciones seleccionadas de áreas iluminadas por los dos métodos. Si 15 medidas en la primera área dieron una desviación típica de 2.5 pies-bujías, y 21 medidas en la segunda área dieron una desviacijn típica de 4.1 pies-bujías, ¿,se puede concluir que la ilumina- ción en la segunda área es menos uniforme'? Emplear un nivel de significacih de 0.01. ¿Qué suposiciones se deben hacer en la manera de obtener las dos muestras?

Page 181: ingenieria

10.1 Estimacibn de proporciones

En muchos problemas de ingeniería se presentan proporciones, porcentajes, O

probabilidades. AI tomar muestras para aceptar algo. nos hemos de ocupar con la proporcicin de los objetos defectuosos en un lote, y en los tests de vida probable tra- tamos con el porcentaje de ciertas componentes que deberin trabajar satisfactoria- mente durante un periodo de tiempo establecido. o la prohahilid~d de que una com- ponente determinada dure, al menos, un número dado de horas. Debe quedar claro. en estos ejemplos, que los problemas referentes a proporciones. porcentajes .o proba- bilidades, son, en realidad, equivalentes: un porcentaje es. simplemente. una propor- ción multiplicada por cien, y una probabilidad se puede considerar como una pro- porción cuando el número de casos observados se va extendiendo.

La información disponible generalmente para determinar una proporcicin es 4 n6mero de veces, x. que un suceso determinado se presenta en 11 pruetias U observa- ciones. La estimacicin de puntos es, usualmente. la frecucncia relativa x/th es decir. la proporción de las veces que ha ocurrido el succ)so. Si los II ensayos satisfacen las suposiciones que hicimos al tratar de la distribucifin b inh ica (pigina 36). sabemos

173

Page 182: ingenieria

174 INFERENCIAS REFERENTES A PROPORCIONES

que la media y la varianza de la dixtribucicin del nilmero de casos favorables estin dados por t?p y n p ( 1 - p ) . En el ejercicio I de la página 378. e1 lector deberj veri- ficar que la media y la varianza de la propolcicin de casos favorables (la írecuencia relativa X/II) están dados por

Esto muestra que la proporcicin muestral debe considerarse como un cdmrrdor i j l -

.w.yur/o del parámetro p de una distribucicin bintimica. es decir. de la proporcicin "verdadera" que estamos tratando de estimar basados en la muestra.

En la construccitin de intervalos de confianza para el parimetro p de la distribu- cicin bintimica. encontramos \!arios obsthculos. Estos se deben principalmente a clue ( 1 ) la distribucicin bincimica es discreta. por lo que es imposible encontrar un inter- valo con un grado de confianza que sea exactamente 1 - (Y. y (?) la wri:tnza dc la distribucitin mucstral de .Y ( o la de la proporcicin muestral s / n ) contiene implíci- to el parametro p que estamos tratando de calcular. Para construir un intervalo de confianza para p con u n grado de confianza aproximado de 1 - CY. seleccionamos, para un conjunto dado dc valores de p , las cantidades correspondientes xo y X I . don- de xII es el mayor entero, para el que

Para hacer resaltar el hecho de que x,, y x1 dependen del valor escogido para p . designaremos estas cantidades por x 0 ( p ) y x1 ( p ) . Entonces, podemos afirmar. con una probabilidad aproximada de 1 - CY (y por. l o I ~ J I M L Y 1 - a), quc

Z d P ) < x < a ( p ) para cada valor dado de p .

Para cambiar estas desigualdades en intervalos de confianza para p . usamos un nv2todo grifico muy simple que se ilustra en el siguiente ejemplo. Se trata de deter- minar intervalos con grado de confianza de 0.95 aproximadamente para p , en mues- tras de tamaño 20. Utilizando la tabla I, comenzaremos por encontrar x,, y x1 para valores determinados de p . de tal forma que x(, sea el ma;or entcro. para el c1uc

Z3(:fY,; 20, p) 5 0.025

y x1 el nzcmr ctltero, para el que

1 - R(x.1 - 1; 20, p ) 5 0.0'25

Haciendo p -: a 0.1, 0.2.. . .. y 0.9, obtenemos la tabla siguiente:

Page 183: ingenieria

ESTIMACION DE PROPORCIONES 175

" ."

zL 0 9 11 1 3 15 17 19 20 -

Marcando los puntos (p , x<) ( p ) ) y (1.1, x, (11)) como hicimos en la figura 10.1, y di- bujando curvas suaves, una uniendo los puntos x,, y otra los xL, podemos, ahora, ha- llar los intervalos de confianza para cualquier p. Para cualquier valor dado de X,

obtenemos límites de confianza aproximados al nivel de 0.95, para p , trazando una horizontal hasta las dos curvas y marcando los valores correspondientes de P (ver fi- gura 10.1). Así, para x - 4 obtenemos el intervalo aproximado de confianza al nivel de 0.95: 0.05 < p < 0.45.

- P

Fig. 1 0 . 1 Intervalos de confianza de proporciones

En las tablas VIII(a) y VIII(b) se dan grhficas similares a la mostrada en Ia figura 10.1 para varios valores de IZ y los grados de confianza 0.95 y 0.99. Estas tablas difieren de la de la figura 10.1 en que la frecuencia relativa x/n se utiliza en lugar de x. con lo que se hace posible dibujar las curvas correspondientes de varios valores de I?. También. para aumentar la exactitud. las dos tablas antes citadas estin hechas de tal forma que los valores de x/n de O a 0.50 se encuentran marcados en la escala inferior y los de 0.50 al 1.00 están marcados en la escala superior del diagrama. Para valores de .r/n entre O y 0.50, los limites de confianza de p se leen en la escala de la izquierda del diagrama. mientras que los valores de x/ir entre 0.50 y 1.00 se leen en la escala de la derecha. N6tese que. usando la tabla VI11

Page 184: ingenieria

176 INFERENCIAS REFERENTES A PROPORCIONES

(a), se obtiene, para 17 = 20 y x = 4. el intervalo de confianza 0.06 < p < 0.44, que esti muy próximo al intervalo de confianza obtenido en la figura 10.1.

Cuando 11 es grande y no hay razón para sospechar que p se encuentra muy próximo a O 6 1. podemos encontrar intervalos de confianza aproximados para p. empleando la aproximación a la distribución binómica dada por la curva normal. Como la media y la desviación tipica de la distribución binómica son n p y d n p ( 1 - p ) , podemos afirmar con una probabilidad 1 -a que

Resolviendo esta desigualdad cuadrática para p , podemos obtener un'conjunto de li- mites de confianza (aproximados) para p (problema VI11 de la página 179). Sin embargo, como es necesario hacer ccilculos, utilizaremos de nuevo otra aproximación substituyendo en vez de p, la proporción muestra1 x / n , en v 'np( l - p ) . Esto nos da el siguiente intervalo de confianza de muestra grande para p con un grado 1 - u:

" - - . . - ".

Por ejemplo, para n = 100 y x = 36. obtenemos el intervalo de confianza de mues- tra grande

o 0.266 < p < 0.4.X

Si en este ejemplo hubiésemos empleado la tabla VIII(a) hubiéramos obtenido 0.27 < p < 0.47

La magnitud del error cometido al usar r/n ccmo una estimación de p , está dado por 1.- - p / , y usando la aproximación 3 la distribucicin binomial dada por la

curva normal, podemos afirmar, con una probabilidad I -a, que

I . t .

t 1.

Para usar esta última fórmula, substituimos nuevamente p por x / n en el radical y, si se trata de una muestra suficientemente grande, podemos asegurar con una probabi- lidad 1 -a que el error al usar x/n como una estimación de p es menor que

Por ejemplo, si 65 de 250 personas que visitan una exposici6n de automciviles afir- man que tienen la intencitin de comprar un automtivil nuevo durante ese año y esti-

Page 185: ingenieria

ESTlMAClON D E PROPORCIONES 177

mamos la proporción verdadera de compradores de automóviles nuevos (de acuerdo con los datos de la exposición) como 65/250 = 0.26, podemos asegurar, con una probabilidad de 0.95, que el error de esta estimación no excede a

L a fórmula en que nos basamos para obtener la estimación anterior del error, se puede utilizar también para determinar el tamaño de la muestra necesaria para 10- grar un grado determinado de precisión o confiabilidad. Si E es el error mhximo que estamos dispuestos a arriesgar con una probabilidad de 1 - a, tendremos

+ + Esta fórmula no se puede utilizar tal como está escrita, a menos que tengamos al- guna informacitjn sobre el posible valor de p , basándonos en datos colaterales, por ejemplo, por una muestra piloto. Si no tenemos tal información podemos hacer uso del hecho de que p ( 1 - p ) es, a lo más, igual a 1/4. Luego, si

+ n = -[-I 1 x 4 2 4 E + aseguraremos con una probabilidad de al menos I - (Y que el error al usar x/tr como una estimación de p es menor que E.

Por ejemplo, si queremos emplear una proporción muestra1 para estimar la pro- porción verdadera de unidades defectuosas en un gran envío de ladrillos de vidrio, y queremos ser capaces de asegurar con un grado de confianza de 0.95 al menos que el tamaño del error es menor de 0.03, tendremos que tomar una muestra de tamaño

esto es, una muestra de tamaño 1068. Si de experiencias con ladrillos de vidrio seme- jantes, supieramos que la proporción que estamos tratando de estimar era prbxima a 0.12, por substitución en la fórmula adecuada tendríamos como tamaño de mues- tra requerido, solamente

E p(l - p ) [B] 242 = (0.12)(0.88) [-I 1.96 a = 4-50.7 0.03

esto es, .una muestra de tamaño 451. Esto sirve para ilustrar cómo algunas informa- ciones colaterales sobre el posible valor de p pueden reducir apreciablemente el ta- maño de la muestra requerida.

Si p está muy próxima a O ó 1, ninguno de los intervalos de confianza des- critos anteriormente da una aproximación muy satisfactoria, incluso para valores grandes de n. Por ejemplo, para n = 1000 y x = 2, un intervalo de confianza al nivel de 0.99 para p , calculado por el metodo anterior, que estaba basado en la aproximación a la distribución binómica dada por la curva normal, es 0.0020 I+

Page 186: ingenieria

178 INFERENCIAS REFERENTES A PROPORCIONES

0.0036. NotCmos que el límite de confianza inferior de p es negativo. En los casos en que p está prcixima a 0(ci 1,) tales como los que se pueden encontrar en tests de gran precisih, estamos realmente más interesados, en intervalos de confianza uni- lateros de la forma p < C; esto es. nos interesa principalmente encontrar un limite superior. de conf iut~:~ pm.u p. Cuando p es pequeíio y n es grande, aproximamos la distribucih binomial con una distribucidn de Poisson mejor que con una curva normal (véase la discusión de página 46), empleando la relacicin A = np para ob- tener un límite de confianza superior para p . Sin entrar en detalles. indicaremos el resultado de que aproximadamente. tal límite superior de confianza con probabilidad

I - a. est6 dado por --.x& donde xn" se definici en la página 129 y el número de grados de libertad es 2(s A I ) . (En el libro de A. Hald, mencionado en la bi- hliografía. se puede encontrar un anilisis de esta aproximacih.)

Usando esta teoría para el ejemplo anterior, en el que x == 2. tI ~ 1000. y (Y = 0.01, obtenemos el intervalo de confianza lateral para p:

1 2n

16.8 p < a(looo> = 0.0084

donde 16.8 es el valor de X?OI para 2 (2 + 1 ) =- 6 grados de libertad. Si hubikramos usado errtinearnente la distribucicin normal en lugar de la distribución de Poisson para aproximar la distribucicin bincimica, habríamos obtenido el intervalo mucho más corto O < p < 0.00.3i.

EJERCICIOS

1 . Verificar las fkmulas dadas en l a gg ina 174 para la media Y la varianza de la distri- bución de la proporcidn de los casos favorables.

2. En una muestra alcatoria de 200 votantcs. X 0 estuvieron a favor de cierta ley y 120 en contra. Usar la tabla Vlll para construir un intervalo de confianza al nivel de 0.95 para la proporcibn verdadera de votantes en favor de la ley.

3. Entre 400 dueños de automóviles a los que se les hizo una entrevista, 260 dijeron que el prbximo coche que pensaban comprar seria de la mlsma marca que el que usaban corrientemente. Empleando la tabla Vll l . construir un intervalo de confianza al nivel de 0.99 para la proporción verdadera de ducños de autornciviles que piensan cambiar SU auto por otro de la misma marca.

4. En una muestra alcatoria de I O 0 diodos, se cncontr0 que 2X fallaron en cierta categoria de voltaje. Construir intervalos de confianza al nivel de 0.99, para la proporción de dio- dos quc fallaron er. la categoría dada, utilizando la tabla Vlll y fa fbrrnda para mues- tras grandes de la pagina 188. Comparar los rcsultados.

5. Una compañía de seguros de accidentes industrides encontri) que 138 de 10s 250 dicntcs dieron parte de un accidcnte por lo menos, durante el período de 3 años, de 1960 a 1962. Dado que csta información está basada cn una muestra alcatoria tomada de 10s archi- vos de la compañia, construir un intervalo de confianza al nivel de 0.95 de l a ProPor- cion verdadera corrcspondicntc, ( a ) utilizando la tabla VIII, y ( b ) utilizando la f M n u l a Para muestras grandes rle la phgina 176.

Page 187: ingenieria

HIPOTESIS REFERENTES A UNA PROPORCION 1 79

6.

7.

x.

9.

1 o .

11.

12

¿cuál es el tamaño de la muestra más pequeña necesaria para calcular una proporcijn desconocida en la que se permite un error miximo de 0.01 con un grado de confianza de O%? Si se estima que la proporcih es 0.15 sobre la base de una pequeña muestra piloto, ¿qué tamaño de muestra se podrh usar'? ;,Cuál es el tamaño mínimo de muestra en una encuesta de opiniún pública si se desea que esta encuesta sea capaz de asegurar, con una probabilidad de 0.95 por lo menos. que SU estimación del porcentaje de los votos que puede obtener cierto candidato no esté "equivocado" en más de un 5 % ? ¿Cómo se vería afectado el tamaño mínimo de la muestra si se supiera que el porcentaje que se va a estimar es próximo al 65%? Demostrar que la doble desigualdad de la página 176 conduce a los limites de confian- za con probabilidad de I - cy, siguientes:

1 2 2 + - & f Q2

n + z L 2

Emplear la fórmula del intervalo de confianza del ejercicio 8 para hacer el ejercicio 4 y comparar los resultados. En 5000 disparos de un proyectil "de airc a aire". hubo un caso en el quc aquel ex- ploti, durante la ignición. Construir un limite superior de confianza al nivel de 0.99 para la probabilidad de que tal proyectil explote durante la ignicibn. Entre 500 unidades instaladas por una compañía telefjnica. 3 requirieron reparación durante el primer año. Utilizar el método discutido en la página 178 para determinar un límite superior de confianza al nivel de 0.95 para la proporcibn verdadera de uni- dades nuevas que requieren reparación durante el primer año de operación. En el ejercicio 10, encontrar el número de proyectiles encendidos sin fallo que se nece- sitan para poder afirmar, con ,un grado de confianza de 0.995 al menos? que la probabi- lidad de explosión durante la ignición es menor que 0.O001.

10.2 Hipótesis referentes a una proporción

Muchos de los métodos empleados en inspección de muestras, control de cali- dad y verificación de fiabilidad, están basados en tests de la hipótesis nula de que una proporción (porcentaje o probabilidad) sea igual a una constante determinada. Los detalles de la aplicación de tales tests al control de calidad se discutirán en el capítulo 15, donde, además, mostraremos algunos problemas de inspección de mues- tras; las aplicaciones a fiabilidad y tests de duración de vida se darán en el ca-

Aunque existen tests exactos basados en la distribucicin bincimica (que se pue- den construir empleando la tabla I), consideraremos aquí solamente los tests apro- ximados con muestras grandes (n 2 100) basados en la aproximación normal a la distribución binómica. En otras palabras, contrastaremos la hipótesis nula

frente a una de las alternativas

pitulo 16.

110: p = I'd

f.-1: p < pn, 111: p > pa, II1. p Z po utiiizando el siguiente estadístico

Page 188: ingenieria

180 INFERENCIAS REFERENTES A PROPORCIONES

Si la hipótesis nula es cierta, la distribución muestra1 de este estadístico es, aproxi- madamente, la distribución normal tipificada. y las regiones criticas del test se muestran en la tabla siguiente:

KFGIONES CRITICAS PAR.A CONTRASTAR flu: p = (Muestras grandes)

Hipdresis alternativa rechazar H, si

~~

z < -2,

P > Po

P f Po 6 z > z,;2

(Si el tamaño de la muestra no es suficientemente grande para usar la aproximación normal de la distribución binómica, tendremos que emplear el test exacto menciona- do con anterioridad. Por ejemplo, para contrastar la hipótesis nula p = p o frente a la alternativa p < po, utilizamos la región crítica x 5 k,, donde k , es el mayor mtero, tal que B(k,; n, p o ) I ,).

Para ilustrar el test con muestras grandes, supondremos que queremos contras- tar la afirmación de un ejecutivo de que menos del 60% de los empleados de una compañia muy grande están en favor de unirse a un sindicato. Si el peso de la prue- ba se hace recaer sobre el ejecutivo, la hipótesis nula adecuada y la alternativa son, respectivamente, p = 0.60 y p < 0.60. Si se toma una muestra aleatoria de tamaño 400 y en ella hay 208 votos en favor de la alianza y 192 en contra, obtenemos.

208 - 400(0.60) z = = -3.3

de donde la hipótesis nula se puede rechazar con un nivel de significación del 0.01. Esto apoya la afirmación del ejecutivo.

~400(0.60)(0.40)

10.3 Hipdtesis referentes a varias proporciones

Cuando comparamos las respuestas de los consumidores (porcentaje favorable y porcentaje desfavorable) a dos productos diferentes, cuando decidimos si la pro- porción de defectos en un proceso dado permanece constante cada día, cuando juz- gamos si hay una diferencia en la persuasión política entre varios grupos nacionales. etc., estamos interesados en contrastar si dos, o más, poblaciones binómicas tienen el mismo parámetro p. Llamando a estos parámetros p , , p2, . . . y p k , lo que hace- mos es contrastar la hipótesis nula

11”: = j>? . . , -y 7);

Page 189: ingenieria

HIPOTESIS REFERENTES A VARIAS PROPORCIONES 181

frente a la alternativa de que, al menos. dos de estas proporciones de poblacicin no sean iguales. Para Racer un test adecuado de muestras grandes para estas hipóte- sis, necesitamos muestras de azar independientes de tamaño nl, u ? , . . . tzk de las X poblaciones y se supondrá que los nilmeros correspondientes de "casos favorables" son x, x2,. . . xk. El test que emplearemos está basado en el hecho de que (1) para muestras grandes, la distribución muestral de

2 ; = xi - n,,p;

Jn,.p,U - P i )

es, aproximadamente, la distribución normal tipificada, (2) el cuadrado de una va- riable aleatoria con distribución normal tipificada es otra variable aleatoria que tie- ne distribucidn X-cuadrado con l grado de libertad, y (3) la suma de las k varia- bles aleatorias independientes que tienen distribución X-cuadrado con 1 grado de libertad es una variable aleatoria con distribución X-cuadrado con k grados de li- bertad. (En el libro de J. E. Freund mencionado en la bibliografia, se dan las de- mostraciones de estos dos últimos resultados.) Entonces. la distribucirin muestral del estadístico

(.Ci - n,p;)Z i = l n , p , ( l - pi)

= 2

es, aproximadamente, la distribución X-cuadrado con k grados de libertad. (Esta aproximación, generalmente. es bastante correcta cuando ni pi 2 S para todas las i). Ahora, si la hipótesis nula es cierta, y p I = p . = . . . = p k = p . el valor del estadístico anterior x2 es

Y en la práctica substituimos p (la cual, por supuesto. es desconocida) por el valor estimado conjunto

1;= x1+22+ . . .+.TI n l + n 2 + . . . + n k

Como la hipótesis nula se debe rechazar si las diferencias entre las xi y las tli p son grandes, la región crítica es x' 2 x:, donde x: se definió en la página 129 y el número de grados de libertad es k - 1. La pkrdids de un grado de libertad se debe a que p esta estimado por p .

No ilustraremos este test de manera directa, porque, en la práctica, es conve- niente realizar el test o expresar el estadístico x' 2n diferentes (aunque equivalen- tes) f 11.mas. En el caso especial en que k = 2. en el que estamos contrastando la hipi.tc:.,, nula de que dos proporciones de poblaci6n son iguales. basamos nuestra decisih en el estadistico

Page 190: ingenieria

182 INFERENCIAS REFERENTES A PROPORCIONES

cuya distribucicin muestra1 es. aproximadamente. la distribucicin normal tipificada. El test basado en este estadístico es equivalente al lest x' mencionado anteriormen- te. en sentido de que el c.~rc/dr.ur/o de este estadístico : es igual al estadístico X 2 ante- rior con X = 2 (ver ejercicio 7 de la pagina 198). Es preferible utilizar el estadístico ,:. ya que nos permite contrastar la hipótesis nula p , -: p 2 frente a alterrlativas uni- lateras o bilateras: esto no es cierto para el estadístico x2. con el que scilo podemos hacer un test frente a la alternativa bilatera p, -;i 1):. Las regiones críticas resultan- tes basadas en el estadístico : son

Pl f p? 2 < "Z,'?

6 2 > 2,,*

Para ilustrar este test de muestras grandes para la diferencia entre dos propor- ciones muestrales. supongamos que una encuesta hecha por una organizacicin inves- tigadora de mercados, mostrci que cierto producto era usado por 128 de 400 perso- nas entrevistadas en una ciudad en que se había anunciado profusamente, pero sdo por I I5 de 500 personas entrevistadas en una ciudad en que el producto no se habia anunciado. Para determinar si realmente es eficaz el anuncio. se desea contras- tar la hipótesis nula p I -. p 2 frente a la alternativa p , > p.. donde p1 y p - son las proporciones verdaderas de perwnas de las dos ciudades que usan el producto. ( E n esta forma, el rechazo de la hipcitesis nula implica que el anuncio es eficaz.) Substituyendo x1 = 128. I I ~ = 400, X- = I 15. y 11: = 500 en las fcirmulas para $ y .:- obtenemos

Y "- 128 I15 400 500

2 = = 3.02 m.27)(0.7:i) - + 7 (A .)o0 ' >

Esto excede el valor crítico para Q: . 0.05. es decir, 1.645, y concluimos que la diferencia en las proporciones de las muestras es significativa. En otras palabras. el anuncio es efectivo. Determinar si es "suficientemente efectivo" para justificar SU

empleo, depende del costo del producto. el tamaño del mercado, el costo del anun- cio y, posiblemente, o!m consideraciones.

Page 191: ingenieria

HIPOTESIS REFERENTES A VARIAS PROPORCIONES 183

Cuando aplicamos el criterio x-cuadrado de la phgina 182 a la comparación de varias proporciones de muestras, es conveniente tomar los datos preparados de la manera siguiente:

suceso 7- : I I _ j l / 2

Fallo n1 - x1

Total n1 Izs ... n k 12

7% - zk n - x n2-G

donde la notaci6n es la misma que antes, excepto en la adición de x y n, que re- presentan, respectivamente, el número total .de casos favorables y el número total de pruebas para todas las muestras combinadas. Con respecto a esta tabla, la en- trada de la casilla correspondiente a la idsima fila y la j-ésima columna recibe el nombre de frecuencia de Ia casilla observbda jij phra i = 1, 2 y j = 1, 2,. . .k.

Con la hipótesis' 'nula p1 = p z = I: . '. = p k = p . estimamos p , como antes, como el número'total de casos favorables divididos por el número total de pruebas, lo que indicamos por j =' x/n.';Entonces, el número de casos favorables,,esperdo

Muestra I Muestra 2 ... Muestra k Tot&

I ,

para la muestra j-bima se estima en nj.2 n

I elj = nj .$ -

mientras que el número de casos desfavorables esperado se estima en

para la muestra j-ésima,

Las cantidades elj y ezj se llaman frecuencias esperadas de casilla eij para i = 1, 2 y j = 1, 2,. . . k. Entone -; las frecuencias esperadas para una casilla dada se pueden obtener multiplicando los totales,.de la fila y la columna a las que pertenece. la casi- lla, y dividiendo después por, el gran total n.

Utilizaqdo ,esta nueva notación, podemos. ver que (ejercicio 12 de la pdgina 185) el estadístico X2 de la página 182 se puede escribir en la forma

Esta fórmlrla tient la ventaja que se puede aplicar directamente 'a problemas más generales, en los que cada prueba admite más de dos casos, posibles, y donde hay, por lo tanto, mhs de dos filas en el esquema anáIogo al de la página 182. Esta clase de problemas se discutirin en la sección 10.4.

Para ilustrar el empleo de este estadistico x2, supondremos que se desea con- trastar a n un nivel de significación de 0.01 si la proporción de compras devueltas y cambiadas, en cierto departamentó de un almacén est6 sometida b variaciones es- tacionales. Los datos obtenidos para este test se muestran en la tabla siguiente:

Page 192: ingenieria

184 INFERENCIAS REFERENTES A PROPORCIONES

Primcr S e u n d o Terker Cuurro frjmesrrc, rrimcstrc rrimesrre rrirnesrrr Told*

"" ~~ ~ ~"

Ntimerc~ dv piezus cambiadas 8 21 ~ 70

Mimero de pic,.-us s in camhiur 92 i 139 1 430

T o l d 110 I :io 1 00 X GO 500

( 1 ~

~

___ p~L-.--p'p--J

La frecuencia de casilla esperada para las tres primeras casillas de la primera fila son

y , como se puede demostrar que !as frecuencias esperadas para cada fila o columna, totalizan lo mismo que las frecu&ncias"observadas correspondientes ( ver ejercicio 16 de ,la página 186), ,encontramos, por substracción, que e,, es igual a 70 - (15.4

18.2 i- 14.0) = 22.4 y que las frecuencias esperadas para la segunda fila son

Como las frecuencias esperadas son todas de 5, mayores, pódemos substituir estos valores junto con los observados de las frecuencias de casilla en la fórmula adecua- da del estadístico x ' , y obtendremos

I10 - 15.4 94.6, 130 - 18.2 = 111.8, 100 - 14.0 = 86.0 y 160 - 22.4 = 137.6.

(2!1 - l . i . - 1 ) 2 (12 - IS.'))? (8 - 14.0)Z (21 - 22.1)* x 2 = l,-j..l + 18.2 + 14.0 + 22.4

+ ____" + ~~

(81 - (118 - 111.8)2 (92 - 86.0)' (139 - 137.6)' 91. ti 111.8 + 86.0 -k 137.6

= 19.49

Como este vdor excede a 11.345, valor de x ? , ~ con 3 grados de libertad, podemos rechazar la hipótesis nula de que la proporci6n de compras cambiadas permanece constante: en otras palabras, concluimos que hdy una definida variación kstacional.

EJERCICIOS

1. Un investigador médico desea determinar si un nuevo producto para relajar los músculos produce resultados benéjicos en una mayor proporción de pa,cieptes que sufren vn desor- den neurológico, que el 0.70 que"son'los que obtienen resultados positivos con un trata-

" miento normal. ¿Cd?no deberá interpretar u n experimento (con un nivel de significa- cibn de 0.05) .si :156 de '200 pacientes obtienen 'resultados benefices con el nuevo pro- ducto?

3,. Una muestra aleatoria de tamaño 1.W.) 6e: obtiene de un gran lote de objetos fabricadas. ~ Se desea contrastar, (con un nivel de significgción de 0.05) si la propqrci0n;de objetos 'aceptables en el lóte es 0.80 frente a la alternativa de que sea menor que esta cantidad. fa) ;,Cui1 es e l número máximo de objetos aceptables en la múestra que conducen al re-

1 , . .

Page 193: ingenieria

HIPOTESIS REFERENTES A VARIAS PROPORCIONES 185

3.

7.

8.

9.

1 o.

11.

12.

13.

(b) Hallar la probabilidad de aceptar la hipótesis si el lote contiene un 75% de objetos

(c) Dibujar la curva UC de este test. De un cierto tipo de municiones cuesta más hacer un test que fabricarlas y, Por consi- guiente, sólo tres unidades de cada lote grande son probadas. Si se rechaza el lote, a menos que las tres unidades trabajen de acuerdo con las especificaciones, (a) dibujar la curva OC de este test, (b) hallar la proporcibn real de unidades defectuosas para 10s que Procedimiento del

Un oficial de carreteras asegura que 3 de cada 10 automóviles no cumplen con 10s re- quisitos concernientes a luces, frenos, señales direccionales, etc. Contrastar esta afirma- ción con un nivel de significación de 0.01, si entre 400 automóviles detenidos en un punto de la carretera hubo 73 que no cumplían los requisitos. Se asegura que el 30% de todas las máquinas de escribir en USO en Cierta área fueron fabricadas por cierta compafiía. Una investigación, que muestra que 118 de las 500 m& quinas fueron hechas por esa compañía, ¿sostiene o contradice la afimación? Utilizar un nivel de significación de 0.01. La hipótesis nula p = 0.35 de una población binómica se va a contrastar frente a la al- ternativa p > 0.35 con un nivel de significación de 0.05. Si la decisión se basa en una muestra de tamaño n = 15, ¿cuál es el menor número de “casos favorables” para el que se puede rechazar la hipótesis nula? ¿Cuál es la probabilidad de que se acepte la hipótesis nula con este criterio, aunque p sea realmente igual a 0.40? Demostrar que el cuadrado del estadístico z de la página 162 es igual al estadístico x-cuadrado de la misma página cwndo k = 2. Las experiencias pasadas muestran que en 150 embarques del vendedor A había 34 que no eran satisfactorios por una razón u otra, mientras que en 120 embarques del vendedor B había 46 que no eran satisfactorios. Utilizar el estadístico X’con un nivel de significa- c i h de 0.05 para contrastar la hipótesis nula p1 = pt siendo pI y pz las proporciones verdaderas de envíos no satisf@orios de los dos wndedores. Repetir el test usando el es- tadístico z de la página 182, y verificar que el cuadrado de este estadístico es igual al va- lor obtenido previamente para el estadisticb.X* Repetir el problema 8, contrastando la hipjtesis nula p I . -- p z frente a la alternativa unila-

Un fabricante de equipo electrónico desea someter a dos compañías de transistores en competencia, a un test comparativo rápido. De los 80 transistores’del primer fabricante 25 fallan en el teSf y de los 50 transistores del segundo 21 fallan. Empleando un nivel de, significación de 0.05, aprobar si hay diferencia entre 10s dos productos (a ) basando el resultado en el estadístico x-cuhdrado dado en la pagina 182. (b) basando el resultado en el estadistico z dadó en la página 182.

Verificar tambih que el cuadrado del valor :obtenido con ei estadístico z es igual al ob- tenido con el estadístico x-cuadrado. Dos grupos de 50 pacientes cada uno, tomaron parte en un experimento en el cual un grupo recibió píldoras que contenían una droga antialérgica, y el otro grupo recibió píl- doras que no contienen tal droga.’En el grupo que recibió la droga, I 5 pacientes mostra- ron síntomas alkrgicos, mientras que, en el grupo que recibió la píldora sin droga, hubo 24 con estos síntomas. ¿Es esto evidente suficiente para concluir (con un nivel de signi- f icacih de 0.05) que la droga es eficaz para reducir los síntomas? . , Verificar que las dos fórmulas dadas para el estadístico en las páginas 182 y 183, son equii valentes. Las siguientes son las ventas en enero de 1964 de tres agentes vendcdores empleados por, cierta firma:

aceptables.

test hace que se rechace un lote, con una probabilidad de 0.10.

terir pl < pg .

Page 194: ingenieria

1 86 INFERENCIAS REFERENTES A PROPORCIONES

14.

15.

16.

Agente A Agente B

Clientes visitados r,T] Nlimero de ventas realizadas,

I

Usando un nivel de significacijn de 0.05, probar si .las diferencias entre las proporcio- nes de ventas son significativas. Se hacen test sobre la proporci6n de funciones defectuosas producidas por. 5 moldes diferentes. Si hubo 12 unidades defectuosas entre 100 hechas en el molde T . 32 entre 200 del motde 11, 25 entre 180 del molde 111, 15 entre 120 del molde IV y 20 entre 150 del molde V, contrastar* (en un nivel de significación de 0.05) si la proporción verdadera de piezas defectuosas es l a misma para cada molde. Empleando un nivel de significacijn de 0.05, ¿se puede concluir, de los datos.siguientes, que la proporci6n de estudiantes que manejan'autom6vil en cierta universidad depende de su clase?,

Novatos Cadetes de pemíltimo de d t i m o

Número de estudiantes

96 102 90 Estudiantes COJI auto

300 340 360 . 450 -

I 99

Verificar que, si las frecuencias esperadas se determinan Como se indica en . la página 183, las frecuencias e s p a d a s en cada fila o columna totalizan Io mismo que las fre- cuencias observadaid correspondlentes.

10.4 Tabias de contingencia Como sugerimos en la pigina 183, el. método por el que anzlizamos el ultimo

ejemplo de la sección precedente se presta también para el análisis de las llamadas tablu.7 r por k, esto es, tablas en las qLle se situan las frecuencias observadas en r filas y k columnas.'Tales tablas aparecen esencialmente en dos tipos de problemas. En primer lugar, podemos tener nuevamente, muestras de k poblaciones, con la dis- tinci6n de que~ahora, cada prueba permita más de dos casos posibles. Esto puede ocurrir, por ejemplo, cuando a personas pertenecientes a diferentes grupos de nivel de ingresos, se pregunta si piensan favorecer a un candidato político, si están et? contra de &,o si están indecisas. La otra situación que nos da tablas de r por k (:S

aquella en que tomamos muestras de una sola poblacicin, pero las clasificamos con respecto a dos categorías (usualmente cualitativas). Esto se presenta, por ejemplo. si un servicio para aconsejar a los consumidores, somete a un test a los automtiviles y los clasifica en excelentes, superiores, medios y pobres, atendiendo a SUS cualida- des y, al mismo tiempo, atsndiendo a su apariencia: Cada automóvil podri. enton- ces, caer dentro de alguna de las 16 casillas de una tabla de 4 por 4.

La diferencia esencial xntre las dos situaciones es que, en ei prirner caso los totales de las columnas (los tamaiios de las muestras) están fijados, mientras que, en el segundo, sólo el gran total es fijado. Aparte de esta diferencia, el método de

Page 195: ingenieria

TABLAS DE CONTINGENCIA 181

analisis es el mismo y podremos tratar las dos situaciones como un solo problema. Para ilustrar el método general, consideramos el problema que se le presenta :a un fabricante de latas de conservas vegetales que quiere saber si la reacción del consu- midor ante su producto es la misma independientemente de la calidad de colorante empleado en la preparación de la conserva en otras palabras, si, existe una relacicin entre el empleo de difer2ntes cantidades'kle colorante y la r&cci6n del cohsumidor. Los datos que tiene para el estudio se'muestran en la tabla siguiente:

> . ' . I ,, Sin ' . r Color Color

color ..! ; I tenue iufeltSo I . Total , , .

Buen sabor 90 '

Sabor mediano

Sabor malo I GO

Total 100 150 50 300

. .

Si estos datos se han obtenido de ill0 latas sin colol'ante, 150 con una ligera colo- ración y 50 con una fuerte coloración, y viendo la reacci6n del consumidor, tenemoy la primera clase de 'Situaciones descritas anteriormente y ,deseanios contrastar la" hi- pótesis nula

pil = piz = pi, para i = 1 , 2, 3

donde pijes la probabilidad de obtener una resp.uesta correspondiente a la i-ésima fila y la j-ésima columna. La hipótesis alternativa es aquella en la que las p no son todas iguales, por lo menos en una fila. Si los datos se hubieran obtenido entrevis- tando al azar a un grupo de consumidores y clasificando cada respuesta de acuerdo con la cantidad de coiorante usado en el producto y la reacci6n del consumidor. tendríamos la segunda clase de situaciones descritas anteriomente y tendriamos que contrastar la hipótesis nula

donde pi es la probabilidad de obtener una respuesta correspondiente a la i-isima fila y />.j es la probabilidad de obtener una correspondiente a la j-Csima columna. La alternativa a esta hipótesis nula (que,.en realidad, eg pna hip6tesis nula de indcpcn- dencia) es que no haya igualdad, por lo menos, para un par de valores de i y j .

Independientemente de cómo se hayan obtenido los datos (o cónio enfoquemos el,-problema), el lmétodo de dnálisis es el mismo: Calculamos la frecuentiaf espe- rada de casilla eij rnultipfitando el'total de la fila i .por el total .de h colamna j y di- vidiendo poc.el'gran total. (En la práctica, -haemos uso del hecho de que las fre- cuencias observadas, y las frecuencias eiperadas totalizan io mismo paial cada fila y columna,.de tal forma que sdlo (I. - 1). ( k - 1) dit las.ei, se deb- calcular para una tabla dada. d e r por k, y los valores restantes se pueden calcular por substrac-

Page 196: ingenieria

188 INFERENCIAS REFERENTES A PROPORClONES

ción 'de los totales de la fila o la columna apropiada.) .Entonces, substituyendo en la fdrmula

rechazaremos la 'hipótesis nula si el valor de este estadístico excede a 2 con (r - 1) ( k - 1) grados de libertad. (Esta expresión del número de grados de li- bertad se justifica por la observación, hecha anteriormente, de que, después de es- coger (r - 1) (k - 1) de las frecuencias de casillas esperadas, las otras quedan determinadas automtiticamente, es decir, se pueden obtener por substracción de la fila o la columna adecuada.)

Volviendo a nuestro ejemplo numérico, encontramos que las frecuencias de ca- silla esperadas para las dos primeras casillas de las dos primeras columnas son

y, por substracción, las otras frecuencias de casillas esperadas son eI3 = 15, % = 25, e31 = 20, e23 = 30, y g 3 = 10. luego,

(18 - 30)2 (61 - 45)2 ~ (11 - 15)' x2 =

30 + 35 15

" 50 75 25 @4 - 20)2 110 - 30)' I (16 -

i- 30 10

(48 - 50)' (79 - 75)' I (23 - 2513

+ 20 = 3a.74

Como excede a 9.488, valor de xib5 con (3 - 1) (3 - 1) = 4 grados de libertad, la hipótesis nula debe ser rechazada. Concluimos que hay cierta relación (alguna dependencia) entre la cantidad de colorante y la aceptación del producto por el consumidor.

10.5 Bondad de ajuste

Hablamos de "bondad de ajuste" cuando queremos comparar una distribución observada con los valores correspondiente de una distribución teórica. Para ilus- trar esto, supongamos que, en la manufactura de una l¿imina de vidrio, un inge- niero de control de calidad inspecciona muestras a intervalos regulares de tiempo y que, en ,250 de tales muestras, observa O, 1, 2, . . . y 10 imperfecciones con las frecuencias respectivas de 8, 40, 62, 54, 43, 27, 10. 3, 2, O y 1. Con esta informa- cidn, desea determinar si los valores de los datos se pueden considerar como valores

Page 197: ingenieria

BONDAD DE AJUSTE % 8 9 ” , ‘ b ,

de una variable aleatoria .que .sigue una distribución de Pqisson, es decir, si una distribución de, Poisson da, en este’caso, un buen ajuste. La rnEdia de la distribu- ción dada es 740/250 = 2.96 y, por lo tanto, la intentamos ajustar a una distribu- ción de Poisson con A = 3 (el :valor más pr&mo a 2.96 en ía .tabla 11). En la ta- bla que sigue, las frecuencias observadas se ‘&n en la segunda columna, las proba- bilidades de Poisson con A = 3 están dadas en la tercera columna;y las frecuencias esperadas de la, cuarta colutqna se. obtienen multiplicando cada una de las proba- biljdades . . de Poisson por 250 y redondeándolas . a un decimal. ,.

“ 2 . . ~. . _ / I , 5 ’

NI imero de Frecuetrciu i ,Pl!>buhilidudes Frecuetlriu imperfecciones observuda Poissott esperada

I -7 . , f

O

3 4 5 6 7 8 9.

10

8 40 62 54 43 27

.lee 37.4 56.0

D 56.0 42.0 25.2% 12.6, 5.4 I 2.0 0,7 18.3 0.21

I , .ii . 6 I .. I /

Un test.adecuada de,la hipótesis nula, de que los da& provienen de una poblcthn con distribución ‘de Poisson (frente a la alternatiya de que f a poblacih ltiene cualquiera otra distribución), se puede basar en el estadístico ’

. .

. .

.. ,

donde las fi y las et son; como antes. las frecwncias observadas y esperadas, corres- pondientes. La distribuci6n. muestra1 de este estadístico es. aproximadamente. l a distribución q-cuadrado con X- - 2 grados de libertad.”siendo k el nimero‘ ‘de tCr- minos en la fórrnuli de x?. En general, el nílmel-o de grados de libertad para el test x-cuadredo de bondad d e ajuste, es -el- nitmero de terminos ’& la bmmu€a de x 2 , menos el número de cantidades ohtcnidw (IC los &tos’ w.igi&lcs cpre sou nece- sarias para calcurar las frecllencias esperadas. Ncitese que. en nuestro ejemplo, de- bemos conocer la media de la distribucicin $ la fricuencia total para calcular las e , ; por lo tanto, tenemos k - 2 grado$ de libertad.

Para seguir la regla de la página 182. de acuerdo con la cual ninguna de las frecuencias esperadas en una comparaci6n x-cuadrado debe ser menor ‘de 5. se- guiremos la práctica simple de combinar clases adyacentes copo se indica cn la tabla anterior. Combinando las illtimas 4 clases en una sola clase que represente 7, o mlis imperfccciones. obtenemas

Page 198: ingenieria

190 INFERENCIAS REFERENTES A PROPORCIONES

(8 - 12.5)2 I (40 - 37.4)' I (62 - 56.0)' (54 - 56.0)% X2 =

12.5 37.4 56.0 " 56.0

(43 - 42.0)* (27 - 25.2)2 110 - 12.6)' I (6 - 8.3)' " 42.0 i- 25.2 -k 12.6 8.3

= 3.84

Como este valor es menor que 12.592, valor de x% para 8-2 = 6 grados de libertad, la hipótesis nula no puede ser rechazada y llegamos a la conclusión de que la dis- tribuci6n de Poisson nos da un buen ajuste.

EJERCICIOS 1. Las muestras de tres clases de materiales sujetos a cambios extremos de temperatura, pro-

dujeron los resultados mostrados en la tabla siguiente: Material A Mat& B Material C

Factura completa 9 8

Mostrando ligeros defectos I 18 1 31 1 27

I Permaneció perfecto I 62 I 48 I 51 I

Contrastar, con un nivel de significación de 0.05, si las proporciones verdaderas de casos mostrados en las tres categorías son las mismas para los tres materiales.

2. Un periódico comercial desea determinar la actitud de los ejecutivos de varios campos, al valorar actividades "de prestigio", tales como apadrinamiento de investigaciones, becas, exposiciones científicas, etc. Utilizando los resultados de la YabIa siguiente, contrastar con un nivel de 0.01, si hayaalguna relacibrí entre la actitud de los ejecutivos hacia tales actividades y la clase de sus empleos.

Publicidad Personal Producción

Poco valor

Algún valor

Gran valor 100 55 , 95 -

Administración general de ejecutivos

3. LOS siguientes datos de muestras, pertenecen a envms recibidos por una empresa grande de cuatro vendedores diferentes:

Número de Número de im- , Número de rechazos perfect? aceptables perfectos

Vendedor A

Vendedor B

65 18 7

86 8 6 Vendedor D

103 25' 12 Vendedor C

83 32 6

Page 199: ingenieria

BONDAD DE AJUSTE 191

Contrastar con un nivel de significacijn de' 0.05, si los cuatro' vendedores envían pro- ductos de igual calidad.

4. En una muestra de azar de 600 familias entrevistadas para conocer sus hibitos de ver televisibn, liubo 124 familias de ingresos económicos bajos entre las .que a 48 les gus- taba cierto comediante nuevo, mientras que a las 76, restantes no les ,gustaba O no lo habían visto. Hubo famb%n 319 familias',con ingresos económicos medios de entre las cuales a I15 les gust6 el nuevo comediante*,y a las restantes 204, o no les gustó O no 10 habían vist? Y, entre 157 familias con ingresos aItos, a 94 les gusta el nuevo comediante y a 63 no les gusta, o no Ió han visto. Cohfrastar, con un nivel de 0.05, si hay alguna relación entre el nivel de ingresos y los 'gustos con respecto 'al nuevo comediante

5. Un ingeniero de control 'de calidad toma diariamente muestras de Id'componentes elec- trónicos y los revisa para ver sus imperfecciooes. Si en 200 días de trabajo sonsecutivos obtuvp 112 muestras con O defectos, 76 muestras con un defecto, y 12Lmuestras con dos defectos, contrastar, con un nivel de 0.05, si dichas muestras se pueden considerar como provinientes de una distribución binómica.

6. Con respecto a los datos del ejercicio 5, contrastar, con un nivel de 0.05, si se pueden aonsiderar como muestras de una poblacibn binómica con p = 0.05.

7. Tirar un dado 240 veces y usar los resultados para contrastar (con = 0.05) si el dado se encuentra realmente equilibrado.

8. Se desea contrastar si el nhmero de rayos gamma emitidos por segundo por cierta substancia radioactiva tiene una distribucijn de Poisson con = 3.4 Contrastar esta hipótesis con el nivel de significación 0.01, si los resultados siguientes se observaron en 250 intervalos de un segundo:

Número de rayos gamma por segundo Frecuencia

O 1 2 3 4 5 6

7 0 rnz

3 21 51 60 38 31 26 20

9. A continuación, repetimos los indices de solución de hierro dados en la pagina 98

Indices de solución de hierro Frecuencia

0.10-0.29 3 0.30-0.49 13 0.50-0.69 17 0.70-0.89 32 0 . ~ 1 . 0 9 23 1.10-1.29 7 1.30-1.49 5

e

como demostramos en el capítulo 6, la media de esta distribución es f = 0.795 y su des- viaci6n típica es S - 0.28. (a) Hallar l a s urobabilidades de que una variable aleatoria que tienedistribuciónnormal

con p = 0.795 y Q = 0.28 tome un valor entre 0.095 y 0.295, entre 0.295 y 0.495,

Page 200: ingenieria

192 INFERENCIAS REFERENTES A PROPORCIONES

entre 0.495 y 0.695, entre 0.695 y 0.895. entre 0.895 y 1.095, entre 1.095 y 1.295, Y entre 1.295 y 1.495.

(b) Multiplicar las probabilidades obtenidas en el inciso ( a ) por la frecuencia total (en este caso, n = loo), obteniendo así las frecuerlcias de la curva normal esperadas CO-

rrespondientes a las siete clases de la distribución dada. (c) Probar la hipótesis nula de que los datos dados se puedan considerar como una

muestra aleatoria proviniente de una población normal, comparando las frecuencias observadas y esperadas con un estadístico x2 adecuado (usando (y = 0.05). Explicar por qu6 el número de grados de libertad de esta prueba está dado por k - 3, donde k es el ndmero de terminos del estadístico X”

10. De 10 tubos de vacío usados en un experimento, 35 tuvieron una vida de servicio de menos de 10 horas, 20 de más de 10, pero menos de 20 horas, 18 de más. de 20, pero menos de 30, 8 de mls de 30 pero menos -de 40, Y 19 tuvieron una vida de más de 40 horas. Siguiendo pasos similares a los marcados en el problema 9, contrastar si estas vidas de servicio se pueden considerar como una muestra de una población exponencial con = 25 horas. Utilizar un nivel de significación de 0.01.

e

Page 201: ingenieria

METODOS ABREVIADOS EMPLEADOS 11 EN INFERENCIA

11.1 Introduccidn

La mayoría de los métodos de estimación y de contraste de hipótesis que he- mos estudiado, se basaban en la suposicidn de que las observaciones provienen de poblaciones normales. Estos métodos extraen. toda la informacih que es capaz de dar un muestra, y generalmente alcanzan la precisión máxima posible, esto es, los resultados m8s dignos de confianza. Como hemos indicado anteriormente,, la hi*- tesis de que las muestras provienen de poblaciones normales no es tan restrictiva como parece. La mayor -parte de 'los mktodos estadísticos basados en la distribu- ci6n normal son suficientemente robustos, es decir, dan respuestas razonables acerta- das, aun cuando la suposición de "normalidad'' se satisfaga sólo de uná manera aproximada. Esto no obstante, hay vanos motivos por los que pudieramos desear el empleo de otros mdtodos menos, precisos la hipótesis de normalidad puede ser bastante incorrecta, el trabajo para realizar un lnttodo preciso puede ser excesivo, y un método abreviado se puede desear para determinar por adelantado si es conve- niente efectuar cálculos más detallados.

193

Page 202: ingenieria

194 METODOS ABREVIADOS EMPLEADOS EN lNFERENClA

Ya hemos introducido algunos métodos abreviados, principalmente como arti- ficios para ahorrar trabajo. Por ejemplo, en la página 104 introdujimos un método rápido para estimar la media y la desviación típica de un conjunto de datos normal- mente distribuidos, utilizando los puntos de 50% y 84% de una gráfica de "probabi- lidad". En la página 111 discutimos un método de codificación que puede reducir materialmente el tiempo requerido para calcular la media y la desviación típica de un conjunto de datos sin ninguna pérdida de precisicjn. En " ~ 1 capítulo 6, obser- vamos que estos cálculos pueden simplificarse aun m$s coli solo una ptrdida de precisión mínima, agrupando las observaciones en una tabla de frecuencias.

Otros métodos abreviados relacionados con la estimación puntual se introdu- jeron en los capítulos 8 y 9. Discutimos la mediana muestral, que 'se puede deter- minar siempre más fácil y rápidamente que la media y, como se indicó en la pági- na 134, la mediana da un estimador insesgado de la media de una población simé- trica. También la mediana es superior a la media como medida de la "localización" de una población muy asimétrica. Introdujimos el recorrido muestral en la página 1 6 4 , como un estimador de la desviación típica de una población normal; y que se obtiene mucho más rápidamente que la desviación típica de la muestra y su pre- cisiim es, aproximadamente, la de s para muestras pequeñas.

Si hay que escoger entre varios métodos estadísticos que se pueden emplear en una situación dada, el criterio más utilizado comúnmente es el de la eficacia. Si pensamos que los métodos basados en la hipótesis de normalidad son completa- mente eficaces (cien por ciento), podemos utilizar esto como una medida de los mé- ritos de cualquier otro método. La manera más frecuente de medir la eficacia, es por los tamaños de las muestras necesarios para dar resultados igualmente precisos por un método dado y por el método correspondiente que es completamente eficaz. Por ejemplo, al estimar la media de una población normal, el método más eficaz implica el uso de la media muestral 2. Si deseamos utilizar la mediana en lugar dc la media deberemos tener en cuenta que la varianza de la distribución muestral

de la mediana es, aproximadamente, 1.57 2, por lo que la eficacia de la mediana es 1/1.57 .o, aproxitpadamente, 64%. En. otras palabras, la mediana basada en una muestra de tamafio 100 nos da una,estimación de la media de una poblacibn normal tan digna de confianza.como la media basada en una muestra de tamaño 64. De una manera semejante, se puede demostrar. que la eficacia :del estimador lrecorrido para la desviacicin tipica de una población normal decrece a,medida que aumenta el tamaño de la muestra la eficacia es de 100.5ij para muestras de tamaño 2, 96% para muestras de tamaño 5, y 81% para muestras de tamaño 15. En :la próxima sección introduciremos otros métodos abreviados para estimar p y 6, que son, generalmente, más eficaces que la mediana y. el recorrido.

Ciertos métodos de inferencia 'tienen la importante ventaja de no necesitar la hipótesis restrictivas de los rnktodos basados en la distribución normal. Estos rné- todos, que, generalmente, tienen la otra ventaja de necesitar menos cálculos. o menos complicados, se conocen como m6todos no paramPtricos (o de distribucicirt libre), puesto que generalmente no se encuentran ligados de una manera especifica a los pa-

n

Page 203: ingenieria

ESTIMACION RAPlDA 195

rhe t ros de las, distribuciones dadas. La principal ventaja de los métodos no paramé- tricos es que se pueden hacer tests exactos cuando las hipótesis que subyacen en los asi llamados los métodos -“normales” no se puexlen confirmai; esencialmente, estos métodos no dependen de la distribución de la población (o poblaciones) dc las que se obtienen las muestras. ,La mayor desventaja de los métodos no paramCtricos es que se desperdicia mucha información y, usualmente, tienen una eficacia menor que los metodos paramétricos ‘correspondientes cuando se pueden conjbmar las hi- ptitesis de los mttodos normales (paramétricos). Así, si aseguramos quea la eficacia de cierto‘método no paramétrico es SO%, debemos entender que este valor relativo esti referido a la eficiencia del método “normal” corírespondiente, pero la @cien- cia de éste último será algo menor del 100% si no se verifican esactamente todas ?as hipótesis.

En este capítulo indicaremos una gran variedad de métodos abreviados de in- ferencia muy útiles: la mayoría de los cuales son no param&icos. Estos métodos 51: pueder, emplear en lugar de los métodos “normales” corr&pbndi&tes (descntOs en los capítulos 8, 9 y IO) , cuando no se cumplan todas las hip&esis 0 que haya una necesidad da gran simplificación en lbs cálculos. Otros métodos abreviados, que pueden ser usados en lugar de métodos “normales” no tratados todavía, se describi- rán junto con estos Últimos ‘en capítulos siguientes.

11.2 ‘Estimación rápida

Se recomienda generalmente e1 uso de Z para estimar la media de cualquier po- blación porque es loo%, eficaz para poblaciones normales, porque tiene alta eficacia para otros tipos de poblaciones y porque es fácil de calcular. Para muestras grandes, donde el cálculo de E se vuelve lento, la mediana sirve para dar estimaciones rápidas de p para poblaciones más o menos simétricas. Lo mismo podemos decir del recorri- do medio, el cual se obtiene promediando los valores mayor y menor de una mues- tra; aunque este valor es ficil y rápido de calcular, su eficacia es, generalmente, muy baja y resulta muy sensible a la omisión de valores de muestras (que pueden representar, o no, errores grandes). ’ 1

Una variedad de tknicas rápidas de estimación puntual para p y cr se ba- san en las’euantilas de una distribución observada. Dividiendo la distribuciijn en k partes iguales; definimos la jésima k-cuantila: Pj,k de tal’forma que j / k esla frac- ción de los datos que se excede en ,Fj,k. De especial importancia son las cuartifai, para los que k --7. 4 y j = 1, 2, 3; las nueve decilas, para los que k = 10 y j = 1,2,.. . 9, y las 99 centiIus, para los que k = 100 y j = 1, 2,. . . ,99. Para el cálculo dE cuan- tilas debemos ordenar las observaciones, ya sea situando Jas observaciones individua- les de acuerdo a su tamaño, o construyendo una tabla de frecuencia.

El cálculo de cuantilas a partir de datos no agrupados se facilita por el uso de la regla siguiente: dadas n ohservaciqcs ordenadas, Fj,k es el ,valor de la &serva- S n que ocupa el lugar j ( n -1 l ) /X: et1 tatnario, cometIZando por la mayor. Natese p e esta regla concuerda con la que dimos anteriormente para calcular la mediana

Page 204: ingenieria

196 METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

FIP, de acuerdo con la cual la mediana es el valor de la observacibn numerada (n + 1)/2, Para ilustrar el cálculo de cuantilas a partir de datos no agrupados, ha- llaremos Fina, Pin, y para el siguente conjunto ordenado de 30 observaciohes:

4 5 7 8 8 9 11 17 19 19 21 21 25 27~ 28 28 28 29 30 31 31 32 34 36 37 37 40 44 47 61

Para calcular F‘lI16, debemos encontrar el valor de la observación numerada 31/16 = 1.9, y esto significa que debemos ir nueve décimos del camino de la primera ob- servaci6n hacia la segunda. Entonces:

9 10

Para calcular la mediana Flw debemos encontrar el valor de la observación nume- rada 31/2 = 15.5, lo que significa que debemos recorrer la mitad del camino entre la observación 15 y la 16. De aquí se sigue que F l p = 28, ya que los dos valores (15 y 16) son 28. Para obtener llamado también tercera cuartila determinare- mos el valor de Ia observación numerada (3.31)/4 = 23.25, y obtenemos

F I / I ~ = 4 + - (5 - 4) = 4.9

1 F 3 / 4 = 34 + -1 (;% - 34) = 34.5

Para ilustrar el cálculo de cuantilas a partir de datos agrupados, determinare- mos la tercera decila de los datos agrupados en la tabla siguiente:

X f 0.5 6 3.5 14 6.5 15 9.5 8 12.5 5 15.5 2

50

Encontraremos, primero, la clase en que está localizada la tercera decila. Como hay 50 observaciones, Fallo excede a las 6 (50) = 15 observaciones más bajas y, por consiguiente, se encuentra localizado en la segunda clase. Como hay 6 observaciones en la primera clase, necesitamos 9 de las 14 observaciones de la segunda clase; esto es, la tercera decila está localizada a 9/14 del camino recorrido en la segunda clase. Como el límite inferior de la segunda clase es 2.0 y el intervalo de clase es 3.0, ob- tenemos:

FSllo = 2.0 + - (3.0) = 3.9 9 14

N6tese que, para datos agrupados, contamos j.n/k observaciones en lugar de j(n + l ) / k , como hicimos en el caso de datos no agrupados. Se hace esto porque hemos supuesto que las observaciones en cada clase están “uniformemente disper- sas” a lo largo del intervalo de clase.

Page 205: ingenieria

ESTIMACION RAPIDA 197

Las estimaciones rápidas más cómúnmente usadas para p basadas en las cuan- tilas, son la medida Fin. y la cuartila media, 1 (pill + F ~ , ~ ) la eficacia de la pri-

mera es de 64CJ0, la de la segunda 81c/o, y se deben utilizar como estimaciones de ,u solo para muestras de poblaciones simétricas. Para las 30,observaciones en la lista

antes considerada, la mediana es 28 y la cuartila media es - (15.5 + 34.5) 25.0, mientras que Z es igual a 25.5.

Las .siguientes son dos estimaciones bastante M e s de u basadas en las cuantilas de un conjunto de datos:

1 2

La primera tiene un 62% de eficacia y no se debe emplear para poblaciones con mu- cha asimetría, mientras que la segunda tiene 7356 de eficacia y no es sensible a la asimetria. Para las 30 observaciones de la lista, que tienen la desviación tfpica de muestra1 S = 12.7, obtenemos

- (47.4 - 4.9) = 14.2 1 3

Y 3 4 i ( 4 7 . 4 + 4 (34.5) - (15.5) - 4.0) = 14.2

Si un conjunto de datos sigue aproximadamente una distribución normal, un método muy riipido de estimar U (aún para muestras muy grandes) es calcular un 5% inferior. Este método tiene una eficacia de 70% para muestras grandes pro- vinientes de poblaciones con distribucibn normal. Aplicándofo a las 30 observaciones anteriores en la página 196, encontramos que las medias, de las 1% observaciones Euperiores.e inferiores, respectivamente, son

51 + 2 (47) 1 4 +, ; (5)

L 1 1 ” = 49.7 Y 1 = 4.3

J .

2 1 + 2 y, por lo tanto, podemos estimar U en - (40,7 - 4.3) = 11.4. 1

4

‘ EJERCICIOS

1. Hallar F1/4, Fl/% Fa147 Flilo, Y Fm1, para las velocidades no agrupadas del ejercicio 10 de la página 107.

2. En la dktribuci6n de remaches que faltan dada en la página 101, hallar (a) la mediana, fh) la primera wartila, (c) l a novena decila. y (d) F s i s .

3. Usar 10s dos estimadores de cuantilas para estimar la media de la poblacicin en la que se hicieron las 15 medidas d e resistencia a la cornprcsicin en el ejercicio 9 de la página 107.

Page 206: ingenieria

198 METODOS ABREVIADOS EMPLEADOS EN INFEKENCIA

4. Utilizando las 20 lecturas de temperatura dadas en el problema 4 de la página 114, esti- mar la media de la población a partir de la cuartila media.

5. Empleando la distribución de pesos de recubrirnientos de estaño obtenidos en el ejercicio 3 de la pAgina 106, determinar la mediana y la cuartila media y comparar con la media obtenida en el problema 10 de ia página 114.

6. Usar la distribución de velocidades obtenida en el problema 10 de la página 115 para calcular la cuartila media y estimar p . Comparar este resultado con Z y con una estima- ción de p obtenida dibujando la gráfica en papel de probabilidades.

7. Utilizar los dos estimadores de cuantilas de la página 197 para dar una estimacibn de U

para los ingresos no agrupados del problema 6 de la página 105. Calcular 1a.desviación típica muestral y comprara: las estimaciones. Estimar, tambikn, cr tomando un cuarto de la diferencia entre la media. del 5% superior y el 5% inferior de los datos.

8. Con respecto a las lecturas de temperatura di1 ejercicio 4 de la phgina 114, estimar la desviación típica de la población utilizando (a) la desviación típica muestral, (b) las dos fórmulas dadas en la psgina 197, y (6) una gr&fica de probabilidad. Comparar los resulta- dos obtenidos.

9. Emplear la distribucibn de pesos de recubrimiento de estaño obtenida en el problema 3 de la página 106 para calcular los dos estimadores de cuantilas de u dados en la p k i - na 197. Tambih, comparar con el valor de la desviación típica de la muestra obtenida en el problema I1 de la página 114.

10. Comparar el valor estimado de u obtenido de la gráfica de probabilidad del ejercicio 6 con los valores estimados basados en las dos fórmulas de la página 197. Calcular las cuantilas necesarias a partir de los datos agrupados.

11.3 Tests de l o s signos

En esta sección describiremos tests no paramétricos basados en clasificar los datos de acuerdo con dos tributos, representados convenientemente por sfgnos más y signos menos. Por ejemplo, si queremos contrastar la hipótesis nula H O : p = M sobre la base de una muestra de azar de tamaño n, podemos cambiar cada observa- ción que exceda de po por un signo más y, cada observación menor que pFco, por un signo menos. Si la población de la que obtenemos las muestras es continua y simétri- ca la probabilidad de que una observación sea cambiada por un signo mAs es igual a 1/2 cuando H , es cierta. En consecuencia, la prueba de la hipótesis nula p = PO es equivalente a una prueba de la hipótesis nula p = 1/2, donde p es el parámetro de una distribución binómica. La alternativa bilatera p # po es equivalente, ahora, a p # 1/2, y las alternativas unilaterales p < po y p > po son equivalentes a P < 1 /2 y p > 1/2, respectivamente, siendo I, la probabilidad de encontrar un sig- no más, es decir, una observación mayor que po.

Para ilustrar el test de los signos de una sola muestra que acabamos de descri- bir, vamos a contrastar la hipótesis de que ]a temperatura media a la que opera un termostato es 2 8 O C., utilizando los resultados siguientes obtenidos de 20 termos- tatos:

29.9 28.2 32.0 30.5 29.3 30.1 27.7 31.4 28.6 27.9 + + + + + + - + + - 26.8 30.3 29.0 28.8 28.0 31.4 32.1 27.8 31.7 29.2 - + + + + + - + +

Page 207: ingenieria

TEST DE LOS SIGNOS 199

Notemos que,hay 15 observaciones mayores que 28.0, 4 observaciones menores que 28.0 y una observación igual a 28.0. Aunque la probabilidad de que una observa- ción, en una población continua, sea exactamente igual, a 28.0, es nula, los números anteriores están redondeados y, como no sabemos. si el número 28.0 representa un valor mayor o menor que 28, descartamos esta observación. Así pues, debemos de- terminar si los 15 signos más y los 4 signos menos, o sea. 15 “casos favorables” er, 19 pruebas, comprueban la hipótesis de que p = 1/2. Aplicando el criterio del test exacto dado en la página 180 con cy = 0.05, encontramos en la tabla de probabilida- des bincimicas que k.oB =4 y k,Lz5 = 15; como hubo 15 signos más y 4 signos me- nos, se deduce que la hipótesis nula debe ser rechaza. Nótese que, si el tamaiio de la muestra es suficientemente grande, podemos usar la curva normal como apro- ximación de la distribución binómica y los tests dados en la tabla de la piigina 1 6 4 .

Utilizando muestras apareadas, podemos extender inmediatamente el test de los signos a test de diferencias entre dos medias de poblaciórl, En este caso, cl test de los signos se puede emplear como una’ alternativa ‘no paramétrica del test t para muestras apareadas introducida en la página 157. Dadas II observaciones apareacias. con la primera observación proviniente de la población uno y la segunda de la po- blacibn dos, usamos un sigrlo 177ds para reemplazar cada par para el cual la obser- vación de la primera población excede a la de la segunda, y un siglro m w o . s para substituir cada par en el que la observacicin de la segunda poblacicin excede al de 1 2 primera. En el caso en que dos observaciones, pareadas sean iguales. se omite esta pareja y la prueba se desarrolla comb en el caso de tina sola muestra antes, descrilu.

Para ilustrar el test de los signos (ILJ mlmtrgs q m w h . ~ , vamos a comparas dos métodos para anodizar aluminio atendiendo a la apariencia de las piezas ano&- zadas (brillo, color, etc.). Autque resulta difícil asignar valores numericos a esias cualidades, no es difícil comparar piezas apareadas y decidir cui1 tiene el aspc~io más agradable. Supongamos que 40 unidades apareadas se juzgan. dando un sigw más o un signo menos a cada par, de acuerdo con que el anodizado del prin2cL mgtodo o el del’ segundo se considere superior. Dado cluc hubo 24 signos mris. 11 signos menos y 5 empates, queremos probar si el primer mCtodo es realil:<i?tL’ superior. Empleando la curva normal (va- prigina 180) y : 0.05 calculamos pri- mero

y como este valor excede a 1.645. valor crítico para 1111 test unilatero, con u n n i v d de significación de 0.05, concluimos que la hipcitesis nula drbc ser rechazada. E[> otras palabras, concluimos que el primer mCtodo de ~nodizacicin es mejor.

La eficacia del test de los signos es bastalile alta para muestras peq~~eiias. 95‘, para 11 = 6, pero disminuyc a medida que el tamalio de la mucstra aumcnin 1 : a h t a

llegar, a una eficacia límite de 6 3 ; . Las hipbtesis necesarias para aplicar cl !cst dc. los signos. lo mismo en el caso dc una soia murstra qtle en e1 de muestras aparc:~tl:r>. son C ~ C las poblaciones consideradas sean continuas y sinl2tricas. Si ‘la pohlacicitl

Page 208: ingenieria

200 METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

fuese continua, podría haber una probabilidad positiva de que una observación fW- ra realmente igual a po en el caso de una’ sola muestra, o que las observaciones apareadas fueran exactamente iguales en el caso de muestras apareadas. Entonces, dejará de ser válida la.hip6tesis de ser p = 1/2, a menos que impongamos mayores restricciones. Si la población (o poblaciones) no fueran simétricas, la Probabilidad de que una observación fuera mayor que la media, ó de que la diferencia entre dos observaciones apareadas fuera mayor que cero, no iguala necesariamente un medio, bajo la hipótesis nula p = po en el caso de una sola muestra, o pl = p2 en el caso de muestras apareadas. Sin embargo, es posible modificar el test de los signos para eliminar la hipótesis de simetría. Para concluir esto, sólo tenemos que considerar las hipótesis concernientes a las medianas de la población en lugar de las concer- nientes a las medias.

11.4 Tests por suma de números de orden

El test de los signos de muestras apareadas es ‘uno de los métodos no paramé- tricos para contrastar la hip6tesis nula de que dos muestras provienen de poblaciones continuas idénticas, frente a la alternativa de que las poblaciones tienen medias dife- rentes. Una clase altamente eficaz de tests no paramétricos de esta hipótesis, y otras similares, se basa en la suha de los nzímeros de orden: esto es, se dan números de orden a las observaciones de acuerdo- con su magnitud y los tests se realizan sobre la base de ciertas sumas de estos n6mero. de orden. En esta sección, introduciremos tres tests basados en sumas de números de orden. El test U de Mann-Whifney se presenta como un substituto del test t de dos muestras, y tiene una eficacia límite de 95.5% cuando las hipótesis necesarias para el test t correspondiente quedan. sa- tisfechas. Un test similar al test U , que se puede emplear cuando la hipótesis alter- nativa especifica que las dos poblaciones tienen dispersiones diferentes, se considera- rá a continuación. Finalmente, introduciremos el test H de Kruskal- W d i s H para contrastar si k muestras provienen de poblaciones idénticas, frente a’ la alternativa de que las poblaciones tengan medias diferentes. Como el test U , el test H tiene, tam- bién, una eficacia de 95.5% cuando se compara con el procedimiento “normal” correspondiente, que se analizará en el capítulo 13.

Vamos a describir, en primer lugar, el test U de Mann-Whitney por medio del ejemplo siguiente. Supongamos que queremos comparar dos instrumentos de control O “registradores” diferentes utilizados para la determinación del contenido de hume- dad dentro de un semiconductor, a partir de las siguientes corrientes medidas en microamperes:

Registrador A : 1.3 0.9 0.8 0.2 0.4 0.6 0.1 5.1 0.2 Registrador B: 1.7 3.5 7.8 0.9 0.7 2.6 0.2 1.5 15.3 0.7

Primero, ordenamos conjuntamente las 19 observaciones de acuerdo con su tamaño, reteniendo la identidad de la muestra en cada observaci6n. Después, asignamos a estas observaciones los puestos 1, 2, 3, . . . y 19, como se indica en la tabla siguiente:

Page 209: ingenieria

TESTS POR SUMA DE NUMEROS DE ORDEN 201

Registrador: A A A B A A B , B A A B A Observación: 0.1 0.2 0.2 0.2 0.4 0.6 0.7 0.7 0.8 0.9 0.9 1.3 Rango: 1 3 3 3 5 6 7.5 7.5 9 10.5 10.5 12

Registrador: B , B . I3 B A B B ,. Ohservación: 1.5 1.7 2.6 3.5 5.1 7.8 15.3 Rango: 13 14 ' 15 16 17 18 19

Nótese Que, si dos t, más observaciones están empatadas 'en el mismo lugar, damos a cada uná'de ellas el medio de los lugares que ocupan en conjunto.

! .Si denotamos los tamaños respectivos de las muestras por n, y n z y la suma de los números de orden ocupados por la primera muestra .por R1, se puede demostrar que la medi8 y la varianza de la distribuci6n muestra1 de1:estadístico

. .

+ están dadas por

+

+

+ (Si hay empates en la ordenación, estas fórmulas son correctas s610 aproximadamen- te). Si n, y n, son, arqbas, mayores que 8, la distribución del estadístico U se puede aproximar con bastante exactitud por una distribución normal y, por lo tanto. el test se puede basar en el estadístico

L *

, * "

+ z = u - pu nu

4

y ,en la tabla 111. Existen? también,, tablas en las que se pueden basar tests exactos cuando n, y nip son pequeños (ver la tabla de D. B. Owen mencionada en la biblio- grafía). Observemos que no tiene consecuencias sajer qui muestra se considera "primera", por lo que podemos trabajar co,n cualquier suma de números de orden. escogiendo la que sea más fácil de obtener.

Volviendo ahora a nuestro ejemplo, tenemos 11, = 9, rz2 = 10. R , = 66.5, y. por consiguiente,

4sí,

9.10 - = 45.0 . : 2 . .

. 2 e' G8.5 - 45.0 4 x 0

= 1.93

Page 210: ingenieria

282 METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

1; como este valor se encuentra entre -1.96 y 1.96, valores críticos de una alternativa :‘:!stera con a = 0.05, llegamos a la conclusión de que la hipótesis nula de pobla- ..imes idénticas no se puede rechazar.

Si se asignan los números de orden de alguna otra forma diferente, se puede cmpicar el mismo estadístico U para contrastar la hipótesis nula de poblbciones idinticas frente a la alternativa de que las poblaciones tienen dispersiones distintas. Los números de orden se asignan “desde ambos extremos hacia el medio”, dando c.! nilmero 1 a la menor observación; los números 2 y 3, a la mayor y segunda ma- yor observaciones; los números 4 y 5, a la segunda y terceza menores; los 6 y 7, a la tercera y cuarta mayores, y así sucesivamente. Todos los demás aspectos de ,este ‘ ex con dispersiones diferentes son idénticos a los del test U de Mann-Wllitney.

El test Kruskal-Wallis para decidir si k muestras independientes provienen de poblaciones idénticas, se desarrolla en una forma similar al test U. Como antes, las observaciones se tratan en conjunto para darles el lugar de orden, y si Ri es la suma de los números de orden ocupados por las ni observaciones de la i-ésima muestra, c l test se hasa en el estadístico

1 .

l2 z - - 3(n + 1) k R: n(n + 1) i = l ni I€ =

donde n = n, + n2 + . . . + n k . Cuando ni > 5 para todas las i y la hipótesis nula es válida, la distribución del estadístico W se puede aproximar bastante por la distribución X-cuadrado, con k - 1 grados de libertad. En la tabla de D. B. Owen. mencionada en la bibliografía, se encuentran tablas especiales para aplicar con valores pequeños seleccionados de las ni y k.

Para ilustrar la prueba de Kruskal-Wallis 22, supondremos que el experimento descrito en la pagina 200, se amplía para incluir cuatro registradores diferentes, con los resultados mostradds en la tabla siguiente. (Nótese que a las observaciones em- patadas se les asignan nuevamente, el medio de los puestos que ocupan en con- jonto.)

Registrador A: 0.2 0.3 0.4 0.5 I .7 1.9 2.0 Registrador B: 0.8 1.1 1.3 1.9 ‘ 2.5 7.8 Hegislrador C: 0.7 0.9 . 8.2 12.0 12.1 15.3 Registrador D: 0.1 o. 1 0.3 0.5 2.9 13.8

Las observaciones son, otra vez, corrientes de retorno en microamperes. Como b e pusdc verificar ficilmente, las observaciones de ‘la primera muestra ocupan los ;Tuestos 3 , 4.5, 6, 7.5, 14, 15.5 y 17, por lo que R , = 67.5. Similarmente, las obser- \:aciones de la segunda muestra ocupan los puestos 10, 12, 13, 15.5, 18 y 20, por l o que K , == 88.5: las observaciones de la tercera muestra ocupan los puestos 9, 11, 21, *?2. 23 y 25. por lo que R , = 11 1.0; y las observaciones de la cuarta muestra ocu- pan los puestos 1.5, 1.5, 4.5, 7.5, 19 y 24, por lo que R , = 58.0. Substituyendo en ia 5rmula de H , encontramos

Page 211: ingenieria

TESTS FOR SUMA DE NUMEROS DE ORDEN 203

y si comparamos este valor con 7.815, valor de x%& con 3 grados de libertad, vemos que no se puede rechazar la hipótesis nula. En otras palabras, ho podernos rechazar la hipótesis nula de que las muestras provienen de~poblaciones idénticas frentc a 13

alternativa de que las medias de las poblaciones no son iguales;

EJERCICIOS

1. con respecto a las 100 medidas de los pesos de planchas de estaño de galvanizado elecLicl- litico del problema 3 de la página 106, utilizar el test de los signos con a = 0.05 par:{, contrastar la hipbtesis nula fl = 0.33 frente a la alternativa, 1.1 < 0.33, donde p es l a mrdio de la pobiación de pesos de la que se obtuvo la muestra.

2. Empleando el test de los signos de una sola muestra, contrastar la hipótesis nula de qa:. el8 octanage mqdio de la gasolina de la que se tomaron. las 16 muestras siguientes cs ! M I .

frente a la hipótesis alternativa de que es mayor, de cien.

101.6 98.2 104.5 99.0 102.8 105.4 107.7 99.4 103.3 100.0 102.5 97.1 103.6 101.0 98.7 101.0

. '

Emplear un nivel de significación de 0.05. 3. Utilizar el test de los signos y un nivel de significacibn de 0.10 para decidir si hay u l ~ t

diferencia sistemática entre las lecturas obtenidas de los dos instrumentos dci cjcrcicio j J

de la página 161. 4. Se sierran vigas de acero por dos métodos, consistente el primcro cn ascrrarix cunnci!

abn están calientes, Y el segundo cuando se han enfriado. Las longitudes finalcs restlltanlc:, (en pies) una vez que todas las vigas se han enfriado hasta la temperatura ambicnte, soil las siguientes:

Vigas serradm en calienre: 31.6 30.5 31.1 29.7 27.9 30.2 30.5 31.8 32.6 28.8 29.0 28.5 28.9 29.9 31.6 30.7 30.3 3: .5

Vigas serradas e n frio: 30.1 31.0 29.9 29.8 30.0 30.5 30.6 30.2 31.1 29.8 29.7 29.6 31,3 30.5 30.1 30.0 30.8 30.3

Apareando al azar las 18' observacibnes de las dos muestras. usar cl tcst dc l o \ ,,::::I.

de dos muestras, con un nivel de significacidn de 0.05. para detcrrninar si hay algunl L , k . -

rencia significante en las longitudes finales medias. 5. En pruebas repetidas, un motor experimental opercj. respcctivamcntc, duranw 20. 19, 23.

17, 18, 20, 23, 19! 20, 15, 24, 21, 18, 20. 24, 23, 20, 17, 25 y 28 minutos. con u n p ! b n de cierta clase de comhustiblc. Empleando el fest de los signos y un njvel dc significncich de 0.01 contrastar la hip6tesis nula p = 20 frente a la alternativa N # 20.

6. Para comparar una bebida con la de una marca'de la competencia: 50 pcrsnnas probarm una bebida y luew la otra y despues. se les pidih que indicaran .su preferida. (El ordcn

* ,de las marcas se escogib al a@r para cada persona.) Si 27 prefirieron la marca dada, 18 prefirieron la de la competencia, y 5 no encontraron difercncia cn el sabor. contrastar. con un nivel de significacidn de 0.01, si la marca dada es superior cn sabor a la de la competencia.

7. Un experimento para comparar la rcsistcncia a la tcnsiirn dc dos clascs de hilos dio los resultados siguientes (en libras) :

Page 212: ingenieria

204 METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

Hilo A: 143.6 144.8 145.2 144.8 145.6 146.0 143.0 147.4 144.0 145.6 145.5 144.8

Hilo B: 146.6 147.8 144.4 140.8 143.0 148.8 153.0 142.4 146.8 143.2 140.9 150.6

Usar el test U y un nivel de significación de 0.05 para contrastar la hipótesis nula de que las dos muestras provienen de poblaciones idénticas, frente a la alternativa de que las dos poblaciones tienen medias diferentes.

8. Repetir el ejercicio 4, usando el test U de Mann-Whitney. También contrastar si las disper- siones de las dos poblaciones son iguales, utilizando el test de suma de nfimeros de orden mencionada en la página 21 l .

9. En el ejercicio 7 utilizar a = 0.05 para contrastar la hipótesis nula de que las muestras provienen de poblaciones idénticas,‘frente a la alternativh de que las dos poblaciones tie- nen dispersiones diferentes.

10. Los tests denominados de Franklin se establecierdn para determinar las propiedades de aislamiento de aceros al silicio de granos orientados que fueron recocidos en cinco atmbs- feras diferentes, con los resultados siguientes :

Atmosfera Resultados del ensayo (amperios)

1 0.58 0.61 0.69 0.79 0.61 0.59 2 0.37 0.37 0.58 0.40 0.28 O.’$ 0.35 3 0.29 0.19 0.34 0.17 0.29 0.16 4 0.81 0.69 0.75 0.72 0.68 0.85 0.57 0.77 5 0.26 0.34 0.29 0.47 0.30 0.42

Emplear el test H de Kruskal-Wallis H y un nivel de significación de 0.05 para decidir si se puede aceptar que estas cinco muestras proceden de poblaciones idhticas.

11. Para investigar tres medidas preventivas contra la corrosión, se probaron muestras al azar de 10 piezas de alambre para cada una de las tres medidas preventivas, dando los siguientes resultados para las profundidades máximas de las partes erosionadas (en milé- simas de pulgada) :

A: 45 53 60 48 57 62 49 55 53 52 B: 62 58 47 59 63 48 58 52 50 49 C: 57 45 60 54 57 55 48 59 62 60

Contrastar, con un nivel de significacion de 0.05, si hay,alguna diferencia en la eficacia de las tres medidas preventivas contra la corrosión.

11.5 Tests de las series de términos iguales

Al discutir las muestras aleatorias en el capítulo 7, presentamos varios métodos que daban por anticipado cierta seguridad de que una muestra fuera de azar. Sin embargo, es útil tener una técnica para contrastar si una muestra se puede considerar como aleatoria despuh de haber sido obtenida. Una de estas técnicas está basada en el orden en que se obtuvieron los valores de las muestras; mis concisamente, se basa en el número de series de términos iguales mostradas en los resultados de las muestras.

Page 213: ingenieria

TESTS DE LAS SERIES DE TERMINOS IGUALES 205

Dada una sucesión de dos simbolos, tales como H y T (que pueden representar. por ejemplo, las caras y las cruces en $iradas sucesivas), una "serie de iguales" es una sucesión de símbolos idénticos comprendidos entre dos símbolos diferentes o sin estos Últimoq. Es decir, l a serie

""" T T H H T T H H H T H B H T ' T T T H f i H I . .

contiene 8 series de iguales, como indican los subrayados. El número total de series de iguales en una sucesión de n ensayos da una indicación de si la sucesión se puede qqiderar como de azar. Entonces, si sólo ha habido dos,series.de iguales, consisten- t& en diez caras, seguidas por diez cruces, se puede suponer que la probabilidad de un.caso favorable no ha pelmanecido constante de una prueba a la siguiente. Por otra parte, si la sucesión consta de veinte tiradas formadas alternativamente por caras y cruces, se puede suponer que los ensayos no han sido independientes. En cualquier caso, hay razones para suponer que no. se trata de un azar. Notemos que nuestra suposici6n.no procede del número de caras y cruces, si.no del orden en que

Si una sucesibn contiene n, símbolos de una clase y n, de otra (y ni n 1 ni 1 1 ~

son muy pequeiíos), lq distribución muestra1 del número total de series de iguales se p u d e representar muy aproximadamente por, una distribución normal de media

aparecen.

I / + pu = - 2np2 n1 + ni fl

y desviación típica +

donde u denota el número total de series de iguales. Entonces, el test de la hip6tesis nula de que la ordenación de los símbolos (y, por consiguiente, de la muestra) sea aleatoria, se puede basar en el estadistico.

+ o

y en la tabla 111. Este test da una excelente aproximacibn cuando ni ! I , ni tr, son menores de 10. Se pueden encontrar tablas especiales para hacer tests. exactos cuan- do nl o n, son' pequeñas, en Iás tablas de D. B. Owen, citadas en la bibliografía.

Para ilustrar este test, examinaremos la siguiente sucesión de 32 vuelos de yrue- ba de un cohete, donde S y F marcan, sucesivamente, los éxitos y los fallos:

F F F S S F F S S S F S P S S S S F S S S F ~ S , S ~ ~ ~ F , S ~ S ~ ~ "" """_ Como hay 22 éxitos, 10 fallos y 14 series de iguales, substituimos tr , = 22. I T , =- 10. u = 14, y obtenemos

--

2,22.10(2-22.10 - 22 - 1 0 ) = .vu = G+ 10)2(22 -6 10 - 1)

Page 214: ingenieria

206 METOOOS ABREVIADOS EMPLEADOS EN INFERENCIA

?‘

Como este valor queda entre -1.96 y 1.96, no podemos rechazar (con un nivel dc significacicin de 0.05) la hipótesis nula de que la ordenación sea aleaioria. Evi- dcntcmente, no hay razones suficientes para concluir que hay una fiabilidad real.

Se puede emplear también el test de series de iguales para contrastar la casua- lidad que hay en las muestras formadas por datos numéricos, contando las series de iguales a partir de la mediana por encima y por debajo de ésta. Si denotamos ana observación mayor que la mediana de la muestra por la letra a y una observación menor que la mediana por la letra b, podemos utilizar la sucesión resultante de Q y h para constrastar la casualidad, siguiendo el mCtodo indicado antes. Una aplicaci6n frecuente de este método es en el control. de calidad, donde las medias de muestras pequeñas sucesivas se representan en una gráfica en orden cronológico. El test de serles de iguales se puede usar entonces para comprobar si hay alguna tendencia en los datos, que nos indique que es necesario ajustar una máquina o hacer algiln otro proceso antes de que ocurra algiln daño grave.

Para ilustrar un test de series de iguales por encima y por debajo de la media- na. supongamos que un ingeniero se interesa en la posibilidad de que se hayan he- cho demasiados cambios en el ajuste de un torno automático. Para contrastar esta hipiitesis. se obtuvieron los siguientes diámetros medios (en pulgadas) de 40 ejes tor- neados sucesivamente en el torno:

n . X I 0.258 0.249 0.251 0.247 0.256 0.250 0.247 0.255 0.243 0.252 0.250 0.253 0.247 0.251 0.243 0.258 0.251 0.245 0.250 ‘).24S 0.252 0.254 0.250 0.247 0.253 0.251 0.246 0.249 ’ 0.252 0,237 0.250 0.253 0.247 0.249 0.253 0.216 0.251 0.249 0.253

L. T: ;;iana de estas medidas es 0.250 y. cambiando cada una de ellas por una letra r i si escede de 0.250. por una 1) si es menor que 0.250, y omitiendo las cinco que ! 3 G ~ ! ’ I c ! ~ . i l : ~ ;! 0.250, obtenemos la sucesicin

a,abaha~~abaababaabbaabaabbahabbabababa

q+.! * ~ C I : C 117 series de iguales. Entonces, n t = 19, n2 = 16, u = 27, tendremos:

clu = 2 p - 19-’ l6 + 1 = 18.37 30

U” = 2*19*16(2*19.16 - 19 - 16) = 2.89

(19 + 16)’(19 + 16 - 1)

? z = 27 - 18.37 = 2.98 2.89

Como este valor excede a 1.96, podemos rechazar la hipótesis nula de que la suce- sicin de medidas sea aleatoria. Como el número de series de iguales es mayor que el que se podría esperar, debido al azar, es razonable suponer que el torno se ha ajus-

Page 215: ingenieria

TESTS DE KOLMOGOROV-SMIRNOV 207

tad0 demasiado; es probable que se haya hecho un ajuste después de tornear cada pieza, tratando, con ello, de compensar cualquier discrepancia que se haya observa- do con respecto a1 diámetro nominal de 0.250 pulgadas.

11.6 Tests de Kolmogorov-Smirnov

Los tests de Kolmogorov-Smirnov son test no paramétricos para diferencias en- tre dos distribuciones totalcs o acumulativas. El test uni-muestrul se refiere a la con- cordancia entre una distribución acumulativa observada de valores de una muestra y una función de distribución continua especificada; es decir, se trata de una prueba de bondad de ajuste. El test bi-muestrul se refiere a la concordancia entre dos dis- tribuciones acumulativas observadas: se contrasta la hipótesis de si dos muestras independientes provienen de distribuciones continuas idénticas, y es sensible a las jiferencias de población en lo que se refiere a la localización, dispersión, o disimetría.

El test uni-muestra1 de Kolmogorov-Smirnov es, en general, más eficaz que el :est X-cuadrado para la bondad de ajuste de muestras pequeñas y puede usarse con nuestras muy pequeñas en las que el test X-cuadrado no es aplicable. Debemos re- :ordar, sin embargo, que el test X-cuadrado de la sección 10.5 se puede usar con listribuciones discretas, mientras que el test de Kolmogorov-Smirnov no puede Isarse.

El test uni-muestra1 se basa en la diferencia absoluta máxima D entre los valo- es de la distribución acumulativa de una muestra aleatoria de tamaño II y una dis- ribucidn teórica especificada. Como ilustración de este test, se quiere comprobar si 3s agujeros para clavijas en una placa de hojalata electrolítica están distribuidos niformemente para lo cual se han tomado medidas de las siguientes distancias (en lulgadas) de 10 agujeros a partir de un extremo de una tira grande de placa de hoja- ita de 30 pulgadas de ancho:

4.8 14.8 28.2 23.1 4.4 28.7 19.5 2.4 25.0 6.2. ,ajo la hipbtesis nula de que los agujeros estan uniformemente repartidos, la distri- lución acumulativa teórica con la que queremos comparar la distribuci6n acumula- va observada esth dada por

i: para 2 ,< O

para x 2 30 F ( x ) = x/30 para O < x < 30

a gráfica de esta distribución acumulativa te6rica se muestra, junto con la de la istribución acumulativa observada, en la figura 11.1. Como se indica en esta figura,

Para determinar si esta diferencia es mayor que lo que -se puede esperar razona- Aemente, encontramos el valor crítico de D en la tabla IX. Para tz = 10 OL = 05, el valor crítico es D.o6 = 0.410, y de aquí que la hipótesis nula (que los agu- ros estan uniformemente distribuidos) no se puede rechazar.

diferencia máxima entre las dos distribuciones acumulativas es 0.193.

Page 216: ingenieria

208 METODOS ABREVIADOS EMPLEADOS EN INFERENCIA

F

1 .c

O.€

0.E

0.4

0.2

C

X )

Fig. 11.1 Prueba Kolmogorov-Smirnov

El test bimuestral de Kolmogorov-Smirnov se basa en la diferencia absoluta maxima entre los valores de las dos distribuciones acumulativas observadas. En' principio, es muy similar al test uni-muestra], y los valores cnticos necesarios se pue- den obtener de tablas especiales (por ejemplo, las de D. B. Owen, citada en la bi- bliografía).

EJERCICIOS

1. Para comprobar si cierta señal de radio contiene un mensaje, se puede subdividir un inter- valo de tiempo en cierto número de intervalos muy cortos y determinar después si la fuer- za de la señal excede cierto nivel (ruido de fondo) en cada corto intervalo. Supongamos q,ue la siguiente es parte de una observación de este tipo, donde H indica una señal-fuerte y L que la señal no excede cierto nive1,de ruido.

L L H L H L N L H H € i L H H H L H H H L H L ' H L L L '

L L H L H L I I L N H H L H H € I L H H € I L H L H L H L L ~

Verificar si esta sucesión se debe al azar (usando un nivel de significacibn de 0.05) y comprobar si es razonable suponer que la señal contiene un mensaje.

2. La siguiente es una lista que nos da, leyendo las filas sucesivas de izquierda a derecha, el orden en que una máquina produjo piezas defectuosas ( D ) y no defectuosas (N) durante cierto periodo:

N N N N N N N N N D D D N N N t N N N N N , N N N D N N N N N N N N D D N N D D N N N N N N N N N N N N N N N ' D D D N N D N D N N D N N N N N N N N D D N N N D N N N N N N N N N N D D D N N N N N N N N N

Page 217: ingenieria

TESTS DE KOLMOGOROV-SMIRNOV 209

Comprobar, con un nivel de significacibn de 0.05, si este arreglo es debido al azar. 3. En la página 92 se describió un método para generar digitos al seudoazar, en el cual un

mímero de 4 dígitos se elevaba al cuadrado, los 4 números de la parte media del número resultante se elevaban al cuadrado, y así sucesivamente. Comenzando con el número 3571: usar una tabla de cuadrados o una calculadora para continuar este proceso hasta obtener una sucesión de 48 dígitos. Contrastar si la sucesidn resultante, para ver si es de azar, uti- lizando series de términos iguales por encima y por debajo de la mediana y un nivel de significación de 0.05.

4. En una fábrica, el tiempo que no trabaja una máquina durante laS horasde trabajo, debido a dificultades tales como roturas o fallos, se llama “tiempo muerto”. La tabla que sigue corresponde a 50 tiempos muertos (en minutos) consecutivos observados por un ingeniero de control durante cierto periodo (léanse las filas sucesivas de izquierda a derecha):

18 25 28 21 29 30 34 30 25 21 22 29 30 24 35 37 20 27 30 25 30 21 26 33 36 35 31 20 28 39 40 36 36 34 35 39 42 30 35 41 38 35 50 46 34 37 39 42 48 51

Usar el test de las series de iguales por encima y por debajo de la mediana, a un nivel de significación de 0.05, para contrastar la hipjtesis de que los datos marcan una tendencia.

5. Las temperaturas horarias de un horno (en grados centígrados) tomadas durante un perio- do de 24 horas son las siguientes:

269, 265, 271, 268,270, 266, 273, 271, 275,269, 271, 273 275, 268, 276, 270, 273, 266, 270, 268, 272, 271, 278, 267

Contrastar si esta disposición es al aza.r, con un nivel de significacibn de 0.01, para investi- gar si el horno está trabajando ciclicamente en intervalos de dos horas.

6. El problema 13 de la página 107 contiene el número de imperfecciones en muestras toma- das de 50 piezas de tela. Suponiendo que el orden de las muestras es el mismo que el or- den en que se han producido las piezas de tela, contrastar la hipótesis de que la presencia de muestras sin imperfecciones se ,debe al azar, frente a~ la alternativa de que existe un agrupamiento. (Se toma a = 0.05).

7. Utilizar e1,test de Kolmogorov-Smirnov,. Con a = 0.01, para decidir si las resistencias a la compresión del ejercicio 9 de 13 página 107 se pueden syponer provinientes de una distri- bución normal’con. media de 50,000 libras por pulgada cuadrada y desviación típica de 10.000 libras ‘por pulgada cuadrada. [Sugerencia: utilizar papel gráfico,de‘ probabilidades.]

8. En un esiudiv de vibraciones, se sometieron las componentes de un ,avión a fuertes vibra- ciones, hasta que se originaron fallos estructuraks.. Los siguientes son los tiempos obteni- dos (en minutos) 4.1, 0.8;.5.3, 50 , 8.3, 1.7, 2.5, 6.2, 7.3, 9.0, 1.2, 3.7, 9.5, 10.5. Contrastar si se pueden considerar estos datos como una muestra proviniente de una población qpo- nencial con una media de 5 minutos. (Se toma (Y = 0.05.)

Page 218: ingenieria

12 AJUSTE DE CURVAS

12.1 Metodos de mínimos cuadrados

Uno de los objetivos más importantes de muchas investigaciones de ingeniería es hacer predicciones, de preferencia empleando ecuaciones matemáticas. Por' ejem- plo, un ingeniero puede desear predecir la cantidad de óxido que se.formaria en la superficie de un metal calentqdo qn un horno durante un intervalo especificado de tiempo a 200° C., o la medida de deformaci6n de un anillo sometido a una fuerza de compresión de lo00 libras, o el tiempo de desgaste entre recublimientos de una cubierta de una rueda de auto que tiene una composicidn y un espesor de cuerda dados. Generalmente, tales predicciones requieren que se obtenga una fhrmula que relacione la variable dependiente (cuyo valor se desea predecir) con una o mis variables independientes. En esta sección consideraremos el caso especial en el que una variable dependiente se ha de predecir en funcicin de una sola variable inde- pendiente.

En muchos problemas de esta clase, las observaciones de la variable indepen- diente se hacen sin error, o con un error que es insignificante al compararlo con el error [variación aleatoria) de la variable dependiente. Por ejemplo, al medir la can-

21 o

Page 219: ingenieria

METODO DE MlNlMOS CUADRADOS 21 1

tidad de 6xido en la superficie de un metal, la temperatura de calentamiento se pue- de controlar, en general, con buena precisión, pero la medida del espesor de óxido se encontrará sujeta a considerables variaciones aleatorias. Así, aunque la variable independiente se puede fijar en un valor x, las medidas repetidas de la variable de- pendiente nos darán valores y que difieren considerablemente. Las diferencias entre los valores de y se pueden atribuir a diversas causas, principalmente a errores de me- dida y a la existencia de otras variables, incontrolables, que pueden influir en el va- lor de y cuando x permanece fija. Luego, las medidas del espesor de óxido variaran para diferentes piezas calentadas durante el mismo tiempo a la misma temperatura, debido tanto a la dificultad en medir los espesores, como a las posibles diferencias en la composición de la atmósfera del horno, a las condiciones de la superficie de la pieza, etc.

De esta discusión, debe quedar claro que y es el valor de una variable aleatoria cuya distribución depende de x. En la mayoría de las situaciones de este tipo, nos interesa principalmente la relación entre x y la media de la distribución correspon- diente de y, y nos referimos a esta relación llamándola curva de regresiún de y res- pecto de x, o brevemente de y sobre x. (Por el momento, supondremos que x es fija, esto es, no depende del azar; en la sección 12.5 consideraremos el caso en que x e y son, ambas, variables aleatorias.)

Trataremos primero el caso en que la curva de regresión de y sobre x es lined, esto es, cuando, para cualquier x dada, la media de la distribución de las y está dada por CY + fix. En general, una y observada diferirá de esta media y denotaremos esta diferencia por E, escribiendo

y = a + p z + e

Nótese que E es un valor tomado por una variable aleatoria y que siempre podremos escoger CY de tal manera que la media de su distribución sea igual a O. El valor de E para cualquier observación dada dependerá de un posible error de medida y de los valores de otras variables diferentes de x que tengan influencia en y.

' Para dar un ejemplo en que la curva de regresión de y sobre x se puede supo- ner lineal de una forma razonable, consideremos que se va a calibrar un par termo- eléctrico, midiendo la fuerza electromotriz en milivoltios a varias temperaturas cono- cidas. En la tabla siguiente (que da los resultados de 10 medidas) xi es la i-ésima temperatura en grados centígrados y yi es Ia medida correspondiente del termopar en milivoltios:

1 . 2 3 4 5 6 7 8 9 1 o. 4 0 20 40 60 , 80 100 120 140 ' 160 180 '

0.01 0.12 0.24 0.38 0.51 0.67 0.84 1.01 1.15 1.31

En la figura 12.1, en que se han marcado estos datos, es evidente ,que resulta razo- nable suponer que la relación (la curva de regresión) es lineal. (Si el recorrido de x se extendiera, se haría evidente que la curva de calibración del termopar no sería

Page 220: ingenieria

212 AJUSTE DE CURVAS

lineal, pero una línea recta nos da una excelente aproximación en el recorrido limita- do usado en nuestro ejemplo.)

Nos encontramos ahora ante el problema de usar los datos marcados en la figu- ra 12.1 para calcular los parámetros cy y /3 de la línea de regresión de y sobre x supuesta. Nótese que estos parámetros determinan completamente la línea de regre- sión, y que el cálculo de cy y p es equivalente a encontrar la ecuación de la recta que

X Temperatura PC)

Fig. 12.1 Regresión lineal

“ajusta mejor” los puntos de los datos. En este ejemplo, se puede hacer esto “a ojo” y, si experimentadores diferentes hicieran este tipo de líneas, probablemente predije- ran que a llOo C. la fuerza electromotriz sería de alrededor de 0.75 milivoltios. Sin embargo, si tenemos que tratar con datos tales como los marcados en la figura 12.2, el problema de encontrar la Iínea de mejor ajuste no es tan sencillo. Para tratar pro- blemas de esta clase, desarrollaremos un método no subjetivo para ajustar líneas rectas que tiene, además, algunas propiedades estadísticas deseables.

Para establecer formalmente el problema, consideremos que se tienen IZ obser- vaciones apareadas (xi, yi) para las que es razonable suponer que la regresión de Y sobre x es lineal, y queremos determinar la recta (esto es, la ecuación de la recta) que nos da en alguna forma el “mejor” ajuste. Hay diversas maneras de interpretar la palabra “mejor”, y el significado que le daremos aquí se puede explicar como sigue. Si se supone que y está dada por la ecuación

y’ = a + DX donde a y b son constantes, entonces ei, el error al suponer el valor de y correspon- diente a la xi dada, es

y. - y! = c . . ( %

Page 221: ingenieria

METdDO DE MlNlMOS CUADRADOS 21 3

Nótese que la ecuación y' = a + bx nos da una estimacicin de la ecuación de la línea de regresión cuya ecuación real, pero desconocida, es y = a + DX. El error real al predecir y; es E;, y este error se estima por la cantidad yi - yi' = ei. Tratare- mos de determinar a y b de tal forma que los errores estimados sean tan pequefiios como sea posible, en algún sentido.

Y

35

30 -

-

- m . - o 25- .S .- U

a 20- Y)

$ 15- n

., ,

, ' al

> 5 -

'0 20 40 60 80 100 120 140 '160 180 x tiempo (minutos)

Fig. 12.2 Criterio de mínimos cuadrados

Corno no podemos hacer mínimo cada e; individualmente, se sugiere, de mane- .a inmediata, que tratemos de hacer su suma I; eí tan cercana a cero como sea po-

;ibIe. Sin embargo, como esta suma se puede hacer igual a cero de muchas maneras y por lo tanto para muchas líneas rectas, pues basta que los errbres positivos y nega- :ivos se compensen anulándose su suma, haremos mínima la suma de los cuadrados le los eá (véase también la aefinición de desviación típica). En otras palabras, esco- geremos a y b de tal forma que

n

i-l

2 [y; - (a + bzi)12 i - 1

ea mínima. Notemos, en la figura 12.2, que esto es equivalente a hacer minima la uma de 10s cuadrados de las distancias verticales de los puntos a la línea. El trite- io, llamado criterio de mínimos cuadrados, nos da valores de a y b (estimaciones de I y p) que tienen muchas propiedades deseables, algunas de las cuales se menciona- án al final de esta sección.

Una condici6n necesaria para un mínimo relativo es la anulación de Ias deriva- as parciales con respecto a a y b. Entonces, tenemos

Page 222: ingenieria

21 4 AJUSTE DE CURVAS

2 L: [y; - (a + bs,)l(-za) = 0 i = l

y volviendo a escribir estas ecuaciones en una forma más conveniente. obtenemos las ecuaciones siguientes, llamadas ecuaciones normales:

Las ecuaciones normales son un conjunto de dos ecuaciones lineales en las incog- nitas a y b; su resolucirin simultánea nos da los valores de a y h de la recta que proporciona el mejor ajuste a los datos dados, de acuerdo con el criterio de mínimos cuadrados. Notemos que se pueden recordar fácilmente de la manera siguiente: pri- mero escribimos la ecuación y L = a + /)xi y luego la ecuación xiyi = axi + bs;, obtenida multiplicando ambos miembros de la primera ecuación por xi. Si ahora sumamos los dos miembros correspondientes de cada una de estas ecuaciones, obte- nemos las dos ecuaciones normales (después de algunas simplificaciones algebrai- cas sencillas).

Para ilustrar el método de mínimos cuadrados, tal como se usa para ajustar una recta a un conjunto dado de datos apareados, lo aplicaremos a los datos de la figura 12.2. pertenecientes a los tiempos de calentamiento y los espesores del rixido de cierta pieza:

x 1 20 30 40 60 70 90 100 120 150 180

y 1 3.5 7.4 7.1 15.6 11.1 14.9 23.5 27.1 22.1 32.9 ~______

siendo las x los tiempos de calentamiento en minutos y las y los espesores de dxido en Angstrom. Como IZ == 10,

I1 n 2 = 860, 2 x: = ‘38,800

i = l i = l

n n

2 y, = l G . 2 , Z; X ; Y ~ = 18,460.0 i = l 2 - 1

las ecuaciones normales son

18,4i!).0 = 8 0 0 ~ + !38,800b

Resolviendo estas dos ecuaciones, obtenemos (I 7: 1.90, h ~ 0: 17, y la ecuacidn de la recta que proporciona el mejor ajuste en el sentido de mínimos cuadrados es

y’ = 1.90 + 0.17.L

Page 223: ingenieria

WFERENCIAS BASADAS EN LOS ESTIMADORES DE MlNlMOS CUADRADOS 21 5

Esta ecuación se puede usar, por ejemplo, para predecir que el espesor del óxido de hierro de una pieza calentada durante 80 minutos será y' = 1.90 + (0.17) (80) = 15.5 Angstrom.

Es imposible hacer cualquier afirmación' exacta sobre la "bondad" de esta pre- dicción, a menos que hagamos algunas suposiciones acerca de la distribución de las lecturas de espesor de 'óxido y acefca de la 'verdadera naturaleza de la regresibn, es decir, que para una x dada, la media verdadero de las y es de la forma a + Pz. Considerando los valores de a y b obtenidos de las ecuaciones normales como esti- maciones de los coeficientes de regresión a y p, el lector deberá demostrar, en los problemas 13 y 14 de la página 213, que estas estimaciones son lineales en las obser- vaciones yi y que tienen estimaciones insessgadas de a y p. Con estas propiedades. nos podemos referir al notable teorema de Gauss-Markov que establece que, entre todos los estimadores insesgados de a y p que son lineales en las yi, los estimadores de mínimos cuadrados tiene la menor varianza. En otras palabras, los estimadores de mínimos cuadrados son los que nos dan mayor confianza en el sentido de que esttin sujetos a las menores variaciones aleato$as. p,uede encontrar una demostración del teorema de Gauss-Markov en el libra de.F, A. Graybill citado en la bibliografía.

12.2 lnferencias basadas en los estimadores de mínimos cuadrados

El método de la sección precedente se emplea cuando la relación entre x y la media y es lineal, o suficientemente aproximada a una línea recta, de tal forma que la recta de mínimos cuadrados de predicciones razonablemente acertadas. En lo que sigue, supondrembs que la regresión es lineal y que las n variables aleatorias que son los valores yi ( i = I , . . .,n) están distribuidas independientemente con una dis- tribución normal de media a + Pxi y varianza comrín d. Si escribimos

. .

dependientes distribuidas normalmente, que tienen (medias igual a .cero y varianza común uz. Las hipótesis que hemos hecho están ilustradas en lit figura 12.3, en la que se ven las distribuciones, de valores de yi para varios valores de x;. Notemos que estas ,hipótesis adicionales se necesitan para analizar 'la bondad de las predicciones a n base' en las ecuaciones de mínimos cuadrados, las prop.iedades de a y b como estimaciones de a p, etc., y no fueron necesarias para obtener las estimaciones ori- ginales basadas en el método de mínimos cuadrados.

Antes de establecer un teorema referente a la distribución de los estimadores de mínimos. cuadrados de a y p, es conveniente introducir una notación especial. Lis'expresiones siguientes, correspondientes a los valores de las muestras (XI, yi); se encbentran'tan frecuentemente que es conveniente éscribirlas en la forma "

Page 224: ingenieria

21 6

+ AJUSTE DE CURVAS

+

Empleando esta notación, el lector deberá mostrar, en el ejercicio 15 de la pbgina 223, que

a = - b.z Y b = SZ,/S,,

Fig. 12.3 Suposiciones del teorema 12.1

donde a y b son la solución de las dos ecuaciones normales de la página 214, y z e ij son, respectivamente, las medias de las xi y las yG Nótese, también, la cercana re- lación entre S,, y S,,, respectivamente, y las varianzas de las muestras de las Xi y las yi; pues, S: = S,, /n(n - 1) y sf = S,, / n (n - I), y en algunis ocasiones usaremos esta otra notación.

La varianza u2, definida en la pagina 215, se estima usualmente en función de las desviaciones verticales de los puntos de las muestras de la linea, de rninimos cuadrados. La i-ésima desviación de este tipo es yt - y'i = yi - (a -f- hxi) y la estimación de u* es

donde se' es tradicionalmente designado como error típiccg de estimacicin. Una fórmu- la equivalente para esta estimación de 8 , que es más conveniente en las aplicqcio- nes, es

+ +

Page 225: ingenieria
Page 226: ingenieria

21 8 AJUSTE DE C U R V A S

(248,400)(8,343.76) - (42,618.0)' = 12.90 2 = (10)(8)(2&8,400) Como es igual a 2.306 para 10-2 = 8 grados de libertad, obtenemos los siguien- tes intervalos de confianza a un nivel de 0.95 para (Y y p :

6 -3.32 < a < 7.12

Y 0.17 f (2.306)(3.59) d z i 6 0.12 < p < 0.22

Los resultados del teorema 12.1 se pueden utilizar también para establecer cri- terios de test de hipótesis referentes a a y p. En este sentido, el parámetro /3 es de especial importancia, ya que representa la pendiente de la línea de regresión, esto es, nos da el cambio en la media de y correspóndiente al incremento en una unidad de x. Si p = O, la línea de regresión es horizontal y la media de y no depende lineal- mente de x.

Para contrastar la hipótesis nula H,,: p = Po, podemos usar el segundo eStadís- tic0 t del teorema 12.1, o sea,

y las regiones críticas resultantes son las siguientes:

REGIONES CRITICAS PARA PROBAR H,: fl = Bo

donde ta se obtiene en la tabla IV, con n - 2 grados de libertad. Para ilustrar esta clase de tests, vamos a probar la-importancia de la regresión

lineal (dependencia lineal) del espesor de óxido en el tiempo de calentamiento, ba- sando nuestros cálculos en los datos dados en la página 204. La hipótesis nula a contrastar es H,: /3 = O y la alternativa adecuada es H,: /3 # O. Utilizando los cálculos de la página 234, obtenemos

t = 3.59

Page 227: ingenieria

INFERENCIAS. BASADAS EN LOS ESTIMADORES DE MlNlMOS CUADRADOS 21 9

y, como esto excede a 2.306; valor de t.025 para 8 grados de libertad, podemos re- chazar la hipótesis nula a un nivel de significación de 0.05. En otras palabras Ile- gamos a la conclusión de que existe una relación entre el tiempo de calentamiento y el espesor promedio de óxido.

Otro problema, estrechamente relacionado al de estimar los coeficientes de re- gresión a y p , es el de estimar CY + px, o sea, la media de la distribución de las y para un valor dado de x. Si x permanece fijo en xo, la cantidad que queremos esti- mar es a + J3 x. y es razonable utilizar a + bxo, donde a y b son, nuevamente, los valores obtenidos por el método de los minimos cuadrados. Efectivamente, po- demos demostrar que este estimador es insesgado, tiene la varianza

+ donde se obtiene de la tabla IV, con n - 2 grados de libertad.

De importancia, aún mayor que la estimación de LY + fix(,, es, en general, la prediccio'n de y', un valor futuro de y cuando x = xo. Por ejemplo, aunque en el experimento sobre los espesores de óxido no se consideraba un tiempo de calenta- miento de 80 minutos, es importante predecir cuál será el espesor de óxido en este tiempo. En la página 215, obtuvimos una.estimación de 15.5 para este espesor, subs- tituyendo x = 80 en la ecuación de la recta de mínimos cuadrados. Construiremos, ahora, un intervalo en el que se puede esperar que y se encuentre, con una proba- bilidad dada, cuando x = xu. Si se conocieran CY y p, podríamos emplear el hecho de que y es un valor de una variable aleatoria que tiene distribución normal, con media CY + pxo y varianza u* (o que y - (Y - pro es un valor de una varia- ble aleatoria que tiene distribución normal con media igual a cero y varianza d ) . Sin embargo, si CY y /3 no se conocen debemos considerar la cantidad y -a - bxo, donde y, a y b son valores de variables aleatorias, la teorla nos da los siguientes li- mites de prediccio'n para y cuando x = xo:

+ + donde, una vez más, el número de grados de libertad de tu,% es n - 2.

Para ilustrar la construcción de límites de confianza para CY + px0 y límites le predicción para un valor futuro de y, nos referimos nuevamente a los espesores le óxfdo de nuestro ejemplo numérico. Cuando x = 80, podemos escribir los lí- nites de confianza a un nivel de 0.95 para a + 80 p en la forma

15.5 -f (2.306)(3.59) 8 248,400

k donde 12.9 < a + 800 < 18.1

Page 228: ingenieria

220 AJUSTE DE CURVAS

Igualmente, los limites de predicción a un nivel de 0.95 para un valor futuro de y cuando x = 80, están dados por

15.5 f (2.306)(3.59) dl + $ + 248,400 (10)(80 - 86)'

. . 6 15.5 rt 8.7.

N6tese que, aunque la media de la distribución de las Y cuando x = 80. se puede estimar con bastante aproximación, el valor de una observación futura, no se puede predecir con buena precisión. Obsérvese de la frirnlula de los límites de predicción, que, cuando n "+ co , la amplitud del intervalo no se aproxima a cero. La amplitud límite depender6 de se, que expresa la variabilidad inherente de los datos. Aún más, notemos que, si se quiere'exfrupular, esto es, predecir un valor fu- turo de y' correspondiente a un valor de x fuera del recorrido de las observaciones, los límites de predicción '(y también los límites de confianza de a + Px) se vuelven progresivamente más anchos. Por ejemplo, los límites de predicción a un nivel de 0.95 para y' correspondientes a x = 240 minutos están dados por

42:7 f (2.306)(3.59) 1 + lo + 248,400 1 (10)(240 - 86)2

6 42.7 t 11.8. En otras palabras, podemos afirmar, con una probabilidad de 0.95, que el espesor de óxido en una pieza calentada durante 240 minutos, cae entre 30.9 y 54.5 Angstroms. Pobre como es, esta predicción se basa en I$ hipótesis de que la verdadera regresión es lineal aim si salimos fuera del recorrido de las obser- vaciones.

€JERCICIOS

1. La tabla siguiente muestra los resultados de,las medidas de resistividades eléctricas en ohm-cm.10-6 del platino a diferentes temperaturas, en grados Kelvin.

Temperatura, x 1 0 0

Hesistividad, y 4.1 8.0 12.6 16.3 19.4 I 200 300 400 500'

(a ) Suponiendo que la regresión de y sobre x es de la forma y = (Y + px. hallar las ecuaciones normales para estimar los parámetros (y y p y resolverlas para u y b

h ) Hacer la gráfica de los datos y dibujar la recta obtenida en (a) en el mismo sistema de coordenadas. ¿,Cuál es su estimación de la resistividad det platino cuando SU tem- peratura es 350"K?

2. Resolviendo las ecuaciones normales de la página 230 en su forma simbólica, depostrar que

Page 229: ingenieria

(Los indices y límites de sumación se. han omitido por simplicidad.) Usar estas f6rmu- las para verificar los resultados obtenidos en la parte (a) del problema 1.

3. En la tabla siguiente, x es la fuerza de tensión aplicada a una probeta de acero en miles de libras, e y es la elongación resultante en milésimas de pulgada. Suponiendo que la re- gresión de y sobre x, es lineal, calcular los pathmetros de la línea de regresión y cons- truir un intervalo de. confianza a un nivel de 0.95 para p, elongación de la probeta, por miles de libras del esfuerzo de tensión.

1 2 3 4 5 6

y 15 35 41 63 77 84 5 1

4. 'Un estudiante obtuvo los siguientes datos sobre la cantidad de bromuro de potasio, y , que se puede disolver en 100 gramos de agua a distintas temperaturas, x.

x ?PC) 1 O 10 20 30 40 50

y-(gramos) 1 52 60 64 73 76 81

(a), Calcular (y y p , coeficientes de las l i m a de regresión de y sobre x. (b) Probar la ,hipótesis.nula @, = 0.5, a un nivel de significación de 0.05. El costo de fabricación de un lote de cigrto producto depende del tamaño del lote, como se muestra en la tabla siguiente;

Costo (dólares), 30 80 130 270 520 1050 6025

Tamafio del lote 1 1 5 10 50 , 100 250 600

Ajustar a estos datos una recta por,el mktodo de mínimos cuadrados empleando los ta- mafios de lote como variable independiente. Encontrar, tambidn, un intervalo de con- fianza a un nivel de 0.90 para a, que en este caso se puede interpretar como el costo general fijo de la fabricación. El material crudo usado en la producción de 'una fibra sintktica se almacena en un lu- gar que no tiene control de humedad. Las medidas de la humedad relativa en el alma- c8n y del contenido de humedad de. una muestra del material crudo (ambas en porcen- tajes) en 12 días, dio los siguientes resultados:

X Y Humedad Contenido de humedad

43 I. 12 35 8 51 14 47, 9 46 11 62 16 32 7 . 36 9 41 12 ,39 10 53 13 48 11

Page 230: ingenieria

222 AJUSTE DE CURVAS

( a ) Calcular y p, coeficientes de:regresiÓn de la recta de y sobre x. ( b ) Hallar un intervalo de confianza a un nivel de 0.99 para el contenido medio de. hu-

medad en el material crudo cuando la humedad del almacén es 40% . (c) Hallar límites de predicción a un nivel de 0‘95 para el contenido de humedad del

material crudo cuando la humedad relativa del lugar de almacenamiento es 40%. ( d ) Con respecto al.inciso (c), indicar en que medida la amplitud del intervalo queda

afectada por el tamaño de la muestra, en que medida queda afectado por ,¡a variabi- lidad inherente a los datos.

7. Con respecto a los datos del problema 3, (a) Hallar un intcrvalo de confianza a un nivel de 0.95 para la media de la distribución

de las y cuando x = 3.5. (b) Expresar los límites de confianza a un nivel de 0.95 para la media de la distribu-

ción de las y en función de x,,, dibujar la gráfica de la recta de regresión estimada y eligiendo valores convenientes de xu, trazar la poligonal que une 10s puntos fija- dos por los limites superiores de confianza, así como la que une 10s límites infer¡@ res, en el mismo sistema de coordenadas Nbtese que, las “bandas de confianza” obtenidas, no dan intervalos de confianza para la recta misma, Y tales bandas S510 deben emplearse en relación con algún valor fijo xn.)

8. Con referencia a los datos del ejercicio 4, expresar límites de predicacijn a un nivel de 0.95, para la cantidad de bromuro de potasio que se disolverá en 100 gramos de agua en función de 2,; éscogiendo valores convenientes de xn dibujar las gráficas de las Poli- gonales que unen los puntos fijados por los límites inferiores de predicción,’ así como la que une a los limites infériores, en el m h o sistema de coordenadas. (Nótese, que como en el ejercicio 7, tales bandas d l o deben emplearse en relación con a l g h Valor fijo de xo).

9. En el ejercicio 3, es completamente razonable imponer la condición de que no habra elon- gación cuando no haya ninguna fuerza de tensión aplicada. ( a ) Empleando el mCtodo de mínimos cuadrados, obtener una fbr&<la para ‘estimar p

cuando la línea de regresión tiene la forma y = px. (b) Utilizando los datos del ejercicio 3 .y la fórmula obtenida en (a) , estimar p y com-

parar el resultado con la estimación’ obtenida anteriormente, sin la condición de que la recta deba pasar por el origen.

10. En el ejercicio 4, supongamos que se conoce que, a 10 grados centígrados, se disuelven 60 gramos de bromuro de potasio ea 100 gramos de agua . ( a ) Empleando el método de mínimos cuadrados, obtener una fórmula para calcular p

cuando la línea de regresión tiene la forma y = 60 + p (x - lo), esto es, cuando se supone que la línea pasa por el punto (10, 60) .

(b) Utilizando los datos del ejercicio 4 y la fhrmula obtenida en (a) , calcular p y com- parar el resultado con el obtenido anteriormente sin la condición de que la recta pase por el punto (10, 60)

11. Con los datos del problema 5, ajustar una recta, utilizando cl costo como variable inde- pendiente. Dibujar la línea resultante y la que se obtuvo en el problema 5, sobre el mismo sistema de coordenadas y nbtese que las dos líneas de regresibn no coinciden,

12. Cuando la suma de los valores x es igual a cero, el cálculo de los coeficientes de la línea de regresión de y sobre x se simplifica; de hecho, sus estimaciones están dadas por

Esta simplificaci6n se puede obtener también cuando las x están igudrnente espaciadas, esto es, cuando están en progresión aritmética. Entonces, podemos “codificar” los datos, substituyendo los valores de x por los números.. ., ”2 , -1, O, 1, 2, . . ., cuando 72 es

Page 231: ingenieria

REGRESION CURVILINEA 223

impar, o por los números.. ., -3, -1, 1, 3,. . ., cuando n' es par. Las- fórmulas' ante; riores se utilizan, entonces, de acuerdo con los datos codificados. (a ) Usar esta técnica para ajustar una línea de tendencia de mínimos cuadrados, para

los siguientes datos de las utilidades de una compaaía, en millones de dólares:

X 21 Año Vtilidbdes

1957 , . . ,. . 6.7 1958 7.5 1959 a3

1961 11.1 1982 12.5 1963 14.6

1960 10:2 .~ . I

(b) Utilizar los resultados obtenidos en (a) para estimar las utilidades de la. cympañía en 1965.

13. Utilizando las fórmulas obten'idas en el problema k( demostrar que (a) La expresión de a es lineal en las yi; 3 .

(b ) a es una estimación insesgada de (Y. ( a ) La expresión de b es lineal en las yi) (b) b es una estimacibn insesgada de P nea de regresión de y sobre x se pueden escribir en la forma

14. Emplear las fórmulas obtenidas en el problema 2 para demostrar que

15. Demostrar que las estimaciones de rninimos cuadrados de los coeficientes de la lí-

a = B - b.Z y ' b = S,,/S,, ' .. .

.12.3 'Regresibn curvilínea

Hasta ahora, hemos estudiado únicamente el caso en que la curva de regresión de y sobre x es una recta, es decir que para cualquier x dado, la media de la distri- bución de las y está dada por (Y + px. En esta sección, investigaremos primero los casos en que la curva de regresión no es rectilínea, pero en que, sin embargo, se pueden aplicar los métodos de la sección 12.1; luego, estudiaremos el caso de re- gresiones polinómicas,,esto es, de problemas donde, para cualquier x dada, la media de la distribución de las y está dado por Po + plx + &x' + . . . + &xP. Esta úl- tima técnica se usa también para obtener aproximaciones cuando la forma funcional de la curva de regresión es desconocida.

' ' .Es práctica común, entre ingenieros, marcar en papel gráfico datos apareados de diversas clases, con objeto de determinar si los puntos siguen más o menos una línea recta, 'tomando unas convenientks escalas transformadas. Si así ocurre, la na- turaleza de la transformaci6n utilizada nos conduce a la forma funcional de las ecua- ziones de regresión, y las constantes (parámetros) necesarias se pueden determinar 3plicando el método de la sección -12.1 a los datos transformados. Si un conjunto de datos apareados consistente en n puntos (xi, yi) "se sitúan en línea recta" al ser narcados en un papel semilogarítmico, por ejerpplo. esto indica que la curva de re-

Page 232: ingenieria

224 AJUSTE DE CURVAS

gresión de y sobre x es exponencial, es decir, que, para cualquier x dada, la media de la distribución de las y esta dada por a.p. Tomando logaritmos en base 10 en ambos lados de la ecuación de predicción*,

obtenemos l o g y ‘ = l o g a + x + logs

y podemos, ahora, obtener estimaciones de log a y log p y, por consiguente, de a y p, aplicando el método de la, sección 12.1 a los n pares de valores (xi, log yi).

Para ilustrar este ~ l t imo ajuste por minimos cuadrados de log a y log p en una curva exponencial, consideremos las observaciones siguientes de los pesos de 8 pro- betas de metal expuestas a una atmósfera corrosiva por diferentes periodos:

y’ = a-p”

y, Peso (gramos) 92.7 58.3 59.5 41.7 45.6 31.8 38.3 19.9

x, Tiempo,de exposición (días) 5 10 15 20 25 30 35 40 AI marcar los datos en papel semilogarítmico como en la figura 12.4, observamos aue los puntos siguen aproximadamente una línea recta, y que, por consiguiente, es

Y

Fig. 12.4 Regresión exponencial

justificable ajustar una curva exponencial a los datos originales. Determinando pri- mero los logaritmos de las ocho y , obtenemos, respectivamente, 1.967, 1.766, 1.775, 1.620, 1.659, 1.502, 1.583, 1.299, y las sumas necesarias para substituir en las ecua- ciones normales son

L: x = 180, 2 z2 = 5100

I: log y = 13.171 I: x - log y = 280.420

* Se puede emplear otra base cualquiera.

Page 233: ingenieria

REGRESION CURVILINEA 225

donde los indices y limites de las suhas' se,'had''ornitido por dmplicidad. Usando, nuevámente, a -y b pdfa istimar 'los infnimos cuadrados de a y p, obtenemos i a s ecuaciones normales

13.171 ,F ,8(bg a) + 180flog b ) 280.420 = 18O(log a) + 51oo(bg b) '

y, resolviendo 'este 'sistema, tefiemos . .. I

'. e .

log a = 1.986, log b = -0.0151

Luego, a = 96.8, b = 0.966, y la curva exponeneial de mhimos cuadrados tiene la ecuación

v' ,= (96.8)(Q966)z , ,

Esta <$m$ ecui6ón se puede escridir también en la forma , .

, . y' (96.8)10-0.0151~ 6 '.' y' '= (96,8)e--0.034&

haciendo uso de que 0.966 = 10-0.0151 = e--0.0346.

Si quei-emos basar una predicción en una ecuación exponenkial ajustada a un conjunto de datos, será, en general, más conveniente utilizarla en su forma logarit- mica. Entonces, si querekiis predecir el peso de una probeta expuesta a una atm6s- fera corrosiva durante 12 días, en nuestro ejemplo tenemos

log y = 1.986 - 0.0151(12) ~= 1.805' L 1

y por lo tanto, el peso es de 6f8 gramos. Otras dos tipos de relaciones que aparecen frecuentemente en ingenieria y que

se pueden ajustar por el método de la sección. 12.1, después de tra&,formaciones con-

venientes, son la funciún recíproca dada por y' == - , y la funcicjn potencial f f .+ @x

puntos (xi, ]/y¿) . La segunda representa una relación. lineal entre log x y log y', es, decir,

log y' = log a 3. 0 * log x y,obtenernos estimacieneide jog cy y log /3 y, por condguiente, de CY y p, aplicando el método de k secci6n 12.1 a los puntos (log Xi, log $ i ) . En.los 'ejercicios 6 y 7 de la páginh 233 se dad~ejernp'6s.de otras curvas que se pueden ajustar por el métodoi de mínimos cuadrados después de una transformacidn .conveniente.

Si no hay una clara indicación sobre la fdrma funcional de la regreSi6n de y sobre x) 'se puede suponer con. frecuencia, que la relación 'al menos, "se'.comporta bien" en el sentido dd que se puede dekarrollai- en serie de Taybr y que los primeros

Page 234: ingenieria

226 AJUSTE DE CURVAS

términos de esta serie darán una buena aproximación. Entonces, podemos ajustar nuestros datos a un polinomio, esto es, a una ecuación de predicción de la forma

Y‘ = Po + P l X + P2x2 + . . . + Ppz’ donde se determina el grado, por inspección de los datos o por métodos más “cientí- ficos” que se discutirán más adelante.

Dado un conjunto de datos consistente en n puntos (xi, yi), estimamos los coe- ficientes Po PI Pz . . . P p , del polinomio de grado p haciendo mínima

n

i = l I: EYi - (Po + P l X i + PS? + - . + B+f>12

En otras palabras, aplicamos el criterio de mínimos cuadrados para hacer mínima la suma de los cuadrados de las distancias verticales desde los puntos a la curva (Figura 12.5). Derivando parcialmente con respecto a Po, PI, . . , PP. e igualando

Y

Fig. 12.5 Criterio de mínimos cuadrados para polinomios

estas derivadas a cero, reordenando algunos términos y considerando bi como es- timación de Pi, obtenemos las p + 1 ecuaciones normales

6

I: y = nbo + b l Z x +. . . + bpZxP

Z XY = bo Z X + bl I: X 2 + . . . + bp Z: xP+’Q ........................................ 2; X P ~ = bo Z XP + BIZ X P + ~ + . . . + b p I: x 2 P

6

donde los indices y límites de las sumas se han omitido por simplicidad. Notemos que e i e es, un sistema de p + 1 ecuaciones lineales, con p + 1 incognitas, bo, bl, . . . b,. A menos que la selección de los valores de x sea muy extraña, este sistema de ecuaciones tendrá una solución (mica.

Para ilustrar .el ajuste de un polimonio por el método de mínimos cuadra- dos, ajustaremos un polinomio cuadrático (de segundo grado) a los datos siguientes, que relacionan el tiempo de secado de un barniz con el aumento de.cierto aditivo:

Page 235: ingenieria

REGRESION CURVILINEA 227

X Y Cantidad de adi- Tiempo de secado

tivo al barniz (gramos) (horas)

O 1 2 3 4 5 6 7 8

12.0 10.5 10.0 8.0 7.0 si0 7.5 8.5 9.0

La inspección de los datos de la figura 12.6 indica que podemos obtener un buen ajuste con un polinomio de segundo grado ya que tiene un mínimo relativo. Calcu-

Y

6-

Fig. 12.6 Curva de regresih polinómica

laremos primero las sumas necesarias para substiNir en las ecua'ciones normales, con' lo que obtendremos

'Z X =' 36,. Z x2 = 204, Z x3 = 1296, Z X' = 8772 Z y = 80.5, 2 xy = 299,!0, x2y = 1697.0

y tendremos que resolver el siguiente sistema de tres ecuaciones lineales con tres in. cognitas:

80.5 = 9bo + 36b1 + 204b2 299.0 = 36bo + 204b1.+ 1296b2 . ..

1697.0 = 2kbO + 129631 + 8772b2 Obteniendo bo = 12.2, dl = - 1.85,' Y b, = 0.183, encontramos que la ecuación del polinomio de mínimos cuadrados es . . .

y' = 12.2 - l . 8 5 ~ + 0 . 1 8 3 ~ ~

La gráfica de esta ecuación se muestra también en la'figura 12.6.

Page 236: ingenieria

228 AJUSTE DE CURVAS

Habiendo obtenido esta ecuación, podemos emplearla ahora para predecir el tiempo de secado cuando la cantidad de aditivo .es des 6.5 gramos. SubstituyendG x = 6.5 en la ecuación, obtenemos

y’ = 12.2 - 1.85(6.5) + 0.183(6.5)* = 7.9

esto es, la predicción es de un tiempo de secado de aproximadamente 7.9 horas. Notemos que sería más peligroso usar la ecuación anterior para predecir, por ejem- plo, el tiempo de secado correspondiente a 24.5 gramos de aditivo. El riesgo inheren- te a la extrapolación, discutido en la página 220, en relación con rectas de ajuste, aumenta considerablemente cuando se emplean polinomios para aproximar fun- ciones de regresión desconocidas.

.En.la pr,áctica, es difícil determinar e l grado del polinomio que se va a ajustar para un conjunto dado de datos apareados.. Como siempre es posible encontrar un polinomio de grado n - 1 a lo más, que pase por los n puntos correspondientes a los n valores de x, debemos aclarar que lo que buscamos es un polinomio del me- nor grado posible que describa los datos “adecuadamente”. Como hicimos en nues- tro ejemplo, con frecuencia es posible determinar el grado del polinomio por ins- pección de los datos.

Existe un mCtodp más riguroso para determinar el grado de un polinomio que ajuste los datos. Esencialmente, .con>ist.e en ajustar, primeramente, una recta y un polinomio de segundo grado y contrastar la hipótesis nula p. = O, o sea, la hipóte

. sis de que nada se gana incluyendo el término cuadrático. Si se puede rechazar esta hipótesis nula, ajustamos un polinomio de tercer grado y contrastamos la hipótesis

= O, o sea, de que nada se gana incluyendo el término cbbico., Se continúa este proceso hasta w e no sea posi4.e rechazar la hipótesis nula.Bj .= O en dos pasos SU-

cesivos y, por lo tanto, no haya ventaja evidente en tener términos extras. Nótese que, para hacer esta prueba, es necesario imponer la suposición de normalidad, inde- pendencia e igualdad de varianzas, introducida en la sección 12.2. Además, estos tests no deben usarse n u q a “a ciegas”, es decir, sin una inspección general d e los datos.

El empleo de esta técnica es sumamente tedioso y no lo ilustraremos aquí. En el ejercicio 10 de ]a página 234 deberá aplicarlo el lector a1“tiempo de secado del aditi- vo del barniz para‘ comprobar’ s’i’ cortvieite el término cuadrático. (Si 10s Valores de x.se encuentran igualmente espaciados, es posible simplificar 10s CáhdOS utili- zando polinomios ortogonah, como se explica en el libro de R. L. Anderson Y T. A. Bancroft, citado en la bibliografía.)

12.4 Regresi6n múlhplk

Antes de extender los métodos de las Secciones precedent? a problemas de más de una varyable independiente, apuntaremos que las curvas obteñidas (y las superfi- cies que obtendremos) no sólo se usan para hacer predicciones. También se pue- den emplear en los problemas de optimizucitin, eri los que se trata de determinar 10s valores de la variable independiente (o variables) que dan un máximo 0 Un mínimo

. .

Page 237: ingenieria

REGRESION MULTIPLE 2B9

de.la.variable dependiente. Por ejemplo, en el ejercicio de la pagina 234, podemos utilizar el polinomio ajustado a los datos para llegar 8 la conclusi6n de que el tiempo minimo de s&ado se obtiene cuando la Cantidad deiaditivo es de 5.1 gramos (ver problema 11 de la pagina 227).

Los mttodos estadísticos de predicci6n y optiimización se agrupan frecuente- mente bajo el nombre de análisis de seperficies de respuesta. En el desarrollo de

Y

Fig. 12.7 Regresión lineal m6ltiple ~'

este texto, introduciremos dos métodos más de anhlisis de superficies de respues- ta: la regresión múltiple en esta sección y los problemas de experimentución factorial en el capitulo 14.

En el mktodo de regresión múltiple, tratamos con datos consistentes en n, (r + 1)-tuples (xl{, X2i. ;. . xri, yi), donde se supone que las x se conocen sin error, mientras que las y son vaIores de variables aleatorias. Se encuentran datos de esta clase, por ejemplo, en estudios para determinar el efecto de varias condiciones cli- máticas en la resistencia a la corrosión de,un metal; el efectp de la temperatura del horno, la humedad y el .contenido de hierro en la resistencia de un recubrimiento cerámico; o el efecto de la producción fabril, el nivel de consumo y las existencias en almacén en el precio de su producto.

Como en el caso de una variable independiente, comenzaremos por tratar el problema en el que la ecuación de regresión es lineal, es decir, si para un con- junto dado de valores xl, . . .xr la media de la distribución de las y esta dado por >

. .., ,: s o + BlSl + BnSz + * . . + ,@a7 '^

L

Para dos variables independientes, este problema de ajustar un plano a un conjunto de n puntos de coordenadas (zli, zab y<) esta ilustrado en la figura 12.7 :

Page 238: ingenieria

239 AJUSTE DE CURVAS

Aplicando el' método de mínimos cuadrados para obtener estimaciones de los coe- ficientes pot y p2, hacemos mínima la suma de los cuadrados de las distancias ver- ticales de los puntos al plano (Fig. 12.7) ; es decir, se trata de hacer mínima

y las ecuaciones normales resultantes, como podrá verificar el lector en el proble- ma 12 de la página 234, son:

+ +

Como antes, designamos los valores estimados por mínimos cuadrados de Po, pl, y p. por bo, bl y h . Nótese que en la notación abreviada empleamos Cxl para 2

zli, Z xlxz para. Z zlixziJ Z: ZIY y para Z sliyi, etc. Para ilustrar este método de ajuste de un plano a un conjunto, de datos, consi-

deremos los datos siguientes correspondientes a el número de dobleces necesarios para quebrar una aleación forjada en relación al porcentaje de cada uno de los dos elementos aleados preseotes en el material.

n

n n i = l

i-1 i = l

2/ x1 X2 Números de Por ciento del Por ciento del

dobleces elemento A elemento B

38 40 85 59 40 60 '

68 53 31 35 42 59 ', '

18 34 29 42

Substituyendo

1 5 ' 2 S 3, 5 4 5 1 10 2 10 3 10 4 10 1 15 2 15 3 15 4 15 1 20 2 20 3 20 4 20

Page 239: ingenieria

REGRESION MULTIPLE 231

733 = 1 6 b o + 40bl+ 200bz 1989 = 40bo + 120bl + 500bz 8285 = 200bo + Mob1 + 3000be

La ímica solución de este sistema de ecuaciones es bo = 48.2, b, = 7.83, bz = -1.76, y podemos estimar (predecirj el número de doblados necesarios para romper la pieza por medio de la ecuación:

y' = 48.2 + 7.8321 - 1;70~2

para cualquier par dado de valores de x1 y x2. Nótese que b, y b.) son estimaciones del cambio promedio de y resuItantes de un incremento unidad en la variable inde- pediente corréspondiente cuando la otra variable independiente pe&anece fija.

Cuando un problema de regresión consta de varias variables y '(6) el ajuste es de polinomios, los cálculos necesarios pu'eden resultar muy tediosos. Sin embargo, si los valores de,las pariables independientes se pueden tomar convenigtevente, es posi- ble lograr considerables simplificaciones utilizando espacios agFopiados y una codi- ficación (semejante a la usada en el ejerciciQ.8 'de la página.234). Observemos que, en el ejemplo precedente, las x1 y las xz están igualmente espaciadas y, por consi- guiente, cada valor (nivel) de x1 se'presenta una sola vez en combinación. de cada valor (nivel) de xa. Esta disposición hace posible reducir el trabajo para obtener y resolver las ecuaciones normales. Codificando los valores de x1 y x? con "3, -1, 1, y 3,'y llamándolos zl y z., podemos escribir los datos originales en la forma: . ,

Y ' '21 ' 2 9

38 ' -3 -3 40 -1 - -3 86 1 . ' j , r 3

40 -3 60 -1 -1 68 1 -1 53 : -1 31 -3 1 35. -1 1 42 1 1 59 3 1 18 -3 3 34 -1 3 29 . 1 3 42 3 3

59 3 . -3 2

- A

1 . I

Ahora obtenemos

y las ecuaciones normales son

Page 240: ingenieria

232 AJUSTE DE CURVAS

733 = 16bo

313 = 80bl "351 = Sobs

Entonces, en función de estas variables codificadas tenemos

y' = 45.8 + 3.9121 - 4.3922

y el lector deberá probar, en el ejercicio 15 de la página 236, que (excepto por erro- res de redondeo) este resultado es equivalente al obtenido anteriormente.

La misma codificación habria originado aún mayores.'simplificaciones si hu6ié- ramós querido ajustar un polinomio de segundo grado a nuestros datos,+es decir, si hubiéramos usado:una ecuación . ' , de la forma

y' = 0 0 + plzl + '82x2 + p3xlX2 -k b4d 3- Sin codificacionib d- método de mínim6s cuadrados hubiera originado un sistema de ecuaciones normales fprmadó' 'por .seis ecuaciones simultaneas y seis incógnitas. Como el lector deberá'verificar en el problema 16 de la página 236, la misma codifi- cación utilizada antes reduce el problema, esencíalmente, al de resolver tres ecuacio- nes Iinedes simultáneas con tres incbgnitas.

El. ejemplo de esta sección sirve para ilustrar cómo una lección Cuihadosa ,de las variables independientes puede simplificar los cálculos en un problema de regre- si6n múltiple. Los principios y procedimientos para hacer esta selección, sien;@re que sea posible, son parte del importante tema denominado diseco de experimentos. En el capítulo 13 consideremos algunos de los simples, pero ampliamente usados. dise- ños de experimentos. Enfocaremos nuestra atención en lo que se llama andisis de la varianza, donde se hacen tests referentes al significado de los efectos de ciertas combinaciones de niveles de las variables independientes. En el capítulo 14 introdu- ciremos el problema de experin~entacicin factorial.

EJERCICIOS

1. En la tabla siguiente, y es la presión barométrica medida a la altura x sobre el nivel del. mar:

(pulgadas)

2. Los datos siguientes pertenecen a la cantidad de una substancia que permanece en un 2/ = (y. e-Bz. Usar el metodo de mínimos cuadrados para ajustar una curva exponencia1 de ]a forma

O 500 1000 1500 2OOO z (p ies )

29.9 29.4 29.0 28.4 27.7

sistema químico en reacción después de x minutos:

y (gramos) 1 96 75 63 30 9 2

Page 241: ingenieria

REGRESiON MULTIPLE 233

(a) Dibujar los datos en papel semilogarítmico y usar el método de mínimos cuadra-

(b) Utilizar el resultado obtenido en la parte( a) para estimar qué cantidad de substan-

3. Se hizo una experiencia en la que cinco grupos diferentes de ratas se mantuvieron con una dieta deficiente en vitamina A, y después se dieron raciones suplementarias de esta vitamina en forma de aceite de hígado de bacalao. La dosis de aceite de hígado de baca- lao dada a cada grupo de ratas, y el aumento de peso medio correspondiente, fue el si- guiente:

dos para ajustar una curva exponencial de la forma y = a.P.

cia permanecerá después de 8 minutos.

Dosis (mg) 1 . 0.25 1 .o0 1.50 2.50 7.50

Aumento de peso ( g ) ] -10.8 13.5 16.4 28.7 51.3

(a) Dibujar estos datos de los dos modos siguientes: usando papel ordinario (aritmético), y usando papel gdfico semilogarítmico, marcando las dosis en la escala logaritmica.

(b) Ajustar una,curva de la forma y = (y + P log x, donde x representa la dosis e y el aumento de peso correspondiente.

4. La concentración iónica n, que permanece en un gas después de extraer el agente ioni- zante está dada por

n=-

donde no es la concentración inicial de iones y (Y es una constante llamada “cwficiente de recombinación”. En un experimento para determinar a, se ioniza un gas por rayos X y se obtiene la siguiente información:

no 1 +nocrt

n.10-4 I 5.03 4.71 4.40 3.97 3.88 3.62 3.30 3.15 3.08 2.92 2.70

t ( s e g ) ( O 1 2 3 4 5 6 7 8 9 10

Utilizando estos datos, estimar (Y y no por el método de mínimos cuadrados. ¿Porque es preferible emplear las estimaciones de mínimos cuadrados de no obtenidas en lugar

del valor observado de 5.03? Hacer una gráfica de los datos y de la curva de ajuste. 5. En un experimento para determinar la razón de ca1oi.s específicos 7 de cierto gas, este

se comprimió adiaháticamente hasta determinados vohímenes especificados I/ y se midi6 la presión correspondiente p con los siguientes resultados:

p (Zblin.3 1 16.8 39.7 78.6 115.5 195.0 546.1

v (in.’) I 50 30 u) 15 10 5

Suponiendo que el gas sigue la ley de los gases ideales p . V y = C, usar estos datos para:

(b) construir un intervalo de confianza p un nivel de 0.95 para (Indicar qué hipb- . (a) estimar el valor de y de este gas,

tesis se deben hacer). 6. Ajustar una curva Gompertz de la forma

y E @-+8

a 10s datos del problema 2 y comparar el ajuste con el de la curva exponencial obtenida en la parte (a) del ejercicio 2.

7. El aumento de corriente en un circuito inductivo que tiene tiempo constante T esth dado Por

I 1 - e - l / r

Page 242: ingenieria

234 AJUSTE DE CURVAS

donde t es el tiempo medido desde el instante en que se cierra el circuito, e Z es la razón de la corriente, en el instante, al valor total de la corriente dado por la ley de Ohm.

Dadas las medidas

I 1 0.110 0.330 0.450 0.555 0.630 0.700 0.775 0.865

t (seg) I 0.2 0.4 0.6' 0.8 1.0 1.2 1.5 2.0

8. Los valores siguientes muestran el consumo de tabaco por persona (en libras) en los Es- estimar T . [Sugerencia: ver el. el ejercicio 9 de la página 221.1

tados Unidos durante el período de 25 años de 1931 a 1955:

Aiio Consumo Consumo

1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943

8.4 7.6 7.8 8.3 8.2 8.8 9.0 8.8 8.8 9.1 9.8

10.7 11.5

1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955

11.2 12.5 12.2 12.0 12.1 11.9 12.0 12.5 12.9 12.9 12.2 12.3

Codificando con 10s años -12, -1 1,. . ., 11 y 12, ajustar una tendencia parabólica a estos datos.

9. Las siguientes son las medidas de la elevación de una carretera sin curvas (pero monta- ñosa) sobre un punto de referencia situado en la carretera; estas medidas. se hicieron a distancias horizontales crecientes a lo largo de la carretera desde el punto de referencia:

' Elevación (pies)

Distancia (100 pies)

O 6 12 19 16 9 10 11 15 20

0 1 2 3 4 5 6 7 8 9

(a ) Dibujar este conjunto de datos y determinar, por inspección, el grado del polinomio que describe adecuadamente la elevación de la carretera en función de la distancia.

( b ) Ajustar el polinomio a los datos y emplear los resultados para estimar la localiza- ción de la cima de la montaña y la parte más baja de esta carretera.

10. AI ajustar un polinomio a un conjunto' de' datos apareados, comenzamos, usualmente, por ajustar una línea recta y, usando el método de la página 218, probamos la hip6tesis nula

= O. A continuacih , ajustamos un polinomio de segundb grado y probando si es mnveniente tener un término cuadrático, comparando a:, la varianfa residual después de ajustar la recta, con cis, la varianza residual después de ajustar el polinomio de se- gundo grado. Cada una de estas varianzas residuales estri dada por la fórmula:

2 (y - y')2

grados de libertad

con y e y' tomadas, respectivamente, de la ecuación de la recta y de la ecuación de se- gundo grado. La decisión de si se ha de tomar el término cuadrhtico está basada en el

estadístico

Page 243: ingenieria

REGRESION MULTIPLE m

que (con las hipótesis de la sección 12.2) es un valor de una variable aleatoria que tiene distribución F , con I y n - 3 grados de libertad. (a ) Ajustar una recta a los datos de cantidad de -a&tivo y tiempo de secado del barniz

d e J a página 243, probar la hipótesis nula = O con un nivel de significa+'111 de 0.05, y calcular 8:.

(b) Utilizando los resultados de la phgina 227, calcular,, para los datos dados, y probar. con un nivel de significación de 0.05, si nos conviene tomar el término cuadrhtico. (Nótese que podemos continuar este proceso y probar un término cúbico por medio de una comparación de varianzas residuales. Luego podríamos seguir con un término de cuarto grado, etc. Es costumbre terminar este proceso cuando dos pasos sucesivos

1 1 . Con respecto al ejemplo de la pkgina 227, verificar que el tiempo de secado es mínimo

12. Verificar que el metodo de mínimos de cuadrados nos da el sistema de ecuaciolles nor-

13. Doce láminas de acero trabajadas en frío, y que tienen diferentes contenidos de cobre

no dan resultados significantes.)

cuando la cantidad de aditivo de barniz utilizado es 5.1 gramos.

males de la phgina 230.

y diferentes temperaturas $e recocido, tuvieron las, siguientes durezas: Dureza Contenido, de , Temperatura de recocido

(Rockwell SO-T) sobre (96) (Fahrenheit)

78.8 0.02 1000 65.1 0.02 1100 55.4 0.02 1200 56.2 o m 1300 80.9 0.10 1'000 69.5 0.10 ' * 1100 57.4 0.10 1200 55.2 0.10 1300 85.6 0.18 1000 71.8 0.18 1100 60.2 0.18 1200 58.7 0.18, I R 0

Ajustar una ecuación de la forma y = Po -b plxl + &x2 donde x 1 representa el con- tenido de cobre, x2 la temperatura de recocido, e y la dureza.

14. Los siguientes datos se obtuvieron para determinar la, relación entre dos variables de la fabricacibn y la ganancia de corriente de cierta clase de transistor:

. a ; TI zz Y Tiempo $e difusión Resistencia de la '

Ganancia de corriente' (horas) hoja (ohm-cm)

5.3 1.5 66 7.8 2.5 87 7.4 0.5 69 9.8 1.2 141

10.8 . 2.6.: , I , 1 93

9.1 0.3 105 8.1 2.4 111 7.2 2.0 78 6.5 0.7 66

12.6 -1.6 ' 123

Page 244: ingenieria

236 AJUSTE DE CURVAS

Ajustar una ecuación de la forma y = Po + Plxl -k p2x2 a los datos y emplearla para estimar la ganancia de corriente correspondiente a un tiempo de difusión de 2.2 horns y una resistencia de fa lámina de 90 ohm-cm.

15. En el ejemplo referente al número de doblados necesarios para romper una barra for- jada, verificar que el resultado dado en la página 232, obtenido por codificación, es equi- valente al resultado original mostrado en la página 231.

16. Verificar que las x codificadas como en la página 231, hacen que las ecuaciones norma- les para estimar los coeficientes de

Y' = Po + PlZl + 02x2 + P P l X S + P45:: + P.&

733 "1 1 6 b o + gob4 + 8% 315 = 80bl 351 = 80bz

-79 = 400bs 3453 = 80bo . + 65634 + 40ob6 3493 5: 80bo + 400b4 + 656bs

se convierten en "

17. Codificar los valores de x1 del problema 13, con z1 =- 1, O, +l ,y los valores de x2 con z2 = -3, "1, + 1, + 3. Despds, escribir las ecuaciones normales, resolverlas 'y demos- trar que la ecuacijn de regresión resultante es equivalente a la obtenida en el proble- ma 13.

12.5 Correlación Hasta ahora, sólo hemos estudiado problemas en que se suponía conocida sin

error la variable (o variables) independiente. Aunque esto es cierto en muchos ca- sos experimentales, existen también problemas donde tanto las x como las y se tie- nen que suponer como variables aleatorias. Este sería el caso, por ejemplo, si estu- diáramos la relacidn entre la precipitación pluviométrica y la cantidad recogida de cierta cosecha; la relación entre el esfuerzo de tensión y la dureza de aluminio; o la relación entre las impurezas en el aire y la incidencia de cierta epidemia. Problemas como éstos, en los que se supone que los puntos datos pi, yi) para i = 1, 2,. . .,n, son valores de un par de variables aleatorias cuya densidad conjunta esta dada por f(x, y ) , reciben el nombre de problemas de utzcilisis de correlacibn.

La densidad bivariante que más se emplea en los problemas de análisis de co- rrelación es la densidad bivariante normal. Para introducir este tipo de densidad, definiremos primero lo que se entiende por densidad condicional. En forma análoga a la fórmula P(A n B) = P ( A ) P ( B / A ) que usamos para determinar probabilida- des conjuntas, escribimos.

f(zJ Y> = g(zlf(Y I donde f(y 1 x) define la densidad condicional de la segunda variable aleatoria para x fija. En este caso, g(x) es una densidad marginal, tal como se definió en la pB- gina 76.

En lo que respecta a la densidad bivariante normal, las condiciones que impo- nemos a f(y j x) son prácticamente idénticas a las empleadas en la teoría de las

Page 245: ingenieria

CORRELACION 237

muestras en la sección 12.2. Para una x dada, se supondrá que'ffy 1 x) es uná distri- bución normal con media a + px y varianza u2. Entonces, la regresión de y sobre x es lineal y la varianza de la densidad condicional no depende de x. Además, su- pondremos que la densidad marginal g(x) es normal con media PI y varianza u?. Substituyendo las expresiones adecuadas de f (y j .x) ,yb g (x), . obtendremos

1 ' . f(x, u) e-(Z-r3'/20: . .A e-[g-(a+Hl*/2a' d27r .u1 d2? u,, .

. .

- - ~ e- ~ [ ~ - ( ~ + B z ) ~ ~ / ~ u ~ + ( z - P , ) ~ / ~ u ~ ) 1

2T.U.Ul

para - w < x < 03 y -m < y < 00. Notemos que esta distribución conjunta con- tiene los cinco parámetros pl, ul, (Y, @, y U.

Para razones de simetría y otras que se explicarán más Adelante, es costumbre expresarb densidad normal bivariante en función de los parametros PI, 6 1 , PZ, u2, y p. Aquí p2 y uf son la media y la varianza de la distribución marginal h ( y ) , mientras que p, tlamda coeficiente de correlacibn, se define por

p 2 = 1 - - U2

U;

tomándose p positivo cuando /3 es positivo (y negativo cuando /3 es negativo). De- jamos al lector, en el ejercicio 4 de la página 240, la demostración de

y entonces substituyendo estos valores en la expresión anterior de f (y/x), se obtiene finalmente la siguiente forma de la distribución normal bivariante:

para - 00 < 'x < m y -m i y < m (ver problema 5 de la página 259). Con respecto al coeficiente de correlación p1 debemos notar que - 1 5 p I + 1

puesto que a$ = n2 + p2a! y por consiguiente U; 2 u2. Además; p sólo puede ser igual a - 1 ó + 1 cuando u? = O, lo que representa el caso degenerado en el que todas las probabilidades se encuentran concentradas a lo largo de la recta y = CY + Bz y entonces, hay una relacibn lineal perfecta entre las dos variables alea- torias. (Esto es, para un valor dado de x, y debe ser igual a a t. px.) El coeficiente de correlación es igual a cero si, y sólo si. U* = U; , y de la identidad of = u2 + deducimos que esto sólo pasará cuando /3 = O. Entonces, p = O implica que la re- gresión de y sobre x es una recta horizontal y, por lo tanto. que el conocimiento de x no ayuda a la predicción de y. Ahora, cuando p = =t I , decimos que hay una co- rrelación lineal perfecta (relacibn o aaociacibn) entre las dos variables aleatorias: cuando p = O, decimos que no hay correlación (relación ~~asociacibn) entre las dos variables de azar. h e hecho, D = O implica Dara la densidad normal bivariante que las dos variables aleatorias son indepentiier~tes (ver el problema 6 de la página 240).

Page 246: ingenieria

238 AJUSTE DE C U R V A S

Para valores entre O y + 1 o en~r, O y -- Itupretarnos p refiriéndonos a la identidad.

Como a2 es una medida 'de la kariaci6n de las y cuando x es conocidu, mien- tras que gz es una medida de l a s 21 , d n de las y cuando x es desconocida, u;- a2 medirá la variación de las v caiculadas por la relación lineal con x. Luego, p2 nos dice en qué proporcidn se pueden atribuir las variaciones de las y a la relación li- neal con x.

Dada una muestra aleatoria de tamario n -esto es, n pares de valores (xi, y{ ) - se estima comúnmente p por medio del coeficiente dc rorrelacicin muestral

+ + donde S,,, S,,, y S,, se definieron en la página 216. Este estimador no es inses-

gad0 y, salvo el factor d=, Se puede obtener substituyendo 422 por la varian-

za muestral de las y, y C T ~ por el estimador de la página 21 7, o sea, sf (véase el ejercicio 7 de la pagina 259). Notemos que el coeficienk de correlación muestral r se emplea siempre para medir la fuerza de la tendencia a una relación lineal exhibida por datos de la muestra, aunque estos datos no provengan necesariamente de una población normal bivariante.

Para ilustrar el cálculo de r, consideraremos las siguientes medidas apareadas del módulo de ruptura y el módulo de elasticidad de 12 maderas comunes:

z Módulo de

ruptura

Y Módulo de elasticidad

X Y Módulo de Módulo de

ruptura elasticidad

8.76 889 7.08 808

11.35 1513 5.25 550

10.91 1008 13.56 1952

6.49 908 11.83 1654 15.08 1502 7.13 1216 9.08 1315 3.86 497

Los cálculos requeridos para hallar I son los que siguen, donde los indices de las sumas y los límites de las mismas se han suprimido por simplicidad:

2 X = 110.38, 2 z2 = 1143.8090 2 y = 13,812, 2 XY = 141,673.33 2 y2 = 18,132,296 S,, 12(114:1.8090) - (1 9.38)' = 1541.9636 S,, = 12(141,67:3..73) - ,' s.J.38)(13,812) = 175,511.40 S,, = I ~ ~ , Y ~ J X ~ B G ) - (13,dla); = 2~,8i6,208

Page 247: ingenieria

CORRELACION 239

Esto significa que el 100 r2 = 74% de la variación en el módulo de elasticidad se explica (se debe, o se puede, atribuir) por diferencias en los módulos de ruptura.

Siempre que un valor de r está basado en datos de muestras, se acostumbra hacer un test de significación (test de la hipótesis nula p = O), para determinar si no tenemos falsamente un valor alto muestral, aunque no hay relación entre las dos variables. Para muestras aleatorias de una población normal bivariante, esta piueba se basa, generalmente, en el estadístico:

puesto que podemos demostrar que la distribución muestral de este estadístico es aproximadamente normal, con media 1 In k k - f y varianza -. Así, probare- 1

2 l--p n - 3 mos la hipótesis nula p = O con el estadístico:

z = -In- 2 l - r

d n - 3 l + r

cuya distribución muestral es aproximadamente la distribución normal tipificada.

mos ahora Volviendo a nuestro ejemplo numérico, para el cual obtuvimos r = 0.86, tene-

Como este valor excede a z . ~ = 2.58, llegamos a la conclusión de que el valor de muestra es significativo, es decir, que existe una relación lineal entre los módulos de ruptura y los de elasticidad en las maderas.

Hay varias fallas serias en la interpretación del coeficiente de correlación. Pri- mera, debemos hacer resaltar que r es una estimación de la validez de la asociación lineal entre las variables aleatorias; así, como se ve en la figura 12.8, r debe estar próxima a cero cuando haya una relación fuerte (pero no lineal) entre las dos va-

e

e

e

e

Fig. 12.8 Relacibn no lineal con coeficiente de correlación cero.

Page 248: ingenieria

240 AJUSTE DE CURVAS

riables de azar. Segunda, y quiz4 de mayor importancia, una relación significativa no implica necesariamente una relación causal entre las dos variables. Aunque no debe sorprendernos, por ejemplo, obtener una correlación positiva alta entre las ventas anuales de goma de mascar y la incidencia del crimen en los Estados Unidos, no podemos concluir que el crimen se puede reducir prohibiendo la venta de goma de mascar. Ambas variahles dependen del tamaño de la población y es esta mutua relación con una tercer variable (el tamaño de la población) la que produce la correlación positiva. La controversia inicial sobre la evidencia de la conexión entre el tabaco y el cáncer se debió a una confusión similar entre correlación y causación.

EJERCICIOS

1 . Las siguicntcs son medidas dcI contenido de carbón y la permeabilidad de veinti mezc]a.g sintetizadas:

Contenido de lndice de Contenido de Indice de carbono (%) permeabilidad carbono (%) permeabilidad

4.1 1 3 5.1 :22 4.9 12 . 4.5 21 4.4 11 5.1 13 4.7 10 3.0 37 5.1 13 4.8 13 5.0 14 4.2 19 4.7 21 5.2 12 4.6 14 5.5 14 ,3.6 26 5.2 21 4.9 25 4.4 29

(a) Calcular el coeficiente de correlacibn. ( b ) Probar la hipbtesis nula de que estas dos v a r i a b h n o están correlacionadas: utilizan-

do un nivel de significación de 0.05. 2 . Calcular r para la humedad relativa y el contenido de humedad del ejercicio 6 de la pá-

gina 221. Suponiendo que se puedan encontrar las condiciones necesarias, hacer la prueba con un nivcl de significacijn de (y = 0.01.

3. Utilizando lo establecido en la página 239 sobre la distribuciún muestra1 aproximada del

estadístico -7 se puede demostrar que la fórmula siguiente da límites de confian- 2 1 - - r

za a ua nivel de 1 - (y para p:

1 + - (1 - ~ ) e + 2 & / ~ / ~ n - 3 -

1 + T + (1 - r)e *2%/2/ dn-3 I

empleando esta fórmula y el resultado obtenido en la parte (a) del problema 1, cons- truir un intervalo de confianza a un nivel de 0.95 para la correlacih entre el contenido de carbón y el índice de permeabilidad.

4. Resolviendo las integrales necesarias, verificar las identidades.

p2 = (Y + pp1 Y u; = u2 + p.: de la página 237.

5. Substituir: p2 = (Y + pp1 y u; = u2 + p*.:

Page 249: ingenieria

CORRELACION 241

6.

7.

8.

9.

1 o.

en la fórmula de la densidad bivariante dada en la (parte superior de la pcigina) 237 y demostrar que da la forma final indicada en la misma página. Demostrar que, para la distribucih normal bivariante: (ai la inaependencia implica cero correlación. (b) la correlación cero implica independencia. Substituyendo la varianza muestra1 de las y en lugar de a; Y S: en lugar de u’ en la fbrmula p2 = 1 - n2/u& verificar la fórmula de r dada en la página 238 (salvo una constante multiplicativa). En lugar de usar la fórmula de la página 238, el coeficiente de correlación r se puede obtener por la fórmula

que es análoga a la empleada para definir p. Aunque los cálculos requeridos en el uso de esta fSrmula son tediosos, tienen la ventaja de que se puede emplear también para medir la fuerza de la validez de relaciones no lineales o de relaciones de varias variables. Por ejemplo, en el ejemplo de la relación lineal múltiple de la página 230, se pueden calcular los valores que se predicen por medio de la ecuación

y’ = 48.2 + 7.83~1 - 1.7622 y determinar después r como una medida de la fuerza de la validez de que Y, los do- bleces necesarios para romper una de las piezas, dependa de ambos porcentajes de los elementos aleados. (a) Utilizando los datos de la página 230, hallar Z (y - g)2 por medio de la fórmula

(b) Empleando la ecuación de la regresi6n obtenida en la página 231, calcular y’ para

(c) Substituir los resultados obtenidos en ( a ) y ( b ) en la f,órmula anterior para r. El re-

Substituyendo los valores reales de los datos apareados por los números que ocupan en las muestras respectivas, el coeficiente de correllación se puede escribir en la forma

Z (y - g)’ = I; y2 - ng2.

los 16 puntos y, después, determinar C ( y - y’)2.

sultado es el llamado coeficiente de correlación múltiple.

r ’ = l - 6 I; d: n(n’ - 1)

llamándose, en esta forma, coeficiente de correlación por puestos. En esta fórmula, di es la diferencia entre los puestos de les observaciones apareadas (xi, ri) y n es el ntímero de pares en la muestra. (En caso de empates, substituir por cada observación el medio del puesto que hubieran ocupado, como en la sección 11.4.) Calcular r’ para los datos del problema 1 y comparar cod el valor de r obtenido anteriormente. Calcular ‘el coeficiente -de correlación por puestos (problema 9) de 16s datos de la pfi- gina 227 sobre.rla cantidad de aditivo y el tiempo de secado del barniz.

Page 250: ingenieria

13.1 Introducción

Algunos de los ejemplos del capítulo 12 nos han enseñado que con un planea- miento previo del experimento se puede lograr considerable economía en el cálculo. LO que es mhs importante, un planeamiento experimental adecuado puede dar una seguridad razonable de que los resultados de un experimento den respuestas claras a las preguntas que se investigan. Como es imposible dar en este capítulo una dis- cusión completa del diseiio de experimento.r, incluyendo los muchos fallos a los que está expuesto un experimentador, comenzaremos por presentar en esta sección algunos de los principios generales del diseño de experimentos. Muchos de estos diseños se aplican frecuentemente en ingeniería y otras investigaciones aplicadas se trataran en secciones subsecuentes.

Para ilustrar algunos de los aspectos más importantes del diseño de experimen- tos, consideramos l a situación siguiente. Una laminadora surte de hojalata a tres fabricantes, de envases, existiendo la especificación más importante de que el recu- brimiento del fondo del envase pese al menos 0.25 libras por envase tipo. La lamina- dora y cada uno de los fabricantes de envases tienen laboratorios donde se hacen

242

Page 251: ingenieria

INTRODUCCION 243

medidas de los pesos de recubrimiento de muestras tomadas de cada envío. Supon- gamos también que hay cierta discrepancia sobre los pesos de los recubrimientos efectivos, y se decide planear un experimento para saber cuál de los cuatro labora- torios ha hecho. medidas correctas. Un factor de complicación radica en el hecho de que parte del’ proceso de medida consiste en la remoción química del recubrimiento de la superficie del metal de la base; luego, es imposible tener la misma muestra me- dida por cada laboratorio para determinar con qué exactitud corresponden las me- didas a la muestra.

Una posibilidad es mandar varias muestras (en forma de discos circulares de áreas iguales) a cada uno de los laboratorios. Aunque esos discos no tengan en rea- lidad pesos idénticos de recubrimiento, es de esperarse que tales diferencias sean pequeñas y que, más o menos, den el mismo promedio. En otras palabras, se su- pondrá que cualesquierz diferencias que puedan existir entre las medias de las cuatro muestras podrán ser atribuidas a causas debidas irnicamente a las diferen- cias sistemáticas en las técnicas de medida y a variaciones aleatorias.

Ahora queda el problema de decidir cuántos discos se deben mandar a cada laboratorio y cómo se deben seleccionar estos discos. La ,cuestión del tamaño de la muestra se puede resolver de muchas formas diferentes, una de las cuales es usar la fQrmula de la página 154 para la desviación típica de la distribución muestra1 de la diferencia entre dos medias. Substituyendo los valores conocidos de u1 y u%, y especificando qué diferencias entre las medias verdaderas de cada dos laboratorios se han de.detectar con una probabilidad de al menos 0.95 (6 0.98, ó 0.99), es posi- ble determinar n, = n2 = p (problema 10 de la página 253.) Supongamos que este método y quizás, .también las consideraciones de costo y obtención de las muestras necesarias, nos conducen a la deGisiÓn de enviar una muestra de 12 discos a cada laboratorio.

E1 problema de seleccionar los 48 discos y distribuir 12 a cada laboratorio no es tan sencillo como puede parecer a primera vista. Para empezar, supongamos que una hoja del material, suficientemente larga y suficientemente ancha, se selecciona y que los 48 discos que se cortan son los mostrados en la figura 13-1. Los .doce dis- cos de la tira 1 se envían al laboratorio primero, los doce de la tira 2 al segundo, y así sucesivamente. Si encontramos que las cuatro medias de los pesos de recu- brimiento difieren considerablemente, ¿nos permite esto llegar a la conclusión de que las diferencias se pueden atribuir a fallas en las técnicas de medida? Supongamos, por ejemplo, que una investigacidn adicional muestra que la cantidad de estaño de- positado electrolíticamente en una hoja de acero larga sigue en proceso no uniforme y que se repite de variación perpendicular a la dirección en que se lamina. (Este proceso de depósito puede deberse a la posici6n de los electrodos, a “efectos de bor- des”, etc.) Luego, si los cuatro laboratorios midieron correctamente los recubri- mientos, hay una causa para que existan diferencias en las medidas. El envío de una tira entera a cada.laboratorio nos lleva a que las diferencias entre las técnicas de medida en los laboratorios son inseparables (o se confunden con) de cualquier di- ferencia que haya en realidad en la cantidad de estaño depositado perpendicularmen- te a la dirección de laminado.

Page 252: ingenieria

244 ANALISIS DE LA VARIANZA

Lámina , Dirección de los rodillos : *

Fig. 13.1 Numeracibn de las muestras de hojalata

Un medio de evitar esta clase de confusión es numerar los discos y enviar al azar doce de ellos a cada laboratorio, como en la selección siguiente, que se obtuvo con la ayuda de una tabla de números de azar:

Laboratorio A: 3, 38, 17, 32, 24, 30, 48, 19, 11, 31, 22, 41 Laboratorio B: 44, 20, 15, 25, 45, 4, 14, 5, 39, 7, 40, 34 Laboratorio C: 12, 21, 42, 8, 27, 16, 47, 46, 18,43, 55, 26 Laboratorio D: 9, 2, 28, 23, 37, 1, 10, 6, 29, 36, 33, 13

Si hubiera algún proceso sistemático en la distribución del esp;esor del recubrimiento de la lhmina, se “rompería”, al tomar Ias~muestras al azar.

Aunque hemos identificado y eliminado una posible ley de variación, no te- nemos seguridad de que no puedan existir otros. Por ejemplo, puede haber una di- ferencia sistemática en las Breas. de los discos causada por desgaste progresivo de la herramienta de corte, o puede haber grietas u otras imperfecciones en una parte de la Ihmina, de tal modo que afecten a las medidas. Entonces, siempre hay la posibili- dad de que las diferencias entre las medias atribuidas a fallos técnicos en los lhbora- torios se deban, en realidad, a otros factores no controlados, y el prop6sito de tomar las muestras al azar es el de evitar que se pueda confundir la variable en investi- gaci6n con otras variables del tipo de las descritas.

Al distribuir los 48 discos enteramente al azar entre los cuatro laboratorios, n6 nos, queda ya, otra alternativa que incluir cualquiera variación atribuible a causas extrañas como una “variación aleatoria”. Es posible que esto nos lleve a una’esti- mación excesivamente amplia de lo que hemos designado como variaci6n aleatoria, lo que, a su vez, hará difícil detectar diferencias entre las medias verdaderas de los distintos laboratorios. Para evitar esto, tal vez podríamos emplear sólo discos corta- dos de la misma hoja y de la misma tira (o de alguna otra región homogknea). Des- graciadamente, este tipo de experimento controlado nos presenta nuevas complica- ciones. Por ejemplo, ¿,qué utilidad tiene hacer un experimento que nos permite con- cluir que los laboratorios coinciden (o no) en sus medidas, si tal conclusicin se li- mita a las medidas hechas a una distancia fija del borde de la lámina? Para consi- derar un ejemplo en el que se presentan tales complicaciones con agudeza, suponga- mos que un fabricante de materiales de fontanería desea comparar las características de diversas clases de materiales para emplearlos en tubería que van a estar sumergi- das en agua. Si vamos a fijar condiciones tales como la acidez del suelo, profundidad

Page 253: ingenieria

INTRODUCCION 245

del tubo y el cantenido mineral del agua, las conclusiones sobre qU6 tipo de material es mejor, s6b serán válidas para las condiciones fijadas. Lo que, en realidad, desea conocer e1 fabricante, es cuál material es mejor en una amplia variedad de condicio- nes, y al disefiar un experimento adecuado sera conveniente (de hecho, necesario) especificar que tubo de cada material ha de ser enterrado en cada una de las distintas profutldidades, en cada uno de los distintos tipos de suelo, y en lugares donde el agua vana de dureza.

Todo lo expuesto sirve para ilustrar que raramente es deseable mantener fijos todos, o la mayona de, los factores extraños de la circunstancia de un experimento, cuando se trata de obtener una estimación de la variación aleatoria que no est6 "in- flada" por variaciones a otras causas. (De hecho, es muy difícil,, si no imposible, ejercer un control tan cxtricto que mantenga constantes todas las variables extrañas). En la práctica, se planean los experimentos de tal forma que se varían deliberada- mente las fuentes conocidas de variabilidad en un rango tan amplio como sea necesario; aun más, deben ser variadas en tal forma que su variabilidad quede eli- minada en la estimación de la variación aleatoria. Una forma de conseguir esto, es repetir el experimento en varios bloques, manteniendo fijas en cada bloque determi- nadas fuentes de variabilidad (esto es, variables extrañas), pero variá,ndolas de blo- que a bloque.

Volviendo a nueitro ejimplo del estañado de 'la ]&mina de acero, podemos medir las variaciones a'lo largo de hi hoja, tomando al azar'tres discos de cada tira para cada laboratorio, como se muestra en la seleccih siguiente:

. 1

tira I tira 2 . tira 3 tira 4 Zaboratorio A ; 8,4# IO 23, 24,19 26, 2 9 , 35 37, 44, 48

' _ Lpbpratoyio Br.. 2, &, 12, 21,115, 22 34, 33, 32 45, 43, 46

taboratorio D:' 7, 3, 9 17, 18, 14 28, 31, 25 39,40, 42 ,<: I Labora top C: ~ 1, $,ll 16, 20, 13 36, 29, 30 41, 38, 47

* I 0 1 , . '

En'este'exprimento;' 'I.as;firas forman los blbques, y, 'si basamos nuestra estimación de variación aleatoria en la variabilidad entre cada urio de los 16 conjuntos de tres disco$ esta &irnación no estará inflada por ,I& variable's extrañas, esio es , las dife- rencias entre tiras. (Notemos, además, que, con 'esta selecci6n, las diferencias entre las medias obtenidas en los cuatro laboratorios no se puedafi atribuir a diferencias entre las tiras. Esto no se puede afirmar para la selección de la aágina 244).

El análisis de los experimentos en que se utilizan bloques para elimipar una [uéntk de variabilidad se discutirá en l a 'sección 13.3.',El análisis de los exppimen- tos'en que se deben elimin'ar dos o tres fuentes de variabilidad se encuentra en la sección 13.5. , .

13.2 Clasificaciones en una sola direcci6n

En esta seceión consideraremos>el análisis estadístico del diseño hecho completa- Rente al azar, O de clasificacicin en una sola dirección. Supondremos que el experi-

Page 254: ingenieria

246 ANALISIS DE LA VARIANZA

mentador cuenta con los resultados de k muestras de azar independientes, cada una de tamaño n, provinientes de k poblaciones diferentes (esto es, datos sobre k trata- mientos, k grupos, k métodos de producción etc.) ; y debe contrastar la hipótesis de que las medias de esas k poblaciones son todas iguales. Un ejemplo de tal expe- rimentos, con k = 4, es el expuesto en la página 245. Si denotamos la j-ésima ob- servación en la i-ésima muestra por yij el esquema general de la clasificación en una sola dirección es el siguiente:

Media Muestra I: yn, . , Ylj, + . Yln 81

Muestra 2: y21, 1/22, . 1 Y2j1 - , ’Lhn Q2

Muestra i: yil, yi2, . . . , yijl . . . , yin 5;

Muestra k: Ykl, Yk2, . ykj, , ykn 8 k

Y.

Con respecto al experimento de la página 263, yji (i = 1, 2, 3, 4; j = 1, 2, . . .12) es el j-ésimo peso de recubrimiento medido por el i-ésimo laboratorio, 8; es la me- dia de las medias obtenidas por el i-ésimo laboratorio, e jj es la media general (o media mayor) de las 48 observaciones.

Para poder contrastar la hipótesis de que las muestras obtuvieron de k po- blaciones con medias iguales, haremos varias suposiciones. Concretamente, se supon- drá que tratamos con poblaciones normales que tienen varianzas iguales. Existen métodos para contrastar en qué grado es razonable es esta última suposicih (‘vei el libro de A. M. Mood y F. A Graybill, citado en la bibliografía), pero los “mktodos que desarrollaremos en este capítulo son bastante “robustos”; es decir, son relativa- mente insensibles a las violaciones de la .hipótesis de la normalidad y de la igualdad de las varianzas.

Si pi denota la media de la i-ésima población y denota la varianza común de las k poblaciones, podemos expresar cada observación yij por pi, más el valor de una componenté aleatoria, esto es, podemos escribir.

yij = pi + eij para i = 1,2, . . . , k; j = 1,2, . . . , n De acuerdo con las suposiciones anteriores las rij son valores de ,variables aleatorias independientes con distribuciones normales de medias cero y varianza común u2. (Nótese que esta ecuación, o modelo, se puede considerar como una ecuación de re- gresión múltiple; introduciendo las variables xil que sean igual a O ó 1, dependiendo de que los dos subindices sean desiguales o iguales, podemos escribir.

yij = Plxil P2xi2 + * + Pkxik $- eij

Los parámetros pi se pueden interpretar ahora como coeficientes de regresión, Y se pueden estimar por los métodos de mínimos cuadrados del capítulo l?.)

Page 255: ingenieria

CLASIFICACIONES EN UNA SOLA DlRECClON 247

Para lograr uniformidad con las ecuaciones correspondientes para clases más complicadas de diseño, es costumbre reemplazar E . C ~ por p + a{, donde p es la media

de las , u i y, por lo tanto, Z ai = O (ver problema 11 de la página 254). Utilizan-

do estos nuevos parámetros, podemos escribir la ecuación. modelo para la clasifica- ción en una sola dirección, en la forma

k

i l l

+ yij = p + ai + t ij para i = 1,2, . . . , k; j = I, 2, ., . . , n y la hipótesis nula de que las k medias de poblaciones sean todas iguales se puede cambiar por 4 hipótesis nula de que a1 = az = . . . = cyg = O. La hipótesis alternativa de que, al menos, dos de las medias de población sean diferentes, es equivalente a la hipótesis altenativa de que ai # O para alguna i.

Para contrastar la hipótesis nula de que las k medias de población sean todas iguales, compararemos dos estimaciones de $-uno basado en la varianza entre las medias muestrales, y otra basada en la variación dentro de la muestras. Como, por hipótesis, cada muestra proviene de una población de varianza d , esta varianza se puede estimar por cualquiera de las varianzas muestrales

y, por consiguiente, también por sus medias

Nótese que cada una de las varianzas muestrales S: está basada en n - 1 grados de libertad (n "1 desviaciones independientes de V i ) y, por lo tanto, 3k está ba- sada en k(n - 1) grados de libertad. Ahora, la varianza de la media IC muestral está dada por

E

i l l S: = z1 (Pi - g . I 2 / ( k - 1)

y, si la hipútesis nula es cierta, 'nos da una estimación de $/n.Luego,

62, = n-sg = n. Z (pi - p)*/(k - 1)

nos da una estimación de basada en las diferencias entre las medias mhestrales, y está basada en k - I grados de libertad.

Si la hipótesis nula es cierta, podemos demostrar que & y gi son estimaciones independientes de c2, y de aquí que

' k

(-1

. ,

2s un valor de una variable aleatoria que tiene .distribución F, con k - 1 y G(n- 1) grados de libertad. Coho la vuriurtzu ifttermuestru[ d, (puede esperarse que exceda a la varianza muestral interior, U$, cuando la hipótesis"nu1a es fulsh;

Page 256: ingenieria

248 ANALISIS DE LA VARIANZA

ésta deberá rechazarse si F excede de Fa, donde Fa se obtiene de la tabla VI, con k - 1 y k(n - 1) grados de libertad.

El argumento precedente ha demostrado cómo se puede basar en la compara- ción de dos estimaciones de varianzas el test de la igualdad de k medios. Quizá más interesante resulta el hecho de que las dos estimaciones consideradas (excepto para los divisores k - I y k(n - 1 ) ) se pueden obtener por “ruptura” o análisis de la varianza total de todas las nk observaciones en dos partes. La varianza muestra1 de las nk observaciones está dada por

E n

i = l j - 1 S’ = Z: 2 (yij - g . ) ’ / ( d ~ - 1)

y con respecto a su numerador, llamado suma total de cuadrados, probaremos aho- ra el siguiente teorema

TEOREMA 13.1

La prueba de este teorema está basada en la identidad

yi j - 8. = (yij - + (ZI~ - 5.) Elevando ambos miembros al cuadrado y haciendo la suma respecto de i y de j, obtenemos

A continuación, observamos que

Es costumbre denotar la suma total de cuadrados, primer miembro de la identi- dad del teorema J 3.1 por SST. El primer término del segundo miembro es 8% veces sus grados de libertad y nos referimos a esta suma como la sun~a de cuadrados de error, SSE. El término “suma de error de cuadrados” expresa la idea de que la can- tidad estima el error aleatorio. (0 de azar). El segundo término del segundo miembro de la identidad del teorema 13.1 es veces sus grados de libertad y lo llamamos

Page 257: ingenieria

CLASIFICACIONES EN UNA SOLA DIRECCION 249

suma intermuestral de cuadrado so suma de tratamiento, de cuadrados SS(TT). (La mayoría de las primeras aplicaciones de esta clase de análisis se hicieron en el campo de la agricultura, donde las k poblaciones representaban diferentes tratamientos, ta- les como fertilizantes, aplicados a campos agricolas.) Notemos que con esta notación la razón F de la phgina 248 se puede escribir.

+ SS(Tr) / (k - 1) F = SSE/k(n - 1) +

Las sumas de cuadrados necesarios para substituir en esta última fórmula, se obtienen generalmente por medio de las fórmulas abreviadas siguientes,, que el lec- tor debera verificar en el problema 12 y SS(Tr) por medio de las f6rmulas

SST =

+

de la página 254. .Primero calculamos SST

donde C, llamada término de correccicjn, está dada por .

+ y donde Ti es el total de las n observaciones de la i-Csima muestra, mientras que T2 es el total mayor de las kn observaciones. La suma de error de cuadrados, SSE, se obtiene, entonces, por substracción; de acuerdo con el teorema 13.1 podemos escribir

Los resultados obtenidos al analizar la suma total de cuadrados por sus com- ponentes, se puede resumir en la siguiente ,tabla de análisis de la varianza:

Origen de F Cuadrado medii) cuadrodos libertad variación

Suma de Grado de

I , . - Tratamiento I-IS ( Tr) ius( Tr) SS( Tr) k - 1

=ss(Fr)/@ - 1) MSE

Error -

k(n - 1) MSE SSE PSSE/k(n - 1)

Total SST nk - 1

N6tese que cada cuadrado medio se obtiene dividiendo la suma de cuadrados co- rrespondiente por sus grados de libertad .

Para ilustrar el análisis de, la varianza (como se llama esta.técnica) para la cla- sificación en una sola dirección, supongamos que, de acuerdo con lo establecido en

Page 258: ingenieria

250 ANALISIS DE LA VARIANZA

la .página 244, cada laboratorio mide los pesos de recubrimiento de 12 discos y que los resultados son los siguientes:

Laboratorio A : 0.25, 0.27, 0.22, 0.30, 0.27, 0.28, 0.32, 0.24, 0.31, 0.26, 0.21, 0.28 Laboratorio B: 0.18, 0.28, 0.21, 0.23, 0.25, 0.20, 0.27, 0.19, 0.24, 0.22, 0.29, 0.16 Laboratorio C: 0.19, 0.25, 0.27, 0.24, 0.18, 0.26, 0.28, 0.24, 0.25, 0.20, 0.21, 0.19 Laboratorio D: 0.23, 0.30, 0.28, 0.28, 0.24, 0.34, 0.20, 0.18, 0.24, 0.28, 0.22, 0.21

Los totales para las cuatro muestras son, respectivamente, 3.21, 2.72, 2.76, y 3;00, el total mayor es 11.69, y los cálculos para obtener las sumas de cuadrados necesarias son 10s siguientes:

C = (11.69)'/48 = 2.8470

SST = (.25)2 + (.27)2 + . . . + (21)' - 2.8470 = 0.0809

SSE = 0.0809 - 0.0130 = 0.0679

Así, obtenemos la siguiente tabla de andisis de la varianza:

Como el valor 'obtenido para F excede de 2.82, al valor de F.,,s con 3 y 44 grados de libertad, la hipótesis nula se puede rechazar al nivel de significado de 0.05; Ile- gamos a la conclusión de que los laboratorios no esthn obteniendo resultados con- cordantes.

Para estimar los parámetros M , al, m , a3, y a4 (6 PI, pz, p3, y p4 ), podemos em- plear el mCtodo de mínimos cuadrados, haciendo minima l a expresicin

con respecto p y las ai, con la restriccicin de que Z a, = O. Esto se puede hace1

eliminando una de las a, o mejor aún, utilizando' el método de los multiplieadores de Lagr'ange que se puede encontrar e n la mayon'a'de los libros dc Cilcula supe- rior. En cada,caso. obtenemos la!: estimaciones "intuitivamente "obvias'. '

4

i = l

Page 259: ingenieria

CLASIFICACIONES EN, U N A SOLA DiRECClON 251

y las estimaciones correspondientes de las pi están dados por .pi = vi. El análisis de la varianza descrito en esta sección se aplica a clasificaciones en

una sola direccih en las que cada muestra tiene el mismo número de observaciones. Si no es Cste el caso, y los tamaños de las muestras SQ~I nl, no,. . . m ; , sólo tenemos

que substituir N = r: ni en lugar de nk y escribir las expresiones de cSlculo de

XSTy SS(Tr) en la forma , .

k

* = l

4 . .

4

En lo demás, el procedimiento es el mismo. (Ver problema 13 de la página 254.)

EJERCICIOS

1. Se hace un experimento para comparar la acción limpiadora de dos detergedtes, A y B. Se ensucian 20 piezas de tela con grasa y mugre, y cada una se lava con uno de los de- tergentes en una máquina de tipo agitador, midiéndose después la blancura de las piezas. Criticar los. aspectos siguientes -del experimento: (a ) E l experimento completo se hizo- con agua sum&. (b) Quince piezas se lavaron con el aetergente :A y &o con el B. (c) Para acelerar la pruebk, se empleó agua muy cahente y un tiempo de lavado de 30

(d) Las medidas de blancura de todas las piezas lavadas con el detergente A se hicieron

2. Un bon vivant, deseaba saber la causa de- sus frecuentes malestares, después de beber hizo el siguiente experimento. La primera noche sólo bebió whiskey c'on agua; la segun- da, vodka y agua; 11 tercera, ginchra y agua, y en la cuarta, ron y agua. En cada de las siguientes mañanas tuvo malestares y llegó a la cbnclusi6n de que era el factor cu- mun, o sca el agua,, lo que le hacía daño. (a) Esta conclusión, obviamente, es incorrecta, pero, ¿puede usted decir qut principios

' (b) Dé un ejemplo menos obvio de un experimento que tenga las mismas conclusiones. ( c ) Suponga que nuestro amigo ha m.odificado su experimento de tal for,rllla.que cada

una de las bcbidas alcohjlicas se ha.empleado CM, y sin, agua, de tal forma que el experimento duró 8 noches. ?,Pueden los resultados de este otro experimento servir Para confirmar o refutar la hipjtesis de que el agua.es.,la. causa de los. malestaFes? Explique por qué.

segundos. . .

primero. . ,

I

del proyecto experimental han sido violad os?

Page 260: ingenieria

252 ANALISIS DE LA VARIANZA

3. Muestras, tomadas al azar, de 4 marcas cubiertas, necesitaron las siguientes distancias de frenado a 30 millas por hora:

Marca A Marca B Marca C Marca D 27 25 27 26 30 20 31 26 25 22 30 25 26 21 32 23

(a) Sin emplear f6rmulas abreviadas, calcular Z Z (yij - v.)*, .z (vij - %)*,

y 12. .Z (gi - v.)*, y verificar la identidad del teorema 13.1.

k n k n

i -1 j-1 i - l j - 1 k

1-1

(b) Verificar los resultados obtenidos para las tres sumas de cuadrados, utilizando las

4. Para determinar el efecto en la salida de polvos de un precipitador, se hicieron las si- fórmulas abreviadas de la pfigina 249.

guientes medidas: Con carga de polvo

Corriente total gramos por yarda cúbica (pie"/hora) en el gasto de gas m 1.2 1.0 1.6 300 2.0 1.8 2.5 400 2.4 3.0 3.5 500 3.1 3.8 4.4

(a) Comprobar si el gasto en la salida a través del precipitador tiene algún efecto en

(b) Estimar los efectos (yi correspondientes a las diferentes velocidades del gasto. 5. Utilizando las sumas de cuadrados obtenidas en el ejercicio 3, probar con un nivel de

significacijn de 0.05, si las diferencias entre las distancias medias de frenado obtenidas para las 4 marcas de cubiertas tienen a l g h significado.

6. Tres probetas de cada uno de los cinco diferentes metales que se indican a continua- cibn, fueron sumergidas en una, solución altamente corrosiva y se midieron sus velo- cidades de corrosión con los siguientes resultados:

la carga de polvo de salida.

Metal VeIocidad de corrosión

Aluminio 0.5 0.4 0.6 Acero inoxidable 0.6 0.7 0.6 Acero al carbono 6.5 7.0 7.3 Acero esmaltado 0.8 0.6 0.8 Aleación de niquel 4. L 3.5 3.0

(a) Contrastar la hipótesis nula de que los cinco metales tienen la misma velocidad de corrosión.

(b) .Estimar la diferencia de velocidad de corrosión entre el acero inoxidable y el acero al carborto y dar un intervalo de confianza a un nivel de 0.95 para esta diferencia.

7. Para comparar la efectividad de tres tipos diferentes de pinturas fosforescentes para cuadrantes indicadores de instrumentos de aviones, se pintan 8 cuadrantes con cada

Page 261: ingenieria

CLASIFICACIONES EN UNA SOLA DlRECCClON 259

una de las pinturas. Luego se iluminan los cuadrantes con luz ultravioleta, y , los si- guientes son los ntmleros que indican los minutos que dieron luz, después' que la ultra- violeta fue apagada:

Tipo A Tipo B Tipo C

46.3 48.7 62.3 48.2 53.6 64.7 4298. ,'. 493 I , 56.2 41.8 47.3 60.2 48.9 51.4 53.6 51.0 53.9 55.5 49.7 43.6 61.8 50.1 48.8 54.5

(a) Calcular F y (suponiendo que se ' obtienen las condiciones necesarias) contrastar; con un nivel de 0.01, si las diferencias observadas entre las medias de las' mueh- tras se pueden atribuir al azar.

(b) Estimar los parfimetros del modelo usado en el análisis de este experimento. 8. Un fabricante de planchas eltctricas, deseando probar la exactitud de los termostatos

de tres proveedores diferentes, comprdbó los hierros a 500" F. Las' temperaturas se mi- dieron con un gar termoel&trico, y dieron los resultados dguientes:

>

Proveedor A: 494, 516, 487,491 Proveedor 'B: 512, 528 Proveedor C: 480; 515, 510

. ,

¿Se puede llegar a la conclusibn de que hay una diferencia en la exactitud en los ter- mostatos de los tres proveedores?

9. Teniendo 20 pruebas disponibles para comparar. el crecimiento de tres variedades de maíz, un investigador agrícola planta 7 con cada una de las Variedades A y B, y 6 eon la variedad C. Los siguientes son los crecimientos obtenidos en bushels por acre:

Variedad A Variedad B Variedad C

81.6 73.5 66.7 77.3 72.9 57.5 86.7 69.0 73.5 62.4 63.8 77.7 69.2 71.5 .

89.6 86.1

.'.72.4 78.4 85.2 70.5

' . '

Esttmar el crecimiento promedio verdadero de cada variedad y probar si hay difcren- cias significativas entre las medias db las muestras aon = 0.05.

10. Con respecto a la discusión de la página 243, supongamos que las desviacioncs t ipias de los pesos de recubrimiento determinado$ por cada Üno dc los trcs laboratorios tíe- nen el valor común IS = 0.012, y que se desea una confianza de 95% para determinar una diferencia entre las medias de dos laboratorios cualesguicra en mis de 0.01 .libras por envase. Demostrar que estas suposi.ciones'nos conducen a la dccjsión de enviar una muestra de 12 discos a cada laboratorio.

Page 262: ingenieria

254 ANALISIS DE LA VARIANZA

1 1 . Demostrar que, si p , = p + ai, y p es la media de las pCla entonces z ai = 0.

12. Verificar las frjrmulas abreviadas para aalcular SST y SS(Tr) dadas en la página 249. 13. Establecer y probar un teorema andlogo al teorema 13-1, para el caso en que el tamaño

de la i-ksima muestra sea n i , esto es, cuando los tamaños de las muestras no son ne- cesariamente iguales.

k

i-1

13.3 Clasificaciones en dos direcciones

Como hicimos notar en la sección 13.1, el valor estimado de la variacibn alea- toria (el error experimental) puede frecuentemente ser reducido, es decir, liberado de la variabilidad debida a causas extrañas, dividiendo las observaciones en cada clasificación en bloques. Esto se logra cuando fuentes de variabilidad conocidas (o sea, variables extrañas) se mantienen fijas en cada bloque, pero varian de un bloque a otro.

En esta sección supondremos que el experimentador tiene a mano medidas pertenecientes a a tratamientos distribuidas en b bloques. Primero consideraremos el caso en que hay exactamente una observación procedente de cada tratamiento en cada’bloque; en la ilustración de la página 245, este caso se presentaría si cada laboratorio comprobara un disco de cada tira. Indicando con yii Ia observacidn perteneciente al i-ésimo tratamiento y al j-ésimo bloque, con P ~ . la media de las b observaciones del i-ésimo tratamiento, con la media de las a observaciones del bloque j, y con P. la media mayor de todas las ab observaciones podemos uti- lizar el siguiente esquema para este tipo de clasificaciún en dos direcciones:

Bloque

B1 Bz . . . B j . . . Bb Media Tratamiento I: yll, YlZ, . ,,ylj, , Ylb 81. Tratamiento 2: yzl, yzz, . . . , yzj, . . . , YZb 82.

Tratamiento i: yilt ya, . . . , yij, . . . , Y i b vi. Tratamiento a: gal, y02, . . . , yoj, . . . , Yab P..

Media P.1 g.2 . . . 17.j . . . g . b P..

Nótese que, cuando empleamos un punto en lugar de un subíndice, esto sig-

El modelo subyacente que aceptaremos para el análisis de este tiPo de dasi- nifica que la media se obtiene sumando respecto a ese subíndice.

ficación de dos direcciones con una observación por “casilla” está dada por

6 l/ij = I.( + L Y ~ + + e i j para i = 1,2 , . . . , ~ ; j = 1,2,. . , , b 6

Donde es la media’mayor, cy1 el efecto del i-ésimo tratamiento, & el efecto dcl j-bimo bloque, y las Eij son valores de variables aleatorias con distribucidn nor- mal, independientes y con medias cero y vavianza común 42: Igual que en el mo-

Page 263: ingenieria

CLASIFICACIONES EN DOS DIRECCIONES 255

delo para la clasificación en una sola dirección, restringimos los parámetros impo-

niendo las condiciones ,X ai = O y ,X pj = O (problema 10 de la página 263).

En el análisis de una clasificación de dos direcciones en el que cada trata- mienfo está representado una vez en cada bloque, el objetivo principal es probar si la diferencia entre las gi., es significativa, esto es, contrastar la hipótesis nula

a1=CQ= . . . = a.=o

Además, siempre será conveniente comprobar si la agrupación de los bloques ha sido efectiva, es decir, si se puede rechazar la hipótesis nula

a b

$311 J - 1

f l l = & = . . . = f l b = o

En cada caso, la hipótesis alternativa es que, al menos, uno de los efectos sea diferente de cero.

Como en el análisis de la varianza de una sola dirección, basaremos estos tests de significación en comparaciones de las estimaciones de U S ; una basada en la’ variación entre tratamientos, otra basada en la variaci6n entre bloques, y otra que mida el error experimental. Notemos que solo la última es una estimaci6n de u* cuando alguna (o ambas) de las hipótesis nulas no es válida. Las sumas de cuadrados necesarias estin dadas por las tres componentes en que se “rompe” la suma total de cuadrados, por medio del siguiente teorema:

TEOREMA 13.2

a b + .2 ( P i . - P . J 2 + a Z @ . j - g..)2 t- 1 j-1

El primer miembro de esta identidad representa la suma total de cuadrados, SST, y los términos del segundo miembro son, respectivamente, la suma de cuadrados de error SSE, la suma de cuadrados de tratamientos, SS(Tr), y la suma de cua- drados de bloque SS(BI) . Para probar este teorema, empleamos la identidad

yij - 5.. = (Yij - Y$. - B . j + v..) + ( ~ i . - 5.J + ( ~ . j - p..) y seguimos, esencialmente, la misma argumentación que en la prueba del teore- ma 13.1.

En la prhctiea, calculamos las sumas de cuadrados necesarias por medio de fórmulas abreviadas análogas a las de la página 248, mejor que las expresiones que definan estas sumas de cuadrados, tales como las definidas en el teorema 13.2. En lo que sigue, Ti. es la suma de las b observaciones del i-ésimo trata- miento, T.5 es la suma de las a observaciones del j-ésimo bloque, y T.. es el gran total de todas las observaciones. Usando el término de correccicin

+ c = - T2 ab +

Page 264: ingenieria

256

tenemos

ANALISIS DE LA VARIANZA

+

SSE = SST - SS(Tr) - SS(BI) Nótese que los divisores de SS(Tr) y SS(BI) son el número de observacio-

nes de los totales respectivos, T?. y T.j. En el problema 11 de la pbgina 263, el lector deberá verificar que estas fórmulas son equivalentes a los términos corres- pondientes de la identidad del teorema 13.2.

Empleando estas sumas de cuadrados, podemos rechazar la hipótesis nula de que las ai son todas igual a cero con un nivel de significación a si

+ MS(Tr) SS (Tr ) / (a - 1) Fr,. = ___ - MSE SSE/(a - l ) ( b - 1) - +

excede a F,, con a- 1 y ( a - 1) ( b - 1) grados de libertad. La hipótesis nula de que las pj son todas igual a cero se puede rechazar con un nivel de signifi- cación a, si

MS(B1) SS(Bl) / (b - 1) FBZ = - - M S E SSE/(U - l ) ( b - 1)

excede a F , con b - 1 y (a- 1 ) ( b - 1) grados de libertad. Notemos que las medias de cuadrados, MS(Tr) , MS(Bl ) , y MSE, se definen nuevamente como las sumas de cuadrados correspondientes divididas por sus grados de libertad.

Los resultados obtenidos en este análisis, se pueden resumir en la siguiente tubla de andisis de la varianza:

Origelt de variacidn

Tratamiento

B1 oc

Error

Total

I F I SS(U1) b - 1 Ms(Ba MS(B1)

= SS(Bl ) / (b - 1) FBI =

(a - l ) ( b - 1) ~ SSE MSE =SSE/(a - l ) ( b - 1)

I 1

Page 265: ingenieria

CLASIFICACIONES EN DOS DIRECCIONES 257

Ilustraremos el anilisis de una clasificación en dos direcciones con una obser- vaci6n de cada tratamiento en cada bloque, considerando un experimento para comparar vanos proyectos de cascos de lanchas de motor. Como las condiciotes del aire y del agua pueden afectar la velocidad máxima de una lancha, posible- meate en un grado mayor que las diferencias en los proyectos de los cascos, cada uno de los cuatro cascos se probó en tres días diferentes, correspondientes a con- diciones de calma, moderado, y picado. En cada día las cuatro lanchas se 'corrie- ron en una ruta marcada a la velocidad máxima, habiendo sido su orden de salida al azar, y los tiempos (en minutos) necesarios para cubrir la trayectoria se muestran en la tabla siguiente:

Día I

Proyecto A

Proyecto B

45

42

Proyecto C 1 36

Proyecto D 48 Total 172

Dia 2 Día 3 Total

142

136

1%

47 150

178 203 553

7, Considerando los proyectos como tratamientos y los días como bloques, obtene- mos las sumas de cuadrados necesarias en la forma siguiente:

SST = (45)' + (46)' + . . . + (54)' - 25,484 = 265

#SE = 265 - 111 - 135 =: 19 Dividiendo las sumas de 'cuadrados por sus respectivos grados de libertad para obtener las medias de cuadrados adecuadas, obtenemos los resultados mostrados en la siguiente tabla de analisis de la varianza:

Origen de F medio cuadrados libertad vwiacidn

Cuadrado Suma de Grado de

, proyecto del casco ' 3 11.6 37.0 111

. Dias 21.1 67.6 , 135 2

Ehror 3.2 19 6

Total If "

265 4

Page 266: ingenieria

258 ANALISIS DE LA VARIANZA

Como Frr = I 1.6 excede de 9.78, valor de F.,,l con 3 y 6 grados de libertad, lle- gamos a la conclusión de que las diferencias en los proyectos de los cascos afec- tan la velocidad máxima de las lanchas. Además, como FBi 21.1 excede de 10.9, valor de F.*,, con dos y seis grados de libertad, concluimos que las dife- rencias en la velocidad máxima se deben también a las condiciones del, tiempo, es decir, que la distribución en bloques ha sido efectiva. (Para hacer más evi- dente el efecto de estos bloques, el lector deberá verificar, en el probleya 6 de la página 262, que el test de diferencias entre proyectos no da resultados signi- ficativos si consideramos los datos como una clasificación en'una sola dirección.)

El efecto ai del i-bimo casco se puede estimar por medio de la fórmula di = pi. - g,., que se puede obtener por el método de mínimos cuadrados. Las estimaciones resultantes son

= 47.3 - 46.1 = 1.2, Bs = 45.3 - 46.1 = -0.8

6?3 = 41.7 - 46.1 = "4.4, d24 50.0 - 46.1 = 3.9

Debemos observar que una clasificación en dos direcciones nos conduce auto- máticamente a repeticiones de las condiciones del experimento: por ejemplo, en el caso anterior, cada casco se prob6 tres veces. Las repeticiones se pueden tratar de diferentes maneras, y debemos tener cuidado de que el modelo empleado describa convenientemente l a situación. Una forma de obtener repeticiones adicionales en una clasificación de dos direcciones es incluir bloques adicionales, por ejemplo, probar cada casco en mayor número de días, haciendo al azar el orden de prueba en cada día. Nótese que el modelo permanece, esencialmente, igual que antes, ha- biendo cambiado ímicamente por un incremento en b y un incremento correspon- diente en los grados de libertad por bloques y por error. L.o idtimo es importante porque un aumento en los grados de libertad por error hace mús sensible el test de la hipótesis nula ai = O para todo i, para pequeñas diferencias entre las me- dias de los tratamientos. De hecho, el prop6sito real de esta clase de repeticiones es aumentar los grados de libertad por error. y por lo tanto incrementando la sen- sibilidad de los tests F (problema 9 de la página 263).

Un segundo método es repetir el experimento completo, usando un nuevo método de selección al azar para obtener a b observacipnes adicionales. Esto sólo es posible si los bloques son idmtificahles, esto es, si las condiciones que definen cada bloque se pueden repetir. 'Por ejemplo, en el experimento de los pesos de re- cljbrimiento descrito en la sección 13.1, los bloques son tiras tomadas a Io'largo de la direccicin de laminado de una hoja de acero galvanizado y, dando una nueva hoja, es posible identificar cuál es la'tira uno. cuál es la dos, etc. En el ejemplo de esta sección, esta clase de repetición (llamada generalmente rc;p€icu) es difí- cil de conseguir porque sería necesario que las condiciones del tiempo se' repitieran exactamente en los tres días. Esta clase de repetición se usará en los diseños de cuadrado latino de la seccidn 13.5. Véanse también los problemas 7 y 8 de la página 262.

Un tercer método de repetición es incluir IZ observaciones para cada trata- miento en cada bloque. Cuando se desarrolla un experimento en esta forma, las

Page 267: ingenieria

COMPARACIONES MULTIPLES 259

rl observaciones de cada “casilla” se consideran como duplicados, y es de espe- rar que su variabilidad sea algo menor que el error experimental. Para ilustrar este punto, supongamos que los pesos de los recubrimientos de tres discos de po- siciones contiguas en una tira se midieron consecutivamente por uno de los labo- ratorios, utilizando las mismas soluciones químicas. La variabiIidad de estas me- didas será probablemente mucho menor que la de tres discos de la misma tira medidos en tiempos diferentes en dicho laboratorio, utilizando soluciones químicas diferentes y, quizá, técnicos diferentes. El análisis de la varianza apropiado para esta clase de repetici6n se reduce esencialmente a un análisis de la varianza de dos direcciones aplicado a las medias de los n duplicados en las a . b casillas; lue- go, no 1zabr.ú aumento en los grados de libertad por error y, en consecuencia, no habrá aumento en la sensibilidad de los tests F.

13.4 Comparaciones múltiples

Los tests F usados en este capítulo muestran si hay diferencias entre varias medias y si éstas son significativas, pero no nos dicen si una media dada (o un grupo de medias) difiere significativamente de otra media dada (o grupo de me- dias). En la práctica esta última es la clase de información que le interesa a un investigador; por ejemplo, habiendo determinado en la phgina 251 que las medias de los pesos de recubrirnientos obtenidos por los cuatro laboratorios difieren de una manera significativa, será importante encontrar qué laboratorio (o laborato- rios) difiere de cuáles otros .

Si un experimentador se encuentra ante k medias, es razonable, en primer lu- gar, hacer tests para contrastar las diferencias significativas entre todos los posibles

pares, esto es, hacer (i) = ’9 test t de dos muestras, como los descritos

en la página 156. Adem& de1,hecho de que esto requiere un gran número de prue- bas, aún siendo k relativamente pequefio, estas pruebas no serían independientes y seria virtualmente imposible asignar a todo este proceso un nivel de significado general.

Se han propuesto varios tests de comparaciones múltiples para superar estas dificultades; entre ellas, el test del recorrido múltiple de Duncan, que estudiare- mos en esta sección (en el libro de W. T. Federer, citado en la bibliografia, se hace referencia a otros tests de comparaciones m~ltiples). Las suposiciones en que se basa el test ,del recorrido múltiple de Duncan, son, esencialmente, las del an&- lisis de la varianza en una sola dirección, con tamaños de muestras iguales. El test compara el recorrido de cualquier conjunto de p medias con un adecuado mínimo recorrido de significacicin, Rpr dado por

+ R, = S Z * T ~ +

Page 268: ingenieria

260 ANALISIS DE LA VARIANZA

donde MSE es el error cuadrado medio del análisis de la varianza. El valor de rp depende del nivel de significación deseado y del número de grados de libertad correspondiente a MSE, y se puede obtener de las tablas X ( a ) y ( b ) para (Y = 0.05 y 0.01, para p = 2, 3, . . . 10, y para varios grados de libertad entre 1 y 120.

Para ilustrar este proceso de comparaciones múltiples, nos referiremos a los datos de la página 250 y ordenaremos las cuatro medias de las muestras en un orden de magnitud creciente:

Laboratorio B C D A

Media 1 0.227 0.230 0.250 0.268

A continuación calcularemos sI, utilizando el error cuadrado medio de 0.0015 en el análisis de la varianza de la página 250, y obtendremos

SI = 4 9 = 0.011

Luego, obtenemos (por interpolación lineal) de la tabla X ( a ) los valores siguien- tes de r, para (Y = 0.05 y 44 grados de libertad:

P I 2 3 4

2 3 4 51 0.031 0.033 0.034

El recorrido del conjunto de las cuatro medias es 0.268 - 0.227 = 0.041, que excede a R , = 0.034, mínimo recorrido de significación. Se podia esperar este re- sultado, puesto que el test F de la phgina 270 demostró que las diferencias entre las cuatro medias eran significativas, para un nivel (Y = 0.05. Para contrastar las diferencias significativas entre tres medias continuas. obtenemos los recorridos 0.038 y 0.023, para los conjuntos de tres medias 0.230, 0.250. 0.268 y 0.227, 0.230, 0.250 respectivamente. Como el primero de estos valores excede a R , = 0.033, las diferencias observadas en el primer conjunto son significativas; como 'el se- gundo valor no excede a 0.033, las diferencias correspondientes no son significa- tivas. Finalmente, paca pares contiguos de medias encontramos que no hay ningún par adyacente que tengg un recorrido menor que el minimo recorrido de signi- ficación R2 := 0.031. Todos estos resultados se pueden condensar escribiendo

0.227 0.230 0.250 0.268 -

donde se ha dibujado una línea debajo de cualquier conjunto de medias contiguas para las que el recorrido es menor que el valor adecuado de Rp, esto es, debajo de cualquier conjunto de medias contiguas para las cuales las diferencias no son

Page 269: ingenieria

COMPARACIONES MULTIPLES 261

significativas. Por lo tanto, llegamos a la conclusión de que, en nuestro experi- mento, el laboratorio A promdia pesos de recubrimiento mayores que los otros tres laboratorios.

Si aplicamos este mismo método al ejemplo de la sección 13.3, en el que comparamos los cuatro cascos de lanchas, obtenemos (véase también el problema 12 de la phgina 262)

Proyecto de casco C B A D 41.7 45.3 47.3 50.0

En otras palabras, entre ternas de medias contiguas, ambos conjuntds de di- ferencias son significativos. En lo que respecta a pares de medias contiguas, en- contramos que solo la diferencia entre 41.7 y 45.3 es significativa. Interpretando estos significados, concluimos que el casco C es significativamente mejor que cual- quiera de los otros.

1. Para hallar la mejor disposici6n de instrumentos en un tablero de control, cuatro dis- posiciones diferentes se sometieron a un test simulando una emergencia y observando el tiempo de reaccibn neczsario para corregirla. Los tiempos de reacción (en dkirnas de segundos) de tres personas diferentes fueron los siguientes:

Sujeto I Sujeto 2 Sujeto 3

Disposición A 8 Disposición B 11 Disposición C 5 Disposición D I?

14 15 11 18

10 11 6

15

Utilizar el analisis de la varianza de dos direcciones adecuado, para contrastar si hay diferencias significativas entre las diversas disposiciones.

2. Suponganios que, en el experimento del problema 3 de la pAgina 252 la primera me- dida para cada marca se obtuvo con un Chevrolet, la segunda con un Ford, la ter- cera con un Plymouth, y la cuarta con un Rambler. Analizar los datos como una clasi- ficacibn de dos direcciones y contrastar si hay diferencias entre las cubiertas, con un nivel de significación de 0.05.

3. La tabla siguiente da la productividad (medida por el ndmero de piezas aceptables por trabajador y por hora) de tres turnos en una fabrica durante un periodo de una semana.

Lun. Mar. Miér. Jue. Vier. ~ ~~~ ~ ~ ~

Turno primero 5.6 6.1 5.9 6.5 5.8 Turno segundo 4.8 6.5 6.0 5.8 5.0 Turno tercero 3.9 5.8 4.2 5.9 5.1

¿Hay diferencias significativas de turno a turno o de día a día?

Page 270: ingenieria

262 ANALISIS DE LA VARIANZA

4.

5.

6 .

7 .

8.

9

Los siguientes son los números de piezas defectuosas producidas por cuatro trabajado- res que operan, por turno, en tres máquinas diferentes:

Trabajador BS Ba Bd

22 23 30 21

Aa 20 18 27 22 Mdquina ti 1 14 15 22

considerando las máquinas como “tratamientos” y los trabajadores como “bloques”, analizar los datos como una clasificación de dos direcciones. Estimar también cuántas piezas defectuosas se puede esperar que haga un trabajador operando la máquina A,. En el ejercicio 4 de la página 252, supongamos que los datos en cada una de las tres columnas se obtuvieron de precipitadores diferentes. Repetir el análisis de la varian- za, tratando el experimento como una clasificación de dos direcciones, y observar qué cambios se presentan en el error cuadrado medio. para hacer resaltar la importancia de la distribucibn en bloques, volver a analizar los datos de la pagina 257 pertenecientes a los proyectos de cascos de lancha- * como una clasificación de una sola dirección. Si, en una clasificación de dos direcciones, se repite el experimento completo r veces, el modelo se transforma en

Y i j k E EL + ai + pj + P k + ei ik

para i = 1, 2, . . . a, j y= 1, 2, . . . b, y k = 1, 2, . . . r, siendo la suma de las a, la suma de las p y !a suma de las p igual a cero. Las eiik son de nuevo valores de variables aleatarias indepcdicntes con distribuciones normales de medias cero y va- riancia común u2. ( a ) Escribir (pero no probar) una identidad análoga a la del teorema 13.2, que sub-

divida la suma total de cuadrados en componentes atribuibles a tratamientos, bto- ques, réplicas y error.

( b ) Generalizar las fórmulas de cálculo de la página 256, de tal forma que se pue- dan aplicar a un diseño de bloques al azar con réplicas. Nótese que el divisor en cada caso es igual al número de observaciones en los totales respectivos.

(c) Si el número de grados de libertad para la suma de cuadrados de réplicas es r - 1, ¿cuántos grados de libertad hay para la suma de cuadrados de error?

Supongamos, en el ejercicio 3, que las medidas de productividad se repitieron en una segunda semana con los resultados adicionales siguientes:

Segunda semana Lun. Mar. Miér. Jue. Vier.

Turna primero 5.4 6.5 5.9 7.1 6.2 Turno segundo 4.8 6.7 5.8 6.2 5.9 Turno tercero 4.3 6.4 4.6 5.9 5.3

utilizar la teoría desarrollada en el ejercicio 7 para analizar los resultados combinados de ]as dos semanas como una clasificación de dos direcciones con réplica. Como se indicó en la página 258, dos métodos para aumentar el tamaño de una d a - sificación de dos direcciones son (aj doblar el número de bloques, y ( b ) hacer una réplica del experimento completo. Discutir y comparar la ganancia en grados de mer- tad para la suma de cuadrados de error por los dos métodos.

Page 271: ingenieria

OTROS DISENOS DE EXPCRIMENTOS 263:

$0. Demostrar que, si pii = p + ( Y ~ + Pi, la media de las pij (sumadas respecto de j) es igual a p + ai, y la media de las pii sumadas respecto de i y j es igual a p , de esto

se deduce que 2 (Y¡ = z. Pi = 0. a b

i = l j-1

11. Verificar que las fórmulas de cálculo de SST, SS ( T r ) , S S ( B l ) y SSE. dadas en la pi- gina 256, son equivalentes a los terminos correspondientes de la identidad del teo- rema 13.2.

12. Verificar los resultados del test de Duncan para la comparación de los cuatro cascos de lancha, dada en la página 261.

13. Utilizar el test de Duncan con un nivel de ct = 0.05 para analizar las 'medias obteni- das para las cuatro.marcas de cubiertas del ejercicio 3 de la página 252

14. Utilizar el test de Duncan, con un nivel de [Y = 0.05, para comparar los efectos de las pinturas fosforescentes del ejercicio 7 de la página 252. I , , ,

15. Utilizar el test de Duncan, con un nivel de (Y = 0.01, .para comparar las cuatro dispo- siciones de instrumentos del ejercicio 1. ¿Qué disposícibn o disposiciones son mejores?

16. Utilizar el test del recorrido mhltiple de Duncan, oon u n ' nivel de (Y e 0.01 para analizar: ( a ) Las medias obtenidas para las tres máquinas. ( b ) Las medias obtenidas para los cuatro trabajadores del ejercicio 4.

13.5 Otros diseños de experimentos

Los diseños de bloques al azar, o las clasificaciones en dos direcciones, son apropiados cuandouna fuente extraíia de variabilidad,.se debe eliminar al compa- rar un conjunto de medias de muestras. Una característica importante' de esa cIase ,da diseños es su equilibrio, logrado dando. el mismo número de observacio- nes, para cada tratamiento en cada bloque. (En este sentido, véase también el comentario de la página 246, en el que indicamos que las diferencias debidas a bloques no afectarían las medias obtenida$ para los diferentes tratamientos.) La misma clase de, equilibrio se puede obtener en tipos más comp!icados de diseños cuando se desea eliminar el efecto de varias' fuentes de variabilidad extrañas. En esta sección introduciremos dos diseños equilibrados más generales, e1 diseño de cuadro latifro y el diseño de cuadrado gredolatino, que se utilizan para eliminar 10s efectos de dos y tres fuentes extrañas de variabilidad, respectivamente.

: . Para introducir el diseño de cuadrado latino, supongamos que se desean com- parar tres tratamientos A, B y C, en la presencia de otras dos fuentes de varia- bilidad. Por ejemplo. los tres tratamientos pueden ser tres métodos para soldar terminales eléctricas de cobre y las doh fuentes extrañas de variabilidad pueden ser (1) diferentes operadores haciendo la soldadura, y (2) el empleo de fundentes di- ferentes. Si tres operadores emplean tres fundentes, el experimento se puede pre- sentar en el siguiente esquema:

Page 272: ingenieria

264

Operador I

Operador 2

Operador 3

r

I -

ANALIS IS DE L A V A R I A N Z A

Fundenre 1 Fundente 2 Fundente 3

C I A I B I B I C I A l

L

En este caso, cada método de soldadura se aplica una vez por cada operador, junto con cada fundente y, si hay efectos sistemáticos debidos a diferencias entre operadores o entre fundentes, estos efectos se presentan igualmente en cada trata- miento, es decir, para cada método de soldadura.

Una presentación experimental, tal como la descrita anteriormente, se llama cuadrado latino. Un cuadrado latino de n X n es una disposición en forma de cua- drado de n letras distintas, en el que cada letra aparece una vez y sólo una en

5 x 5

4 x 4

Fig. 13.2 Cuadrados latinos

cad.a fila y en cada columna. En la figura 13.2 se ven ejemplos de cuadrados latinos con n = 4 y n = 5, y se pueden obtener ejemplos mayores en el libro de W. C. Cochran y G. M. Cox, citado en la bibliografía. Nótese que un cuadrado latino incluye n tratamientos, y es necesario incluir n2 observaciones, correspon- diendo n a cada tratamienio.

Como veremos en la página 286, un experimento de cuadrado latino sin ré- plicas da solamente ( n - 1) ( n - 2) grados de libertad para estimar el error expe- rimental. Por lo tanto, tales experimentos se hacen raramente sin réplica si n es pequeña, esto es, sin repetir el cuadrado latino completo varias veces. Si hay un total de r réplicas, el análisis de los datos presupone el siguiente modelo, en el que &j(k) l es la observación de la i-ésima fila y la j-ésima columna de la I-Csima ré- plica, y el subíndice k, entre paréntesis, indica que pertenece al k-bimo trata- miento:

+ Y i j ( k ) l = + ai + Pi + X k + PI + '%(k)I + para i, j, k = 1, 2, . . . 11, y 1 = 1, 2, . . . r, con las restricciones de que:

n n n r L: ai = o, L: pj = o, 2: Yk = o, y 2: pz = o.

i = l j = 1 k = l z=1

Page 273: ingenieria

OTROS DISEAOS DE EXPERIMENTOS 265‘

En este caso p es la medía mayor, ai es el efecto de la i-ctirp fila, pj es el efecto de la j-;sima columna, yk es el efécto del k-&imo tratamiento, ’ pr es. el efecto de la I-ksima replica, y las € i j ( k ) l son vaiores de variables aleatorias independientes con distribución normal de medias cero y varianza común u2. Nótese que, por “efectos de fira” y “efectos de columna”, entendemos los efectos de IaS dos variables ex- trañas, y que incluimos los.efectos de las réplicas, puesto que, como veremos, las réplicas pueden introducir una tercera variable extraña. Nótese, también, que el subindice k se encuentra entre .paréntesis en yi , (k)~ , porque, para un. diseño de cuadrado latino dado, k queda determinado automiticamente cuando se cono- cen i y j.

La hipótesis principal que queremos contrastar es la hipótesis nula yk .+:O para todas las k, es decir, la hipótesis nula de que 110 hay diferencia en la efectividad de los n tratamientos. Sin embargo, podemos contrastar también si la distribucibn de “bloqueado cruzado” del cuadrado latino es efectiva: es decir, podemos con- trastar la hipótesis nula ai = O para todas las i y pj = O para todas ‘las‘;’ (contra alternativas convenientes) para ver si las dos variables extrañas tienen .algiln efecto sobre los fenómenos considerados. Además, podemos contrastar la hipótesis nula p 1 = O para todas las 1 frente a laralternativa de que no todas las pt sean igual a cero, jr este test para los efectbs de la rc;plit*a puede ser importante si las par- tes del experimento que representan los cuadrados latinos individuales se reali- zara4 en diferentes días por técnico3 diferentes, a temperaturas . , diferentes, etc.

Las sumas de cuadrados necesarias para desarrollar estos tests se obtienen generalmente por medio de las fórmulas abreviadas siguientes. en las que Ti.. es el total de las r.n observaciones en toda la fila i, T.;, es el total de- las r . n obser- vaciones. en toda la coiumna j, T . .1 es el total de las 11’) obsrevaciones . en .la‘ rO- plica I, T c k ) es el total de todas las r . n observaciones pertenecientes al k-Psimo tratamiento y T. . . e4 .el-.total mayor de todas las ,r.n2 obgervaciones:

_ I (T...P . : . . i c = - ran2 I ( , , . ,

SS(Tr) =z - z T&) - .G‘ I ”

1 ” Ten i - 1

b ..

: I

, . Ten k - 1 1

I

SSR = - Z T:.. - C (efecto de fib)

+ +

Page 274: ingenieria

266 ANALISIS DE LA VARIANZA

Nótese que, una vez más, cada divisor es igual al número de observaciones ea los totales cuadrados correspondientes. Finalmente, los resultados del analisis quedan como se muestra en la siguiente tabla de análisis de la varianza:

Réplicas

Error

Total

Grado de libertad

n - 1

n - 1

n - 1

r - 1

(n - l)(rn + r - 3)

I n 2 - 1

Suma de .uadrados Cudrado medio

SS(TT) MS(TT) SS( TT) n - 1

-- -

SSR 1 MSR SSR 1 = n " l

ssc

SSE

SST

MSR MSE -

Como en los casos anteriores, los grados de libertad para la suma total de cuadrados es igual a la suma de los grados de libertad de las componentes indi- viduales; luego, los grados de libertad para error se encuentran, generalmente, al final por substracción.

Para ilustrar el análisis de un experimento de cuadrado latino con réplica, supongamos que se hacen dos réplicas del experimento de soldadura, empleando las disposiciones siguientes:

1 I

Hépliccl I I Futldrllrc

2 S

n I3 C

A

c A

Page 275: ingenieria

OTROS DISENOS DE EXPERIMENTOS 267

Los resultados, mostrando la fuerza de tensión en libras necesaria para sepa- rar las terminales soldadas, fueron los siguientes:

Réplicu I Réplica I1

11.0 12.0 13.5 13.5 18.0 11.5

El total para el primer tratamiento (método A) es

14.0 + 17.0 + 13.5 + 13.0 + 12.0 + 18.0 = 87.5

mientras que los totales para los otros dos tratamientos (mttodos B y,C) son

16.5 + 15.0 + 11.0 + 16.5 + 14.0 + 13.5 = 8 6 5

Y 11.0 + 9.5 + 12.0 + 10.0 + 12.0 + 11.5 = GG.0

respectivamente. Además, los totales para las tres filas son 81.0. 79.5 y 79.5: los de las tres columnas son 70.0, 92.0 y 78.0; los totales de las dos riplicas son 119.5 y '120.5, y el total'mayor es 240. Entonces. obtenemos

C = o2 = 3200.0 18

SS(TT) [(87.5)2 + (8G.5)2 + (CiG.O)'] - 3200.0 = 49.1 1

SSR = T [(81.0)2 + ($9.5)* + (79.5)': - 3200.0 = 0.2 1 6

SSC = G 1 [(70.0)' + ('32.0)' + (7S.O)'I - :K?OO.O = 11.3

Page 276: ingenieria

268 ANALISIS DE LA VARIANZA

Como las razones F para los métodos y los fundentes exceden ambas, a 7.56, va- lor de F.,) , . para 2 y 10 grados de libertad, las diferencias, tanto las debidas a los métodos como las debidas a los fundentes, son significativas. Como se puede ver por inspección, las diferencias debidas a las otras dos fuentes de variación (ope- radores y rtplicas) no son significativas. Para dar un paso más, la prueba de reco- rrido múltiple de Duncan de la sección 13.4, nos da el siguiente esquema cle cleci- s i t h con un nivel de significación de 0.01:

Método C M é t o d o B hfé lodo A

Mcdiu 11.0 14.4 14.6

Entqnces, llegamos a la conclusión de que el mttodo C nos da, definitivamen- te, soldaduras más débiles que los 'lnétodos A y B.

La eliminación de "tres fuentes extrañas de variabilidad se puede hacer por medio de un diseño denominado "cuadrado greco-latino". Este diseño es una dis- posición en cuadro de I? letras latinas y Ir letras griegas, en el que tanto las letras latinas como las griegas forman, cada una, un cuadrado latino; además, cada letra latina aparece una vez y sólo una junto con cada letra griega. El siguiente es un ejemplo de un cuadrado greco-latino de 4 X 4:

_ ~ _ _

1 A a 1 Ir0 1 Cr

La construcción d l cuadrados greco-latinos, llamados también cuadrados latinos orfogonales, plantea varios problemas matemáticos interesantes, algunos de los cua- les se mencionan en el libro de H. B. Mann, citado en la bibliografía.

Page 277: ingenieria

OTROS DISEAOS DE EXPERIMENTOS 269

Para dar un ejemplo en el que .es conveniente utilizar un cuadrado greco- latino, supongamos que, en el ejemplo de las soldaduras, se considera la tempe- ratura de soldadura como una fuente adicional de variabilidad. Si se emplean tres soldaduras a temperaturas diferentes a, /3 y y, junto con los tres métodos, los tres operadores (filas) y los tres fundentes (cdlumnas), se puede presentar una réplica de un experimento de cuadrado greco-latino, en la forma siguiente:

Fundente 1 Fundente 2 Fundente 3

Operador I 1 A ,

Operador 2

cff , I A Y . 1 I: 6 Operador 3 A @ ~ l h

(‘lY

Entonces, el método A se empleará con el operador 1, usando el fundente 1 y la temperatura a; con el operador 2; ,el fundente 2 y la temperatura /?; y con el operador 3, el fundente 3 y la temperatura y. Similarmente, el método B se usarh con el operador 1, el fundente 2 y la temperatura y, etc.

En un cuadrado greco-latino, cada variable (representada por filas, columnas, letras latinas, o letras griegas) está “igualmente distribuida” sobre las otras varia- bles. Luego, al comparar las medias obtenidas por una .variable, todos los efectos de las otras variables quedan promediados. El análisis de un cuadrado greco-latino es semejante al de un cuadrado latino, con la adición de una fuente extra de va- riabilidad correspondiente a las letras griegas.

Existe una gran variedad de diseños experimentales además de los discutidos en este capítulo que son útiles para diversos fines. Entre los más corrientemente utilizados están los diseiios de bloques incompletos, que se caracterizan por que cada tratamiento no está representado en cada bloque. Si el nilmero de trata- mientos investigados en un experimento es grande, sucede frecuentemente que es imposible encontrar bloques homogéneos, de tal forma que cada uno de los tra- tamientos se pueda acomodar en un bloque. Por ejemplo, si se van a comparar II pinturas, aplicando cada una a una hoja de acero y después calentindola en un horno, será imposible poner todas las hojas en el horno al mismo tiempo. En consecuencia, será necesario utilizar un proyecto experimental en el que k < n tra- tamientos (pinturas) se incluyan en cada bloque (calentamiento en el horno). Una forma de lograr esto, es asignar los tratamientos a cada hornada en tal modo que cada tratamiento se presente junto con cada otro tratamiento en el mismo nilmero de bloques. Esta clase de proyecto se llama provrcto de hloqrres incompletos equi- librados, Y podemos utilizar el siguiente esquema para J Z = 4 y k = 2:

I ,CY I ea

~~ ”” __ - . ~ _ _ _ _

Hornnda . Pi l l / l l rm

1 2

l Y 2 3 Y 4

3 l Y 3 4 2 Y 4 6 - l y 4 6 1 2 Y 3

Page 278: ingenieria

270 ANALISIS DE LA VARIANZP

Los proyectos de bloques incompletos equilibrados tienen la ventaja de que se pueden hace; con igual precisi6n las comparaciones entre dos cualesquiera de los Iratamientos.

Como los proyectos de bloques incompletos equilibrados requieren demasiados bloques, se han desarrollado muchos otros modelos. La mayoría de estos diseños experihentales surgieron para cubrir lis necesidades específicas de algún investi- gador, especialmente en el campo de la agricultura. Como hemos indicado ante- riormente, el lenguaje empleado en estos diseños, incluyendo términos como “tra- tamiento”, “bloques”, etc., provienen de la agricultura. Sólo en los años recientes se han aplicado estos métodos a la experimentación industrial y de ingeniería y, con una aplicación más amplia, es de esperarse que se desarrollen muchos nuevos diseños para cubrir las necesidades de estos campos.

EJERCICIOS 1. Se empleó un cuadrado latino con tres réplicas para comparar tres combustibles ex-

perimentales. Los números representan los minutos que los motores E, , E , y E , estu- vieron trabajando, operados por los mecánicos M,, M , y M , , teniendo 1 galón de los combustibles A , B o C. Las replicas pertenecen a duplicados del experimento completo hecho (con orden al azar), en tres dias consecutivos.

B Z 6 1 ‘ 1 6 1 24 I ‘19 I A 2 4 1 B 2 8 1

Analizar estos datos y, si la hipbtesis nula referente al efecto de los combustibles se puede rechazar, aplicar el test del recorrido múltiple de Duncan para analizar las me- dias correspondientes.

2. En el problema en el que se distribuyen muestras de recubrimiento de estaño entre cua- tro laboratorios (Sección 1 3 . 1 ) , supongamos que se encuentran diferencias sistemáticas en el peso del recubrimiento, tanto en la dirección del laminado como en !a trans- versal. para eliminar esas dos fuentes de variabilidad, cada una dc dos láminas de

Page 279: ingenieria

OTROS DISENOS, DE EXPERIMENTOS 271

hojalata se divide en 16 partes, que representan cuatro posiciones a lo largo y cuatro a lo ancho de ¡a dirección de laminado. Luego, se mandan cuatro muestras de cada lámina a cada uno de los laboratorios A , B, C y D, como se muestra, y los pesos de recubrimiento determinados son:

Réplic, - 1 .29 I A .25

D B .28 I .18

.28 .23

""

C D

"

A C .30 , .19

a l

Diry:ón

laminado -

.21 a .25 .28

"

A C B

-___ B A D

.20 .28 .34

D A .24 .25 .32

Réplica ¡I

A

.24 1 .20 1 .27 1 ______- c A ID

.19 .22 .28

B ' C A .23 .21 .28

C

A partir de estos datos, determinar si los laboratorios están obteniendo resultados co- rrectos. Determinar también si hay diferencias en los pesos reales de recubrimiento a lo largo y a lo ancho de la dirección de laminado. !EmpIear.un nivel de significación de 0.0%)

3. Las siguientes son las medidas de la resistencia a la rotura (en onzas) de los hilos de lino A , B. C, D y E , obtenidos por S técnicos de laboratorios en 5 díap diferentes:

Técnicos TI Tz T3 7'4 T6

A B 1 19.6 D

30.2

24.5 1 A 31.0 23.4 27.1 21.4

21.5 1 E 17.3 24.3

B E D C

C B A B D ~-

20.7 20.6 29.1 25.2 26.5

D C B A E ___-

20.7 22.2 25.2 32.3 24.7

E D C B A "-

20.6 21.5 23.6 23.9 35.8

Analizar este experimento de cuadrado latino y aplicar la prueba del recorrido múlti- ple de Duncan, con a! = 0.01, a las medias de las resistencias a l a rotura de los cinco hilos de lino. .

4. U n fabricante de telas desea .determinar cuál, de cuatro agujas diferentes, es mejor para su máquina de coser. Las fuentes de variabilidad que deberán ser eliminadas para hacer esta comparación son: la máquina empleada actualmente, el operador y el tipo de hilo. Utilizando el diseño de cuadrado greco-latino mostrado a continuación (las filas repre- sentan operadores; las columnas representan máquinas; las letras latinas, agujas; y las letras griegas, tipos de hilo), el fabricante anotó los números de prendas rechazadas al cabo de dos días, con los siguientes resultados:

Page 280: ingenieria

272 ANALISIS DE LA VARIANZA

Primer día

Ca I Ay 15 j 6 42

28 ! Bg 8 ~ Aa 24 I " 34

24 ' B6 DP

-I"--" D6

1 30 ~ 21

C6 D y 13

I 1- I I

Usando un nivel de significado de 0.05, determinar si hay alguna diferencia entre las agujss. Determinar también si hay diferencias significativas entre los operarios, las má- quinas y los tipos de hilos.

5. Para estudiar la eficacia de diferentes clases de envases, un fabricante de desayunos hizo el siguiente experimento de cuadrado greco-latino, donde A , B, C, D y E representan tipos diferentes de envases, c y , U, y, 6, y B representan (en orden creciente de magnitud) las cantidades de dinero gastadas en anuncios del producto el día anterior al experi- mento, y las filas representan localizaciones diferentes en supermercados proyectados idhticamente, los cuales, a su vez, esan representados por las cinco columnas. Los números representan las ventas de desayunos de 9 A.M. a 11 A.M.

Aa 50

B y 51

1 43 ~ 47 1 'Or 41 1 42 I " 42 1 Analizar este experimento.

6 . La siguiente es un modo sencillo de construir cuadrados greco-latinos cuyo lado es un ndmero primo impar p . Comenzamos por construir dos cuadrados latinos. En el pri- mero, ponemos el número i 9 j- 2 en la casilla correspondiente a la i-bsima fila y la jdsima columna, restando p si una entrada excede de p - 1. En el segundo cuadrado ponemos el ntimero 2i + j- 3 en la casilla correspondiente a la i-&sima fila y la /-bsima columna, restando p ó 2p, de tal forma que ninguna entrada exceda de p - 1. Si en- tonces substituimos por A , B. C. . . . los números o, 1, . , . p - 1 en el primer cuadrado, y por cy, @, y , . . . los números 0 , 1, . . . p - 1 en el segundo cuadlado los cuadrados superpuestos constituyen un cuadrado greco-latino. (a) Verificar que este mttodo se utilizó para construir el cuadrado greco-latino del

problema 5.

Page 281: ingenieria

OTROS DISEMOS DE EXPERIMENTOS 273

(b) Utilizar este m6todo para construir un cuadrado greco-latino de 3 X 3 y otro de 7 x 7.

(c) Comprobar que este m6todo da un cuadrado greco-latino para cualquier ndmero primo impar p . [Sugerencia: probar primero que cada uno de los dos cuadrados es un cuadrado latino y probar después que cada par de letras latina y griega se presenta una vez y.sblo una.]

I ,

8 .,

Page 282: ingenieria

14 1 EXPERINIENTACIBN FACTORIAL

I

114.1 Experimentación de dos factores

En el capítulo 13, nos interesamos principalmente en los efectos de una va- riable CUYOS valores los considerábamos Como “tratamientos”. Las variables extra- ñas se acomodaron para evitar su influencia en bloques, réplicas, filas o columnas de cuadrados latinos y en formas más complicadas de diseños. En este capítulo trataremos de los efectos individuales y en conjunto de varias variables, y de las combinaciones de los valores, o niveles, de esas variables que harán ahora el papel de diferentes tratamientos. Las variables extrañas, si las hay, se tratarán como antes.

Para considerar un experimento simple de dos factores (dos variables), supon- gamos que se desea determinar los efectos de la temperatura de la caldera y el espesor del horno en el tiempo necesario para hacer coque. Las condiciones expe- rimentales utilizadas son

Ancho drl Temperatura de puses hogar (grados F )

4 1600 4 1900 8 1600 8 1900

12 1600 12 1900

Page 283: ingenieria

EXPERIMENTACION DE DOS FACTORES 275

y si se hacen varios bloques (o réplicas) ~ consistente cada uno en estos seis “tra- tamientos”, será posible analizar los datos como una clasificación en dos direccio- nes y contrastar las diferencias significativas entre las medias de los seis trata- mientos. Sin embargo, en este caso el experimentador está interesado en conocer algo más que esto: .desea saber si las variaciones en el espesor del horno o en su temperatura afectan al tiempo para hacer el coque, y posiblemente también si cual- quier cambio en este tiempo atribuible a variaciones del espesor,.es el mismo a diferentes temperaturas.

Contestar preguntas de este tipo será posible si las condiciones del experi- mento, los tratamientos, consisten en combinaciones adecuadas de los niveles (o valores) de los distintos factores. Los factores, en este caso, son el espesor y la temperatura; el espesor tiene los tres niveles 4, 8 u 12 pulgadas, mientras que la temperatura tiene los dos niveles 1600 y 1900 grados Fahrenheit. Nótese que los seis tratamientos se escogieron de tal forma que cada nivel del espesor del horno se asocia una vez a cada nivel de la temperatura. En general, si dos factores A y 11 se investigan en a niveles y b niveles, respectivamente, y si hay a.b condiciones experimentales (tratamientos) correspondientes a todas las combinacions posibles de los niveles de los dos factores, el experimento resultante se denomina a p e - rimento factorial a X b completo. Nótese que, si una o más de las a.b condicio- nes experimentales se omite, aun así se podrá analizar el experimento como una clasificación en dos direcciones, pero no se podrá analizar como un experimento factorial. Es costumbre omitir la palabra “completo‘“, ya que el experimeato fac- torial a X b’ debe contener condiciones experimentales correspondientes a todas las combinaciones posibles de los niveles de los dos factores. ,

Para obtener una estimación del error experimental en un experimento de dos factores, es necesario hacer réplicas, esto es, repetir el conjunto completo de las ;! .b condiciones experimentales, tat como un total de Y veceq, tomando al azar el orden de aplicación’ de las condiciones en cada rkplica. Si Yijk es da observación de la k-ésima réplica, tomada con el i-ésimo nivel del factor ,A y el j-ésimo nivel del factor B, el modelo necesario para el análisis de esta clase de experimentos se escribe corrientemente de la siguiente forma

+ Y i i k = f ai + pj + (ab)ij + pk + E i j k + para i = 1, 2, . . . a; j == 1, 2, , . b; y k = I , 2, , . . Y. En este caso p es la me- iia mayor, ai es el efecto del i-ésimo nivel del factor A, p,i es el efecto del j-6simo live1 del,factor B.: (@)ij es la interaccihn, o efecto conjunto, del i-ésimo nivel del :actor A y el j-ésimo nivel del factor B, y pr; es el efecto de la k-ésima réplica. [gual que en los modelos empleados en el capítulo 13, supondremos que las e i ik

ion vaIores de variables aleatorias independientes que tienen distribuciolies nor- nales con medias cero y varianza comb ~9. También, en forma análoga a las estricciones impuestas a los modelos de las phginas 266 y 275. supondremos que

a b a b 7

i = l 3 = 1 a = 1 3 - 1 2 ai = ,2 Pj = ,X (ap)ii = ,X (aB)iJ ,S, p k = o

Page 284: ingenieria

216 EXPERIMENTACION FACTORIAL

Se puede demostrar que estas restricciones aseguran estimaciones únicas para los parámetros p , ai, Pj, (aP)ij, y m.

Para ilustrar el modelo utilizado en un experimento de dos factores, consi- deremos un experimento con dos réplicas en las que el factor A se presenta en dos niveles y el factor B en otros dos niveles y los efectos de la réplica son O, esto es, pt = p2 = O. En vista de las restricciones impuestas a los parámetros, tendremos

y las medias de las poblaciones correspondientes a las cuatro condiciones expe- rimentales definidas por los dos niveles del factor A , y los dos niveles del factor B se pueden escribir de la siguiente forma:

Sustituyendo ,Uijl = pij. por la media de todas las observaciones obtenidas para el i4simo nivel del factor A y el j-ésimo nivel del factor B encontramos cuatro ecua- ciones lineales simultáneas que se pueden resolver para los parámetros p, cyl, p1 y (q3) (problema 7 de la página 290).

Para continuar con nuestra ilustración, supondremos ahora que p = 10. Si todos los demás efectos son nulos, cada una de las pijk será igual a 10, y la super- ficie de resputsta será un plano horizontal, como el mostrado en la figura 14.1 (a). Si afiadimos ahora un efecto del factor A, con al = -4, la superficie de res- puesta se convierte en el plano inclinado mostrado en' la figura 14.1 (b), y si añadimos a esto un efecto del factor B, con PI = 5, obtenemos el plano mostrado en la figura 14.1 (c). Nótese que los efectos de los factores A y B son aditivos, esto es, el cambio en la media de cualquier factor al ir del nivel 1 al nivel 2 no depende del nivel del otro factor, y la superficie de respuesta es un plano. Si ahora incluimos una interuccitin, con CY/^),^ = -2, el plano se curva como se muestra en la figura 14.1 (d), los efectos ya no son aditivos y la superficie de respuesta ya no es un plzno. Nótese, también, que, si los efectos de las réplicas no fueran igual a cero, habríamos obtenido una superficie diferente para cada réplica: la su- perficie de la figura 14.1 (d) para cada réplica se habría inclinado cierto nitmero de unidades hacia arriba o hacia abajo.

El analisis de un rxperimetlto fuctorial u X h se basa en la siguiente descom- posici6n de la suma total de cuadrados. Primero, subdividimos SST en compo- nentes atribuidas a los tratamientos, las riplicas (o bloques), y error, por medio de la identidad

Page 285: ingenieria

EXPERIMENTACION DE DOS FACTORES 277

Excepto en la notación, suma total de cuadrados

esta identidad es equivalente a la del teorema 13.2. La en el primer miembro de la identidad tiene abr- 1 gra-

dos de libertad. Los términos del segundo miembro son, respectivamente, la suma de cuadrados de los tratamientos, con ab - 1 grados de libertad, la suma de cua- drados de las réplicas (o bloques), con ‘ I - l grados de libertad, y la suma de cuadrados de error, con (ab - 1) ( r - 1) grados de libertad. (Ndtese que los va-

(a) Efectos factoriales ausentes (b) Efectos A solamente

P i j k

I ‘r

A’ (a) Efectos factoriales ausentes (b) Efectos A solamente

(c) Efectos de 8 suplementario (d) Efecto suplementarlo de interaccion

FIG. 14.1 Efectos factoriales

Page 286: ingenieria

278 EXPERlMENTAClON FACTORIAL

rios grados de libertad son los mismos que los del análisis de varianzas de la tabla de la página 256 si sustituimos ab por Q y r por b.)

No hay nada nuevo en este análisis de los datos; se trata de el análisis de una clasificación en dos direcciones, pero el hecho que distingue a un experimento factorial es que la suma de cuadrados de los tratamientos se puede continuar sub- dividiendo en componentes correspondientes a los distintos efectos factoriales. Así, para un experimento de dos factores, tenemos la siguiente subdivisih. o descom- posición, de la suma de cuadrados de los tratamientos:

a b a b

i - l i - 1 i - 1 3 = l r Z Z (pi,. - p...)2 = rb Z (pi.. - + ra @.i. -

a b

i= lJ .= l + r 2: Z ( p i . - vi.. - p.j. + p...I2

El primer término del segundo miembro mide la variabilidad de las medias co- rrespondiente a los diferentes niveles del factor A, y llamamos a esta suma de cuadrados del factor A, SSA. Similarmente, el segundo término es la suma de cua- drados del factor B, SSB, y el tercer témino es la suma de cuadrados de las in- teracciones, S S ( A B ) , que mide la variabilidad de las medias gij. que no es atri- buible a los efectos individuales (o separados) de los factores A y B. Los ab - 1 grados de libertad de los tratamientos se subdividen, análogamente, en a - 1 gra- dos de libertad para el efecto del factor A, b - 1 para el efecto del factor B, y

ab - 1 - (a - 1) - (b - 1) = (a - l ) ( b - 1)

grados de libertad para la interacaón. Para ilustrar el análisis de un experimento de dos factores, nos referiremos

nuevamente al experimento del coque dekcrito en la página 274 y supondremos que tres réplicas dieron los siguientes tiempos (en horas):

Factor B Factor A Temperatura dc

Ancho del hogar los guses Rep. 1 Rep . 9 Rep. S Total

4 1600 3.5 3.0 2.7 9.2 4 1900 2.2 2.3 2.4 6.9 8 1600 7.1 6.9 7.5 21.5 8 1900 5.2 4.6 6.8 16.6 12 1600 1o.s 10.6 11 .o 32.4 12 1900 7.6 7.1 7.3 22.0

Total 36.4 34.5 37.7 108.6

Siguiendo el procedimiento utilizado para analizar una clasificación en dos direcciones, calculamos primero el término de corrección

Luego, la suma total de cuadrados está dada por

SST = (R.5)2 + (2.2)2 + . . . + (7.3)2 - 655.22 = 149.38

Page 287: ingenieria

EXPERIMENTACION DE DOS FACTORES 279

y las sumas de cuadrados de los tratamientos y las réplicas (en lugar de bloques) esthn dados por

SS(TT) = 3 [(9.2)' + (6.9)' + . . . + (22.0)2] - 655.22 = 146.05 1

SSR = g [(36.4j2 + (34.5)' + (37.7)'] - 655.22 = 0.86 1

Finalmente, por substracción, obtenemos

SSE = 149.38 - 146.05 - 0.86 = 2.47

Se puede facilitar la subdivisión de la suma de cuadrados de los tratamientos en componentes para los factores A y B y para la interacción, construyendo la siguiente tabla en dos direcciones, en que las entradas son los totales de la CO-

lumna derecha de la tabla que da los datos originales:

Factor B Temperaruru de los gtrses

1600 1900

4 16.1 6.9 9.2 Factor A

Atrcho del hogur 8 38.1 16.6 21.5

12 I 32.4 1 22.0 1 54.4

63.1 45.5 108.6

Empleando fórmulas semejantes a las que utilizamos para calcular las sumas de cuadrados de varios efectos en el capítulo 13, tenemos ahora los dos efectos principales

= 6 [(16.1)' + (38.1)' + (54.4)'] - 655.22 123.14 1

= - [(ti3.1)' + (15.5)'] - 655.22 = 17.21 1 9

y para la interarcicin

S S ( A B ) = SB(Tr) - SS.4 - SSB

= 146.0.5 - 122.l.l - 1'7.21 = 5.70

Page 288: ingenieria

280 EXPERIMENTACION FACTORIAL

Finalmente, dividiendo las diferentes sumas de cuadrados por sus grados de liber- tad y dividiendo los medios cuadrados por el error medio cuadrado, obtenemos los resultados mostrados en la siguiente tabla de análisis de la varianza:

La prueba F para réplicas no es significativa ni en el nivel 0.05 ni en el 0.01, pero las otras 3 pruebas F son significativas en el nivel 0.01. En consecuencia, recha- zamos la hipótesis nula de que las ai son todas igual a cero, la de que las p.; son todas igual a cero, y la de que las (a/3)ij Eon todas igual a cero. Estos resultados se ilustran en la figura 14.2, en la que se ve la tendencia de los tiempos de coqui- zación medios a variar el espesor de horno para. cada una de las temperaturas. En esta figura se ve claramente que el aumento en el tiempo al cambiar el es- pesor es mayor a la temperatura mAs baja. En vista de esta interacción, se debe tener mucho cuidado al establecer los resultados de este experimento. Por ejem- plo, sería muy erróneo establecer que el efecto de aumentar la temperatura de

Temperatura de los gases

O 4 8 12 Ancho del hogar (pulgada)

Fig. 14.2 Resultados del experimento .de la coqulficaciCh

Page 289: ingenieria

EXPERIMENTOS DE VARIOS FACTORES m3 1 6 0 0 O a 1900° F serviría para disminuir e1 tiempo de coquización en (63.1/9) - (45.519) = 1.96 horas. De hecho, este tiempo se disminuye en promedio sólo una cantidad tan pequeña como 0.77 horas cuando el espesor de 'las paredes del horno es de 4 pulgadas y en tanto como en 3.47 horas cuándo el espesor es de 12 pul- gadas.

14.2 Experimentos de varios factores

Una gran parte de la investigación y experimentación industrial está dirigida a descubrir los efectos individuales y de conjunto de algunos factores en variables que son las mis importantes en los fenómenos investigadd. El tipo de clasifica- ción en dos direcciones o el de bloques simples al azar son los tipos de diseños de experimentos más usados, pero la característica distintiva de la mayoría de ellos es la disposición factorial de los tratamientos, o de las condiciones experimentales. Como observamos en la secci6n precedente, se pueden analizar r conjuntos de da- tos perteneciehtes a a.b condiciones experimentales, como un experimento facto- rial con r réplicas si las condiciones experimentales representan todas las combi- naciones posibles de los niveles de dos factores A y B. En esta, sección, extende- remos el anilisis de los experimentos factoriales al caso de más de ,dos factores. esto es, a experimentos donde las condiciones representan toda las combinaciones posibles de los niveles de tres, o más, factores. '

Para ilustrar el análisis de un experimento de muchos factores considerare- mos la situación siguiente. Se emplea un baño de solución sulfúrica caliente para quitar los óxidos de la superficie de un metal antes de someterlo a un recubri- miento electrolítico, y se desea determinar qué factores, además de la concentra- ción de ácido sulfúrico, pueden afectar la conductividad eléctrica del baño. Como se sabe que la concentración de la sal y la temperatura del baño afectan también la conductividad, se planea un experimento para determinar los efectos indivi- duales y en conjunto de estas tres variables sobre la conductividad eléctrica del baño. Para cubrir los recomdos de concentraciones y temperaturas que se encuen- tran normalmente, se decide emplear los niveles siguientes para los tres factores:

FllCtOr Nivel I Nivel 2 Nivel 3 Nivel 4

A . concentración de O G 12 18

B. Concentraci6n de O 10 20

C. Temperatura del 80 100

Acid0 7%

sal IC

baño

El experimento factorial resultante necesitará 4.3.2 = 24 condiciones expe- rimentales en cada réplica, donde cada condición experimental es un baño. hecho de acuerdo con las especificaciones. El orden en que se deben tomar estos baños serrin al azar. Supongamos que efectivamente se han completado dos réplicas del

Page 290: ingenieria

EXPERIMENTACION FACTORIAL

RESULTADOS DE LOS EXPERIMENTOS DE I1 \ N O - /lCI,D() I

, . N i d drl f w o r Cc,,lducrividl!j (dm!cItcB) A /I C' /<?/J. 1 ' h p . 2 Totnl

1 1 1 0.99 0.93 1.92 1 1 2 1.15 0.99 2.14 1 2 1 0.97 0.91 1.88 1 2 2 0.87 0.86 1.73 1 3 1 0.95 0.86 1.81 1 3 2 0.91 0.85 1.76 .

~2 1 I 1 .o0 1.17 2.17 2 1 2 1.12 1.13 2.25 2 2 1 0.99 1 .o4 2.03

2 :? 1 0. 97 0.95 1.92 2 3 2 0.94 0.99 1.93

E . 3 1 1 1.24 1.22 2.46 3 1 2 . 1.12 1.15 2.27 3 2 1 1.15 0.95 2.10

, 3 2 2 ~ . 1.11 0.95 2.06 3 3 1 1 .m 1 .0 i 2.04 Y 3 ' 2 1.12 0.9G 2.08 4 1 1 1.24 1.20 2.44

. 4 1 2 1.32 1.24 2.56 4 2 1 1.14 1.10 2.24 4 2 2 1.20 1.19 2.39 4 3 1 1 .o2 1.01 2.03 4 3 ' 2 1.02 ' 1.00 2.02

?'otrd 25.53 24.64 50.17

___ "" . " "-_I_

,c.. 2 2 2 0.96 0.98 1.94

"

Page 291: ingenieria

EXPERIMENTOS DE VARIOS FACTORES ,283

experimento, esto es, se han medido las conductividades de los diferentes haiios. y los resultados son los mostrados en la tabla de la página 303.

El modelo que supondremos para el analisis de este experimento (o cualquier experimento similar de tres factores) es una extensión inmediata del usado en la sección 14.1. Si Yi jk l es la medida de conductividad obtenida en el i-ésimo nivel de concentración de ácido, el j-ésimo nivel de concentración de sal. el k-ésimo ni- vel de temperatura del baño de la /-ésima réplica, tendremos

para i = 1, 2, . . . a; j = 1, 2, . . . h; k = 1, 2, . . . C: y 1 I= I , 2. . . . I'. Supo- nemos, también, que las sumas de los efectos principales (a, p y y ) y la suma de los efectos de las réplicas son igual a cero, que las sumas de los efectos de la interacción en dos direcciones sumadas respecto de cualquier subindice son igual a cero para cualquier valor de los otros subindices. y que la suma de los efectos de la interaccicin en tres direcciones sumadas respecto de uno cualquiera de los subindices, vale cero para cualesquiera valores de los otros dos subíndi- ces. Corno antes, .setlsupone que las fillil spn valores de variables,~lea.toriali. inde: pendientes que tienen medias. cero y variapza corniln Q?.

Comenzamos el análisig de. los datos tratando el experiqwnto carno un? . d a - sificación en dos direcciones con a.b , c tratamientos , y r rCpjicas ibloqu:sJ y .u t i - lizando las,fórmulas abreviadas de la página 256, obtenemos , t .

$ t . 4

? C = = cE!T = 3. . .1 :Jgl , * ''b, ' .

48 ' l ! . '

SST = (0.99)2 + (1.15)Z + . . . + (1.00)~ - 52:k:Hl = o.o1i'25

1 2

, J

SS(Tr) = [(l.OJ)l + (2.14)? + . . . + (2.02~21 - >+.L::S1 = 0.5712

SSE = O.OlY21 - 0.57 1s - 0.Olii.i = 0.07 17 ' 3 , . , ,

Los grados de libertad para estas sumas de cuadrados'son. respectivamente, 47. 23, 1 y 23.

A continuación, deseamos subdividir las sumas dc: cuadrados de los trata- mientos en las tres s w n m (le cuadrudos de l o s efectos principales SSA, SSB, SSC. las tres sumas de cwudtudos (le k c itzter-crtr*itirz c t r tlos dirccciolles SS(AB). SS(AC) y SS(BC). y la slmlu (IC. o * r t u l t d o s (le itlto.~l~u.ionc.s P I I trcs tlitwciorrrs SS(ABC). Para facilitar el crilculo de estas sumas. construiremos primero Ins trcs tablas si- guientes anrilogas a la de la prigina 279:

Page 292: ingenieria

284 EXPERIMENTACION FACTORIAL

1

9

s

4

A

B 1 6 S

4.06 3.61

3.85 3.97 4.42 .

3.57

4.12 4.16 4.73

"- " _ ~

-"14.05 I

18.21 16.37 15.59

- 11.24

12.24

13.01

13.68

50.17

A

-

B 1 2

1

2

S

4

S

6.60 I 6.41 I ' 13.01

6.71 I 6 . 9 7 1 13.68

25.04 25.13 50.17

1 I 8.99 18.21 16.37 15.59 50.17

25.13 8.12 2 9.22 8.25 I 25.04

C "-

Las entradas de estas tablas son los totales de todas las medidas obtenidas en los niveles respectivos de las dos variables. Nótese la "autocomprobacii' de es- tas tablas; los mismos totales marginales aparecen varias veces, dhndonos una com- probacirin nipida y eféctiva de los chlculos.

Para calcular SSA, SSB y SS(AB) nos referimos a la primera tabla 'y utili- zamos una identidad semejante a la de la pagina 278. Estos chlculos son para- lelos a los que se necesitan para SSA, SSB y SS(AB) en el experimento de dos factores. Para hacer la suma de cuadrados de los tratamientos, calculamos primero

I = - L(4.06)' + (4.42)2 + . . . + (4.05)z-j - 52.4381 1 4

= 0.5301

y luego obtenemos

. , 1 - " [(11.24)' + . . . + (13.68)'] - 52.4381 12

= 0.2750

Page 293: ingenieria

EXPERIMENTOS DE VARIOS FACTORES 285

- " ' [(18.21)2 + (16.37)? + (15.59)?] - 52.4381 16

= ().z2(j%

Y SIS(AB) = 0.5301 - 0.2750 - 0.22ti2

= 0.0289

Haciendo 10s mismos cálculos para las tablas segunda y tercera de la Pagina 284. obtenemos, similarmente,

ssc = 6.0002 y SS(AC) = 0.0085

y el análisis de la tercera tabla nos da

SS(BC) = 0.0042

Para la suma de cuadrados de la interacción en tres direcciones. obtenemos, por substracción,

SS(A BC) = SS(Tr) - SSA - K3B - SSC - SS(AB) - SS(AC) - SS(BC) = 0.5712 - 0.2750 - 0.2262 - 0.0002 - 0.0280 - 0.0085 - 0.0042

= 0.0282 '

Nótese que los grados de libertad para cada efecto principal son uno menos quc el número de niveles del factor correspondiente. Los grados de libertad para cada interacci6n son el producto de los grados de libertad de los factores que. aparecen en la interacción. Así, los grados de libertad de los tres efectos principales son 3, 2 y 1 en este ejemplo, &entras que los grados de libertad de las interacciones en dos direcciones son 6, 3 y 2, y los grados de libertad de la interaccicin en tres direcciones es 6. :,

La tabla de la página Siguiente muestra el análisis de la varianza completo para el experimento del baño ácido.

Obteniendo los valores adecuados de Zf'.05 y F.,il en la tabla VE, vemos que cl test para las réplicas es significativo en el nivel 0.05 (tal vez las dos rgplicas se hicieron bajo diferentes condiciones atmosf2ricas o el term6metro empleado para medir lhs temperaturas de los bhños se descalibrb, etc.), las pniébas para el fac- tor A y el factor B (efectos principales) son significativas al nivel 0.01 y ninguna de las otras pruebas F son significativas en ningim nivel. De este an6lisis con- cluimos que variaciones en la concentracicin de Acid0 y en la coneentraci6n de sal, afectan la conductividad elGctrica, las variaeiones en la' temperatura'del baficl no la afectan y que''n0 hay intel'acciones. Daremos 1111. paso m%, investigando las maprilucles, de los efectos, estudiando las gr5ficas de las medias como las .mostra- das en las figuras 14.3 y 14.4. En ellas vemos' que la c~nductividad aumenta a medida que se afiade dcido y disminuye a niedida que se afiade sal: 'utilizando los

Page 294: ingenieria

286 EXPERIMENTACION FACTORIAL

Origen de cuadrados libertad variaciórr Suma de Grados de

"

Replicas

Efecto principal

0.0165 1 "______

A

0.0002 1 C 0.2262 2 B 0.2750 3

lnteracción de dos factores

A B

0.0042 2 BC 0.0085 3 AC 0.0289 6

1 Interacción de tres factores

ABC

23 Error

6

- - _____

Total 47

0.0282

0.0747

0.6624

Cuadrado medio F -___

0.0165 5.16

0.0917

< 1 0.0002 35.34 0.1131 28.66

0.0048

< 1 0.0021 < 1 0.0028 1.50

0.0047

0.0032

1.47 -

métodos del capítulo 12, podemos ajustar rectas, curvas o superficies para descri- bir la superficie de respuesta que relaciona la conductividad con las variables con- sideradas.

Concentracidn de ácido (por ciento)

Fig. 14.3 Efecto de la concentración de ácido

ConcentraciQn de ácido (por ciento)

Fig. 14.4 Efecto de la concentración de sal

El procedimiento general de cálculo para un experimento de muchos factores es semejante al método ilustrado aquí para un experimento factorial de 4 X 3 X 2. En primer lugar, analizamos los datos como una clasificaci6n en dos direcciones (o cualquier otro diseño que se utilice) y después analizamos la suma de cua- drados de los tratamientos, descomponiéndola en las componentes atribuidas a los diversos efectos principales y las interacciones. En general, la suma de cuadrados

Page 295: ingenieria

EXPERIMENTOS DE VARIOS FACTORES 287

para cada efecto principal se obtiene sumando los cuadrados de los totales corres- pondientes a los diferentes niveles de dicho factor, dividiendo por el número de observaciones que comprende cada uno de estos totales y restando después el tér- mino de corrección. La suma de cuadrados de cualquier interacción se obtiene SU-

mando los cuadrados de todos los totales obtenidos sumando respecto de los sub- indices pertenecientes a los factores no incluidos en la interacción, dividiendo por el número de observaciones que comprende cada uno de estos totales y restando despuCs el término de corrección y todas las sumas de cuadrados correspondien- tes a los efectos principales y a las interacciones de los menos factores que in- cluyen los factores que intervienen en aquella interaccibn.

EJERCICIOS

Los datos siguientes son los tiempos de vida (en horas) de cuatro alas de aeroplanos sujetas a tres clases diferentes de vibraciones (a frecuencia constante, corriéndose ade- lante y atrás con una velocidad constante en una banda de un ancho determinado. y generadas con un generador de ruidos al azar). El experimento es factorial de 3 X 4 con dos rkplicas, siendo el primer número en cada casilla el de la primera réplica y. el segundo nbmero, el de la segunda.

Proyecto I Proyecto 2 Proyecto 3 Pr()yectíJ 4

(a) Analizar los datos como una clasificación de dos direcciones con 12 tratamientos

(b) Calcular las sumas de cuadrados correspondientes a los efectos principales y a la

(c) Interpretar los resultados del experimento. Para determinar las condiciones óptimas en un baño de plateado, se estudian cn un experimento factorial de 2 X 5 los efectos de la concentración de compuestos sulfo- nados y la temperatura del baño, en la reflexividad del metal plateado. Los resulta- dos de las tres replicas son los siguientes.

y 2 bloques (rkplicasj.

interacción y presentar los resultados en una tabla de análisis de la varianza.

Concentrucitin Tempcr.nturu (g./l itro) F O

4 80 4 100 4 120 4 140 4 160 8 80 8 100 8 1 20 8 140 8 160

Reflectivity Rep. 1 Rep. ,$? Rep. S

33 37 34 30 36 35 31 32 34 29 21 24 17 16 20 37 45 40 36 44 39 37 31 36 34 46 I 39 31 39 32

Page 296: ingenieria

288 EXPERIMENTACION FACTORIAL

Analizar estos resultados y determinar la condicicin o condiciones que producen la má- xima reflexividad. Construir, además, un intervalo de ,canfianza a un nivel de 0.95 de la reflexividad del metal correspondiente a estas condiciones óptimas.

3. Supongamos que en el experimento descrito en la página 257 se desea determinar si hay alguna interacción entre los cascos de las lanchas y las condiciones del tiempo, esto es, si un casco dar& mejores características en condiciones de cnlrna, otro en mar picado, &c. Combínense los datos de la página 257 con la réplica del experimento dada a continuación, y contrástese una interacción significativa y discútanse los resultados?

Diu I Diu 2 Diu S

Proyerro A 7 58

Proyerro B 44

57 45 47 Proyecto D

45 47 34 P r o y r c / ( ~ C

48 46

4. Las tablas siguientes dan los pesos (en gramos) de cpmida ingerida por dos tipos di- ferentes de ratas después de haber estado sin comer el número de horas indicadas y habiéndoscles dado despues las cantidades indicadas de cierta droga:

Réplica I Képlicu 2 T i p o A T i p o B Tipo A Tipo B

I h o w ‘9.07 6.02 Dosage

0.1 mg/kg S horus 11.82 , 9.16 1 7.05 I I I I I

9 horus 1 16.08 I 12.01 1 1 14.65 I 15.35 1 I horo

Dosis 0.3 mg/kg S horas 11.57 11.53 8.30

10.13 14.46 9.26

Dosis 0.5 mg/kg S Izorct.~ 5.22 9.21 10.10

o I1 01’U.Y 7.27 8.17 6.10 11.16

Hacer u n anilisis adecuado de la varianza c interpretar los resultados, 5. Para cstudiar las características de tres detcrgcntcs con difcrentcs ticmpos de lavado y

diferentes tcmperaturas, un laboratorio hizo u n cxpcrirncnto factorial de 2 X 2 X 3 con tres rtplicas. 1.0s resultados se indican ,a continuaciSn; l a 3 ctltradas son las lecturas dc hlancura obrcnidas con un equipo cspccialmente pl-cparado.

Page 297: ingenieria

EXPERIMENTOS DE VARIOS FACTORES 289

Tiempo de Temperatura Blancura Detergerlte lavado (min) del agua Rep. 1 Rep. 8 Rep. S

A 10 A 10 A 20 A 20 B 10 B 10 B 20 B u) C 10 C 10 C u) C 20

caliente tibio

caliente tibio caliente tibio caliente tibio caliente tEbio

caltente tibio

76 51 77 61 63 45 63 55 64 47 65 56

72 48 74 62 62 48 64 53 60 42 66 54

73 50 79 62 60 43 59 58 63 49 62 64

(a) Analizar este experimento como una clasificqción de dos direcciones con I Z trata- 9 mientos y 3 rkplicas (bloques). (b) Completar el análisis, computando las sumas de cuadrados correspondientes a los

(c) Presentar los resultados en una tabla de análisis de la varianza e interpretar el diferentes efectos principales y a las interacciones.

experimento.

6. Pata estudiar los efectos de la posición en el lingote (.,I), la posición en la plancha ( B ) , la preparación de Iá 'probeta (C) , ' y la temperatura del ensayo (D) sobre el nú- mero de vueltas requerido para romper una probeta de accro por torsión. se hicieron las siguientes anotaciones:

, "

A , . B c arriba arriba arriba arriba arriba arriba arriba arriba arriba arribe arriba arriba medio .medio medio medio medio medio medio medio

i 1 1 1 1 1' 2 2 .2 2 2 2 1 1 1 1 1 1 2 2

torno torno torno piedw piedra piedra torno torno torno piedra piedra piedra torno torno torno piedra piedra piedra torno torno

D 2100" F 2200 2300 2100

2300 2100

2300 2100 2200 2300 2 m 2200 2300 2100 2200 2300 2100 2200.

2 m \

am

No.. de vueltas Rep. Rep. 1 I

24 I 22 25 28 41 39 18 18 33 27 35 41 22 19 26 31 37 43

30 28 34 30

' ! 26 19 30 31 39 42 19. 19 31 31 26 35 30 25 31 34

23 7 *

Page 298: ingenieria

290 EXPERIMENTACION FACTORIAL

N o , dc vuelros Rep. Rep.

A 4 R c n 1 2

medio 2 torno 2300°F 39 42 medio 2 pirrlrcc 2100 22 20 medio 2 piedrci 2200 32 26 medio 2 piedra 2300 38 22 ubujrr 1 rorl1o 2100 18 21 uhojo 1 fortto 2200 35 32 ubojo 1 t o r t l o 2300 34 37 uhnjo 1 piedru 2100 21 19 uhr~l~' 1 piedra 2200 20 29 abajo 1 piedrn 2300 44 31 uhujo 2 forrto 2100 23 22 uhujc] 2 ror'lo 2200 31 26 ohujo 2 roruo 2300 38 41 ohujo 2 Pfedru 2100 18 19 uhojíi 2 pirdru 2200 31 24 uhajci 2 pirdra 2300 35 41

Analizar el experimento. 7 . Resolver las cuatro ecuaciones de la página 276 para p, al, PI, y ( ~ f l ) ~ ~ e n funci6n de las

medias de población p i l , corrcspondientcs a las cuatro oondiciones experime6tales de la primera réplica. Nótese que estas ecuacioncs sirven como una guía para estimar los pa- rimetros kn función de las medius muestrnlrs correspondientes a las diversas condicio-

S

nes experimentales.

14.3 Experimentos factoriales 2"

Hay varias razones por las que se emplean frecuentemente 10s experimentos factoriales con cada factor tomado ~610 en dos niveles. En primer lugar, el nil- mero de condiciones experimentales en un experimento factorial crece multiplica- tivamente con el nilmero de niveles de cada faclor: por lo que, si hay que inves- ligar simultáneamente muchos factores, se hará econcimicamente imposible incluir más de dos niveles por cada factor. Otra importante razón para tratar por sepa- rado los experimentos factoriales 2" es que existen mitodos cortos de cálculo que sólo se aplican en este caso. De hecho, el resto de esta sección se dedicará a esos metodos abreviados, mientras que el estudio de otras ventajas, tales como la faci- lidad de mezclar las interacciones de orden superior y la adaptabilidad de los facto- riales 2" a los experimentos con replicas fraccionales, se hari en secciones pos- teriores.

Antes de introducir algunas notaciones especiales que se emplean en los expe- rimentos factoriales 2" vamos a apuntar que tales experimentos tienen algunos inconvenientes. Como cada factor se mide s610 en dos niveles, es imposible juzgar si los efectos producidos 'por las variaciones en un factor son lineales o de otra forma (por ejemplo. parab6licos o exponenciales). Por esta raz6n. los experimen- tos factoriales 2" sc emplean frecuentemente en "experimentos de filtrado". cllle se contintIan con otros experimentos con pocos factores (ordinwiamente. los qllc re-

Page 299: ingenieria

EXPERIMENTOS FACTORIALES 2 " 291

Eultaron "significativos" individualmente o en conjunto en el €XPerjmentO de filtra- do) tomados con más de dos niveles.

En el análisis de un experimento factorial 2" es conveniente denotar los dos niveles por O y 1 (en lugar de 1 y 2). En consecuencia, los modelos usados para el análisis de estos experimentos difieren de los de la sección 14.2 solamente en que ahora tenemos i = O, 1, en lugar de i = 1, 2,. . . a, j = O, 1, en lugar de j = 1, 2, . . . b; y así por el estilo. Por ejemplo, en un experimento factorial Z3 el modelo de la página 281 será:

l / i j k l = + ai + P j + Y k + (aP>,j + ( a Y ) i k + ( h ) i k

+ 4 + ( d h ) i j k + PI + e i j k t

con i = O. 1 , j z O, 1, k = O, 1.. y I =. l , 2, . . : r. Las f3ik[ se definen conlo anlcs, y los parámetros se encuentran ahora sujetos a las restricciones a1 = -ao, ' = -Po, y1 = -yo, ((YP)lO = (aP)o1 = - (QIPIIl = - bP)OO, * * 9

T

2 p1 = o. 1=1

Nótese que, aparte de los parámetros para réplicas, sólo es necesario U I I pardr,lc- tro de cada tipo; es decir, aparte de los parámetros para réplicas, podemos ex- presar el modelo completo en funci6n de los parámetros p , ao, po, y!), (a/3)00, (ay)oo,

Un experimento factorial 2" requiere 291 condiciones experimentales: conlo s u número puede ser bastante grande, ser6 conveniente representar las condiciones del experimento por medio de una notacicin especial y enlistarlas en el llamado "orden normal". La notación consiste. en representar cada condición experimental por el producto de las letras minúsculas correspondientes a los factores tomados en el nivel 1, llamados de "nivel alto". Si se elimina una letra minúscula correspon- diente a un factor, esto significa que el factor se ha tomado en el nivel O. Ila- mado "nivel bajo". Entonces, en un experimento de tres factores, ac representa las condiciones experimentales en que los factores A y C se toman en el nivel alto y el factor 3 en el bajo; c representa la condiciirn experimental -en que se toma 'el factor C eir el nivel alto y los factores A y ' I ? en el bajo; etc. .El "simbolo "1" se usar' para denotar la condicidn experimental en que todos los factores se toman en el nivel ,bajo.

Aunque las condiciones experimentales se aplican en un .orden ai .azar durantc :I experimento, para los propósitos de análisis de los resultados cs conveniente or- lenarlos en el order? 3lor1?1a/. Para n = 2, este orden es 1, u, h . ah: y para 11 - - ~ - 3 :\ orden es el mostrado en la tabla de la pig. siguiente: Nótese que los siqbdos de los cuatro primeros experimentos son como los de, u11 :xperimento de dos factores, y los s$gundqs cuatro se obtienen mpltipjicando cada Jno de los cuatro primeros .símbolos por c. De moda Semejaate, el orden para 'z :T= 4 de ,la pagina 294 se obtiene enlistando los ocho símbolos del experimento ie tres factores y Fepitiendo el conjunto con cada símbolo mu{tiplicado por d.

(PY)oo, y (aPy)coo.

Page 300: ingenieria

292 EXPERIMENTACION FACTORIAL

Condición ex- N ive l del factor perimental A B c

1 a b ab C

ac bc abc

O 1 O 1 O 1 O 1

-

En este capítulo y en el anterior nos referimos al total de todas las observa- ciones correspondientes a una condición experimental dada como al tratamiento total y representamos estos totales por medio de símbolos tales como Ti., Tij.., y así, sucesivamente. Habiendo introducido una notación especial para las condicio- nes experimentales del experimento factorial 2" podemos extender esta notación haciendo que ( I ) , (a): (b) , (ab) , (c) , . . . , representen los totales de los trata- mientos correspondientes a las condiciones 1, a, b, ah, c, . . . Asi, en un e-Yperi- mento de tres factores es

. . . . . . . . . . . . . . . . . Los métodos de cálculo abreviado citados en la página 290, consisten, esen-

cialmente, en expresar las estimaciones de varios efectos principales e interaccio- nes, así como sus sumas de cuadrados correspondientes, en función de combina- ciones lineales de los totales de los tratamientos. Para ilustrar esto, consideremos la cantidad

que es una comhlnaaon heal , con coeficientes + 1 y "I, de los totales de 1 0 s tratamientos correspondientes a las ocho condiciones experimentales. Refiriéndonos al modelo de la página 291 y empleando las relaciones entre los parámetros (pero dejando .todos los detalles al lector en los problemas 5, 6 y 7 de la página 300) se puede demostrar que

- (1) + (a) - (b ) + (ab) - (c) + (ac) - (be) + (abc) = -8r0lo + E A

donde EA es una correspondiente combinaci6n lineal de sumas de las eijkl. Del teo- rema 8.1 de la pagina 155, se deduce que en es un valor de una variable aleato- ria cuya distribución tiene media cero; de hecho, se puede demostrar que EA es u n valor de una variable aleatoria que tiene distribucibn normal con media cero y varianza 3 r d . Llamando a la combinación lineal anterior efecto total [A I del factor A , encontramos que - - [A1/8r nos da una estimación de ayo, efecto prin-

Page 301: ingenieria

EXPERIMENTOS FACTORIALES 2n 293

cipal del factor A , y se p u d e demostrar que rAI2/8r es igual a SSA, suma de cuadrados del efecto principal del factor A.

Analizando de una manera sem,ejante la combinación lineal

el lector deberá demostrar, en el problema 7 de Ia página 300, que es igual a 8r(py)ao + eBc, donde e.qc es una combinación lineal correspondiente a las sumas de las Eiikl. Designando a esta combinación lineal de los totales de los tratamientos como efecto total [ B C ] de la interaczión en dos direcciones de los factores B y C, vemos que [ B C ] / 8 r nos da una estimación de efecto de la interaccicin UC, y también se puede demostrar que [BC12/8r es igual a SS(BC) , suma de los cuadrados de la interacción BC. Procediendo de esta forma, podemos presentar combinaciones lineales de los totales de los tratamientos que nos den estimaciones de los demás efectos principales e interacciones, cuyos cuadrados, divididos entre 8r. nos den las correspondientes sumas de cuadrados. Estas combinaciones linea- les. o efectos totales, se pueden obtener fácilmente, utilizando la siguiente tabh de signos:

(1) (a) (6) (ab) (c) ( 4 ( W (abc)

1 1 1 1 1 1 1 1 -1 1 -1 1 -1 1 -1 1 -1 -1 1 1 -1 -1 1 1 1 -1 -1 1 1 -1 -1 1

-1 -1 -1 -1 1 1 1 1 1 -1 1 -1 -1 1 -1 1 1 1 -1 -1 -1 -1 1 1

-1 1 1 -1 1 -1 -1 1

____

[AB] rc1 LAC1 [BC] [A BC]

Las entradas de esta tabla son los coeficientes de las combinaciones lineales de los totales de los tratarnientos para los distintos efectos principales e interac- ciones. Como una ayuda para construir tablas similares para IZ = 4, t~ = 5. etc.. notemos que, para cada efecto principal, hay un signo "-t 1" cuando el factor está en el nivel alto, y un "-1'' cuando está en el bajo. Los signos para u n efecto de interacción se obtienen multiplicando los coeficientes correspondientes de todos los factores contenidos en la interacción. Entonces, para [AB1 multiplica- mos cada signo de [ A -1 por el correspondiente de [ B ], dándonos

(-W-U (1)(--1) ("1)W (1)(1) (-1H-1) (1)(--1) (--1)(1) (1)(1) ó 1 .2 -1 ' -1 1 1 ' -1 -1

Notemos, tambien, que en la tabla 'anterior [I I es el total mayor de todas las observaciones, de tal modo que [I I2,/8r. nos da el término de corrección para calcu- lar SST, SSE. S S R y S S ( T r ) .

Aunque hemos ilustrado el método abreviado anterior para obtener los dife- rentes efectos principales e interacciones con respecto a un experimento factorial

1

Page 302: ingenieria

294 EXPERIMENTACION FACTORIAL

23, la única diferencia en un experimento factorial 2" con n > 3 es que necesita- mos una tabla más extensa de signos y que las sumas de cuadrados respectivas se obtienen dividiendo los cuadrados de los efectos totales por r-2". Para ilustrar esta técnica e introducir una mayor simplificacicin, consideraremos el siguiente ex- perimento factorial 2*, proyectado para determinar los efectos de ciertas variables en la exactitud de un interruptor giratorio que actúa a intervalos. Los factores estudiados fueron los siguientes:

Factor Nivel bajo Nivel alto

A . Lubricación seco lubricado

B . Protección polvo no protegido cubierto

C. Sin chispas 110

U . Corriente O 0.5 amp.

Cada interruptor se operó continuamente hasta que se presentó un fallo en el fun- cionamiento y el número de horas de operación se anotó en la lista siguiente. El experimento entero se realizó dos veces, con los siguientes resultados:

si

Condició>r Horas de operacicirr experimental R e p . 1 R e p . S Total

1 a b ab C

uc bC ubc d ad bd abd od acd bed abcd

828 997 735 807 994 1069 989 889 593 773 740 936 748 1202 1103 985

797 948 770 1003 949 1094 1215 1010 813 1026 922 1138 970 1182 966 1154

1625 1945 1511 1810 1943 2163 2204 1899 1406 1799 1662 2074 1718 2384 2069 2139

Total 14,388 16,963 34351

Analizando estos datos como una clasificacih de dos direcciones. con 16 tratamientos y 2 réplicas (bloques), obtenemos

C = (.3?,3r,1)2 = 28,786,975 32 SST = (828)* + (Y97)* + . . . + (1154)2 - 28,786,975

= 744,876

Page 303: ingenieria

EXPERIMENTOS FACTORIALS 2n 295

SS(TT) =

- -

SSR =

- - SSE =

1 2 - [(1625)2 + (1945)s + . , . + (2139)Zl - 28,786,975

547,288

- [(14,388)% + (15,963)*] - 28,786,975 1 16

2 .

77,520 744,876 - 547,288 - 77,520 = 120,068

Para subdividir las sumas de cuadrados del tratamiento en SSA, SSB, , . . y SS(ABCD), podemos construir una tabla de signos como la de la pigina 293. calcular los efectos totales y, despues, dividir los cuadrados de los efectos tota- les por r-2" = 2.2' = 32.Para el efecto principal del factor A, tendremos

[ A ] 5 -1625 + 1945 - 1511 + 1810 - 1943 + 2163 - 220-1 + 1899

- 1406 + 1799 - 1662 + 2074 - 1718 + 2384 - 2069 + 2139

= 2075

Y SSA = 32 = 134,551

Estos cálculos son .bastante tediosos, pero se pueden simplificar considera- blemente utilizando un mitodo aún más corto, llamado mPtodo de Yates. Este mé- todo de calcular los efectos totales se ilustra en la página 296. Las condiciones experimentales y los totales correspondientes se anotan en orden normal. En la columna (l) , la mitad superior se obtuvo sumando pares sucesivos de totales de tratamientos y la mitad inferior se obtuvo restando pares sucesivos. Luego. en la columna (1) obtenemos

1625 + 1945 = 3570 1511 + 1810 = 3321

2069 + 2139 = 4208 . . . . . . . . . .

1945 - lG25 320

1810 - 1511 = 299 . . . . . . . . , . 2139 - 2069 = 70

Page 304: ingenieria

296 EX~ERIMENTACION FACTORIAL

Nótese que el primer total de cada par se resta del segundo. La columna (2) se obtiene después, haciendo operaciones idénticas a las entradas de la cólumna ( I ) , y Ias columnas (3) y (4) se obtienen del mismo modo de las entradas en las columnas (2) y (3), respectivamente. La columna (4) y, en general la columna (n), da los efectos totales en orden normal. Cada suma de cuadrados se obtiene como antes, elevando al cuadrado el efecto total correspondiente y dividiendo pos- teriormente el resultado por ~ - 2 % = 2-24 = 32.

7ondición experi- mental

1 a

b ab

C

ac

bc abc

d ad

bd abd

ed a d

bcd abed

Trata- miento totales

1,625 1,945

1,511 1,810

1,943 2,163

2,204 1,899

1,406, 1,799

1,662 2;074

1,718 2,384

2,069 2,139

- (1)

- 3,570 3,321

4,106 4,103

3,205 3,736

4,102 4,208

320 299

220 - 305

393 412

666 70

-

-

- (d

I_

6,891 8,209

6,941 8,310

619 - 85

805 736 - - 249

-3

53 1 106

- 21 - 525

19 - 596 -

(3)

15,100 15,251

534 1,541

- 252 637

- 546 -577

1,318 1,369

- 704 - 69

246 - 425

- 504 -615

(4)

30,351 2,075

385 -1,123

2,687 - 773

- i79 -1,119

151 1,007

889 -31

51 635

-671 -111

28,786,975 134,551

4,632 39,410

225,624 18,673

1,001 39,130

713 31,689

24,698 , 3 0

81 12,601

14,070 385

Dividiendo las sumas de Guadrados por sus grados de libertad para obtener los cuadrados medios,, y dividiendo los diferentes cuadrados medios por el medio cuadrado de error, obtenemos la siguiente tabla de análisis de varianza para el experimento factorial 24:

Page 305: ingenieria

EXPERIMENTOS FACTOWALES 2"

Origen de

1 ' Réplicas

libertad variacibn Grado de

Efecto principal A

1 D 1 c 1 B 1

Interaccih de dos factores

A B

1 CD 1 BD 1 BC '

1 A D '

1 AC 1

[nteracción de tres factores

A BC

1 BCD 1 ACD 1 ABD 1

nteracción de cua- tro factores

A BCD

31 Total

15 Error.

1

Suma de cuadrados

77,520

134,551 4,632

225,624 713

~~~

Cuqdrado medio F

' 77,520 9.68

134,551

< 1 713 28.19 225,624 <1 4,632

16.81

39,410

3 1389 31,689 18,673 18,673 39;410

24,098 '24,698 81 81

1 , O o L 1,001

4.92 2.33 3.96 < 1 3.09 < 1

39,130 30

12,601 14,070

i I 39,130

1.76 14,070 1.57 12,601 < 1 30 4.89

385 I 3 8 1 i < l 120,068

744,876

8,005

297

Como F.& = 4.54 y F.ol = 8.68 para 1 y I5 grados de libertad, encontramos quc los efectos de las réplicas, lo mismo que los efectos de la lubricacih y la supre- sión de chispas, son significativos con un nivel de 0.01, y que hay interacciones significativas con un nivel de 0.05 entre la lubricación, la proteccicin contra el polvo y la supresión de chispas. El lector deberá interpretar estos resultados y estimar ia magnitud de algunos de los efectos en el ejercicio 8 de la página 300.

EJERCICIOS

l . Un experimento de' prueha de saborcs se realizó para. dkuhrir que efecto, si alguno. producen las propiedades físicas de cicrto comestible sobre s u sabor. Los resultados, ex- prcsados por una puntuacibn dc un experto en una escala del 1 al 10 aparecen en la tahla que sigue:

,. , ,

Page 306: ingenieria

298 EXPERIMENTACION FACTORIAL

A B C Clasificación Color Consistencia Textura R e p . 1 Rep . d

ligero ligero ligero ligero ligero pesada ligero pesada oscuro ligero oscuro ligero oscuro pesada oscuro pesada

fina 8 gruesa 7 fina 9

gruesa 2 fina 7

gruesa 8 fina 8

gruesa 3

( a j Analizar los resultados como una clasificación de dos direcciones, con 7 grados dc libertad para los tratamientos, y 1 grado de libertad para los bloques (réplicas).

(b) Usar una tabla adecuada de signos para calcular los efectos totales de [ A ] , [B] ,

(c) Utilizando los resultados obtenidos en la parte (bj, hallar las sumas de los cua- drados correspondientes a los efectos principales y las interacciones y verificar sus totales frente a la suma de cuadrados de los tratamientos de la parte (a).

( d ) Ordenar los datos con combinaciones de tratamientos en orden normal y usar el metodo de Yates para encontrar los efectos totales. Comparar con los resultados obtenidos en (b) .

[el, [AB], CACl, PC], CAW].

(e) Construir una tabla de análisis de la varianza y analizar el experimento.

2. Se realizb un experimento para determinar los efectos de ciertos elementos aleados so- bre la ductilidad de un metal y se obtuvieron los resultados que a continuación se indican:

Carbono Manganeso Níquel Resistencia a la rotura (pics/lb.)

R e p . 1 R e p . 2 Rep . S

0.2% 0.5% 0.2 0.5 0.2 1.0 0.2 1.0 0.5 0.6 0.5 0.5 0.5 1.0 0.5 1 .o

0.0% 3.0 0.0 3.0 0.0 3.0 0.0 3.0

34.6 46.4 41.8 40.0 37.8 33.2 38.2 46.2

37.5 42.4 38.0 44.7 32.7 36.2 40.4 43.5

36.1 44.8 37.2 45.3 31.6 35.5 36.8 49.2

Hacer un anPlisis de la varianza adecuado e interpretar los resultados.

3. Se hizo un experimento para determinar los efectos de los siguientes factores sobre el rendimiento de un semiconductor:

Factor Nivel O Nivel I -~

A . Localización del conjunto Laboratorio Línea de producción B. Presión parcial del material lo-” 10-

C. Humedad relativa 1% 30% D. Tiempo de envejecimiento 72 horas 144 horas

control

Page 307: ingenieria

EXPERIMENTOS FACTORIALES 2" 299

Los resultados fueron los siguientes:

Cortdiciórt Garrarrcias experimerztal Rep. I Rep. 2

-~

1 a b ab C

ac bc abc d ad bd abd cd acd bcd abcd

39.0 31.8 47.0 40.9 43.8 2923 34.8 45.6 40.1 42.0 54.9 39.9 43.1 30.1 35.6 41.4

43.2 43.7 51.4 40.3 40.5 52.9 48.2 58.2 41.9 40.5 53.0 40.2 40.2 39.9 53.7 49.5

Hacer un análisis adecuado de la varianza e interpretar los resultados. 4. Un experimento de filtración se realizó para determinar qué factores influiarl en el

control del contenido final de fósforo de un acero producido en un .convertidor.' Los niveles de los factores estudiados y los resultados experimentales están contenidos en la tabla que sigue:

E D C B A Vaciado

temp. ("F) Cal

2400 2400 2400 2400 2400 2400 2400 2400 2400 2400 2400 2400 2400 2400 2400 2400 2600 2Goo 2600

3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 3 3 3

5% 5 5 5 15 15 15 16 5 5 5 5

15 15 15 15 5 5 5

0.15% 0.15 0.30 0.30 0.15 0.15 0.30 0.30 . 0.15 0.15 0.30 0.30 0.15 0.15 0.30 0.30 0.15 0.15 0.30

Mcurgarrrso Fósforo origirtaf Rep. I

1% 0.003% 3 0.004 1 0.002 3 0.015 1 0.002 3 0.011 1 0.004 3 0.002 1 0.0o0 3 0.008 1 0.003 3 0.005 1 0.010 3 0.006 1 r 0.w 3 0.01 1 1 0.003 3 0.007 1 0.01 1

Firral Rep. 2

0.601% 0.009 0.008 0.007 0.005 ,

O.ooc, 0.001 0.004 0.003 0.002 0.007 0.012 O.ooc, 0.001 0.014 0.015 0.007 0.004 0.005

Page 308: ingenieria

300 EXPER~ME~TACION FACTORIAL

2600 2600 2600 2600 2600 2600 2600 2600 2600 2600 2600 2600 2600

3 5 3' 15 3 15 3 15 3 15 4 5 4 5 4 5 4 5 4 15 4 15 4 15 4 15

0.30 0.15 0.15 0.30 0.30 0.15 0.15

0.30 0.15 0.15 0.30 0.30

Or30

3 1 3 1 3 1 3 1 3 1 3 1 3

0.010 0.004 0.019 0.004 0.017 0.007 0.015 0.004 0.010 0.017 0.005 0.014 0.016

0.017 0.008 0.013 0.008 0.023 0.004 0.009 0.011 0.006 0.011 0.010 0.009 0.011

Analizar los resultados de este experimento. 5. Escribiendo el total del tratamiento (a ) como la suma de las observaciones y ~ w l corres-

pondientes y substituyendo para estas observaciones las expresiones dadas por la ecua- ción modelo de la página 291, se puede demostrar que

Haciendo uso de las restricciones impuestas a los parámetros,-escribir de nuevo la ex- presión de (a ) en función de los parkmetros p, ao , &, 7 0 , (crp)Oo, ( c u ~ ) m , (q!?y)o~o.

6 , Repetir el trabajo del problema 5, escribiendo (1 ), (h) , (ah), ( c ) , ( m ) , (&) y ( a h r ) en función de los parámetros p, ao, 00, TO, (ab)w, (a?')w, (~Y)w, y ( a p ~ ) ~ .

7 . Empleando los resultados de los problemas 5 y 6. verificar las expresiones de [Al y [BC] obtenidas en la página 293. Expresar también, CA en función de las cantidades

8. Interpretar los resultados del análisis de la varianza dado en la tabla de la página 318, y estimar la magnitud de los efectos significativos.

9. Una forma de comprobar, por cilculo~ las sumas de los cuadrados obtenidas para los diversos efectos principales y las interacciones, es que la suma debe ser igual a fa suma de los cuadrados de los tratamientos, obtenida analizando los datos como una clasifi- cacijn de dos direcciones Hacer esta aomprobación en las sumas de cuadrados de la tabla de la página 297.

10. Si se desea una expresión para un efecto total, sin construir una tabla de signos com- pleta, se puede emplear el método que indicamos a continuación, ilustrado para en- contrar [ABC] en un experimento factorial 24. Tomamos la expresión: (a f l ) ( b f 1) (c f l)(d f 1) con signo "+" si las letras correspondientes no aparecen sn el símbolo para el efecto principal o en la interacción para la que se está calculando un efecto total, y "-" si la letra correspondientc aparece. Así, para encontrar [ABC] escribimos

6ijh.f.

(U - l ) ( b - I)(C - l)(d + 1) = abcd + abc - abd - acd - bcd - ab - a c + a d - b ~ + b d + c d + ~ + b + c - d - l

y después de ordenar los términos en orden normal y sumar los parhtesis, obtenemos, finalmente,

[ A m = - (1) + (a) + (b) - (ab) +.(c) - (ad - (bc) + (Cctc) - (dl + ( a d ) + (bd) - (nbd) + (cd) - (acd) - (bcd) + (abcd)

Page 309: ingenieria

EL 'MEZCLADO EN UN EXPERIMENTO FACTORIAL 2n 301

( i ) Utilizar este metodo para expresar [B], [AC], y [ABC] en funci6n de los totales

(ii) Utilizar este método para expresar [Ac] y [BCD] en. función de los totales de tra- de tratamiento en un experimento factorial 2a.

tamiento en un experimento factorial 2$ . i

14.4 El mezclado en un experimento factorial. 2"

En algúnos' experimentos es imposible realizar todas las condiciones experi- mentales requeridas en'un bloque. Por ejemplo; si se hace un experimentó factorial 23 combinando ocho pigmentos' de pintura que se aplicarán a una superficie para dkspués cocerla en un horno y sólo caben cuatro muestras en el horno, Se hace necesario dividir los ocho tratamiéntos en dos bloques (hornadas) en cada replica. Como hemos indicado anteriotmente, si el' tamaño del bloque es demasiado pe- qiieño para incluir todo$ 10s tratamientos. será necesario hacer diseños especiales denoníinados de bloques incompletos.

Cuatldo las 'conditioties experimentales se distribuyen en varios bloques; M0 o mis de ios efectos pueden quedar confundidos o mezclados con posibles efectos 'de bloque, es decir, diferencias entre bloques. Por ejemplo, si en un experimento factorial 2q "cm0 el 'del'párrafó anterior, se incluyen las condiciones U, & Y ubc en una hornada (bloque 1) "y las condiciona. experimentales 1, b, c y bc en la segunaa hornada (bloque 2), entonces el "efecto .de bloque'", diferencia entre los totales de los dos bloques, esta dado por

[(a> + (ab) + (m) '+ (ab4l - [U) + (b ) + ( 4 + (Wl Teniendo prpqnte la tabIa de:signos de la página 293, ,observamos que esta

cantidad es, de hecho, el efecto total. [A], así que la estimación del efecto princi- pal del 'factor A está mezcluda (o cotlfundida) cot1 los bloques. Notemos que to- dos los demás efectos factoriales permanecen sin mezclar; para cada otro efecto total hay dos coeficientes + 1 y dos -1 en cada bloque, ya que los efectos de bloque se eliminan. Esta clase de argumentación se puede emplear para decidir. también, qué condiciones experimentales se deben poner en cada bloque para mez- clar un efecto principal o una interacción dados. Por ejemplo, queremos mezc!ar la interacción ABC con los bloques del ejemplo anterior: para ello, podemos poner las condiciones experiinentales, a, 6, c y ubc, cuyos totaies tienen coeficientes + 1 en IABCI, en un bloque, y las condiciones experimentales 1, ab, CI(' y bc, CUYOS totales tienen coefiíentes -1, en el otro. bloque.

En general, mezclar en un experimento fztctorial 2" puede resultar mucho más Complicado que en el ejemplo. que ;acabamos de dar. Para evitar serias dificulta- des, supondremos que el número de bloques usados sea una potencia de 2, tal como 2 P . Esta nos indica que el precio pagado por hacer un experimento fac- torial 2""en 2 p blotjues, es que 2 p - 1 efectos se mezclen con log bloques. Para aclarar exactamente qué efecms se mezclan, y para indtkar un métddo.que se pub de emplear para mezclar s610 determinados efectos. y no otros, resulta iltil defi- nir el término "interacción generalizada" en la forma siguiente: 'la iItterzwci(jt1 Re-

Page 310: ingenieria

302 EXPERIMENTACION FACTORIAL

neralizada de dos efectos es el “producto” de esos efectos, con supresión de letras iguales. Así, la interacción generalizada de AB y CD es ABCD, y la interacción generalizada de ABC y BCD es ABf?#@D, o AD. Para mezclar un experimento factorial 2” en 2” bloques, se puede emplear el método siguiente: se seleccionan p efectos para mezclarlos, asegurandose de que ninguno sea la interacción gene- ralizada de algunos de los seleccionados. Entonces, podemos demostrar que 2p - ( p + 1) efectos quedan mezclados automhticamente con los bloques; junto con los p efectos escogidos originalmente, esto nos da un total de 2P - 1 efectos mezcla- dos en el experimento. Los otros efectos mezclados son, de hecho, las interaccio- nes generalizadas de los p efectos escogidos originalmente.

* Para ilustrar la construcción de un diseño mezclado, vamos a dividir un ex- perimento factorial 2‘ en 4 bloques, de tal forma que efectos deseados se confun- dan con bloques. En la práctica se mezclan solamente las interacciones de orden superior (con la esperanza de que sean no existentes). Como hemos decidido en- tre 4 bloques, tenemos 2 p = 4 y p = 2 y podemos seleccionar arbitrariamente dos interacciones de orden superior para mezclarlas. Si seleccionamos ABCD y BCD, la interacción generalizada, A. se puede mezclar tambih. Luego, para evitar la mezcla de cualquier efecto principal y para mezclar el menor número posible de interacciones de dos factores, seleccionaremos ABD y ACD, notando que la BC en consecuencia se mezcla. (Observemos que es imposible evitar que se mezcle cuando menos un efecto principal o una interacción de dos factores en este ex- perimento.)

Para repartir las 16 condiciones experimentales en los cuatro bloques, distri- buimos primero en dos bloques, de tal forma que la interacción ABD se mezcle con los bloques. Ahora, ponemos en una tabla de signos adecuada todos los tra- tamientos cuyos totales tengan un ‘‘+ 1” en la fila de [ABD] en un bloque, y todos los que tengan “”1” en un segundo bloque, con lo que tendremos los bloques que se indican a continuación:

Primer bloque: b M: bc d abd cd abcd Segundo bloque: ab c abc ad bd acd bcd

Notemos que cada condición experimental en el primer bloque tiene un número impar de letras en común con ABD, mientras que las condiciones experimentales del segundo bloque tienen un nrírnero p a r de letras en c o m h con ABD. Esta regla de pares-impares nos da una forma alternativa de distribuir las condicio- nes experimentales en dos bloques para mezclar un efecto dado y tiene la ventaja de que no es necesaria la construcción de una tabla de signos completa.

Una vez que hemos mezclado la interacción ABD dividiendo las 16 condi- ciones experimentales en dos bloques, vamos a mezclar la interacci6n ACD divi- diendo cada uno de estos bloques en dos bloques de cuatro condiciones cada uno. Utilizando la regla de pares-impares que acabamos de describir (o una ta- bla de signos) obtenemos los cuatro bloques siguientes:

Page 311: ingenieria

303 EL MEZCLADO EN UN EXPERIMENTO FACTORIAL 2"

Bloque I : a bc d abcd

Bloque 3: ab c ba acd

Comparando estos bloques con una tabla de signos, o lo que es equivalente, apli- cando la regla de pares-impares, el lector deberá verificar, en el problema 8 de la página 310, que la interaccih BC también está mezclada con los bloques, mientras que todos los demás efectos no lo están.

El análisis de un experimento factorial 2" mezclado es semejante al del ex- perimento sin mezclas, con la excepci6n de que las sumas de cuadrados de los efectos mezclados no se calcula y, en cambio, calculamos una suma de cuadra- dos del bloque como si el experimento consistiera en br bloques y no en b blo- ques en cada una de las r réplicas. Con respecto a nuestro ejemplo del expe- rimento factorial 24 en el que se mezclan las interacciones ABD, ACD y BC, y empleamos dos réplicas, tenemos la siguiente tabla del analisis simulado de la

Bloque 2: b ac abd cd

Bloque 4: 1 abc ad bcd

varianza

Origen de variación

Bloques

Efectos principales

Interacciones de dos factores

Interacciones de tres iactores

Interacci6n de cua- tro factores

Error interior de los bloques

Total

5

2

1

12

31

Grados de libertad

7

4 1

La suma de caadrados de los bloques se obtiene, como siempre, sumando los cuadrados de los ocho totales de bloques, dividiendo el resultado por 4 (el nú- mero de observaciones en cada bloque), y restando el tbrmino de correcci6n. La suma total de cuadrados y las sumas de cuadrados de los efectos factoriales no mezclados, se obtienen en la forma habitual, y la suma de cuadrados del errcr dentro de los bloqzes, una medida de la variabilidad en el inferior de 10s blo- ques, se obtiene por resta.

Para ilustrar el analisis de experimentos factoriales 2" mezclados, suponga- mos que cada réplica del experimento con el interruptor por pasos descrito en la secci6n anterior, se hace en cuatro bloques, porque s610 se tienen cuatro posi-

Page 312: ingenieria

304 EXPERIMENTACION FACTORIAL

bilidades de montar los 16 interruptores. (El orden para probar los bloques se toma al azar dentro de cada rkplica, y la manera de asignar cada interruptor dentro de cada bloque es también ai azar.) Suponiendo, además, que las inter- acciones ABD, ACD y BC se mezclan con los bloques, como se muestra en la página 303 (ref. 324-2), obtenemos los siguientes totales de bloques, a partir de los datos de la página 315:

Bloque 1 Bloque 2 Bloque 3 Bloque 4

Replica 1

3799 4056 3978 4130 Réplica 2

3593 3743 3488 3564 "

Entonces, la suma de cuadrados para los bloques está dada por

SS(BI) = (35S4)2 + (348fQ2 + . . . + (3799)2 - 28,786,975

4 = 101,240

donde el factor de corrección es el mismo que en la página 235.

Origen de variación Grados dl libertad

Bloques -I 7

Efecto principal A B c D

Interacciones de dos factores

A B AC A D BD C D

Interacciones de tres factores

ABC 1 BCD 1

Interacciories de cuatro factores l .

ABCD Error interior de los bloaues.

Total 1 - 3 1

Suma de cuadrados

Cuadrado medio F

~ ~ ~ _ _ _ _ _ _ _ ~ ~ "

101,240 . L4,463 1.58 -_

134,551

< 1 713 713 24.62 225,624 225,624 < 1 4,632 4,632 14.68 , 134,551

39,410

2.69 24,698 24,698 3.46 31,689 31,689 2.04 18,673 18,673

39,410 I 4.30

81 81 < 1

I . I ' "

I I ' '

39,130 4.27 39,130 14,070 1.54 14,070

I)

385 < 1 385

109,980 9,165

744,876

Page 313: ingenieria

REPLICAS FRACCIONALES 305

Copiando la suma total de cuadrados y las sumas de cuadrados de los di- versos efectos no mezclados de Ia tabla de la página 297, obtenemos la tabla de análisis de la varianza del experimento factoria1 mezclado, mostrada (parte infe- rior de la púgina 304). En este análisis, los efectos principales A y C son signi- ficativos a un nivel de 0.01, pero ninguno dé los restantes efectos principales o de las interacciones son significativos.

Si hay rkplicas, alguna de la información perdida sobre los efectos mezclados, se puede recobrar por una descomposici6n más amplia de la suma de cuadrados de los bloques. Este análisis consiste en dividir la suma de cuadrados de los blo- ques en una componente para cada uno de los efectos mezcIadss, &a compo- nente para las réplicas, y una componente residual llamada "error entre bloques", qúe es una 'medida de la variabilidad entre bloques. Copiando 'la suma de cua- drados de las réplicas y las sumas de BC; ABD y ACD, del ahálisis de la varianza de la tabla 297, y copiando las sumas de cuadrados de los bloques del anhlisis de varianzas internas del bloque de la tabla anterior, obtenemos el. siguiente análi- sis de la varianza entre bloques:

' I Origen de variacicirz Grado de Suma dr liberrad cuadrados

Rbpticas

Efectos conjuntos

77,520 1

BC

. 12,601 1 ACT) 30 1 ABD

1,001 1

Error interbloqua 3 10;088

TOW (Bloques ) 7 101,240

-

Cuadrado medio

77,520 28.05

F '

1,001 30

< 1.

3.75 12,601 < 1

, . .

3,363 ' P

,'.

Nótese que el error entre bloques se obtiene por resta y que las razones F se Dbtienen dividiendo los cuadrados medios de los efectos mezclados y el cuadrado nedio de las réplicas por el yadrado medio del error entre bloques. Sólo el :est F para las réplicas es significativo (al nivel 0.05). El .pequeño número de yados 'de libertad del error entre bloques implica que la 'sensibilidad de estos :ests de significación es 'muy pobre; de hecho, raramente tiene objeto., esta clase: le análisis entre bloques, a meno;' que el nilmero de réplicas sea relativamente y-ande.

14.5 Replicas fracciónales

En los estudios sobre líneas complejas de produc&n, procesos químicos como os del petróleo, plásticos D metales, procesos físicoquímicos, tales como los qui: lparecen en las industrias electrhicas y de tecnología espacial, y en muchos &ros

Page 314: ingenieria

306 EXPERIMENTACION FACTORIAL

estudios de ingeniería, el experimentador se encuentra ante un conjunto muy gran- de y enredado de variables interrelacionadas. Los principios de la experimenta- ción factorial tratados en este capítulo le ayudan a “recortar” estas variables, para descubrir cuáles de ellas tienen mayor influencia en el proceso considerado y qué interrelaciones importantes pueden existir.

Sin embargo, hay algunas serias limitaciones al estudio simultáneo de un gran número de factores. Aun cuando a cada factor se le den solamente dos niveles, una réplica de un experimento de 6 factores requiere 64 observaciones; en un experimento de 7 factores hay 128 observaciones en una réplica, y en una r 6 plica de un experimento de 10 factores hay 1024 observaciones. Las limitacio- nes económicas y prácticas de estos grandes números hacen necesario buscar métodos en los que el tamaño de los experimentos factoriales se mantengan den- tro de límites manejables. Por supuesto, se debe insistir que no hay ningún subs- tituto para un planeamiento cuidadoso preliminar que, unido a la perspicacia de un buen ingeniero, puede dar la eliminacihn de muchos factores innecesarios.

A pesar de un planeamiento preliminar muy cuidadoso, es difícil muchas veces evitar que sean necesarios 6 6 10 (0 más) factores en un experimento. Una forma de reducir el tamaño de un experimento de este tipo es descomponerlo en varias partes, incluyendo en cada parte la variación deliberada de un factor, mientras que los otros permanecen fijos. Esto puede traer la consecuencia inde- seable de que no se pudieran estudiar algunas de las interacciones. Aún si inclu- yéramos la mitad de los factores en una parte, y la otra mitad en otra, con lo que cambiaríamos un experimento de 10 factores (que necesita 1024 observacio- nes) por dos experimentos de 5 factores (que necesita cada uno 32 observa- ciones), se perdería irremediablemente cualquier interacción entre factores de la primera parte y fslctores de la segunda. Es posible corregir algunas de estas difi- cultades observando que la mayoría de las veces no estamos interesados en todus las interacciones. Por ejemplo, es posible desarroIlar sÓ10 una fracción de un fac- torial 2“ y aún así obtener la mayor parte de la información deseada, tal como la que se refiere a los efectos principales y las interacciones de dos factores (pero no las interacciones mayores).

Los principios de las riplicas fraccionales, en las que sólo se desarrolla una fracción de un experimento factorial 2” completo, son semejantes a los usados en las mezclas. Para obtener una media riplicn, seleccionamos únicamente uno de los dos bloques, en que se han dividido las condiciones experimentales, mezclando un efecto; para obtener un cuarto de riplica seleccionamos sólo uno de los cuatro bloques en que las condiciones experimentales se han dividido al mezclar dos efectos, etc. En contraste con un experimento de mezcla como los discutidos en la sccci6n 14.4, vemos que, en una réplica fracciona1 los efectos est& mezclaclos, no C - I ~ Bloyues, sino entre si. Como ilustración, supongamos que sólo se inclu- yen las condiciones experimentales a, b, c y ubc en una media réplica de un experimento factorial 23 (Este es un bloque de u11 experimento factorial 2 8 con la interacción ABC mezclada.) Considerando la tabla de signos de la prigina 293

Page 315: ingenieria

REPLICAS FRACCIONALES 307

prescindiendo de todas las columnas, excepto las correspondientes a a, b, c y abc, vemos que el efecto total del factor A está dado ahora por

[Al = (a) - (b) - (c) + (dc) r r

Si escribimos ( 4 = T: ylm, (b) = z yo101, . * , y substituimos las yijv por las expresiones dadas por Ia ecuación modelo de la página 291, obtenemos

1-1 2-1

[ A ] = --4r[ao - ( P T ) ~ ] + E donde E es el valor de una variable aleatoria con media O (ejercicio 16 de la página 312). Así encor_tramos que [ A ] mide el efecto principal del factor A , así como la interacción BC, por lo que estos dos efectos se han hecho inseparables, o mezclados. Notemos, también, que en la tabla de signos reducida (con las co- lumnas que corresponden solamente a Q, b, c y Q ~ C ) los signos para [ A ] y [BC] son idénticos y, por lo tanto, [ A ] = [BC]. En el problema 17 de la página 321, el lector deberá demostrar que, para la réplica fraccional dada, el efecto principal del factor B est& igualmente mezclado o aleado con la interacción AC, mientras que el efecto principal del factor C está mezclado, o aleado, con la interacción AB. La interacción ABC no se puede estimar.

Con un diseño cuidadoso, en general será posible mezclar todos los efectos principales y las interacciones de dos factores sdo con interacciones de orden su- perior. Esto se ilustra en el ejemplo siguiente, en el que construiremos una me- dia réplica de un experimento factorial z5 Primero, seleccionamos un efecto (usualmente una interacción de orden superior) para dividir el experimento en dos bloques, como lo hicimos en el caso de las mezclas. El efecto escogido se llama contraste de definicicin, y no se puede calcular de ninguna manera por la réplica fraccional. Todos los demás efectos se alean con otros efectos, a saber, sus interacciones generalizadas (ver página 302) con el contraste de definición. Asi, si el contraste de definiciones es ABCDE, el efecto principal para el factor A tiene la interacción de cuatro factores RCDE como aleada, BC y ADE son un par aleado, y así sucesivamente. Como hemos visto, sólo se puede estimar en el ex- perimento el efecto combinado (la suma o la resta de los efectos aleados). Sin embargo, si se puede suponer que no hay interacciones de un orden superior, podemos atribuir el efecto del par aleado BC y ADE completamente a la inter- acción de dos factores BC, el efecto del par aIeado A y B€DE completamente al efecto principal del factor A , etc. Una lista completa de los pares aleados en una media réplica de un experimento factorial 2" que tiene el contraste de defi- nición ABCDE es la que sigue:

A y BCDE, R y ACDE, C y ABDE, D y ABCE, E y ABCD, A B y CDE, .AC y BDE, A D y BCE, A E y BCD, BC y ADE, BD y ACE, BE y ACD, C D y ABE, CE y ABD, DE y ABC,

Page 316: ingenieria

308 EXPERIMENTACION FACTORIAL

Nótese que ningim efecto principal ni ninguna interacción de dos factores están aleados con otro efecto principal u otra interacción de dos .factores.

Las 16 condiciones experimentales que se deben incluir en la media rkplica, están dadas por aquellas de cualquiera de los dos bloques obtenidos mezclando el contraste de definicicin. Escogiendo “pares” en la regla de pares-impares, o sea, aquellas condiciones que tienen un número par de letras en común con el contraste de definición ABCDE, obtenemos la siguiente media réplica:

1 ad ae de ab bd be abde ac cd ce acde bc abcd abce bcde

Para dar un paso más, ilustraremos ccimo construir un cuarto de réplica para el experimento factorial 25 dado. Haremos esto dividiendo la media répli- ca anterior a la mitad, mezclando la interacción de tres factores ABC. Una vez más, utilizando “pares”. obtenemos las ocho coridiciones experimentales que si- guen:

1 de ab abde ac acde bc bcde

Como la interacción generalizada DE de los dos efectos mezclados está también mezclada, tenemos ahora los tres contrastes de definición ABCDE, ABC y DE. Ninguno de estos efectos se puede calcular en el cuarto de réplica y cada uno de los otros efectos está aleado con sus interacciones generalizadas con los tres contrastes de definición. La aleación completa es la siguiente:

Aleacirit~ de rotrjutrlos

A , BCDE, BC, ADE B, ACDE, AC, BDE C , ABDE, AB, CDE D, ABCE, ABCD, E AD, BCE, BCD, A E . BD, ACE, ACD, BE CD, ABE, ABD, CE

Hemos presentado este cuarto de réplica (micamente como una ilustración; en la Práctica, sería difícil que resultara Gtil, debido a la aleación de los efectos princi- pales con las interacciones de dos factores. Sin embargo, los cuartos de rbplica de experimentos con 6 6 7 factores (y aún los octavos de réplica de experimentos con 7 y 8 factores) pueden dar mucha informacibn útil.

El análisis de un experimento factorial fracciona1 es prácticamente el mismo que el de un experimento factorial con réplicas completas. Dada la fracción 1/2p de un factorial 2”, hay 2“-p condiciones experimentales, y se puede emplear el

Page 317: ingenieria

REPLICAS FRACCIONALES 309

metodo de Yates como si el, experimento fuese un factorial 2n-p Se deben tomar ciertas precauciones para ordenar las condiciones experimentales en un “orden nor- mal” modificado, como se indica en el problema 14 de la pagina 31 1.

Al tratár con factoriales fraccionales, existe ’ el problema de obtener una esti- maci6n del error experimental. Por ejemplo, en la media réplica del factorial 2” descrita en la página 307, la descomposición de la suma total de cuadrados tiene 15 grados de libertad y, por lo tanto, da sumas .de cuadrados de los efectos prin- cipales (5 grados de libertad), sumas de cuadrados de interacciones de dos- fac- tores (10 grados de libertad), pero no da ninguna componente’ (O grados ‘de li- bertad)*’para el error experimental. En una situación Cbmo ésta, y en todos los demas casos en que el número de grados de libertad del error es pequeño, es mejor incluir una cantidad limitada, de ”réplicas. Esto, se puede. lograr seleqio- nmdo al azar varias condiciones experimentales y haciendo observaciones adicio- nales .correspondientes a esas condiciones. Adembs, si se puede suponer que no hay interacciones de orden superior, el total de las sumas de cuadrados corres- pondientes a las interacciones de orden superior que no están aleadas con efectos principales o interacciones de orden inferior se pueden atribuir a “error”, y se pue- den usar en el denominador del test F (problema 15). De esta forma, se puede utilizar la “réplica oculta” inherente en 1a.mayoría de los experimentos factoriales grandes.

En resumen, la réplica fracciona1 es útil siempre que el número de factores incluidos en un experimento es grande y si no ‘es económicamente factible incluir todas las condiciones experimentales posibles. La reducción de tamaño (y, por consiguiente, de cos!o) de una réplica fraccional origina la descompensación de una pérdida en información causada por la aleación y las dificultades inherentes a la estimación del error experimental. En el libro de W. G. Cochran y G. M. Cox, citado en la bibliografía, se puede encontrar un análisis más detallado de la rkplica fraccional; incluyendo réplicas fraccionales de experimentos 3“ y una gran variedad de otros diseños.

EJERCICIOS

l.’ Hacer una lista de las condiciones experimentales incluidas en cada bloque al mezclar un experimento factorial 24,

(a) en 2 bloques en ,ABCD, (b) qn 4 bloques en ABCD y AB. ~ Q u 6 otra interaccibn se mezcla en el inciso (b) ?

B, C. D y E. Indicar,;qu6 tratamientos se deben asignar a cada bloque si: (a) hay dos bloques con la interacción A B C D mezclada, (b) hay 4 bloques con las interacciones ABDE y CDE mezcladas. $uti1 otro efecto

3. Hacer una lista de las condiciones .experimentales incluidas, en cada bloque si se mez- cla un experimento factorial 26 en ABDE, BCDF y ABC, formando 8 bloques. ¿Que otros efectos factoriales se mezclan?

2. Se va a hacer en. varios bloques un experimento lactorial 2: que tiene los factores A,

factorial (o efectos) se mezclarti?

Page 318: ingenieria

31 O EXPERIMENTACION FACTORIAL

4. ¿Cual es el mayor n ~ m e r o d e bloques en que se puede desarrollar un experimento factorial 28 sin mezclar ningtin efecto principal?

S. Supongamos que, en el problema 1 de la phgina 277, los comestibles se juzgan en aonjuntos de cuatro, con un periodo de descanso intermedio, y que el experimento se hace de tal forma que cada réplica consiste en dos bloques con ABC mezclado. Hacer un analisis interno de bloques.

6. Se van a investigar cuatro medicinas nuevas para determinar su eficacia como tranqui- lizadores, aisladamente y combinadas unas Gon otras. A cada paciente se le dan dosis regulares de uno de los 16 tranquilizantes formados con estas drogas (incluyendo un excipiente correspondiente al nivel O de cada droga) y, desputs de un periodo de dos semanas, el efecto de estos tranquilizadores en la estabilidad emocional de cada pa- ciente se juzgó (en una escala de l a S) por cinco psiquiatras. Para mantener el tra- bajo dentro de limites razonables, se usaron dos hospitales para este experimento, y se seleccionaron ocho pacientes de cada hospital para cada ensayo (&plica); luego, el experimento est6 formado por dos replicas de dos bloques cada una, con la interac- ción ABCD mezclada. Los resultados de los ensayos en las dos semanas se muestran a continuacibn:

ler. Hospital 2do. Hospital Comibinación de Clasificación media Comibinación de Clasificación media

tratamientos Ensayo I Ensayo 2 tratamientos Ensayo I Ensayo 2

1 2.0 2.6 a 2.8 2.6 ab 3.8 3.4 b 3.6 2.0 ac 4.2 4.8 C 2.4 1.8 bc 4.8 4.0 abc 4.0 3.8 ad 1.8 2.4 d 1.8 2.2 bd 3.4 3.8 abd 1.6 2.0 cd 4.6 2.8 acd 3.6 2.4 abcd 4.2 4.6 bed 3.4 3.8

Si una alta clasificación indica progresos satisfactorios, iquk droga parece ser la me- jor? (Combinación o combinaciones de los medicamentos.) Hacer un análisis de las varianzas interiores de los bloques para contrastar los efectos significativos.

7. Supongamos que, en el ejercicio 4 de la página 299, d i o se pudieron probar 8 mues- tras de una sola vez, y que ahora el experimento se ha desarrollado de tal forma que cada réplica consta de cuatro bloques con .4 BC, A D E y BCDE mezcladas. (a) si, para cada factor, los niveles O y 1 son, respeotivamente, los valores menor

mayor, construir una tabla que indique las condiciones experimentales que van en cada uno de los cuatro bloques.

( b ) Hacer un análisis interior de bloques del experimento. 8. Verificar que, en el ejemplo de la página 303, los totales de todos los tratamientos quc

tienen coeficiente + 1 en [BC] se encuentran en los bloques 1 y 4, que todos los to- tales de tratamientos que tienen coeficiente -1 en [BC] están en los bloques 2 y 3 y, por lo tanto, que la interacción BC está mezclada con los bloques.

9. Demostrar que la regla “pares-impares” para repartir los tratamientos en los bloques, dada en la página 303, es equivalente al método descrito en el problema 10 de la plgina 321.

IO. Con respecto al ejercicio 2, supongamos que, en cada caso, el bloque que contiene la combinación de tratamiento 1 se escogi5’como una réplica fracciona1 de un factorial 25. ( a ) Mostrar los pares aleados t n la media réplica resultante. ( b ) Mostrar los conjuntos aleados en el cuarto de réplica resultante.

Page 319: ingenieria

REPLICAS FRACCIONALES 31 1

(En la prhctica, la selección al azar debería usarse para escoger el bloque que se de- biera incluir en una réplica fraccional.)

11. Hacer la lista de conjuntos aleados en e1"ejercicio I si un ex6rimento consiste en (a) Una media rkplica de un experimento factorial 2 4 con A i d D mezclado. (b) Un cuarto de réplica de un experimento factorial '24 con ABCD y A B mezclados

12. Hacer una media réplica de un experimento factorial 20 que dene el contraste de defi- nición ,ABCDEF. Hacer la 'lista de los 32 tratamientos en ,el bloque que contiene la condición experimental 1, y posi iar .los pares ,aleados.,' '

13. Diseñar un experimento consistente en cuarto de réplica'de un factorial 27, con ABCDE, ABCFG y DEFG mezcladas, si la condición experimental con cada factor en el nivel O debe quedar incluida. Mostrar, ademtís, todcs' los conjuntos aleadijs.

14. En el ejerqicio 12, podemos d e h i r un arden normal modificuda para las 32 .combina- ciones dk tratamientós de la media' réplica en la forma siguiente. Primero, hacemos la lista de las 32 combinaciones de tratarnientos correspondiintes' a los. cinco factores A , B, C , I) y E, en orden nomal. Después, añadimos l a letra f a 1 6 de estas combina-

' ciones de tratarnientos, de tal modo que 'la lista contenga las mismas que el bpque escogido 'para la media réplica. (a) Utilizar este metodo para hacer una lista de las' combinaciones de tratamientos

obtenidas en el ejercicio 12. (b) Generalizar la regla anterior para ordenar las combinaciones de tratamientos en

un orden normal modificado que se pueda aplicar a una media rCplica de un ex- perimento factorial 2". (Para una réplica fraccional 1 / 2 P de un experimento fac- torial 2", un orden normal modificado se obtiene notando que cualquier bloque escogido contiene un subconjunto de II - p letras que forman una réplica completa de un factorial 2n-p. El orden normal modificado se obtiene, entonces, empleando estas letras solamente y después añadiendo las restantes p letras para obtener las combinaciones de tratamientos necesarias.)

15. LOS factores siguientes se van a estudiar en una media réplica de un experimento fac- torial 26 (contraste de definición ABCDEF), proyectado para evaluar diversas substan- cias químicas como insecticidas:

, .

Factor Nivel O Nivel I

A . BMC 0% 5% B. Malathion 3% 6% C. Tedion 1% 2% D. Chlordan0 2% 5% E. Lindano 1% 4% F. Pyrethro 2% 4%

Cada unidad experimental consta de IO insectos, y los tiempos de vida medios (en se- gundos) despues de cada aplicacibn de los insecticidas respectivos son los siguientes, en el orden de azar en que fueron obtenidos:

ce 181 ae 172 abef 140 bulf 165 aule 139 ef 186 de 104 uhcd 112

162 182 171 176 187 131 125 158

ba df acef bc

beef cdef bdej

(1c

135 171 159 179 165 181 lG3 128

a w ab b d e abcdef af id aMe cd

131 13B 105 109 176 150 115 166

Page 320: ingenieria

31 2 EXPERIMENTACION FACTORIAL

( a ) Hacer una lista de los pares aleados. (b ) Ordenar los resultados en orden normal mhificado (ver ejercicio 14) y utilizar

el metodo de Yates para encontrar los efectos totales. (c ) Identificar los efectos totales como sigue: En la última columna de la tabla de

Yates, escribir las 32 combinaciones [I], [ A ] , [B] , [AB], . . . , [ABCDE] en orden normal. Cada una de éstas est& aleada con otra: identifique los pares aleados, em- pleando el efecto principal o la interacción de orden inferior. (Por ejemplo, ABCD6 e s a aleada con F, identificar el efecto total [ABCDE] como el del efecto prin- cipal F). Notar que I C de los pares aleados son interacciones de tres factores alea- das con interacciones de tres factores; se califican como “error”.

f d ) Obtener los cuadrados medios y completar el anilisis de la varianza. Notar que el cuadrado medio de error. que tiene 10 grados de libertad, es el promedio de los cuadrados medios de los 10 efectos clasificados como “error”.

16. Verificar la expresi6n obtenida para [A] en la pAgina 307. 17. Duplicando los pasos indicados en In p&gina 307, demostrar que, en el diseño dado, el

efecto principal del factor B esth mezclado con la interaccijn AC. Sugerencia: expre- sar [B] y [AC] en funcijn de los parametros del modelo.

Page 321: ingenieria

APLICACIONES 15, , A LA GARANTIA DE CALtDAD

I . . . . .

J

I ,

, I .

15.1 Garantla de calidad

Aunque existe la tendencia a considerar la garantía de calidad como un des- arrollo reciente, no hay nada nuevo sobre la idea básica de hacer un producto de calidad caracterizado por un alto grado de uniformidad. Durante siglos, los artesa- nos hábiles se han esforzado en hacer pro@ctos que se distinguieran por su calidad superior y, una vez que se lograba cierto.grado de calidad, eliminar, hasta donde fuera posible, cualquier variabilidad entre sus productos que los hiciera anormales.

La idea de que la estadística se convierta en un instrumento para asegurar la calidad de los productos fabricados, no YEI mhta116 del advenimiento de la produc- ción en masa y el uso extenso de métodos estadísticos en problemas de garantía de calidad es aún mas reciente. Muchos problemas en la fabricación de un producto se pueden tratar con el método estadístico, y en efecto,-hemos estudiado algunos de ellos en partes anteriores de este libro. Cuando hablamos de garantía de calidad (es- tadística), nos referimos, esencialmente, a las tres técnicas especiales que se trataran en este capítulo; control de calidad. .muestrco de aceptncitin .y fijacicilt de h i t e s de tolerumiu. Nótese que la palabra “calidad’, cuando se usa tknicamente como en esta

31 3

Page 322: ingenieria

31 4 APLICACIONES A LA GARANTIA DE CALIDAD

discusión, se refiere a alguna propiedad medible o contable de un producto, tal como el diámetro externo de un rodamiento de bolas, la resistencia a la rotura de un hilo, el número de imperfecciones en una pieza de tela, la potencia de una droga, etc.

15.2 Control de calidad

Algunas persona$' se Sorprenden a l enterarse que dos partes apwe&Fmente idinticas, hechas bajo condiciones cuidadosamente controladas, de la misma fuente de materia prima y fabricadas sólo con diferencia de segundos por la misma máqui- na, puedan ser diferentes en muchos aspectos. En realidad, cualquier proceso de fa- bricación, aunque sea muy bueno. se caracteriza por un cierto grado de variabilidad que es de una naturaleza aleatoria y que no se puede eliminar completamente.

Cuando la variabilidad presente en un proceso de producción está limitada a la vuriacicin alcutoria, se dice que el proceso está bajo control estadístico. Tal estado se consigue buscando y eliminando todas las causas que originan variaciones de otra clase, son las variaciones atrihnibles, que se puede deber a operarios poco entrena- dos, materias primas de baja calidad, ajustes indebidos de las máquinas, partes usa- das, etc. Como los procesos de fabricacibn raramente se encuentran libres de este tipo de defectos, es importante tener algi~n mitodo siskmático de detectar las des- viaciones notables de un estado de control estadístico cuando Cstas se presenten, o . i es posible,antes. Es para este fin para el que se emplean principalmente las grúfi- ( ' U S (10 ~ ~ o i l l r o l .

En lo que sigue. diferenciaremos entre grúficas de control de medidas y grúficas de control de atributos, dependiendo de que las observaciones que estamos haciendo sean medidas o datos contables (por ejemplo, el número de elementos defectuosos en una mueztra de un tamafio dado). En cualquier caso, una grifica de control con- siste en una linea central (figura 15.1) correspondiente a la calidad promedio en que

Oimensión

Limite superior de control ""L""""

t I 1 I I I I . I Número de la muestrd

F i g . 15.1 Carta de control

se desarrolla el proceso, y dos lineas correspondientes a los límites de control supe- rior e inferior. Estos límites se escogen de tal forma que los valores que caen dentro

Page 323: ingenieria

GRAFICAS DE CDNTROL DE MEDtD6S 31 5

de ellos se pueden atribuir al azar, mientras que los valores que .caen fuera de elios deben ser interpretados como indkaci6n de una falta de control. Marcando los resul- tados obtenidos de muestras, tomadas periódicamente en intervalos frecuentes, es posible verificar, por medio de esta gráfica, si el prweso está bajo control, o si en el proceso ha aparecido algún fallo que causa problemas como los indicados anterior- 'mente. Cuando un punto obtenido de muestra cae fuma de los límites de control, se buscan los fallos,: pero aun si !os puntos,quedan dentro de los límites, la aparicicin de una' tendencia o irregularidad sistemática puede servir como aviso de que se debe tomar. alguna awión para evitar problemas serios. e

La capacidad para "leer" gráficas de control y determinar justamente quC ac- cibn correctiva debe tomarse, es. cuestión de experiencia y de un juicio altamente desarrollado. Un ingeniero de control .de calidad no s610 debe entender, las bases estadísticas de su función, sino también debe estar ampliamente familiarizado con los procesos de. la fabricacidn. Los aspectos de ingeniería y direccibn del control de calidad (y de garantia de calidad en general), que en nuestros días ,incluyen la entra- da de materias primas, la salida de productos y el proceso interqo de control, cons- tituyen un tema muy extenso por sí mismos. En este capítulo s61o presentaremos los aspectos estadísticos del tema; una discusión más completa de otros aspectos se puede encontrar en el libro de D. J. Cowden, citado en la bibliografia.

15.3 Grhficas de coqtrol dq. r , medidas

Al tratar con medidas, es costumbre ejercer control sobre la calidad media dc un proceso, así,eomo sobre'su variabilidad. L a primera meta se consigue marcando las medias de muestras periódicas en lo que se Barna p4fit.u de t-otrtrwl tkr nlctlios o, más sucintamente, grújica de 5: L a variabilidad se controla marcando los recorri- dos de las muestras o las desviaciones típicas, respectivamente, en una grújica R o en una grújicu J, dependiendo de cuál es el estadístico que se emplee para estimar la desviación típica de la población.

Si la media del proccso y la desviación típica, p y l ; , son conocidos, y es razona- ble tratar las medidas como vuestras de una poblacih nomal, podemos afirmar, con una probabilidad de I --u, que la mcdia de una muestra aleatoria de tamalio IZ

'caerá entre ~ . r - zaIs - ' y : b + z,,~ -. Estos dos límites de.S nos dan 10s límites CT U

4; d n , .

de control superior e inferior y, con las suposiciones consideradas, perniten al inge- niero de control de calidad determinar cuándo se debe hacer un ajuste en .el proceso.

En la prácticz, por IO general no se conocen.wni~, y es necesario estinrar sus valores de una gran muestra (o muestras) tomada mientras el proceso est6 "bajo control". Por esta razcin, y porque no hay seguridad de que las medidas se puedan tratar como muestras de una poblacicin normal, eI nivc?l de confianza I -u asocia- do a los'límites de contrdl. tis ' d o aproximado,' y talcs "limites de probabilidad" se emplean rara, vez en la prrictica. En su lugar. es prhctica comtín cn la industria u t i l i - zar los "límites de tres-sigma" obtenitlos al substituir z,,,..? por tres. Con los línlites

Page 324: ingenieria

31 6 APLICACLONES A LA GARANTIA DE.CALIDAD

tres-sigma tenemos, en general, una confianza bastante alta de que el, proceso no se saldrá de control cuando está realmente bajo control.

Si se tiene un largo historial de un proceso con buen control, se pueden estimar y u a partir de los datos pasados, prácticamente sin error. Entonces, la línea cen-

tral de una gráfica f está dada por p y los límites de control tres-sigma superior e inferior se dan por p f Au, donde A = 3/&. y n es. el tamaño de cada muestra.* Por conveniencia, se dan valores de A para n = 2, 3, . . . , y 15 en la tabla XI. El empleo de un tamaño de muestra constante IE simplifica el mantenimiento y la inter- pretación de una gráfica 3 , pero, como el lector observará en ‘el problema 4 de la página 324, esta restricción no es absolutamente necesaria.

En el caso más común, en el que no se conocen los parámetros de la población, es necesario estimarlos sobre la base de muestras preliminares. Para este fin, es con- veniente, en general, obtener los resultados de 20 ó 25 muestras consecutivas, toma- das cuando el proceso está bajo control. Si se utilizan k muestl’as, cada una de tama- ño n, denotaremos la media de la i-esima muestra por zi, y la media mayor de las k muestras por 2, esto es,

+ I l k 2 = - 2 5 ; k i - 1

La variabilidad del proceso u se puede estimar, ya sea a partir de las desviacio- nes típicas o a partir de los recorridos de las k muestras. Como el tamaño de las muestras utilizado com6nmente en las gráficas’ de control de medidas es pequeño, cn general habrá poca pérdida de eficiencia al estimar u a partir de los recorridos. (VCase el problema 5 de la página 325 para un ejemplo en el que se emplean las desviaciones típicas de las muestras para este fin.) Denotando el recorridq de la i-ésima muestra por Ri, podemos usar el estadístico

+ + Como j: da una estimación insesgada de la media de la población p, la línea

central de la grrifica 3 est5 dada por 2. El estadisticd x no da una estimación inses- gada de u, pero, multiplicando i? por la constante Az, obtenemos una estimación insesgada de 3u/d\/n, El coeficiente constante Az, tabulado en la tabla XI para varios valores de n, depende de la suposición de que las medidas constituyen una muestra de una poblacidn normal. Entonces; la linea central y los límites de control tres-sigma superior e inferior, denominados UCL. y L K L . están dados (con k y u es- timados a partir de datos pasndos) para una grúfica Z POI*

* En este capítulo nos separaremos algo de I,? notacibn normal empleada en control de calidad, para ajustarla a la notación, más aceptada en estadística, ,que hemos empleado, en cste libro. (Por ejemplo, en el cnntroI de calidad se acostumbra denotar la media y la desvia- ción típica de la muestra por Z y U, y los parámetros de población correspondientes, por Z’ Y u’.)

Page 325: ingenieria

GRAFICAS DE CONTROL I;€ MEDIDAS 31 7

+

En la figura 15-2 se da un ejemplo de esta clase de gráficas de control para la media.

- X

""""""""_. UCL

"""""

Fig. 15.2 Carta f

Al controlar un proceso, puede ocurrir que no sea suficiente la media de la po- blación como Único indicador. Aunque se pueden percibir fácilmente un aumento en la variabilidad del proceso, a partir de unas fluctuaciones amplias de las Z, se lo- gra una prueba mhs sensible de los cambios en la variabilidad por medio de una grifica de control por separado, ya sea una grújira K basada en los recorridos de las muestras, o una grdflca u basada en las desviaciones tipicas de las muestras. En e1 problema 5 de la phgina 325 se da un ejemplo de la illtima.

La linea central y los limites de control de una gráfica R se basan en la distri- buci6n del recorrido de las muestras de tamaiio n de una población normal. Como observamos en la página 164, la media y la desviación tipica de esta distribuci6n muestra1 esthn dadas por dza y &U, respectivamente, cuando se conoce u. En con- secuencia, 10s limites de control tres-sigma para el recorrido están dados por dzu & 3dao,y el conjunto completo de los valores de la gráfica de control (para 1111;l

,vrtífir.a R ) con u conocida, estAn dados por

Linea trntrcd = dp(T

+ UCL = Dllu +

Aqui, Dl = d 2 - :W:, y D, = (I2 + 3 ~ 1 3 , y los valores de estas constantes sc pucc1c.n encontrar en la tabla XI para valios valores de 11.

Si (T es desconocida, se estima de las experiencias pasadas. con10 indicamos an- Icriormente, y los valores para una gráfica- control de una gr.ifific.o R ( c o t ? U tks- c ~ ) t r o c . i & ) son los siguientes

Page 326: ingenieria

31 8 APLICACIONES A LA GARANTIA DE CALIDAD

Linea central = R UCL = D4-d

LCL = D3Z

Aquí, Da = Dl/& y D4 = Dz/d2, y los valores de estas constantes también se pue- den encontrar en la tabla XI para varios valores de n.

Para ilustrar la construcción de una gráfica Z y de una gráfica R , consideremos el ejemplo siguiente. Un fabricante de cojinetes conoce, por .un registro preliminar de muestras tomadas cada hora durante 20 horas, de tamaño 4, que para los diáme- tros de los cojinetes es L = 0.9752 y i? = 0.0002. Expresando estos ,datos por me-

' R

"" """"_" UCL 4.0

o1 I Y

I 1 I

1 5 10 15 I hora

20

Fig. '15.3 Carta

.,.

dio de la ecuación ción de 0.9750 en ¿MOO1 de pulgada, obtiene

x -, es, gecir. expresandQ cada medida como u?+ &S&- o.Ooo1

. .

C Rrdfica (codificada) R gráfica (codificada)

Linea central 5 = 2.0 Línea central = 2.0 UCL x + APR = 3.4 UCL DdR = 4.6 LCL X - AJ? 0.6 LCL D a = O

Los valores de A , = 0.729, D3 = O , y D, = 2.282 para muestras de tamaño 4 se obtuvieron en la tabla XI. Las grhficas de control se muestran en las figuras 15.2 y 15.3, donde tambiCn se iifdican los resultados obtenidos de'spues en las 20 mues- tras siguientes:

Page 327: ingenieria

GRAFICAS DE. CONTROL DE ATRIB~TOS 31 9

Hora Valores de $as muestras C . z R . 1 1.7 2.2 1.9 1.2 1.76 1 .O 2 n.s 1.5 2.1 0.9 1.33 1.3 3 1.0 1.4 1.0 '. 1.3 1.18 0.4 , I

4 .0.4, -0.6 0.7 0.2 0.18 1.3 # 5 1.4 2.3 2.8 2.7 2.30 1.4

', ,

6 1.8' 2.0 1.1 0.1 1.25 1.9 7 1.6 4 ;o 1.5 2.0 1.52 1.0 8 2.5 1.6 1.8 I .2 1.78 1.3 9 2.9 , 2.0 0.5 . 2.2 1.90 2.4

'1 1 1 .7 3.6' ' 2.5 1.8 2.40 1.9 12 4.6 2.8 3.5 1.9 3.20" 2.7. 13 2.6 ' . 2.8 3.2 1.5 2'62 1.7 14 2.3 2.1 2.1 1.7 2.05 0.6 15 . . ' 1.9 1.6 1.8 1.4 1.68 0.5 16 1.3 2.0 3.9 0.8 2.00 3.1 17 2.8 1.5 0.6 0.2 1.28 2.6 18 1.7 3.6 0.9 1.5 1.a 2.7

10 1.1 1.1 3.1 1.6 1.72 . 2.0

. I 19 1:6 ; ; 0.6.. 1 .o 0.8 1.00 1.0 20 1.7 1.0 0.5 , 2.2 1.35 1.7

Una inspección de la figura. 15.2 muestra que sólo uno de los puntos queda fuera de los límites de control, pero también muestra que, aún así, hay una tendencia hacia abajo en la variabilidad del proceso: notemos especialmente que la mayoría de los recorridos de las muestras quedan debajo de. la línea centra1 de la gráfica R .

El lector habrá observado la cercana conexión entre el empleo de gráficas de control y los tests de hipótesis, Un punto en,una gráfiq, Z que esté fuqa de control, corresponde a una.muest.ra para la que se,rechaza la hipótesis nula .II = M. Para ser más precisos, diremos que las técnicas de las gráficas de control nos proporcio- nan conjuntos secuenciales, tempordmenfe ordenadus, de tests. No sólo nos intere- san las posiciones de puntos individuales, sino también sus posibles tendencias u otras normas que muestren ertos puntos que representan muestras sucesivas. Por con- siguiente, podemos usar d test de los signos (pBgina 198) para verificar si ha ha- bido una tendencia en el pronledio del producto del ejemplo anterior, o un test de series de térTinos iguales (página 204) para determinar si hay una tendencia signi- ficativa.

15.4 Gráficas de control de atributos

:. Aunque, generalmente, se puede obtener una información más completx traba- jando con medidas hechas en .un producto terminado, casi siempre resulta. mBs rá- pidmy barato.mprobar m el produeto las especificaciones de un "atributo" o "ca- racterística" de manera, quo se pueda decidir, si "pasa o no pasa". Por ejemplo, al comprolxir el diámetro: y la excentricidad de un rodamiento de bolas, es miis simple determinar si'pasa pas un agujero circular cortado en una plantilla, que hacer diver-

I ,

Page 328: ingenieria

320 APLICACIONES A LA GARANTIA DE CALIDAD

sas medidas del diámetro con un micrómetro. En esta sección discutiremos dos tipos fundamentales de gráficas de control usadas en relación con muestras de atributos. la grújica de la fraccidn de defectuosos, llamada también “gráfica p”, y la gráfica del nu’mero de defectos, llamada también “gráfica c”. Para aclarar la distinción entre “número de defectuosos” y “nilmero de defectos”, nótese que una unidad sometida a examen puede tener varios defectos, mientras que, por otra parte, tal unidad es de- fectuosa o no lo es. En muchas aplicaciones, decimos que una unidad es “defectuo- sa” si tiene al menos un defecto.

Los límites de control para una gráfica de la fracción de defectuosos se basan en la teoría de muestras para proporciones introducida en la sección 10.1, es decir, se basan en la aproximación por curva norrnal de una distribución binómica. Así, si está dada una norma, esto es, si la fracci6n de defectuosos debe tomar algún valor de p previamente determinado, la línea central es p y los limites de control de tres sigma de la fracción de defectuosos en las muestras aledtorias de tamafio n están

dados por p f 3 $?!LZA 12

Si no se da ninguna norma, lo cual es el caso más frecuente en la práctica, p deberá estimarse de datos pasados. Si se dispone de k muestras, di es el número de defectuosos en la i-ésima muestra, y ni es el nílmero de observaciones en la i-ésima muestra, habitualmente se calcula p como la proporción de defectuosos en la muestra combinada, es decir,

4 p =

Substituyendo p por p en las fórmulas anteriores, obtenemos los valores siguientes para una grájica de la fruccicin de defectuosos basada en el análisis de datos pasados:

dl +ds + . . . + dk % + % + . . . + m

Línea central = p

+ 4

N6tese que, si p es pequeña, como frecuentemente sucede en la prgctica, la substituci6n en la fórmula para el límite de control inferior dará un nlimero negativo. Cuando esto ocurre, es costumbre considerar que este límite es cero y, en efecto, usar solamente el límite de control superior. Se puede Presentar otra complicadcjn cuando p es pequeña, que consiste en que la distribución binómica no resulte ade- cuadamente aproximada por la distribución normal. Hablando en general, el empleo de los límites de control anteriores para gráficas p es irreal cuando n y p son tales que la distribuci6n binómica subyacente (o hipergeométrica) no se puede aproximar por una curva normal (pagina 67). En tales casos, es mejor emplear un límite de control .superior, obtenido directamente de una tabla de probabilidades binómicas o. quizis, del empleo de la aproximación de Poisson a la distribución bidmica.

Page 329: ingenieria

GRAFICAS DE CONTROL DE ATRIBUTOS 321

La gráfica de control del mímero de defectuosos es equivalente a la gráfica p de la fracción’ de los defectuosos. En lugar de marcar la fracción de los defectuosos en una muestra de tamafio n, marcamos el número de defectuosos, y los valores de la gráfica de control en este caso se obtienen multiplicando los valores anteriores, para ‘la línea central y los límites de control, por .n. Entonces, si p se estima por P , los valores de la grcificade control de .número de defectuosos son los que Se indican a continuacibn:

Línea central = np + UCL = np 4- 3dnp(l - p ) ” 9

LCL = np - 31/np(l - p)

Como una ilustracion de gráfica p , supongamos que se desea controlar la sali- da de una línea de producción de cierto transistor para mantener una eficiencia de 60rJ0, esto es, una proporción de defectuosos de 40%. Con este fin, se toman mues- tras diarias de 100 unidades y se comprueban las especificaciones el&tricas, con los resultados siguientes: . .

Número de Fecha defectuosos Fecha

3-12 3-13 3-16 3-17 3-18 3-19 ” 3-20 3-23 3-24 3-25

24 38 62 34 26 ‘36 38 52 33 44

3-26 3-27 3-30 3-3 1 4- 1 4- 2 4- 3 4- 6

, 4- 7 4- 8

Número de defectuosos Fecha

44 4- 9 52 4-10 45 4- 13 30 4-14 34 4-15 33 4-16 22 4-17 34 4-20 43 4-21 28 4-22

Número de defectuosos

~ ~~

23 31 26 32 35 15 24 38 21 16

Como la .norma est& dada pdr = 0.40, los valores de la ‘gráfica de control serán

Línea centrul = 0.40

UCL = 0.40 + 3 loo = 0.55 (0.40)(0.60)

La gráfica de control correspondiente, con puntos para las 30 fracciones de defec- tuosos de las muestras, se muestra en la figura 15.4, que proporciona algunas ca- racterísticas interesantes. Notemos que sólo hay un punto fuera de control en l a parte superior, .pero hay 7 puntos .fuera de control en la parte inferior. La mayorla de estos 7, “puntos bajos” aparecen antes del primero de abril y aparentan &ser una tendencia general. hacia abajo.. De hecho, hay una serie ininterrumpida de 11 pun- tos abajo de Ea 1ínea:central despu6s del 7 de abril. Puede suponerse, por esta grá-

Page 330: ingenieria

322 APLICACIONES A u\ GARANTIA DE CALIDAO

fica, que la eficiencia aún no se ha estabilizado y que, el proceso es potencialmente capaz de mantener una eficiencia bastante superior del valor nominal de 6Ov.

Hay situaciones en que es necesario controlar el número de defectos en una unidad de producción, en lugar de la fraccibn de defectuosos. Por ejemplo, en la producción de alfombras es importante cont~olar el número de defectos en 100 yar- das; en la producción de revistas se puede controlar el número de defectos por ro- dillos. Estas situaciones son similares a la descrita en la sección 4.4, que nos condujo a la distribución de Poisson. Entonces, si c es el número de defectos por unidad fabricada, c se tomará como un valor de una variable aleatoria que tiene distribu- ción de Poisson.

fracción defectuosa

I I I I

3-30 4-6 4-1 3 4-20 Fecha

Fig. 15.4 Carta p

De esto se deduce que la línea central en una grúfica de nhzero de defectos es el parámetro de X la distribución de Poisson correspondiente, y que los límites de control tres-sigma se pueden basar en e1 hecho de que Ia desviación típica de esta distribución es 6 . Si X es desconocida, es decir, si no se da ninguna norma, su va- lor se calcula usualmente partiendo de, al menos, 20 valores de c tomados de datos pasados. Si k es el número de unidades de producto disponible para estimar X, y si ci es el número de defectos en la i-ésima unidad, X se estima por

+ y los valores de la grúfica de control c son

1 k E = - z ci k (-1 +

Linea centrsl = F

+ UCL = E 4- 3 6

LCL = F - 3 4

Para ilustrar este tipo de gráficas de control, supongamos que se conoce, por expe- riencia pasada, que, en promedio, un avión hecho por cierta compaiiía tiene E r- 4 remaches sin colocar. La gráfica de control correspondiente para el número de re- maches que faltan se muestra en la figura 15.5, en la luz también hemos marcado

Page 331: ingenieria

GRAFICAS DE CONTROL DE ATRIBUTOS 323

los resultados de la inspeccidn, que revelan 4, 6, 5, I , 2, 3, 5, 7, 1, 2, 2, 4, 6, 5, 3, 2, 4, 1, 8, 4, 5, 6, 3, 4 y 2 remaches que faltan en 25 aviones.

Número de remaches faltante

lo=_,, """""" UCL

8-

6-

4- Linea central

2 -

o I I I I . . I Número de ensambles 1 5 to 15 20 25

Fig. 15.5 Carta c

EJERCICIOS

1. Una compañía está iniciando un proceso para la fabricación en masa de resortes de com- presijn. Ly espgificaciones indican que las .longitudes libres de los resortes tienen I.( = 1.500 pulgadas y u = 0.010 pulgadar. (a) Emplear las especificaciones para calcular un3 línea central y los limites de Control

treq-sigma de una gráfica 3 con II = 5. ( b ) Utilizar las especificaciones para calcular una línea central y límites de control tres-

s,igma para una grrifica R, con = 5. (c) Marcar las siguientes medias y reGorridos, obtenidos en 20 muestras aleatorias sucesi-

vas de tamaño 5, en gráficas basadas en las constantes de las gráficas obtenidas en las partes (a) y (b), y discutir el proceso.

Muestra z R

1 2 3 4 5 6

8 9

10

" 7

1.515 1.465 1.528 1.532 1.510 1.477 1.490 1.444 1.489" ' 1.523

0.036 0.058 0.037 0.022 0.026 0.026 0.056 0.019 0.035 0.054

Muestra

11 12 13 14 15 18 17 18 19 20

- z 1.492 1.534 1.502 1.520 1.490 1.475 1.538 1.521 1.509 1.489

R

0.025 0.041 0.047 0.015 0.030 0.026 0.039 0.047 0.027 0.040

2. Calcular E y del inciso (c) del problema 1 y .emplear estos valores para construir las líneas centrales y los límites de control tres-sigma para las nuevas grhficas 3 y R que se emplearan en cl control de las longitudes libres de los resortes de compresih.

3. Los datos siguientes dan las medias y los recorridos de 25 muestras, consistentes cada una j en tres medidas de la resistenzia a la. tensibn de fundiciones de hierro, emmiles de libras

por pulgada cuadrada:

Page 332: ingenieria

324 APLICACIONES A LA GARANTIA DE CALIDAD

Muestra 1 2 3 4 5 6 7 8 “ - 55.1 57.6 52.8 51.4 53.7 59.2 61.1 52.8

R 2.5 1.0 3.9 5.6 2.7 3.1 1.5 2.2

Muestra I 9 10 11 12 13 14 15 16

55.4 58.1 56.2 55.7 51.9 59.4 62.6 64.5 R 1 2.7 3.1 5.0 1.6 2.2 5.7 6.5 3.6

Muestra 17 18 19 20 21 22 23 24 25

- 61.1 62.4 57.9 58.6 63.3 59.7 58.2 61.6 62.3 R 1.4 4.3 2.2 2.7 3.0 1.1 2.1 1.6 2.4

(a) Utilizar estos datos para encontrar la línea central y los limites de control de una gráfica Z .

(b) Utilizar estos datos para encontrar la línea central y los límites de control de una gráfica R.

(c) Marcar los datos dados en las gráficas 3 y . R basadas en las constantes de las grá- ficas de control ca!culadas en las partes (a) y ( b ) , e interpretar los resultados.

(d) Utilizando scries de t6rminos iguales por encima y por debajo de la línea central (de manera semejante a las series de iguales por encima y por debajo de la media discutidas en In página 206). contrastar, con un nivel de significacibn de 0.05, si hay alguna tendencia en los valores de 3.

(e) ¿Ser& razonable emplear los límites de control encontrados en este ejercicio en rela- ción con medidas de la resistencLa a la tensih subsiguientes en el mismo proceso’? ¿Por qué?

4. Se hacen lecturas de inversiSn de corricnte en una muestra dc 10 transistores cada cuarto de hora. Como ce ve que algunas de las unidades están “en corta” o “abiertas”, no siem- pre es posible obtener 10 mcdidas. LR tabla siguiente muestra el nhmero de lecturas he- chas al final de cada intervalo de media hora durante un tiempo de 8 horas, y las CO-

rientes medias obtenidas.

Muestra

12.5 15.6 11.1 9.7 10.2 12.3 11.6 21.9 z 9 7 10 8 8 9 6 10 12

1 2 3 4 5 6 7 8

Muesrru

16.7 14.2 9.8 13.1 11.6 9.6 17.2 10.1 5 10 9 8 7 O 10 8 7 n

9 10 11 12 . / 13 14 15 16

(a) Hallar la línea central d-, nna grafica Z tomandc: la media ponderada de las 16 3 tomando como peso para cnda valor el tamaño de la muestra correspondiente.

(b) Construir una tabla, mostrandola línea central obtenida en la parte ( a ) y los limitcs , d e control tres-sigma correspondientes a II = 6, 7. 8, 9 y 10. Utilizar R = 4.0, un valor basado en datos anteriores.

(c) Marcar los datos en una gráfica de control cotno la. de la figura 15.6 c interprctar los resultados.

Page 333: ingenieria

GRAFICAS DE CONTROL DE ATRIBUTOS 325

1 -;" . "1;- """" """_ 10 ""

"" "- """ """_ ""

n=6 0.3 n.10 0.6 n=2 n.3

1 2 3 4 5 6 7 8

""

1 1 1 l 1 1 1 1 Número de la .muestra

Fig. 15.6 Problema 4

5. Si las desviaciones tipicas de las muestras se toman en lugar de los recorridos de las muestras para estimar u, los límites de control de la grhfica 3 resultante están dados por Z f Al$ donde S es l a media de las desviaciones típicas de las muestras, obtenida a par- tir de datos dados, y Al sc puede encontrar en la tabla XI. N5tese que, en relacion con los problemas de control de calidad, la desviacibn tipica de las muestras se define utilizando el divisor n en lugar de n - 1. La grhfica R correspondiente se substituye pol una grfifica u, que tiene la línea central c$ y los lín?ites de control superior e inferior Bal y BJ, donde BI y B.,, se pueden obtener de la tabla XI. (a) Construir una gráfica Z y una gr.iFica u para 20 muestras de tamaño 4 que tienen Z

iguales a 23.3, 23.4, 22.5. 20.3, 19.5, 21.8, 24.1, 24.9, 23.9. 24.4, 22.1, 21.6, 21.1. 20.3, 19.0, 20.4, 20.4, 19.4, 21.2, y S iguales a 3.1, 0.3, 1.2, 4.3, 2.9, 1.3. 0.8, 1.5, 1.0. 0.8, 2.0, 1.3, 0.3. 1.0, 0.9, 1 . 1 , 0.8, 2.0.

(b) ¿Es razonable emplear estos llmites de control para 'datos subsiguientes'? ¿Por qué'? 6. Para establccer grAficas de control de un proceso de fabricacijn de ejes, se toman 30

muestras de 4 medidas de los dittmetros exteriores. y los resultad- son E = 2.426 pulga- das y ji = 0003 pulgadas. Usando el metodo del problema 5, construir una grhfica Z para n = 4, y marcar en ella las siguientes medias obtenidas en 25< ,muestras sucesivas: 2.428, 2.430, 2.421, 2.425, 2.432, 2.440, 2.427, 2.421, 2.424, 2.425, 2.429, 2.426. 2.430, 2.424, 2.428, 2.422, 2.426, 2.427, 2 429, 2.425, 2.424, '2.429, 2.430, 2.421 'y '2.429. Discutir los resultados.

7. Supóngasc que, en el ejemplo del problema 6, tambikn se desea establecer contro1,sobqe la variabilidad del proceso. Usando el mdtodo.de1 qjercicios5 y los, valores de Z y B dados

, en,,el problema 6, calcular la línea central y los límites de control de una grhfica u con n = 4.

8 . . Treinta muestra8 sucesivas de 50 cubiertas de engranajes cada una, tomadas d+ una línea de producción, tuvieran, respectivamente, 3, 2, 3, 0, 5,. 10, 3, 3, 5, 6, 2, 3, 3, 2,, 6, 3, 5, 5, O, 6, 5, 3, 9, 3, 1 , 2, 2, 5, 4 y 5 defectuosaá. Si la fraccibn de los de- fcctumos ha de mantenerse en 0.05 constmir $ma grftfica p para estos datos y establecer si esta norma se cumpIe.

9. LOS datos del ejercicio 8 se pueden considerar como una evidencia d e que la norma de 5% de defectuosos est& siendo cxccdida.

.(a) Utilizar F o s datos del ejercicio 8 para construir nuevos límites de control para .la frac. 'ciós de los defectuosos.

(b) Empleando los límites de control obtenidos en la parte .(a), continuar el control d d proceso, marcando los datos siguientes sobre el ndmero de defectuosos Lobtenidos en las muestras siguientes de tamaño n = 50, 2, 5, 4, 6, 2, 4, 4, 5, 7, 8, 5, 0, 3, 5,

10. Las especificaciones para una v&lvula producida en serie prescribén un procedimiento de comprobacibn de acuerdo con el cual cada válvula se clasificar& como satisfactoria o de.

2, 5, 2, 4, 3 y 2.

Page 334: ingenieria

326 APLICACIONES A LA GARANTIA DE CALIDAD

fectuosa (no satisfactoria). La experiencia anterior ha demostrado que el proceso puede dar = 0.03. Construir una gráfica de control tres-sigma del nimero de los defectuosos obtenidos en muestras de tamafio 100, y marcar en ella los números siguientes de defec- tuosos obtenidos en muestras seleccionadas al azar en 30 medios días sucesivos de produc- c i 6 n : 3 , 1 , 4 , 2 , 2 , 0 , 1 , 4 , 5 , 3 , 2 , 1 , 1 , 0 , 2 , 2 , 3 , 4 , 1 , 0 , 3 , 1 , 2 , 5 , 2 , 7 , 2 , ~ ~ 1 y 2 .

11. La norma para un proeso de fabricacih continua de papel es de 4 defectos por 100 yar- das de papel. Basindonos en el conjunto siguiente de 25 observaciones y dando el núme- ro de defectos por 100 yardas, ¿se puede ccncluir que el proceso está bajo control?

Inspección 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2

N o . d e d e ~ G 1 2 5 1 3 1 O 3 6 3 4 3 4

Inspección

3 4 5 10 5 5 8 5 4 7 1 1 5 No.dedefectos

13 14 15 16 17 18 19 20 21 22 23 24 25.

12. Gn proceso para fabricar grandes lámtnas de vidrio se hizo en el pasado con un promedio de 3.8 imperfecciones por lámina. Construir una gráfica c para emplearse en la inspección de las laminas y discutir el control si 25 piezas sucesivas inspeccionadas tienen, respecti- vamente, 5, 3, 2, 4. 1, 8, 4, 5, 6: 3, 4, 2, 6 , 4. S, 1, 2, 3, 5, 7, 1, 2, 2 , 4 y 5 imperfec- ciones.

15.5 Límites de tolerancia

En cada fase del control de calidad se encuentra el problema de comparar al- gunas características o medidas de la calidad de un producto acabado, de acuerdo con ciertas especific8ciones dadas. A veces, las especificaciones, o límites de tderan- cia, han sido establecidas por el consumidor o por el ingeniero que proyectó la pieza, de tal forma que cualquier separación de estos limites hace al producto inutilizable. Sin embargo,. queda el problema de producir la parte de tal forma que una gran proporción de unidades queden dentro de los límites. de tolerancia ebpecificados. Además, si un producto se hace sin especificaciones iniciales, o si se hacen‘modifi- caciones, es conveniente saber entre qué límites puede mantener el proceso una ca- racterística de calidad durante un razonablemente .alto porcwtaje del tiempo., En este caso, hablamos de límites de tolerancia “naturales”, es decir, dejamos que el mismo proceso estdblezca sus propios límites, que se puCcljeil obtener en la práctica de acuerdo con la experiencia.

Si se dispone de información segura sobre la distribución de las meaidas en cuestick, es relativamente sencillo encontrar los límites de tolerancia naturales. Por ejemplo, si una larga experiencia anterior nos permite suponer que cierta dimensidn de un producto se distribuye normalmente con media p y desviación típica u, es f&iI constritir los límites entre 10s que se puede esperar que encontremos una pro- porción dada P de la población. Para P = 0.90 tenemos los límites de tolerancia p f 1.645u, y para P = 0.95 tenemos p f 1.96~, como se puede verificar fácil- mente en una tabla de itreas limitadas por la curva normal.

Page 335: ingenieria

LIMITES DE TOLERANCIA 327

En la mayoría de las situaciones que se presentan en la práctica, los valores verdaderos de p y u no se conocen, y los límites de tolerancia se deben basar en la media 3 y la desviación típica s'de una muestra aleatoria. Aunque p 4 1 . 9 6 ~ son los límites que incluyen un 9576 de la población normal, no, se puede decir'lo, mis- mo de los límites z f 1.96s. Estos límites son valores variables aleatorias, y pueden. o no, incluir una proporción dada de la poblaci6n. Sin embargo, es posible determi- nar una constante K tal que podamos asegurar con' un grado de confianza 1 - CY

que la proporción de la población contenida entre - Ks y Z + Ks es, al menos P. Estos valores de K para muestras aleatorias de poblaciones normales se dan en la tabla XI1 para P = 0.90, 0.95 y 0.99, grados de confianza de 0.95 y 0.99, y valores de n elegidos entre 2 y 1000.

Para ílustrar esta técnica, supondremos que un fabricante toma una muestra dc tamaño n = 100 de un lote muy grande de resortes de compresión producidos en serie, y que, obtiene if = 1.507 y S = 0.004 pulgadas para las longitudes libres de los resortes. Escogiendo un nivel de confianza de 0.99 y una proporción mínima de P = 0.95, obtiene los límites de tolerancia 1.507 +- (2.355) (0.004): en otras pala- bras, el fabricante puede afirmar, con un grado de confianza de 0.99, que, al, menos. el 955% de los resortes en el lote entero tienen longitudes libres entre '1.497 y 1.5 17 pulgadas. Notemos que, en problemas como éste, la proporción mínima P y el grado de confianza 1 - CY deben especificarsG notemos, ademhs, que el límite de toleran- cia inferior se redondea hacia abajo y que el límite superior se redondea hacia arriba.

Para evitar confusiones, .apuntemos, además, que hay una diferencia esencial entre límites de confianza y limites de tolerancia. Los límites de confianza se usan para estimar un parámetro de una población; los límites de toleraricia se utilizan para indicar entre qué limites se puede encontrar una proporcicin dada de la pobla- ción. Esta distinción la hace resaltar el hecho de que, cuandb n crece y se hace grande, la longitud de un intervalo de confianza se aproxima a cero,'mientras que los límites de tolerancia se aproximan a los valores correspondientes de ]a pobla- ción. Así, para valores grandes de n, K se apraxima a 1.96 en las columnas. para P = 0.95 de la tabla XII.

EJERClClQS

1. En un estudio para determinar el tiempo necesario para el montaje de una pieza de ma- quinaria dada, 50 obreros promediaron 42.5 minutos, con una desviacibn tipica de 3.X mi- nutos. Establecer límites de :olerancia para los que' se pueda afirmar, con un grado de confianza de 0.95, que al tneuos 94'3 de los obreros (en la poblacih de obreros de l a que se tomb la muestra) pucden montar la pieza dentro de esos limites.

2. Para comprobar el tliametro de alambre "calibre O" en u n gran envio. se midieron los diimetros de una mucstra de azar dc 16 piczas de alambre. dando una media de 0.338 y una desviacihn típica de 0.012 pulgadas. Establecer los limites de tolerancia con a = 0.01 y P = 0.99 y expresar e,r pcrlohrcrs qué significan estos límites de tolerancia.

3. En una muestra de azar dc 5 0 anillos dc pist6n escogidos de una línea de produccidn. el cspesor medio del borde fue 0.1284 pulgadas y la desviacidn tipica, 0.0005 pulgadas.

Page 336: ingenieria

328 APLICACIONES A LA GARANTIR DE CALIDAD

(a) ¿Entre qué límites se puede decir, con 95% de confianza, que al menos 90% del es- pesor de los bordes de los anillos de p i s t h producidos se encuentran?

(b) Hallar límites de confianza de 957% para el espesor medio verdadero y explicar la di- ferencia entre estos límites y los límites de tolerancia obtenidos en la parte (a).

4. Límites de tolerancia IZO paramérricos se pueden basar en !os valores extremos de una muestra aleatoria de tamaEo IZ tomada de una poblacim continua. La siguiente ecuación relaciona las cantidades 12, P y cu,donde P es la proporcibn mínima de población contcni- da entre las observaciones mayor y menor, con una confianzz 1 - a:

nP"" - (n - 1)P" = CY

Una solucih aproximada para rz está dada por

donde x: es el valor de una distribución X-cuadrado con 4 grados de libertad que corrcs- ponde a una cola por la derecha del área (a) ¿Cuál debe ser el tamaiio de una muestra para tener un 95% de certeza de que, al

menos, 90% de la población quedará incluida entre los extremos de la muestra?

( b ) ¿Que proporcijn, al menos, de esta poblacidn se puede esperar que quede incluida entre los valores extremos de una muestra de tamaño 100, con un 95% de confianza?

15.6 Muestras de aceptación

LOS productos fabricados se envían al comprador en lotes que varian en tama- ño desde sólo unos pocos hasta muchos miles de objetos individuales. Idealmente. cada lote no debería contener ningún objeto defectuoso, pero, en la prhctica, es muy raro encontrar este caso. Reconociendo el hecho de que se han enviado algu- nos objetos defectuosos, aún suponiendo que el lote haya sido inspeccionado en un cien por ciento, muchos consumidores exigen una evidencia, basada en una inspec- ción cuidadosa, de que la proporción de defectuosos en cada lote no es excesiva.

Un método frecuentemente empleado y muy eficaz para dar esta evidencia, es el de la inspección de muestras, donde se seleccionan muestras de cada lote antes del envío (o antes de que los acepte el consumidor) y se toma una decisión sobre la base de esta muestra para aceptar o rechazar el lote. La aceptaci6n de un lote im- plica, ordinariamente, que se pnede expedir (o ser aceptado por el consumidor), aun cuando contenga aIgunas unidades defectuosas. Los arreglos entre el productor y el consumidor servirán para dar alguna forma de compensación por las partes de- fectuosas descubiertas posteriormente por el consumidor. El rechazo de un lote no significa que haya de ser destruido, sino, simplemente, que se debe someter a una inspección estricta para eliminar todas las partes defectuosas.

Como el costo de inspección no es en ;rbsoluto despreciable (algunas veces cs casi tan alto como el costo de producción y, a veces, es mayor) siempre será cnn- veniente no revisar todas las piezas de un lote. Por consiguiente, la inspección para aceptación implica en general el empleo de muestras; más concretamente, se selec- ciona una muestra aleatoria de cada lote y éste se aceptará si el número de defec- tuosos encontrados en la muestra, no excede de un ncírnero de aceptucitin dado.

Page 337: ingenieria

MlJESTRAS DE ACEPTACION 329

Este procedimiento es equivalente a contrastar la hipótesis nula de que la propor- ción, de defectuosos p del lote es igual a algún valor especificado p,, frente.a la al- ternativa de que es igual a p ~ , siendo p , > p,. En el muestreo de aceptacihn. cl valor pa se llama nivel de calidad aceptable o AQL, y PI se llama tolerancicr dr l porcentaje de defectuosos del lute o LTPD. La probabilidad de un error tipo 1. a,

se puede interpretar como el limite superior de la proporción de lotes “buenos” (lotes con p 5 p,) que pueden ser rechazados y, debido a esto, se llama. i k r o de l productor. La probabilidad de un error tipo 11, $, da un límite superior de la pro- porción de lotes “malos” (lotes con p 2 p i ) que pueden ser aceptados, y se llama riesgo del cotzsumidor.

Un plan de muestreo simple es, sencillamente, una especificación del tamalio de la muestra y el número de aceptación que se deben usar, y su elecci6n se basa generalmente en un AQL especificado y (o) un LTPD asociada a los riesgos del productor y (o) del consumidor dados. Un plan de muestreo dado se describe mejor por su curva de operación característica, o curva QC, que da la probabilidad de aceptación para cada valor que se puede tomar para la proporción de defectuosos del lote p . Así, la curva OC describe el grado de protección ofrecido por el plan frente a la entrada de lotes de varias calidades. Si se toma una muestra de tamaño IZ

de un lote que contiene N unidades, y si el nilmero de aceptación es c, la probabili- dad áe aceptar un lote que contenga la proporción de defectuosos p (el lote contie- ne N p defectuosos) se puede calcular, por medio de la distribución hipergeomktrica, del modo siguiente:

+ + Por ejemplo, si el tamaño del lote es N = 100, el tamaño de la muestra es 17 :: 10, y el número de aceptación es c = 1, tenemos

Como los cálculos de la distribuci6n hipergeométrica son bastante laboriosos, especiaImente cuando tt y N son grandes, es costumbre en estos casos aproximar la distribución hipergeométrica con la distribución binómica. como se hizo en la pá- gina 48.. Por ejemplo, para p = 0.10, el valor exacto es L(O.10) = 0.739, como el lector deberá verificar en el problema 5 de la página 360, mientras,qye en la tabla I, con n = 10 y p = 0.10, obtenemos la aproximación binómica.

L(O.10) U(1; 10, 0.10) = 0.73G

Con ayuda de la tabla T, se puede hacer un boceto de la curva C)C rápidamen- te, como el mostrado en la figura 15.7 para IZ = 10, c = l . De esta curva, se pue- de ver que el riesgo del productor es, aproximadamente, 0.05 cuando la A Q L es 0.04, y el riesgo del consumidor es’aproximadamente 0.10 cuando la LTPD es 0.34.

Page 338: ingenieria

330 APLICACIONES A LA GARANTIA DE CALIDAD

Siempre se puede describir un plan de muestre0 por medio de su calidad pro- medio de salida o curva AOQ. Esta curva describe el grado de protección ofrecido por el plan, mostrando la calidad media de los lotes que salen, correspondientes a cada nivel de calidad de los lotes que entran (esto es, lotes anteriores a la inspec- ción). Si los lotes de entrada son de buena calidad, es decir, si su proporción de de- fectuosos es menor que la AQL, muy pocos lotes serán rechazados y la calidad me- dia de salida AOQ será buena. Si los lotes entrantes son de pobre calidad, esto es,

AOL L rPD Fig. 15.7 Curva OC

si su proporción de defectuosos es mayor que la LTPD, la mayoría de ellos serán rechazados. Si todos los lotes rechazados se inspeccionan en un cien por ciento y todas las unidades defectuosas se cambian por unidades buenas antes de la acepta- ción del lote, la calidad media de salida será buena, aunque la calidad media de entrada sea pobre. Es el caso en el que la calidad media de entrada se encuentra entre los valores de AQL y LTPD cuando la peor calidad de los lotes será envia- da. En general, habrá un máximo AOQ de todos los valores de la calidad de entra- da p , y este valor se llama límite de la calidad promedio de salida, o AOQL.

No es dificil deducir una fórmula para encontrar la AOQ correspondiente a una calidad de entrada p dada, en hipótesis de que todas las unidades defectuosas de los lotes rechazados se cambian por unidades aceptables antes de su aceptacih definitiva. Si la calidad de entrada es p , la probabilidad de que un lote pueda ser aceptado es L(p) , y cada uno de estos lotes contienen una proporción p de unida-

Page 339: ingenieria

MUESTRAS DE ACEPTACION 331

des defectuosas. La proporción 1 - L(p) de lotes eventualmente rechazados no contienen defectuosas, y de aquí deducimos que la AOQ está dada por

P - U P ) + 0 . - UP119

+ AOQ = P - U P ) + ó

La práctica más común es cambiar las partes defectuosas encontradas en todos los lotes inspeccionados, tanto los aceptados como los rechazados, pero la modificación necesaria en la AOQ es, en general,, menor, y es costumbre utilizar la fórmula ante- rior independientemente del procedimiento de inspección. La curva AUQ para el plan de muestreo n = 10, c = 1, se representa en la figura 15.8 y en ella vemos evidentemente que AOQL es, aproximadamente, 0.081.

AOQ

0.03

0.02

-P ".. V.L v.u V.7 ,.6 0.7

Fig. 15.8 Curva AOQ

Algunas veces, se pueden conseguir muestras m b pequeñas (y, por consiguiea- te, costos más reducidos) sin sacrificio en el grado de piotección. usando lo que se llama muestreu doble u miltiple. Un plan de n?lrrstr*co rlohle implica la selección de una muestra aleatoria de tamaño n1 de un lote y, si la muestra contiene CI' o menos defectuosos, se acepta el lote: si contiene c: o m& defectuosos (c: > S>. el lote es rechazado; de otra forma, se toma una segunda muestra de tamaño m del lote, y el lote se acepta, a menm que el nírmero total de defectuosos en la muestra combinada de tamaño n1 + np exceda de cs. Un p l m de nmestrco nniltiple es simi- lar en su naturaleza al plan de muestreo doble, pero requiere m6s de dos etapas. Un ejemplo de dicho plan se muestra en la tabla siguiente:

Page 340: ingenieria

332 APLICACIONES A LA GARANTIA DE CALIDAD

Tamaño Muestra Muestra

Primera 20 Segunda 20 Tercera 20 Cuarta 20 Quinta 20 Sexta 20 Séptima 20

Tamaño

20 40 60 80

100 120 140

."

Muesfras combinadas i-

1 N o . de aceptación

N o . de rechazo

3 4 5 6 7 8 8

En el primer paso, el lote se rechaza si hay 3, o más, defectuosos: si no, continila el muestreo; en el segundo paso se acepta el lote si la muestra combinada contiene a lo más 1 defectuoso, y se rechaza si tiene 4, o mris; s i no, el muestre0 continúa. Se sigue así, si es necesario, hasta que en e! último paso el lote se acepta si hay a lo más, 7 defectuosos en la muestra combinada de tamaño 140 y, si no, se rechaza.

Por una selección apropiada de los tamaños de las muestras y los números de aceptación y rechazo, es posible obtener la curva OC de un muestreo doble o múlti- ple, aproximadamente en una forma semejante a l a de un plan de muestreo simple. Luego, el grado de protección ofrecido por un plan de muestreo doble o múltiple puede ser esencialmente el mismo que el ofrecido por el plan de muestreo simple equivalente.

La ventaja del muestreo doble o múltiple es que hay una mayor probabilidad de que un lote muy bueno sea aceptado o un lote muy malo sea rechazado a partir de la primera muestra (o una de las primeras), reduciendo, con ello, el monto de la inspección requerida. Por otra parte, si la calidad del lote es "intermedia", el tamaño de la muestra total necesario será mayor que en el de el plan de muestreo simple equivalente. Para ilustrar esto. consideremos el plan de muestreo doble que se indi- ca a continuación:

I I Muestras combinadas I I -

Tarnutio

45 I 5 l 6 " Segunda 30 15 Primera 15

crccp/uc.iÓ~~ recha:o Tamafio Muestra Muesrra N o . dc N ( t . de

1 5

Si la calidad del lote entrante es 11 = 0.05, la probabilidad de que una segunda muestra sea necesaria es la misma que la probabilidad de que haya 2, 3 6 4 defec- tuosos en una muestra de tamaño IS. De acuerdo con la tabla I, esta probabilidad es igual a

~ ( 4 ; 15, 0.05) - B(1; 15, 0.05) = 0.170

Page 341: ingenieria

MUESTRAS DE ACEPTACION 333

Luego, en promedio, se necesitará una muestra de tamaño 15 + (0.170) (30) = 20.1 para decidir si ha de aceptarse, o no, un lote entrante de calidad p = 0.05. Con cálculos semejantes, podemos encontrar el tamaño de la muestra promedio necesa- rio para inspeccionar un lote que tenga cualquier calidad de entrada p dada. En la figura 15.9 se muestra una gráfica en la que se ve la relación entre el tamaño de la muestra promedio (llamado también nLimero de la muestra promedio) y la calidad

Flg. 15.9 Curva ASN

del lote entrante; esta curva se llama “curva ASN”, la cual, para el plan de mues- treo doble, es la de la figura citada.

Se han publicado vafios planes tipo de muestre0 para facilitar el uso del mues- treo de aceptación (ver el libro de T. W. Burr, citado en la bibliografía). Entre los planes tipo de uso más común se encuentran los contenidos en las Military Standard 105D Tables (yer bibliografía). Estos planes tienden a mantener una AQL espe- cificada, y estan diseñados para estimular al productor a ofrecer solamente buenos productos. Para lograr esto, hay tres niveles generales de inspección correspondien- tes a diferentes riesgos del consumidor. (El nivel de inspección I1 se escoge normal- mente; el nivel I sirve para tamaños de muestra pequefios y el nivel I11 emplea tamaños de muestra mayores que los del nivel 11.) Hay también tres tipos de ins- pección: normal, afinada y reducida. El tipo de inspección depende de si la propor- ción promedio de defectuosos para las primeras muestras ha estado por enoima o por debajo de la AQL, y puede cambiarse durante el curso de la inspección. En la inspección afinada, el riesgo del productor aumenta, y el del consumidor decrece ligeramente; en la inspección reducida, el riesgo del consumidor aumenta y el del productor decreoe ligeramente.. Se pueden obtener tablas para muestreos simples, dobles y múltiples, y en las tablas XI11 y XIV se reproduce una parte de las mismas.

Page 342: ingenieria

334 APLlCAClONES A LA GARANTIA DE CALIDAD

El procedimiento para usar las tablas MIL-STD-1O5D para muestreos simples consiste en hallar primero la letra en la codificación del tamaño de la muestra que corresponde al tamaño del lote y al.nivel y tipo de inspección deseada. Después, uti- lizando la letra del tamaño de la muestra (la. letra obtenida) y la A Q L apropiada, se obtiene el tamaño de muestra y el n h e r o de aceptación en la tabla maestra. Una parte de esta tabla para encontrar las letras de los tamaños de muestra se da en la tabla XIII, y una porción de la tabla maestra para inspeccidn normal en l a tabla XIV.

Para ilustrar el empleo de la tabla MIL-STD-IOSD, supongamos que los lotes entrantes contienen dos mil unidades y se va a usar el nivel I1 junto con una ins- pección normal y una AQL de 0.025, ó 2.5:4, En la tabla XIIT, encontramos que la letra del tamaño de muestra es K . Entrando después en la tabla XIV en la fila K, encontramos que el tamaño de muestra a usar es 125. IJsando la columna 2.5. vemos que el número de aceptación es 7 y el nhmero de rechazo es 8. Entonces, si una muestra simple de tamañol35, seleccionada al azar de nuestro lote de 2000 unida- des, contiene 7, o menos, defectuosos, se aceptará el lote: si la muestra contiene 8, o más, defectos, el lote se rechazará.

El concepto de muestreo múltiple se lleva a su extremo en el llamado n w a t r e o secuencial. Se dice que m procedimiento de muestreo es secuencia1 si, después de cada observación, se toma una de las siguientes decisiones: aceptar aquella hipóte- sis que se trata de contrastar, rechazar la hipbtesis, o tomar otra observación. Aun- que los procedimientos secuenciales se emplean también en otra clase de problemas, discutiremos este muestreo sólo para la aceptación de muestras, en donde decidire- mos, despues de la inspección de cada unidad sucesiva, si aceptar el lote, rechazar- lo o continuar.

L a construcción de un plan de muestreo secuencial consiste en hallar dos suce- siones de números a, y T,~, donde n es el número de observaciones, tal que el lote se acepte tan pronto como el número de defectuosos sea menor que, o igual, a a, para algún valor de n; el lote se rechace tan pronto como el número de defectuosos sea mayor o igual que 'para algún valor de n; y que la muestra continúe cuando e l número de defectuosos de la muestra de tamaño n' esté entre any T,. Si un plan de aceptación tienepoy pl como sus AQL y LTPD, el riesgo (Y del productor, Y el riefgo p del consumidor, se puede demostrar (véase el libro de A. Wald, citado en la bibliografía) que Ips valores de a, y T, requeridos se pueden calcular por medio de las fórmulas

Page 343: ingenieria

MUESTRAS DE ACEPTACION 335

Si a, no es un entero, se reemplaza por el mayor entero, menor que a,; si rn no es entero, se reemplaza por el menor entero mayor que rn.

Para ilustrar este procedimiento, sean PO = 0.05, P I = 0.20, a = 0.05 Y B = 0.10. Substituyendo estos valores en las fórmulas anteriores de a, y T,, obtenemos

U, = -1.45 + O.lln r, = 1.86 + 0.11~~

y haciendo n = 1, 2, 3 , . . . , 25, obtenemos los ndmeros de aceptación y de rechazo mostrados en la segunda y cuarta columnas de la tabla que sigue:

No. de objetos No. de No. de No. de inspeccionados aceptaciones defectuosos rechazos

n a, dn rn

1 O 2 - O - 3 O 3 4 - O 3 5 O 3 6 - O 3 7 O 3 8 - 1 3 9 1 3 10 - 1 3 11 - 1 4 12 - 1 4 13 - 1 4 14 O 1 4 15 O 1 4 16 O 1 4 17 O 2 4 18 O 2 4 19 O 3 4 20 O 3 5 21 O 3 5 22 O 4 5 23 1 5 5 24 1 5 25 1 5

- -

-

-

-

-

En la tercera columna hemos indicado los resultados obtenidos en una inspecci6n en que los términos 8, 17, 19, 22 y 23 eran defectuosos, y en los que la inspección terminó con el rechazo del lote después de la inspección de la unidad 23.

El procedimiento tabular empleado se puede cambiar por un procedimiento grhfico equivalente. Marcando los valores de a, y r, obtenidos de las ecuaciones de la página 358 (sin redondear), obtenemos dos Iineas rectas como las de Ia fi- gura 15.10. El muestre0 termina con el rechazo o la aceptación si el número de defectuosos observados queda por encima de la línea T, o por debajo de la linea. a,, respec- tivamente.

Page 344: ingenieria

336 APLICACIONES A LA GARANTIA DE CALIDAD

La principal ventaja. del muestreo sucesivo es que puede reducir materialmente el monto necesario de la inspección. Los estudios han demostrado que la disminu- ci6n promedio en el tamaiio de las muestras está cerca del 50% cuando se compa- ra con el tamaño de la muestra de planes de muestreo simples equivalentes. La ma- yor desventaja es que, en un plan de muestreo sucesivo. no hay límite superior para el número de unidades que deben inspeccionarse para llegar a una decisión sobre la

FIQ. 15.10 Procedimiento gráfico para muestras consecutivas

aceptación o rechazo de un lote. De hecho, el tamaño de la muestra es una variable aleatoria y ocasionalmente su valor será muy grande. Por esta razón, se acostumbra truncar los procesos de muestreo sucesivo, eligiendo un número N tal que deba ser tomada una decisión para aceptar o rechazar el lote para n menor o igual de N .

EJERCICIOS

1. Se hace un plan de muestreo sencillo para un muestra de tamaño 200.

debe ser 4% y el riesgo del productor debe ser a = 0.025.

del consumidor si la LTPD es 10%.

( a ) Usar la aproximación normal para determinar el número de aceptaciin si la A Q L

(b) Empleando el número dc aceptacit5n obtenido en la parte ( a ) , determinar el riesgo

2. Un plan de muestreo, en el que el tamafio de la muestra es II = 40, tiene el número de aceptacih c = 2. Suponiendo que el tamaño del lote es muy grande, calcular la pro- babilidad de aceptar un lcte cuya calidad de entrada es defectuosa en 15% y la probabi- lidad de rechazar un lote cuya calidad de entrada es de 3%. (a) Calculando las probabilidades binómicas correspondientes.. (b) Utilizando la aproximaci.5n de Poisson para la distribuci,ón binbmica.

(a) Hallar la AQL si el riesgo del productor es 0.05. (b) Hallar la LTPD si el riesgo del consumidor es 0.10.

3. Un plan de muestreo sencillo tiene II = 50 y c = 3.

(Sugerencia: Emplear la aproximaci'ón normal y establecer ecuaciones que conduzcan a ecuaciones cuadrhticas en po y p l , respeotivamente.)

Page 345: ingenieria

MUESTRAS DE ACEPTACION 337

4

5.

6.

'7. 8.

9.

I o.

1 I .

12.

13.

14.

En el plan de muestreo del problema 2, usar la aproximacijn de Poisson para calcular L ( p ) para p = 0.01, 0.02,. . . 0.19 y 0.20. Dibujar la curva OC de este plan y determine en ella los riesgos del productor y del consumidor correspondiente a una AQL de 3.5%' y una LTPD de 12.5%. En el ejemplo de la página 329, verificar que (a) L(o.10) = 0.739, empleando la fórmula exacta (hipergeométrica). (b) L(O.10 'u 0.736, empleando la f6rm11la aproximada (bionhmica). (c) La curva OC es la de la figura 15.7. (d) La curva AOQ es la de la figura 15.8. Calcular L ( p ) para valores seleccionados de p y dibujar la curva OC para el plan de muestreo simple n = 80, c = 2. (Sugerencia: Suponer un lote de tamaño grande y em- plear la aproximacibn normal a la distribucih bin6'mim.) Dibujar la curva AOQ para el plan de muestreo del problema 6, y estimar la AOQL. Utilizando los valores de L ( p ) obtenidos en ei problema 4, dibujar la curva AOQ del plan y estimar la AOQL. En el problema de la página 332 sobre el plan de muestren doble, usar la tabla 1 y la aproximacih normal (cuando sea necesario) para calcular el riesgo del productor cuando ia AQL es po = 0.10. Calcular el tamafio de muestra promedio requerido para valores seleccionados de p y di- bujar la curva ASN para el siguiente plan dc muestreo dohle:

Muestras cornbinadas ___

Tamaño aceptaciones Tamaño Muestra muestra

No. de Nu. de

5 Segunda 40 4 4 Primera 1

rechazos -

Un lote entrante de 1000 unidades se debe inspeccionar usando el método MIL-STD 105D, con una insp$cci'5n normal en un nivel TI de inspcccih general y una AQL de 1.556. ¿Qué plan de muestreo simple debc emplearse? Un lote de 1 0 0 unidades se debe inspeccionar con una AQL de 10%. Si se debe emplear el metodo MIL-STD-IOSD, c.on una inspecci5n normal en el nivel TI de inspeccibn gene- ral, ¿qué plan de muestreo simple se debe emplear? Determinar las f6rrnulas necesarias para los números de aceptación y de rechazo del plan de muestreo sucesivo que tiene una AQL de 0.10, una LTPD de 0.30, un riesgo del productor de 0.05, y un riesgo del consumidor de 0.10. Si una muestra puede tener defec- tuosos en los ensayos tercero, quinto, séptimo y octavo, ¿se puede aceptar.0 rechazar el lote antes del décimo ensayo, de acuerdo con este plan? Si es así. Len qué ensayo sucede- rb esto? Un plan de muestreo secuencia1 tiene p , = 0.01, p , = 0.10, (y = 0.05 y 13 = 0.20. (a ) Determinar los números de aceptacihn y de rechazo para n = 1, 2, . . . , y 50. ( b ) Usar números de azar junto con los números de aceptación y de rechazo obtenidos

en la parte (a) para simular la inspeccibn de un lote muy grande que tiene un 20% de defectuosos.

Page 346: ingenieria

16.1 lntroduccidn

La tarea del diseño y supervisión de la fabricación de un producto se ha ido haciendo cada vez más difícil por el rápido avance en la complicación de los mo- dernos productos, y la dureza y dificultad de las condiciones externas en que debe trabajar el producto fabricado. Ya no se puede limitar un ingeniero a quedar satis- fecho si la operación asignada a un producto es técnicamente realizable, o si se le puede hacer trabajar en las condiciones óptimas. En adición a consideraciones tales como costo y facilidad de fabricación, se debe ir poniendo cada vez más atención en lo que se refiere al tamaño y peso, a la facilidad de mantenimiento y a la fiabili- dad. La magnitud del problema de mantenimiento y fiabilidad se percibe por las en- cuestas realizadas, que muestran quet frecuentemente, u11 alto porcentaje de equipo electrónico para fines espaciales ha quedado en condiciones inoperativas. Las en- cuestas militares han demostrado, además, quc el mantenimiento y la reparaci6n de equipo electrónico cuestan generalmente más que la obtención general del equipo. aun durante el primer año de operación.

338

Page 347: ingenieria

INTRODUCCION 339

El problema de asegurar y mantener la fiabilidad tiene muchas facetas, inclu- yendo el proyecto del equipo original, el control de calidad durante la producción, las pruebas de inspección para su aceptación, ensayos en el campo, pruebas de vida y modificaciones del proyecto. Para hacer aún más complicada la materia, la fiabili- dad est& conectada directa o indirectamente con una buena cantidad de otras consi- deraciones de ingeniería, principalmente costo, complejidad, tamaño y peso, y facili- dad de mantenimiento. A pesar de sus complicados aspectos ingenieriles, es posible dar una definición matemática relativamente simple de fiabilidad. Para ilustrar esta definición, llamaremos la atención del lector sobre el hecho de que un producto debe funcionar satisfactoriamente bajo un conjunto dado de condiciones, pero no bajo otras condiciones, y que las Características satisfactorias para cierto propósito no ase- guran las buenas características para otro. Por ejemplo, un tubo de vacío que es per- fectamente satisfactorio para un equipo de radio casero, puede resultar completa- mente inútil para el sistema de teledirección de un proyectil. De acuerdo con esto, definiremos la fiabilidad de un producto como la probabilidad de que funcione co- rrectamente dentro de límites especificados, al menos durante un, cierto periodo de tiempo especificado, y en condiciones externas especificadas. Así, la fiabilidad de un “equipo normal” de cubiertas de automóvil es, aproximadamente, la unidad para un automóvil de pasajeros cuando opera normalmente en 10.000 millas, pero es prhcticamente cero si se emplea en las “quinientas millas de Indianapolis”.

Como la fiabilidad se ha definido como una probabilidad, el tratamiento teórico de esta materia se basa, esencialmente, en el material introducido en los capítulos anteriores de este libro. Luego, las reglas de probabilidad que indicamos en el capílu- lo 2 se pueden aplicar directamente al cálculo de la fiabilidad de un sistema comple- jo, si las fiabilidades de los componentes individuales son conocidas. (Las estima- ciones de las fiabilidades de los componentes individuales se obtienen usualmente a partir de pruebas estadísticas de vida, tales como las discutidas en las secciones 16.4 y 16.5.)

Muchos sistemas se pueden considerar como sistemas en serie o en paralelo, o como una combinación de ambos. Un sistema en serir es aquel en el que todas las componentes están interrelacionadas de tal forma que el sistema entero falla si cualquiera de las componentes falla; un sistema en paralelo es aquel que sólo falla si todas sus componentes fallan.

Discutiremos primero un sistema de n componentes conectadas en serie y, su- pondremos que las componentes son independientes, es decir, que el comporta- miento y rendimiento de cualquier parte no afecta la fiabilidad de las demás. En estas condiciones, la probabilidad de que el sistema funcione está dada por la regla especial de multiplicación de probabilidades, y tenemos

?a

i - 1 R. n Ri

donde Ri es la fiabilidad de la i-ésima componente y R, es la fiabilidad del sistema en serie. Esta simple ley del produeto de fiabilidades aplicable a sistemas en serie

Page 348: ingenieria

340 APLlCAClONES A LA FIABILIDAD Y A PRUEBAS DE DURACION DE VIDA

de componentes independientes, demuestra vivamente el efecto del aumento en com- plejidad sobre la fiabilidad. Si un sistema consta de 5 componentes independientes en serie: cada una con una fiabilidad de 0.970, la fiabilidad del sistema completo es (0.970)5 = 0.859. Ahora, si la complejidad del sistema se aumenta de forma que contenga 10 componentes similares, su fiabilidad se reducirá a (0.970)'O = 0.738. Otro aspecto del aumento de la complejidad en la fiabilidad se presenta al conside- rar que cada una de las componentes en el sistema de 10 debería tener una fiabili- dad de 0.985, en lugar de la de 0.970, para que este sistema tuviera una fiabilidad igual al sistema de cinco componentes.

Una forma de incrementar la fiabilidad de un sistema, es cambiar ciertas com- ponentes por componentes similares conectadas en paralelo. Si un sistema consta de n componentes independientes conectadas en paralelo, s610 fallará si las n com- ponentes fallan. Entonces, si F i = 1 - R, es la "infiabilidad" de la i-tsima compo- nentes, podemos aplicar otra vez la regla especial de multiplicación de probabilida- des para obtener

n

i = l F , = TI F i

donde F , es la infiabilidad del sistema en paralelo, y R, = 1 - F , es la fiabilidad del sistema en paralelo. Entonces, para sistemas en parclelo, tenernos una ley del producto de infiabilidades análoga a la ley del producto de fiabilidades de los sis- temas en serie. Escribiendo esta ley de otra forma, tenemos

+ n

i = l R, = 1 - n (1 - ni)

que expresa la fiabilidad de un sistema en paralelo. Las dos fórmulas básicas de la fiabilidad de sistemas en serie y en paralelo

se pueden usar en combinacicin para calcular la fiabilidad de un sistema que tenga tantos componentes en serie como en paralelo. Para ilustrar este cálculo, considere- mos el sistema dibujado en la figura 16.1, que consiste en ocho componentes que

0.70

0.95 0.99 0.70

0.75

0.70

Fig. 16.1 Confiabilidad de sistemas

tienen las fiabilidades indicadas. El si.stema en paralelo C, D. E se puede cambiar por una componente equivalente C' que tenga la fiabilidad 1 - (1 - 0.70)8 = 0.973, sin afectar con ello la fiabilidad del sistema completo. Similarmente, el con-

Page 349: ingenieria

DISTRIBUCIONES DEL TIEMPO DE FALLO 341

junto en paralelo F, G se puede cambiar por una sola componente F' que tenga fiabilidad 1 - (1 - 0.75Y = 0.9375.

El sistema en serie resultante A, B, C', F', H es equivalente al sistema original y tiene la fiabilidad

(0.95)(0.99) (0.973)(0.9375)(0.90) = 0.772. i

16.2 Distribuciones del tiempo de fallo

De acuerdo con la definición de fiabilidad dada en la sección anterior, la fiabi- lidad de un sistema o de una componente dependerá del tiempo que haya estado en servicio. Entonces, la distribucicin del tiempo en que se produce ei fallo de una componente, en condiciones externas dadas, resulta de la mayor importancia. Una forma muy útil de caracterizar esta distribución es por medio de su tosa inrtarztúrzea de fallos (o averías) asociada, definida de la manera siguiente: Si f ( t ) es la densidad de probabilidad del tiempo de fallo de una componente dada, esto es, la probabili- dad de que una componente falle entre los instantes t y t + At , está dada por f(t). At, entonces, la. probabilidad de que la componente falle en el intervalo de O a t est6 dada por

F ( t ) = /k f(.) da

y la funcicin de fiabilidad, que expresa la probabilidad de que sobreviva al instante t , está dada por

Luego, la probabilidad de que la componente falle en un intervalo de tiempo de t a t + A¿ está dada por F ( ¿ 3- A¿) - F(l ) , y la probabilidad condicional de fallo en este intervalo1 dado que In cornporlente sobrevivió al tiempo t, está dada por

R ( 0

R(¿) = 1 - F(¿)

F ( t + A¿) - F(¿)

Dividiendo entre At , oblenemos la tasa medin de fallos en el intervaio de t a 1 + A ¿ , dado que la componente sobrevivió ;+I tiempo f:

P( t + At) - F ( t ) 1 . - At R (0

Tomando el límite cuando At "-f O , obtenemos la tasa it?:,fQtltÚt?Ccl de fallos (o nlv- vias), o simplemente tasa de fallos:

jonde F ' ( t ) es la derivada de F ( t ) con respecto a t. Finalmente, observando que [(t) = F ' f t ) (ver pagina 66), tenemos la relación

. .

Page 350: ingenieria

342 APLICACIONES A LA FIABILIDAD Y A PRUEBAS DE WRACION DE VIDA

que expresa la tasa de fallos en función de !a distribución del tiempo de fallo. ‘

En la figura 16.2 se muestra una curva de tasa de fallos que es típica en mu- chas piezas fabricadas. La curva se encuentra dividida convenientemente en tres partes. La primera parte se caracteriza por una tasa de fallos decredentes y repre- senta el periodo durante el cual fallan las partes pobremente fabricadas. (Es común en la industria electrónica “quemar” componente ”antes de su uso real para eliminar fallos demasiado prematuros.) La segunda parte, que se caracteriza por una tasa de

Proporción de fallos

Fallos 1 i Fallos de prematuros I Fallos ocasionales I desgaste I

O I Tiempo

Fig. 16.2 Curva típica de razón de falta

fallos constante, se considera normalmente como el periodo de vida úti¡ durante el cual sólo Ocurren fallos ocasionales. La tercera parte se caracteriza por una tasa de fallos creciente y representa el periodo durante el cual las componentes fallan primordialmente porque están gastadas. Nótese que la misma curva general de tasa de fallos es típica de la mortalidad humana, en la que la primera parte representa la mortandad infantil y, la tercera, corresponde a la mortandad de gente de edad avanzada.

Obtendremos ahora una importante relación entre 18 densidad del tiempo de fallo es función de la tasa de fallos. Puesto que R(t) = 1 - F( t ) y, por lo tanto, F’(t) = ” R ’ ( t ) , podemos escribir

d[ln R(t)] dt

- “

Resolviendo esta ecuación diferencial para R ( t ) , obtenemos

y empleando la relación f(t) = Z(f) .R(t) , encontramos, finalmente,

+ f ( t ) = Z ( t ) . e - s:Z(z)dz + Como se ve en la figura 16.2, se supone frecuentemente que la tasa de fallos es

constante durante el periodo de vida útil dé una componente. DenQtando esta cons- tante tasa de fallos por a:, donde ct > O, y substituyendo Z ( t ) por a: en la f6rmula de f(t), obtenemos

Page 351: ingenieria

EL MODELO EXPONENCIAL DE FlAElUDAD 343

f(t) 3: ci..e-d t > O

Luego, observamos que la distribución del tiempo de fallo en una distribucirin ex- ponencia1 si podemos considerar que la tasa de fallos es constante. Por esta razón, la hipótesis de tasa de fallos constante se llama algunas veces “hipótesis exponen- cial”. Interpretando el tiempo hasta que se produce el fallo como un tiempo de es- pera, podernos emplear los resultados de la secci6n 5.3 para llegar a la conclusión de que la presencia de fallos es un proceso de Poisson, si una componente que falla se reemplaza inmediatamente con una nueva que tenga la misma constante tasc de fallos (Y, Como observamos en la pigina 85, el tiempo medio de espera entre fallos sucesivos es l/cr,o sea el reciproco de la tasa de fallos. Por consiguiente, la constante 1/a recibe el nombre de tiempo medio entre fallos y se abrevia escribien- do ICITBF.

Hay situaciones en las que la hipótesis de una tasa de fallos constante no nos da una representación real, y en muchas de estas situaciones podemos suponer que la función de tasa de fallos crece o decrece “suavemente” con el tiempo. En otras palabras, se supone que no hay discontinuidades o puntos de cambio de tendencia. Esta hipótesis debe ser consistente con los estados inicial y final de la curva de tasa de fallos mostrada en la figura 16.2.

Para aproximar tales curvas de tasa de fallos, se emplea frecuentemente la si- guiente funci6n

Z(t) = q9t8-1 I! > o donde CY y B son constantes positivas. Nótese la generalidad de esta función: si @ < 1 la tasa de fallos disnlinuye con el tiempo; si p > 1 la tasa crece con el tiempo; y si @ = 1 la tasa es igual Q . Nótese que la hipótesis de una tasa de fallos constante, la hipótesis exponencial queda incIuida como un caso particular.

Si substituimos la expresión anterior para Z(r) en la fórmula de f(t) en la página 366, obtenemos

f ( t ) = a f l P 1 e - d t > O siendo Q y ,O constantes positivas. Llamamos a esta densidad, o distribución, disfri- bucirirz Weibull, y discutiremos su aplicación a problemas en pruebas de duración de vida en la sección 16.5.

16.3 El modelo exponencisl de fiabilidad

Si hacemos la hipótesis exponencial sobre la distribucidn del tiempo de fallo. podremos encontrar algunos resultados muy útiles con respecto al MTBF, tiempo medio entre fallos, de sistemas en serie y en paralelo. Para emplear las leyes de productos de la sección 16.1, tenemos que encontrar una relacicjn que exprese la fiabilidad de una componente en función de su tiempo de servicio t. Partiendo del hecho de que

Page 352: ingenieria

344 APLICACIONES A LA FIABILIDAD Y A PRUEBAS DE DURACION DE VIDA

R(t) = 1 - F ( t ) = 1 - [ f ( t ) dt

obtenemos ~ ( t ) = 1 - /o” Cye-az dx = e-al

para la funcicin de fiabilidad del modelo exponencial. Entonces, si una componente tiene una tasa de fallos de 0.05 por mil ‘horas, la probabilidad de que puede sobre- vivir al menos 10,000 horas de operación es e-(O.u,j)lo = 0.607.

Supongamos ahora que un sistema consta de 12 componentes conectadas en serie, y que estas camponentes tienen las tasas de fallos al, (Y~, . . . , Y (Y, respecti- vamente. La ley del producto de fiabilidades se puede escribir entonces en la forma

n + R,(t) = e-aJ = e 8-1

-( L =;)l + y se puede ver que la función de fiabilidad del sistema en serie también satisface la hipótesis exponencial. La tasa de fallos del sistema de esta serie entera, se identi-

fica inmediatamente con I; al, SUIHU de las tasas de fallos de sus componentes. Como el MTBF es el recíproco de la tasa de fallos cuando cada componente que falla se cambia inmediatamente por otro qu? tenga idéntica tasa de fallos, obtene- mos la fórmula

i = 1

n

i = l

1 1 1 - + - + . . . + - 1

P1 P2 Cln

P a = +

expresando M, el MTBF de un sistema en serie en función de las Pi que son las MTEF de sus componentes. En el caso especial en que todas las n componentes tengan la misma tasa de fallos (Y y, por consiguiente, la misma MTRF, p . la tasa de fallos del sistema es m , y el M T E F del sistema es l / na = p / n .

Para sistemas en paralelo, los resultados no son tan simples. Si un sistema tiene IZ componentes en paralelo, con las tasas de fallos respectivas al, (YZ, . . . , a”, l a “infiabilidad” del sistema en el tiempo t est6 dada por

n F,(t) = (1 - e-a;l)

En consecuencia, la distribucicin del tiempo de fallo de un sistema en paralelo no es exponencial aunque cada una de sus componentes cumpla la hip6tesis exponencial. La funcicin de tasa de fallos del sistema se puede obtener por medio de la fúrmula

pero el resultado es muy complicado. Notemos, sin embargo, que la tasa de fallos del sistema no es constante, sino que depende de t , “edad” del sistema.

El tiempo medio de fallo de un sistema en paralelo también es difícil de en- contrar, en general, pero, en el. caso especial en que todas las componentes tengan la misma tasa de fallos 01, sc puede obtener un resultado iltil e interesante. En este caEo especial, la funcicin dc fiabilidad del sistema es

i = l

Z P V ) = F:(t)/fi,(t)

Page 353: ingenieria

EL MODELO EXPONENCIAL DE FIABILIDAD 345

&,(¿) = 1 - (1 - f3-y

después de haber utilizado la fórmula del binomio para desarrollar ( 1 - . Luego. haciendo uso del hecho de que fY(t) = -fii(¿), obtenemos

y la media de la distribnción del tiempo de fallo está dada por

Se puede probar, por inducción, que esta expresión es equivalente a

P , = - - ( I + : + * 1 I ..+i) En consecuencia, 5i un sistema en paralelo consta de II componenleh c l ~ c t icnm idCntica tasa de falios a, el ticmpo medio entre fallos del sistema es

Page 354: ingenieria

34s A P L I C A C I O N E S A LA F IABILIDAD Y A P R U E B A S DE D U R A C I O N DE VIDA

EJERCICIOS

7 Fig. 16.3 Problema 3

Page 355: ingenieria

EL MODELO EXPONENCIAL DE FIABILIDAD 347

(a) Hallar las oxpresiwcs de f r r ) y I;:t). (I>\ Demostrar que la prr,habilidad de un f a ! l o inicial est:: dado por

1 - e -a@/2

7. Cicrta componente tiene una distribuci3n de vida exponencial con una tasa dc fallos de a = 0.0025faIIos por hora. ( a ) ¿,Cull es la probabilidad de que( la componcntc fa l le durantc l a s ?O() primcras horas

de su optraciiin? (h) ¿,Cub1 es la probahilidad de que dos de tales componentes sobreviva11 (amhas) las

primeras 200 horas de operacibn? 8. u n transistor tiene una tasa dc fallos constantc de 0.01 por 1.000 h x a s .

f a ) <.CuBI es la probabilidad de que trabaje satisfactoriamcntc. por l o mcnos duran te

ib) ic'uB1 es la fiabilidad a 10,000 horas de un circuito ~ I I C ticnc S de estos transistores

9. U n sistema consta de 5 componentes dirercntes conectados en serie. Hallar el M r B / dcl sistema si los 5 componentes tienen distribuciones exponenciales del tiempo de T,t! lo

eon tasas de fallos de 1.2, 1 .h. I .8. ! . O y I .S fallos por mil horas. respectivamente.

25.000 horas?

conectados en serle?

Page 356: ingenieria

348 APLICACIONES A LA FIABILIDAD Y A PRUEBAS DE DURACION DE V I D A

1 0 . Un sistema formado por varios componentes idhticos et1 paralclo ha de tener una tasa de fallos por hora de a lo mas. ¿.Cuál es el nítmero menclr de componentes que se deben emplear si cada uno tiene una tasa de fallos constante de 2.5 X por hora?

11. Cierta parte tiene una distribucibn exponencial de vida con una vida media ( M T B F de 500 horas. (a) &u51 es la probabllidad de que esa parte dure al menos 600 horas? ( b ) ;Cuál es la probabilidad de que. entre tres de esas partes, al menos una falle duran.

( c ) ;,Cuál es la prcjbahilidad de que, entre cuatro de esas partes fallen exactamentc do!

12. Si una componente tiene la distribucih del tiempo de fallo de Wcibull con par5metror (Y = 0 . 0 1 ~ /3 = 0.50, halla la probabilidad dc que trabaje correctamente. por lo menos durante 10,000 horas.

13. En las secciones 16.2 y 16.3 supusimos que los productos de los que nos ocupiibamo: estaban en operacih continua. En consecuencia, los modelos discutidos en esas seccioner no nos sirven cuando querernos investigar la capacidad de tubos electrhicos para resis. tir sucesivas sobrecargas de voltaje. el resultado que dan interruptores que se encienden y se apagan repetidas veces, o la capacidad de un somier para resistir cargas repetidas en una prueba de fatiga. En cada uno de estos casos puede ocurrir el fallo en el x-ésimo ensayo (x = 1: 2, . . . ) y generalmente se supone que la probabilidad de fallo en dicho ensayo es igual a una constante p , ya que la unidad no ha fallado antes de este ensayo. ( a ) Demostrar que la probabilidad de fallo en cl ,u-ésimo ensay6 está dada por

te las primeras 4(Wl horas?

durante las primcras 300 horas?

f ( x ) = p(l - P)”” para x = 1, 2? . . ., ¿por qué a esta distribucijn de probabilidad se le da generalmente el

(b) Hallar F ( x ) para la distribución de probabilidad obtenida en la parte (a) ( c ) ~ C u h l es la prchabilidad de que un tubo electr5nic.o sobreviva a 20 sobrecargas de

voltaje, si en este caso silvc el modelo antcrior y la probabilidad constante de fallo considerada como resultado de cualquiera de las sobrecargas es p = 0.08?

nombre de dis!rihuci& geométrico?

16.4 El modelo exponencial en tests de duración de vida

Un método efectivo y profusamente usado para resolver problemas de fiabili- dad es el de los tests de duración de vida. Para estos tests se selecciona de un lote una muestra aleatoria de n componentes, se somete al test en las condiciones exter- nas especificadas, y e; tiempo de fallo de las componentes individuales se anota. Si cada componente que falla se cambia inmediatamente por una nueva, el test de duración de vida resultante se llama test cot2 rempluzumietlto; en caso contrario, se llama test sill rempluzumiento. Siempre que la vida media de las componentes sea tan grande que no resulte prrictico, o realizable económicamente, probar cada com- ponente hasta el Fallo, el test de duración de vida será truncada es decir, quedar6 terminada después dc los primeros I’ fallos (T 5 n), o después que han transcurri- do un periodo fijo de tiempo.

Un método especial usado frecuentemente cuando se desean resultados rápidos para componentes de alta fiabilidad, es el de rest de durucitirt de vida a c e l e d ~ . En este tipo de test, las componentes se someten a condiciones externas más duras

Page 357: ingenieria

EL MODELO EXPONENCIAL EN TESTS DE DURACION DE VIDA 349

las que se encuentran normalmente en la práctica. Esto hace que las componentes fallen más rápidamente y, asi, podemos reducir drásticamente tanto el tiempo re- querido para la prueba como el nilmero de componentes que se deben probar. Los tests de duración de vida acelerada se pueden utilizar para comparar dos, o más. tipos de componentes, con el objeto de obtener una afirmación rápida de cGá1 es el mhs fiable. Algunas veces, se hace una experimentación preliminar para determinar la relación entre la proporción de fallos que se pueden esperar en condiciones nor- males y en niveles diversos de condiciones externas aceleradas. Los métodos de las secciones 12.4 y 14.2 se pueden aplicar a la determinación de “curvas de desacelera- ción”, que relacionan la fiabilidad de la componente eon la dureza de las condicio- nes externas ;en que opera.

En el resto de esta sección supondremos que sirve el modelo exponencial, es decir, que la distribución del tiempo de falto de cada componente está dada por

f ( t ) = a0e-a’ t > O , a > O

En 10 que sigue, suponemos que se prueban n componentes, se corta la prueba de vida después de que un número fijo, r (T n), de componentes ha fallado, y que los tiempos de fallo observados son. tl 5 tz 5 . . . 2,. Ahora estimaremos y con- trastaremos hipbtesis sobre la vida media de la componente, o sea = 1/a.

Empleando la teoría desarrollada en el articulo de B. Epstein, mencionado en la bibliografía, se puede demostrar que los estimadores insesgados de la vida media de la componente son de ia forma

+ p = - T, r +

donde T, es la vida acumulada en el test hasta que ocurre el r-ésima fallo y, por ]o tanto,

+ para tests sin remplazanliento y

T, = ntr

+

para tests con remplazamiento. Nótese que. si el test cs sin remplazamiento y I’ -- tr ,

fl es, simplemente, la media de los tiempos de fallo observados. Para hacer inferencias referentes a la vida media p de la componente, partimos

de que 2T, /p es un valor de una variable deatoria que ticne disfribucicin x-cuadra- do con 2r grados de libcrtad jviasc la referencia 9 B. Epstein en la bibliografia). Con la expresi6n apropiada que substituya a T,, esto es verdad independientcmen- te de si el test se hace con, o sin, remplazamiento. Luego. en cada caso sc obtiene un intervalo de confianza bilatero dado por

+

Page 358: ingenieria

350 APLICACIONES A LA FIABILIDAD Y A PRUEBAS DE DURACION DE VIDA

donde Xf y x: cortan las colas izquierda y derecha de área a/2 bajo la curva de distribución x-cuadrado, con 2r grados de libertad. (Problema 6 de la página 356.)

El test de la hip6tesis nula de que p = p0, se puede basar en la distribucih muestra1 de ~ T , / F , utilizando la expresión adecuada de T , que dependerá de si la prueba se hace, o no, con remplazamiento. Entonces, si la alternativa 2s u > bo, re- chazamos la hipótesis nula a un nivel de significaci6n a cuando 2T,/po excede a X& o sea,

donde x%, se debe determinar para 2r grados de libertad, como se definió ya en la página 139. En los problemas 2 y 3 de la página 380, el lector deberá construir y desarrollar tests semejantes correspondientes a la hipótesis alternativa

I.r < PO y I.r f PO. Un procedimiento alternativo de tests de duración de vida consiste en interrum-

pir la prueba cuando ha transcurrido un tiempo fijo de vida T, y tratando el número de fallos k observados, como valor de una variable aleatoria. (En el caso especial, y muy importante, en que n unidades se someten a test con remplazamiento, se prue-. ban con cambio, durante cierto tiempo t*, tenemos T = nt* .) Independienternen- te de si la prueba es COI; remplazamiento o sin éI, se obtiene un intervalo de con- fianza de uproximudo a un nivel j -- a, de la vida media de la componente dado Por

4 2T 2T Z < ” < X

Ayui x: corta la cola derecha de Area n/2 bajo la distribución x-cuadrado, con 21; + 2grados de libcrtad, mientras que x: corla la cola izquierda de Brea a/2 baio la distribucih x-cuadrado, con 2k grados de libertad.

Para ilustrar algunos de los métodos presentados en esta seccibn, consideremos el ejemplo siguiente. Supongamos que se somete a test la vida de 50 unidades (sin remplazamiento) y que los tesls se truncan despuh de que r = 10 de ellas han fa- llado. Suponemos, ademlis, que los 10 primeros fallos se producen con ticmpos de 65, I IO. 380. 420, 505, 580. 6-50, 840, 910 y 950 horas. Así que. rt = SO. r = 10.

@O = (65 + 110 + . . . + 950) + ( 5 0 - 10)950 = 43,410 horas

y cstimamos la vida media dc la componente en p = 43’410 = 4341

horas. La tasa de fallos a se est~ma en 1/p = 0.00023 fallos por hora. 6 0.23 fallos por mil horas. Además. se tiene u n intervalo de confianza para p , dado por

10

2(1:5,410) 2(43,410) 31.410 < I( < 10.851

ti 2764 < P < 8001

Page 359: ingenieria

EL MODELO WEIBULL EN TESTS DE DURACION DE VIDA 351

Supongamos que también se desea utilizar la muestra anterior para contrastar si la tasa de fallos cs de 0.40 fallas por mil horas, frente a la alternativa de que sea menor. Esto es equivalente a contrastar la hipótesis nula = 1000/0.40 = 2500 ho- ras, frente a la alternativa de que p > 2500 horas. Empleandd un nivel de significa- do Re 0.05, encontramos que i l valor critico de Tlo para este test está dado por 3(2500)(31.410) = 39,263 horas y, como esto es menos que el valor vbservadoTlo = 43, 410, la hipótesis nula debe rechazarse. Llegamos así a la conclusihn de que el tiempo medio de vida excede de 2500 horas o, lo que es lo mismo. q w la tasa de fallos es menor que 0.40 fallos por mil horas.

16.5 El modelo Weibull en tests de duraci6n de vida

Aunque los tests dc duraci6n de vida de componentes, durante el periodo de vida iltil se basa generalmente en el modelo exponencial, ya hemos indicado que la tasa de fallos de una componente puede no ser constante en el periodo bajo inves- tigación. En algunas ocasiones. el periodo de fallo inicial puede ser tan grande. que el uso más importante de la componente se presenta durante este periodo y, en otras ocasiones, el propósito principal de un test de duración de vida puede ser el de de- terminar el tiempo de los- fallos por uso, en lugar de el de fallos casuales. En tales casos, el modelo exponencial no sc aplica en general, y es necesario substituirlo por una hipbtesis más general que la de la constancia de la tasa de fallos,

Como indicamos en la pagina 343, la distribución de Weibull describe adecua- damente los tiempos de fallo de las componentes cuando su tasa de fallos aumenta o disminuye con el tiempo. Tiene los parámetros a! y 8, y su fdrmula esti dada por

4 + y de aquí se deduce (problenla I 1 de la página 356) que la funcicin de fiabilidad arociada con la distribución de Weibull está dada por

4 R(t) = e-@ + Demostramos, también, en la página 367 que la tasa de fallos que conduce a

la distribución de Weibull est5 dada por

La diversidad de formas que puede tomar'una gráfica de densidad de Weibull es muy amplia, dependiendo, en primer lugar, del valor del parámetro P. Como ilus- tramos en la figura 16.4, la curva de Weibull es asintótica a ambos ejes y con gran tendencia hacia la derecha para valores de menores de I ; es iddntica a la de la densidad exponencial para 6 = 1, y tiene forma de campana, pero asimetrica, para valores de p mayores que 1.

La media de la distribucidn de Weibull con parámetros (Y y p . se puede obte- ner resolviendo la integral

Page 360: ingenieria

352 APLICACIONES A LA FIABILIDAD Y A PRUEBAS DE DURACION DE VIDA

p = /o” t .a@P1e-@ dt Haciendo el cambio (e variable u = at@, obtenemos

= ,-1IB [ ~ 1 1 B e - u du

Como esta integral es r , encontramos que el tiempo medio de fallo del mo- delo de Weibull es

+ + El lector deberá demostrar, en el ejercicio 12 de la página 356, que la varianza de esta distribución está’ dada por

+ + A veces, es difícil estimar los parhmetros a y @ de la distribución de Weibull.

Aunque existen métodos analíticos para estimar estos parámetros, implican la solu- ción de sistemas de ecuaciones trascendentes y no se exponen aquí. En su Iugar, se describirh un método mhs rápido y m k utilizado, basado en una técnica grhfica.

t Fig. 16.4 Funciones ‘de densidad de Weibull (a = 1)

Para ello, partiremos de que la función de fiabilidad de la distribución de Weibull se puede transformar en una función lineal de In t por medio de una transformacicin logarítmica doble. Tomando el lGgaIhI0 natural de R (t), obtenemos

Page 361: ingenieria

EL MODELO WEIBULL EN TESTS DE DURACION DE VIDA 353

Tomando otra vez logaritmos tenemos

y se puede ver que el segundo miembro es line;tl en I n t. Para estimar a y B, necesitamos estimaciones de R ( t ) para varios valores de f.

y el procedimiento usual es situar IZ unidades en el test de vida y observar sus tiem- pos de fallo. Si la i-ésima unidad falla en el tiempo t i * estimamos F(',) = 1 - R(tJ por el mismo método que cn la página 104. es decir, utilizamos el estimador

F ( t J = ___ - i - 1/2

/I

Antes de seguir adelante, es costumbre verificar si es realmente razonable emplear el modelo de Weibull. Para este fin, marcamos puntos de coordenadas b , y F'?,) en papel gráfico especial cuyas escalas están transformadas de tal modo que las divisio-

nes en el eje horrzontal eon proporcionales a ! r ! l u . Si los puntos quedan

aproximadamente en linea recta, se puede suponer que la distribución del tiempo de fallo es del tipo Weibuli. Los parámetros a y p de esta diswibucicin se pueden esti- mar, entonces, aplicando los métodos de regresicin lineal del capitulo 12 para ajustar

1 - F ( t )

una línea recta a los datos transformados.

T

1: i 500

Para ilustrar este procedimiento, consideremos el siguiente ejemplo numkrico. Supongamos que se somete a test la duración de la vida de í O 0 componentes en 500 horas y que los tiempos de fallc, de las 12 componentes que fállan durante este tiempo son las siguientes: 6, 21, 50, 84, 95, 130, 205, 260, 270, 370, 44O.y 480 horas.

Page 362: ingenieria

Estos puntos están marcados en la figura 16.5 en las escalas transformadas descritas anteriormente y se puede vel que quedan. aproximadamente, en una línea recta.

Los parametros a y p estimados se calculan por e1 método de mínlmos cuadrz- dos aplicado a los puntos transformados (.Ti, y,), donde

x, = In t ,

Así. en nuestro ejemplo numérico, obtenemos

Y;* ) 1, si ?/i

0.005 0.015 0.025 0. o3 5 0.045 0.055 0.065 0.075 0.085 0.095 0.105 0.115

1.79 3.04 3.91 4.43 4.55 4.87 5.32 5.5ti 5.60 5.91 ti.09 6.17

-5.30 -4.20 -3.68 -3.33 - 3 .O8 - 2.87 -2.70 - 2.55 - 2.42 - 2.30 - 2.20 - 2.10

y. por 10s métodos de la sección 12.1, la linea de regresión es

y = -6.44 + 0.7l.c

Nótese que, al calcular los valores de y L , es conveniente emplear la aproximacicin

-" In (problema 13 de la página 356) para valores pequeños de FGz). 1--z

Entonces, el parámetro p de la distribución de Weibuil considerada se estima en jj = 0.71, y CY se cstima en dr = e"6.44 = 0.0016. De aquí deducimos que el tiempo medio de fallo se estima en

que es. aproximadamente, 1 I O00 horas. También. se pueden obtener los valores de la tasa de fallos substituyendo t en

28) = (0.0016)(0.71 ) t -0 .2g

Como 6 X' 1 , la tasa de fallos decrece con el tiempo. Despues de una hora (t = I ) , las unidades fallan con una tasa de (0.0016) (0.71) = 0.001 14 unidades por hora. y después de IO00 horas la tasa de fallos ha disminuido a (0.001 14)( 1 0 0 0 ) - o . 2 9 = 0.00015 unidades por hora.

Page 363: ingenieria

EL MOGELO WEIBULL EN TESTS DE DURACION DE VIDA

EJERCICIOS

355

Page 364: ingenieria

355 APLICACIONES A LA FIABILIDAD Y A PRUEBAS DE DURACION DE VIDA

9.

I ( ] .

1 I.

12.

I? .

( h ) Emplcando los datos del eiercicio 3, cstablccer un límite inferior de tolerancia para cl que se pueda afirmar. con un grado de confianza de 0.99, quc es sobrepasado. al menos. por cl 90:;: de las vidas de las partes de aviim consideradas.

Partiendo de quc 2!i",,'p es un valor de Ltn?, variable alcatoria que tiene distribucih x- cuadrado con 2r grados de libertad. obtener el intervalo de confianza para p dado en l a página 349. Se hizo un tcst de duraci;m dc vida de 1,000 horas dc llna mrrcstra dc 50) capacitores dc alta fiabilidad y no hubo fallos: en el tiempo dt: la prueba. Hallar un l h t c de confian- za i/tfcr.ior a un nivel de 0.95 de 121 vida media de los capacitores. Sc somctcn a un tcst a 2 0 0 sparatos y los ticmpos de fallo (en horas; de los 10 primcros quc fallan sen: 0.7. 1.4. 1.9, 3.0. S.S. 8.0, 17.5, 26.0, 44.0 y 80.0. Suponiendo una distri- huci:in dc Wcihull del tiempo de fallo estimar los parámctros LY y p . así como la tasa de fallos a las 100 horas. ¿,Ci.mo sc compara cste valor dc la tasa dc fallos con el quc huhicramos chtciliuo, tomalldo un modelo exponencial? Para investigar las caracteristicns de una sompuncntc dc un cohetc. un laboratorio somclc a un tcst dc duracih de vida a 50 de las componcntcs ism remplazamiento) en condicio- ncs exteriores cspccificadas. y l(;s I O primeros fallos sc prcscntan a los 1 X . 36. 40. 53, 71. 90. 106. 127. 149 y I65 minutos. Uhlizando cl mod210 de Wcibull. estimar la vida media dc la componcnte. :.C6mo sc puede comparar este vr1.lor con la vida media que huhilra- mos obtenido. suponlcndo u n modelo cxponcncisl? Usando las estimaciones dc los parimetros del nlcdelo dc Wcibull obtcnidas en cl prohlc- ma 9. estimar la probabilidad dc quc cstc tipo ae componente de proyectil trabaje 5atis- factoriamcntc, por In nxnos durante 1 0 0 minutos. Demostrar quc 1:1 funcion dc fiabilidad asociada con la tlistrihwi5n dcl ticnlpo de fallo de Wcibull. esti dada por

R(L) = C--"~P

Ohtcncr l a f:irrncrla dc la varianza de la dis t r ibucih dc Weibull dada cn II! página 377,

Dcmostrar qlrc In In - TC pltcdc aproximar por In : para ~ a l ( ~ r c s pcqueiios de 7 . 1 1 - 2

(.\tc~ero~cicr: n:)tcse qw - = 1 + 2 + 22 + 23 . . . 1 para [ Z [ < 1, y cmplear l a 1 - 2

scric rlc Mclaurin para In (1 + x).]

Page 365: ingenieria

l . Estadistica de ingenieria

Bowker, A. H., and Lieberman, G. J., Engineering Statistics. Englewood Cliffs,

Brownlee, K. A., Statistical Theory and Methodology in Science and Engineering.

Ierman, C., and Klein, R4., Probability and Statistical Inference for Engineers.

Ehrcnfeld, S., and Littauer, S. B., Introduction .fa Stat is l id Method. New York:

Lld, A., Statistical Theory with Engineering Applications. New York: John Wiley,

N.J.: Prentice-Hall, 1959.

New York: John Wiley, 1960.

New York: Oxford University Press, 1959.

McGraw-Hill, 1964.

1952.

I. Estadística tebrica

mderson, R. L., and Bancroft, T. A., Stutistical Theory in Research. New York: McGraw-Hill. 1852.

357

Page 366: ingenieria

358 BIBLIOGRAFíA

Brunk, II. D., An Introduction to NatlLematical Statistics. Boston: Ginn and Co.,

Feller, \V., A n Introduction to Probability Theory and Its Applications, 2nd d .

Frcund, J. E., dfath~nwtical Statistics. Englcwood Cliffs, N.J.: Prentice-Hall, 1962. Goldherg, S., Probability, An Introduction. Englewood Cliffs, N.J.: Prentice-Hall,

Hod, P., Introduction to dIathenzaticd Statistics, 3rd ed. New York: John Wiley,

Jlann, H. B., Analysis and Design of I?zperiments. New York: Dover, 1949. Nood, A. ?,I., and Graybill, F. A., Introduction to the Theory of Statistics, 2nd ed.

1960.

iiew York: John Wiley, 1957.

1960.

1962.

Sw York: hlcGraw-Hill, 1963.

3. Diseiio experimental y analisis da la varianza

(’l1cw, V., I:’.rperimental Designs in Industry. New York: John Wiley, 1958. Codlran, W . G., and Cos, G. M., B.cperi??~ental Designs, 2nd ed. New York: John

FViIcy, 1957. J):ivics, O. L., The Ucsign and Analysis of Industrial E.cperiments. New York:

Ilnfncr, 1956.

Fcdcrer, \V. T., Bcperinzenlul Designs, Theory and Application. New York:

Finney, D. J., Experimental Ihsiga and Its ,%¿istical Bmis. Chicago: University of

Fishcr, R. A . , The Design of ILcperinzents, 4th cd. New York: Hafner, 1947. Freund, J. E., Livermore, P. E., and Miller, l.; -1lanual of Experimental Statistics.

Grxyl)ill, F. A . , A n Iutroduction to Linear Statistical Slodels, Vol. I. New York:

Snctlcc:or, G. \V., Statislical Jlethods, 5th d . Anes, Iowa: Iowa State University

Xacmillan, 1955.

Chicago Press, 1955.

Englcwood Cliffs, S.d.: I’renticc-Hall, 1960.

JIcGraw-Hill, 1961.

Press, 1956.

4. Tópicos especiales

Ackoff, It. I,., Progress in Operations Research, Vol. I. New York: John Wiley, 1961. Uazovsky, I., Reliabilily: Theory and Practice. Englewood Cliffs, N.J.: Prentice-

I k r , I . IV., I:ngineerivy Rutistics and Quality Control. New York: McGraw-Hill,

Charws, A . , an(I ( ’oopvr , \V. \V., .llunagement .\lodels and Industrial .4ppEiralions

IIall, 1961.

1953.

of Linear I’ruyrtrwctniytg, Vols. I and 11. Ncw York: John Wilcy, 1961.

(‘onden, D. J., StutisticaZ Alethods in Qwdity ControE. Englcwood Cliffs, N.J.: I’renticc-Hall, 1957.

Page 367: ingenieria

BlBLlOGRAFlA 359

Epstein, B., “Statistical Life Test Acceptance Procedures,” Technometrics, Vol. 2,

Wald, A., Sequential Analysis. New York: John Wiley, 1947. Zelen, M., Statistical Theory of Reliability. Madison, Wisc.: University of Wisconsin

November 1960.

Press, 1963.

5. Tablas de estadística

Kitagawn, T., and Mitome, M., Tables for the Design of Factoria,l Experiments.

Military Standard 10TjD. Washington, D.C.: U.S. Government Printing Office,

National Bureau of Standards, Tables of the Binomial Distribution. Washington,

Owen, D. B., Handbook of Ptatistical Tables. Reading, Mass.: Addison-Wesley,

Pearson, E. S., and Hartley, H. O., Biometm’ka Tables for Statisticians. Cambridge:

New York: Dover, 1955.

1963.

D.C.: U.S. Government Printing Office, 1950.

1962.

Cambridge University Press, 1954.

York: Free Press of Glencoe, 1955. RAND Corporation, A Million Random Digits with 100,000 Xormal Deuiates. h’ew

Rornig, H. G., 50-100 Binomial Tables. New York: .John Wiky, 1953.

Page 368: ingenieria
Page 369: ingenieria

TABLAS DE ESTADISTICA

I. Función de distribución binomial 11. Función de la distribución de Poisson

111. Función de la distribución normal IV. Valores de fa

V. Valores de X:

I VII. Dígitos a l azar VI. Valores de F.w y F.o1

VIII. Intervalos de confianza de 0.95 y 0.99 para proporciones 1%. Valores críticos de D X. Valores de r, para a = 0.05 y a = 0.01,,.

XI. Constantes para tablas de control XII. Factores de limites de tolerancia bilateros

XIII. C6digo de letras dc tamaños de muestras del MIL-ST-IOSD XIV. Tabla maestra para muestras simples (Inspección normal)

del MIL-ST- 105D

361

Page 370: ingenieria

362 TABLAS DE ESTADISTICA

Tabla I

FUNCION DE DISTRIBUCION BINOMIAL

-

n z - 2 0

1

3 0

2 1

4 0 1 2 3

6 0

2 1

3 4

6 0 1

3 2

4

5

7 0

2 1

3 4

5 6

a 0

2 1

3 4

5

7 6

B O 1

3 2

4

5 0 7 8 -

Page 371: ingenieria

TABLA6 DE ESTADISTICA 363

- n z - 10 o

2 1

3 4

5

7 6

8 Q

;1 o

2 1

3 4

K 6

8 7

9

10

12 o 1 2 3 4

5 6 7

9 S

10 11

13 O

2 1

4 3

5

7 6

9 8

10 11 12

14 O 1

Tabla I

FUNCION DE DISTRIBUCION BINOMIAL (Conrimio)

P 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 3.45

0.5987 0.3487 0.11#69 0.1074 O . O W 3 0.0282 0.0135 0.0060 0.0025 0.9139 0.7361 0.5443 0.3758 0.2440 0.1493 0.08Fo 0.0464 0.0232 0.9W 0.9298 0.8202 0.6778 0.5256 0,33828 0.2616 0.1673 0.0996

0.9999 0.9984 0.9601 0.9672 0.9219 0.8497 0.7515 0.0331 0.5014 0.9990 0.9872 0.9500 0.8791 0.7759 0.64Y(i 0.5138 0.3823 0.2680

l . W 0.9999 0.9986 0.9936 0.9803 0.9527 0.90.51 0.8338 0.7384

1.oooO 1.oooO 1.OOOO 0.9999 0.9996 0.9u81 0.9u52 0.9877 0.9726 1 . W l . W 0.R999 0.9991 0.99L5 0.9894 0.9740 0.8452 0.8980

1,ooOO 1.oooO Loo00 1 . W l . W 1.oooO 1.oooO 0.9999 0.9997 1.oooO 1.oooO 1.oooO 1.oMw) 1.oooO O.Y9!)9 O.!lY93 0.9983 0.9955

0.8981 0.6974 0.4922 0.3221 0.1971 0.1130 0.0606 0.0302 0.0139 0.5688 0.3138 0.1673 0.0859 0.0422 0.0198 0.0088 0.0036 0.0014

0 . W 0.9815 0.9308 0.8389 0.7133 0.5696 0.4256 0.2803 0.1911 0.9999 0.9972 0.9841 0.9496 0.8854 0.7897 0.6683 0.5328 0.3971

1.oooO 0.9997 0.9973 0.9883 0.9657 0.9218 0.8513 0.7535 0.6331

1.oooO 1.oooO 1.oooO 0.9998 0.9988 0.9957 0.9878 0.9707 0.9390 1.oooO l .W 0.9997 0.9980 0.9924 0.9784 0.9499 0.9006 0.8262

1.oooO 1.oooO l . W 1.oooO 0.9999 0.9994 0.9980 0.8841 0.9852 1.00W 1.oooO l . W l . W 1.oooO 1.oooO O.Qgg8 0.9993 0.9978

1.oooo 1.Mww) l.m 1.,m 1.oooo l.m 1.oooO l.m 0.9998

0.5404 0.2824 0.1422 0.0067 0.0317 0.0138 0.0057 0.0022 O.ooO8

0.9804 0.8891 0.7358 0.5583 0.3907 0.2528 0.1513 0.0834 0.0421 0.8816 0.650 0.4435 0.2749 0.1584 0.0850 0.0424 0.019G 0.0083

0.9978 0.9744 0.9078 0.7946 0.6488 0.4825 0.3407 0.2253 0.1345 0.9998 0.9957 0.9761 0.9274 0.8424 0.7237 0.5833 0.4352 0.3044

1.oooO 0.9995 0.9954 0.9800 0.0456 0.8522 0.7873 0.6652 0.5269 1.woO 0.9999 0.9993 0.9961 0.9857 0.9614 0.9154 0.8418 0.7393 1.oooO 1.oo00 0.9999 0.9994 0.9972 0.9905 0.9745 0.9427 0.8883 1.ooOO 1.oooO l.W 0.9999 0.9996 0.9983 0.0944 0.9847 0.9644 Loo00 1.W 1.oooO 1.oooO 1.oooO 0.9998 0.9992 0.9972 0.9921

1.oooO 1.oooO 1 . W 1.oooO 1.oooO 1.ooO O.oH99 0.9997 0.9989 l.m l . m l.m l . m 1.oooo l .m 1.ouoo 1.oooo 0.9999

0.5133 0.2542 0 . 1 m 0 . ~ 5 0 o . 0 ~ ~ 0 . ~ 7 0 . ~ 7 o.ooi3 0.000.8

"_

0.9848 0.9104 0.7788 0.617.4 0.4552 0.3127 O.ZOOI o .ma 0.0652

0.8G46 OX213 0.3983 0.2338 0.1207 0.0037 0.0296 0.0120 0.0019 0.9755 0.8661 0.6820 0.5017 OX326 0.2025 0.1132 0.0579 0.0269 0.9969 0.96.58 0.8820 0.7473 0.51u3 0.4200 027110 0.108G 0.0829 0.9997 Q.9936 0.9058 0.9009 0.7940 0.6543 03005 0.3530 0.2279

1.oooO 0.9991 O.Yh2S 0.9700 0.9198 0.8346 0.7159 0.5744 0.42G8 1.ooM) 0.9999 0.9987 0.9930 0.9757 0.9370 0.8706 0.7712 0.W37 Loo00 1.oooU 0.9998 0.9988 0.9944 0.9818 0.9538 0.90?3 0.8212 1.oooO 1.oooO 1.owO 0.9998 O.9!)90 0.9960 0.9874 O.!Mi79 0.Y30.2 1.oooO Loo00 1.oooO l.oUu0 O.L)lr3ll 0.90!33 O.!W75 0.9L)"2 0.9797

l . W l.O(Wx) l.oOo(1 1.OOKIO O.!)9H9 U.!W!l7 0.9987 0.9959 l.oo00 1.oooO 1.oooO 1.oOoO 1.WIO 1.oouO 1.WIO 0.W90 0.9095 1.oooO l . W 1.oouo 1.1W)o l.Oo(Y) 1.oooO 1.WJO 1.uooo 1.oooo

1.4877 0.2288 O.1OPk 0.0440 0.0178 0 . W l U.&J24 0 .W& 0.00112 3.8470 0.5846 0.3567 0.1979 0.1010 . 0.017.5 o.(rm o.0081 o.ooa

0.50

0.0101 0.0010

0.1719 0.0547

0.3770

0.0230 0.8281 0.94.53 0.9893 0.9990

0.0005 0.0059

0.1133 0.0327

0.2744

0.5000 0.7258 0.8867 0.9673 0.9941

0.9995

o.Ooo2

0.0193 0.0032

0.1938 0.0730

0.6128 0.3872

0.8002 0.9270 0.9807

0.9968 0.999e

o.Ooo1 0.0017 0.0112 0.0461 0,1334

0.2905 0.5000 0.7095 0.8668 0.9539

0.9880 0.9983 0.9999

O.OOO1 0 . W -

Page 372: ingenieria

TABLAS DE ESTADJSTICA

- n z

14 2 3 4

5

7 6

8 9

10 11 12 13

15 O

2 1

3 4

6 6 7 8 9

11 10

12 13 14

16 O 1 2 3 4

5

7 6

8 9

10 11 12 13 14

15

17 O 1 2

4 8

-

-

Tabla I

FUNCION DE DISTRIBWION

P 0.05 0.10 0.15 0.20 0.25

0.9699 0.8416 0.6479 0.4481 0.2811 0.9958 0.9559 0.8535 0.6982 0.5213 0.09% 0.9908 0.9533 0.8702 0.7416

1.oooO 0.9985 0.9885 0.9561 0.8883 1.oooO 0.9998 0.9978 0.98E4 0.9617 1 . 0 0 1.oooO 0.9997 0.9976 0.9807 1.00 1.00 1.oooO 0.9996 0.9978 1.oooO 1.oooO l.oo00 1.OOOO 0.9997

"

1.0000

1.oooO 1.oooO

1 . 0 0

0.4683 0.8260 0.9638 0.9945 0.9994

0.9999 1.0000 1 .m 1.oooO Loo00

1.oooO 1.oooO Loo00 1.oooO 1.MXH)

0.4401 0:8108 0.9571 0.9930 0.9991

0.9w 1.oooO 1 . 0 0 1.oooO 1.oooO

1.oooO 1.oooO 1.oooO 1.oooO 1.oooO

l.m

0.4181 0.7922 0.9497 0.9912 0.9988

1.oooO

Loo00 l . W

1 .oooo 0.2059 0.5490 0.8159

0.9873 0.9444

0.9997 0.9978

1 .m 1.0000 1.0000

1 .o0011 1.oooO 1.oooO

1 .oooo 1 .o000

0.1853 0.51.~:

0.9316 0.7892

0.9830

0.9967

0.9m 0.9995

1.oooO 1.0000

1.oooO 1 .m 1.oooO 1.oooO 1.oooO

Loo00

0.1668 0.4818 0.7618 0.9174 0.9779

Loo00

1 .o000 1.oooO

Loo00

0.0874 0.3186 0.6042

0.9383 0.8227

0.9964 0.9832

0.9996 0.9999 1.0000

1 . o w 1.oooO 1 . 0 0

1 .DoM) 1.oooO

0.0743 0.2839

0.7899 0.5614

0.9209

0.9765 0.9944 0.9989 0.9998 1 . 0 0

1 . 0 0 1.oooO

l.oo00 Loo00

1 . 0 0

1.oooO

0.0631 0.2525 0.5198 0.7556 0.9013

1.oooO 1.oooO

1 .m 1.oooO

0.0352 0.1671 0.3980

0.8358 0.6482

0.9389 0.9819 0.9958 0.9992 0.9999

1.0000 1.oo00 1.oooO

1 .oooO 1.0000

0.0281 0.1407 0.3518 0.5981 0.7982

0.9183 0.9733 0.9930

0.9998 0.9985

1.oooO 1.0000 1.oooO

1.oo00

1 .m 0.0225 0.1182 0.3096 0.5489 0.7582

l.oo00

Loo00

1 .oooO 1.oo00

1.oooO

0.0134 0.0802

0.4613 0.2361

0.6865

0.9434 0.8516

0.9827 0.9958 0.9992

0.9999 Loo00 1.oooO

1.0000 1.oooO

0.0100 0.0635 0.1971 0.4050 0.6302

0.8103

0.9729 0.9204

0.9984 0.9925

0.9997 1 . 0 0 1.oooO 1.oooO 1.oooO

1.oooO

0.0075 0.0501 0.1637 0.3530 0.5739

BINOMIAL (Conrinu'a)

0.30

0.1608 0.3552 0.5842

"

0.7805 0.9067 0.9685 0.9917 0.9983

0.9998 1 .oooo 1 .oooo 1.oooO

0.0047

0.1268 0.0353

0.2969 0.5155

0.8689 0.7216

0.9500 0.9848 0.9963

0.9993 0'9899 1 . 0 0

l . W 1.oooO

0.0033 0.0261 0.0994 0.2459 0.4499

0.6598 0.8247 0.9256

0.9929 0.9743

0.9984 0.9997 1.oooO 1.oooO 1 .m 1 .m

0.0193 O.CQ23

0.0774 0.2019 0.3887

0.35

0.0839 0 . W 0.4227

0.6405

0.9247 0.8164

0.9940 0.9757

0.9989

1 .woo 0.9999

1.oooO

0.0016 0.0142 0.0617

0.3519 0.1727

0.2548 0.5643

0.8868 0.9578 0.9876

0.9972 0.9995 0.9999 1.oooO 1.oooO

0.0010 0.0098 0.0451 0.1339 0.2892

0.4900 0.6881 0.8406 0.9329 0.9771

0.W8 0.9987 0.9998 Loo00 1.oooO

1.oooO

O.M)(n 0.0067 0.0327 0.1028 0.2348

0.40

0.1243 0.0398

0.2793

0.4859

0.8499 0.6925

0.9825 0.9417

0.9994 0.9961

0.9999 1 .oooO O.OOO5

0.0271 0.0052

0.2173 0.0905

0.6098 0.4032

0.7869

0.9662

0.9907 0.9981 0.99w 1.oooO 1.oooO

O.OOO3

0.0183 0.0033

0.0651 0.1666

0.3288 0.5272 0.7161 0.8577 0.9417

0.9809 0.9951 0.9991 0.9999 1.oooO

1.oooO

O.ooo2 0.0021 0.0123 0.0464 0.1260

0.9050

0.45

0.0832 0.0170

0.1672

0.3373

0~7414 0.5461

0.8811 0.9574

0.9886 0.9978 0.9997 1.Oooo

0.0001

0.0107 0.0017

0.1204 0.0424

0.4522 0.2608

0.8182 0.6535

0.9231

0.9745 0.9937 0.9989 0.W99 1.oooO

o.Ooo1 0.0010 0." 0.0281 0.0853

0.1976 0.3660 0.5629 0.7441 0.8759

0.9514 0.9851 0.9965 0.9994 1.oooO

1 .oo00

O.ooo8 0.OoM)

0.0041 0.0184 0.0596

- 0.50

0.0089

0.0898

0.2120 0.3953 0.6047 0.7880 0.9102

- 0.0287

0.9713 0.9935 0.9991 0.9999

O.oo00

0.0037 0.0005

0.0176 0.0592

0.3036 0.1509

0.6964 0.5000

0.8491

0.9408 0.9824 0.9963 0.9995 1 .oooo 0.oooO O.OOO3

0.0106 0.0021

0.0384

0.1051, 0.2272 0.4018 0.5982 0.7728

0.8949 0.9616 0.9894 0.9979 0.9907

1 . 0 0

0.w1 0.oooO

0.0012 0.0064 0.0245

Page 373: ingenieria

TABLAS DE ESTADISTICA 365

- __I

W X

17 6 6 7 8 9

IO 11 12 13 14

15 16

1s o

2 1

3 4

5

7 6

8 9

10

12 11

13 14

10 15

19 o

2 1

4 3

6 S

7

9 8

10 11 12 13 14

16 16

17 -

Taw8 I

FUNCION DE DISTRIBUCION BINOMIAL (Conrinda) ~~ ~~

0.05 0.10 0.15 0.20 8.25 0.30 0.35 0.40 0.45 P

0.9980 1.oooO 1.oooO

l . W l . W

1.0000 1.oooO

1 .m 1 . 0 0 1.ouoO

1.oooO 1 .m 0.3972 0.7735 0.9419 0.9891 0.9985

0.9998 1 .m

1.oooO l.”

1 .oooo Loo00 1 .uooo 1 .m 1.oo00 1.0000

1.oooO 1.0008

0.3774 0.7547 0.0335

0.9980 0.9808

0.9998 1 .m 1 .W 1.ooO 1 .0008

1.oooO 1.woO

1.oo00 1 .m 1.0000

1.oooO

I .oMx) 1.oooO

0.99cJ.53

0.9999 0.9992

1.oooo I.orwril

l.(KH)O 1 .m

1 .oo00 1 .m

l.m

1 .m 1 .oo00 0.1501 0.4503 0.7338 0.9018 0.9738

0.9936 0.9988 0.9998 l.oo00 Loo00

1.oooO 1.oooO 1 .m 1.oooO 1.oooO

1 .0000 1 . m

0.1351

0.7054 0.4203

0.8850 0.9648

0.9914 0.9983 0.9997

1.oooO 1 .oooo

Loo00 Loo00

1 .oooo 1.oooO

1 .oooo 1.oooo

1 .oo00 Loo00

0.9681 0.9917 0.9983 0.9997 1 .oooo 1:ohoo LOO00 Loo00 1 .m l.W

1 .m l.oo00

0.0530 0.2241 0.4797 0.7202 0.8794

0.9882 0.9sSl

0.9995 0.9973

0.Q999

1 .m

1.“ 1.0000

1.oooO 1 . W

l.” 1 .oooO

0.0456 0.1985 0.4413 0.8841 0.8556

0.9463

0.9959 0.9837

0.9902 0.9999

1 , 0 0 0 0

1 .oooo 1.oooO Loo00 Loo00

1.oooo 1.oooo 1.woO

0.8913 0.9823 0;9s91 0.9974 08995

0.9999 Loo00 1 .m l . m 1.woO

1 .woo 1 .m

0.0180 0.0991 0.2713 0.5010 0.7164

0.8671 0:9@7 0.9837 0.9957 0.9991

0.9998 1 .m 1.ooM) 1.oooO l.oo00

1.0000 1.oooO

0.0144 0.0829 0.2309 0.45.51 0.0733

0.8769 0.9324 0.9707 0.9933 0.9984

0.9997 1.oooO

1 . m 1.0000

1.oooO

I .m 1.OMw) 1 .m

0.76.53 0.5908 0.8929 0.7752 0.9598 0.8954 0;9876 0.9587 0.W9 0.9873

0.9994 ~O.QQG8 0 . W 0.9993 1.ooo 0.9999

‘1.oooo l.m l.m 1.oooo

l . m l . m l.m l.W

0.0056 0.0016 0.0395 0.0142 0.1353 O.oo00 0.3057 0.1046 0.6187 0.3327

0.7175 0.5344 0.8610 0.7217 0.9431 0.8593 0.9801 0.9404 0.9Q46 0.9790

0.9988 0.9939 0.9998 0.9986 1.oooO 0.9997 1 . m 1.oooo 1.oooo l.m

1 . m 1.0000 l.m 1 . m

0.0042 0.0011 0.0310 0.0104 0.1113 0.9402 0.2f30 0.1332 0.4054 0.2822

0.C678 0.4739 0.8251 0.6055 0.9228 0.8180 0.9713 0.9101 0.9911 O.ffi74

0.9977 0.9895 0.9995 0.9972 0.9Ogs 0.9994 l.m 0.9999 1.oooo 1 . m

l . m 1 . m

l.m Loo00 1.oooO ’ 1.0008

0.4197

0.7872 0.0188

0.8oOo 0.9017

0.8880 0.9970 0.9894 0.8999 1.oooO

1.oooO 1 .m 0.0004 0.0040 0.0236 0.0783 0.1886

0.3650 0.5491 0.7283 0.8009 0.9403

0.9788 0.9938

0.9997 0.9986

1.oooO

Loo00 l.W

O.OOO3 0.0031 0.0170 0.0591 0.1500

0.4812 0.2QG8

0.8145 0.0656

0.91%

0.9653 0.9w 0.9969 0.9993 0.9999

1.oooO 1 .m

1.oooO

0.2639 0.4478 0.6405 0.8011 0 . m 1

0.9052 0.9894 0.9915 0.8895 0.9999

1.oooo 1 .oooo o.oO01

0.0082 0.0013

0.0942 0.0328

0.2088

0.5634 0.3743

0.7368 0.8663

0.9424 0.0797 0.9942 0.99S7 0.9988

Loo00 1 . W

0.0001 0.0008 0.0055

0.0696 0.0230

O. 16.29 0.3081 0.4878 0.M75 0.8139

0.9115 0.8048

0.8969 0.9881

0.9994

0.9999 1 .oooo 1 .0000

0.1471 0.2802 0.4743

0.8188 0.0020

0.9174 0.9099 U23914 0.8981 0.9997

1 .oooO 1.WOO

0.WOO

0.0025 0.0120 0.0411

0.1077 0.2258 0.3916 0.5778 0.7473

0.8720 0.9403

0.9951 0.9817

0.9m

0.9699 1.oooO

O.ooo2 0.oooO

0.0015

0.0280 0.0077

0.0177 O. 1727

0.4940 0.3169

0.0710

0.8159 0.9129

0.9891 0.9058

0.9972

0.9995 0.9WQ I .oooo

awn

- 0.50

0.0717 0.1662

O.Jo00 0.3145

0.6855

0.8338 0.9283 0.9755 0.9936 0.9988

0.9999 1.oooO

0.0001 O.oo00

0.0007 0.mm 0.0151

0.M81

0.2403 0.1 189

0.4073 0.5927

0.7597 0.8811 0.9519 0.9846 0.99G2

0.9993 0.999!,

0.OMx) O.oo00 O.ooo1 0.0022 O.Oo90

0.0318 0.0835 0.1790 0.3238 0.5000

0.6702 0.8204 0.9105 0.8082 0.9904

0.9996 0.9978

10000

-

Page 374: ingenieria

366 TABLAS DE ESTADISTICA

Tabla-. I

FUNCION DE DISTRIBUCION BINOMIAL (Continúa)

P n z 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

20 O

0.9974 0.9568 0.8298 0.6296 0.4148 0.2375 0.1182 0.0510 0.0189 0.0059 4 0.9841 0.8670 0.6477 0.4114 0.8252 0.1071 0.0444 0.0160 0.0049 0.0013 3 0.9245 0.6769 0.4049 0.2061 0.0913 0.0355 0.0121 0.0036 O.ooo9 0.W2 2 0.7368 0.3917 0.1756 0.0692 0.0243 0.0076 0.0021 O.OOO5 O.OOO1 0.oooO 1 0.3585 0.1216 0.0388 0.0115 0.0032 0.008 0.0002 O.oo00 O.OoD0 O.oo00

6 0.9997 0.9887 0.9327 0.8042 0.6172 0.4164 0.2454 0.1256 0.0553 0.0207 6 1.oooO 0.9976 0.9781 0.9133 0.7858 0.6080 0.4166 0.2500 0.1299 0.0577 7 ' 1.oooO 0.9996 0.9941 0.9679 0.8982 0.7723 0.6010 0.4159 0.2520 0.1316 8 Loo00 0.9999 0.9987 0.9900 0.9591 0.8867 0.7624 0.59.56 0.4143 0.2517 9 1.oo00 1.oooO 0.9998 0.9974 0.9861 0.9520 0.8782 0.7553 0.5914 0.4119

10 Loo00 1.oooO 1.0000 0.9994 0.9961 0.9829 0.9468 Q.8725 0.7507 0.5881 11 1.oooO 1.oM)o Loo00 0.!4999 0.9991 0.9949 0.9804 0.9435 0.8692 0.7483 12 1.0000 l.oo00 1 . o o O 1.oooO 0.9998 0.9987 0.9940 0.9790 0.9420 0.86S4 13 1.0000 1.oooO 1 .0000 1.oooO 1.oooO 0.9997 0.99ffi 0.9035 0.9786 0.9423 14 1.oooO 1.000 1.oooO 1 . 0 1.oooO 1.oooO 0.9997 0.9984 0.9936 0.9793

15 1.oooO 1.oooO 1.0000 1.oMx) 1.0000 1.0000 Loo00 0.9997 0.9985 0.9941 16 1.oooO 1.oooO 1.oooO 1.oooO 1.0000 1.oooO 1.oooO 1.oooO 0.9997 0.9987

18 l.oo00 Loo00 l.oo00 1.owO l.oo00 1 . W 1.oooO 1.oooO 1.OOOO Loo00 17 ,1.oo00 1.oo00 1.woO 1.0000 1.0000 1.oooO 1.0000 1.0000 1.oooO 0.9998

Page 375: ingenieria

TABLAS DE ESTADISTICA 367

0.02 0.04 0.06 0.08 0.10

0.15 0.20 O. 25 0.30

0.35 0.40 0.45 0.50

0.55 0.60 0.65 0.70 . 0.75

0.80 0.85 0.90 0.95 1 .o0

1.1 1.2 1.3 1.4 1.5

1.6 1.7 1.8 1.9 2.0

k-O -

O

- 0.980 0.961 0.942 0.923 0.905

0.86 1 0.819 0.779 0.741

0.705 0.670 0.638 0.607

0.577 0.549 0.522 0.497 0.472

0.449 0.427 0.407 0.387 0.368

0.333 0.301 0.273 0.247 0.223

0.202 0.183 0.165 O. 150 0.135 -

1

- 1 .o00 0.999 0.998 0.997 0.995

0.990 0.982 0.974 0.963

0.951 0.938 0.925 0.910

0.894 0.878 0.861 0.844 0.827

0.809 0.791 0.772 D.754 D.736

D.699 D.663 3.627 D.592 D.558

3.525 5.493 1.463 1.434 3.406 -

2

- 1.000 1.OOO 1,OOO 1.OOO

0.999 0.999 0.998 0.996

0.994 0.998 0.989 0.986

0.9232 0.977 0.972 0.966 0.959

0.953 0.945 0.937 0.929 0.920

0.900 0.879 0.857 0.833 0.809

0.783 0.757 KTdl 0.704 8.677 -

3

-

1 .o00 LOO0 1 .o00 1.OOO

1.000 0.999 0.999 0.998

0.998 0.997 0.996 0.994 0.993

0.991 0.989 0.987 0.984 0.981

0.974 0.966 0.957 0.946 0.934

0.921 0.907 0.891 0.875 0.,857 -

-

4

-

. .o00

..o00

..om

. .o00

. .o00 1.999 1.999 1.999

1.999 1.998 1.998 1.997 1.996

1.995 1.992 1.989 1.986 1.981

1.976 1.970 1.964 1.956 1.947 -

-

1 1 1

1 1 1 1 C

c c C C c

C C C

C a

c

-

5

1000 t .o00 I .o00

L .o00 . .o00 I .O00 ..000 1999

1.999 1.998 ).m 1.997 1.996

1.994 1.992 1 . 9 9 0 1.987 1.983

6

L .o00

I .o00 1 .o00 1000 1.999 1.999

1.999 1.998 1.997 ).997

-

7

1.000 1000

1000 1.000 1.999 1.999 1.999 -

8

.000

.000

.000

Con autorizacidn de E.C. Molina, Poisson’s Exponential Binnmial Limit, D. Van Nos- trand Company, Inc., Princeton, N.J., 1947.

Page 376: ingenieria

368 TABLAS DE ESTADISTICA

2.2 2.4 2.6 2.8 3 .O

3.2 3.4 3.6 3.8 4.0

4.2 4.4 4.6 4.8 5.0

5.2 5.4 5.6 5.8 6.0

". . - " 2.8 3.0 3.2 3.4 3.6 3.8 4.0

4.2 4.4 4.6 4.8 5.0

5.2 5.4 5.6 5.8 6.0

Tabla II

FUNCTON DE LA DISTRIEUCION DE POISSON fContimia)

O

- 3.111 D.091 3.074 0.061 D.050

D.041 0.033 0.027 0.022 D.018

0.015 0.012 0.010 0.008 0.007

0.006 0.005 0.004 0.003 0.002

10

1 .o00 1 .o00 1 .m 0.999 0.999 0.998 0.99;

0.99f 0.994 0.999: 0.9% 0.98f

0.98: 0.97: 0.97: O.'%! 0.95:

__

___

-

1

- 1.355 1.308 1.267 1.231 1.199

1.171 1.147 1.126 1.107 1.092

1.078 1.066 1.056 J.048 1.040

1.034 3.029 3.024 3.021 3.017

11 I_

__

1 .o00 1 .o00 0.999 0.999

0.909 0.998 0.997 0.996 0.995

0.993 0.990 0:W o. 984 0.9% -

2

1.623 1.570 1.518 1.469 1.423

1.380 1.340 j.303 1.269 1.238

1.210 3.185 3.1ti3 3.143 3.125

D. 109 0.095 D.082 0.072 0.062

12 __

1 .o00 1 .O00

1 .O00 0.999 0.999 0.999 0.998

0.997 O.% 0.WE 0.c39:: 0.991 -

3

1.819 1.779 1.738 1.692 1.647

1.603 1.558 1.515 1.473 1.433

1.395 ).359 1.3% 1.294 1.265

L238 1.213 ).191 1.170 1.151

13 "

__

1 .ooc 1 .m 1.m 0.991

0.991 0.99I 0.995 0.99; 0.9H -

4

1.928 1.904 1.877 1.848 1.815

1.781 1.744 1.706 1.668 1.629

1.590 1.551 1.513 1.476 1.440

1.406 1.373 1.342 1.313 1.285

14 "

~

1 .oo(

1 .oo( 1 .M O.!% o. !M! 0.99! -

5

__ .975 .964 .951 .935 1.916

8.895 1.871 1.844 1.816 1.785

1.753 1.720 1.686 1.651 1.616

1.581 1.546 1.512 1.478 1.446

15 "

~

1 .o01 1.001 0.99' -

6

1.993 1.988 1.983 1.976 1.966

1.955 1.942 1.927 1.909 1.889

1.867 1.844 1.818 1.791 1.762

1.732 1.702 ).ti70 1.633 1.606

16 __

__

LOO( -

-

7

- 3.998 0.997 3.995 0.992 0.988

0.95 D.977 D.%9 0.960 0.949

0.936 0.921 0.905 0.887 0.867

0.845 0.822 0.797 0.771 0.744

-

8

- 1 .o00 0.999 0.999 0.998 0.996

0.994 0.992 0. 988 0.984 0.979

0.972 0.964 0.955 0.944 0.932

0,918 0.903 0.8% 0.867 0.847

-

9

- 1 .o00 1.000 0.999 0.999

0.998 0.997 0.996 0.994 0.992

0.989 0.985 0.980 0.975 0.968

0.960 0.951 0.941 0.929 0.916

Page 377: ingenieria

TABLAS DE ESTADISTICA 369

Tabla I1

FUNCION DE LA DISTRIBUCION DE POISSON " '. ' '

6.2 6.4 6.6 6.8 7.0

7.2 7.4 7.6 7.8

8.0 8.5 9.0 9.5

10.0

6.2 6.4 6.6 6.8 7.0

7.2 7.4 7.6 7.8

8.0 8.5 . 9.0 9.5

10.0

-

8.5 9.0 9.5

10.0

- O

- 0.002 0.002 0.001, 0.001 0.001

0.001 0.001 0.001 O.OO0

O.OO0 O.OO0 0.000 O.OO0 0.000

10

0.949 0.939 0.927 0.915 0.901

0.887 0.871 0.854 0.835

0.816 0.763 0.706 0.645 0.583

20

1.OOO 1 .O00 0.999 0.998

_I

-

- -

-

-

1

- 0.015 0.012 0.010 0.009 0.007

0.006 0.005 0.004 0.004

0.003 0.002 0.001 0.001 O.OO0

11

0.975 0.969 0.963 0.955 0.947

0.937 0.926 0.915 0.902

0.888 0.849 0.803 0.752 0.697

21

- -

- -

1.O00 0.999 -

2

- 0.054 0.046 0.040 0.034 0.030

0.025 0.022 0.019 0.016

0.014 0.009 0.006 0.004 0.003

12

0.989 0.986 0.982 0.978 0.973

0.967 0.961 0.954 0.945

0.936 0.909 0:876 0.836 0.792

22

- -

- -

1.OO0 -

3

- 0.134 0.119 0.105 0.093 0.082

0.072 0.063 0.055 0.048

0.042 0.030 0.021 0.015 0.010

13

0.995 0.994 0.992 0.990 0.%7

0.984 0.980 0.976 0.971

0.966 0.949 0.926 0.898 0.864

- -

-

-

4

- 0.259 0.235 0.213 0.192 0.173

0.156 0.140 0.125 0.112

o. 100 0.074 0.055 0.040 0.029

14

0.998 0.997 0.997 0.996 0.994

0.993 0.991 0.989 0.986

0.983 0.973 0.959 0.940 0.917

- "

-

- 5

- 0.414 0.384 0.355 0.327 0.301

0.276 0.253 0.231 0.210

0.191 0.150 0.116 0.089 0.067

15

0.999 0.999 0.999 0.998 0.998

0.997 0.996 0.995 0.993

0.992 0.986 0.978 0.967 0.961

- -

-

-

6

- 0.574 0.542 0.511 0.480 0.450

0.420 0.392 0.365 0.338

0.313 0.256 0.207 o. 165 0.130

16

1 .o00 1.OOO 0.999 0.999 0.999

0.999 0.998 0.998 0.997

0.996 0.993 0.989 0.982 0.973

- -

-

- 7

- 0.716 0.687 0.658 0.628 0.599

0.569 0.539 0.510 0.481

0.453 0.386 0.324 0.269 0.220 -

17 I_

1.OOO 1.OOO 1.OOO

0.999 0.999 0.999 0.999

0.998 0.997 0.M5 0.991 0" _I

8

- 0.826 0.803 0.780 0.755 0.729

0.703 0.676 0.648 0.620

0.593 0.523 0.456 0.392 0.333

18 - -

1 .o00 1 .o00 1.000 1000

0.999 0.999 0.998 0.996 0.993 -

- 9

- 0.902 0.886 0.869 0.850 0.830

0.810 0.788 0.765 0.741

0.717 0.653 0.587 0.522 0.458

19 - -

1.000 0.999 b 999 0.998 0.997 -

Page 378: ingenieria

370 TABLAS DE ESTADISTICA

Tabla It

FUNCJON DE LA DISTRIBUCION DE POISSON ICorttirzria)

\., 10.5 11.0 11.5 12.0 12.5

13.0 13.5 14.0 14.5 15.0

10.5 11.0 11.5 12.0 12.5

13.0 13.5 14.0 14.5 15.0

10.5 11.0 11.5 12.0 12.5

13.0 13.5 14.0 14.5 15.0

O

- 1.OOo ).o00 1.OOo ).o00 1.000

1.Ooo ).o00 1.000 1.000 ).O00

10

3.521 3.460 3.402 3.347 3.297

0.252 0.211 0.176 0.145 0.118

U)

0.997 0.995 0.992 8.988 0.983

0.975 0.965 0.952 0.936 0.917

-

-

-

-

-

1

__ 1.OOo 3.000 3.000 5.OOo 3.OOo

3.OOo 3.OOo 3.OOo 3.OOo 3.000

11

0.639 0.579 0.520 0.462 0.406

0.353 0.304 0.260 0.220 0.185

21

0.999 0.998 0.996 0.994 0.991

0.986 0.980 0.971

0.947

-

-

- -

o s a

-

- 2

___ 0.002 0.001 0.001 D.001 0.000

0.000 0.OOO 0.800 0.OOo 0.000

12

0.742 0.689 0.633 0.576 0.519

0.463 0.409 0.358 0.311 0.268

22

0.999 0.999 0.998 0.997 0.995

0.992 0.989 0.983 0.976 0.967

__

"

- -

__

- 3

-__

0.007 0.005 0.003 0.002 0.002

0.001 0.001 0.OOo 0.OOO 0.000

13

0.825 0.781 0.733 0.682 0.628

0.573 0.518 0.464 0.413 0.363

23

1.OOo 1 .o00 0.999 0.999 0.998

0.996 0.994 0.991 0.986 0.981

- -

- -

-

- 4

"

1.021 1.015 1.011 1.008 ).o05

1.004 1.003 3.002 3.001 3.001

14

3.888 3.854 D.815 0.772 0.725

0.675 0.623 0.570 0.518 0.466

24

-

-

-

-

1.Ooo 0.999 0.999

0.998 0.997 0.995 0.992 0.989 -

5

". - 3.050 3.038

I

1 3.020 1 3.028 1

1 3.015

D.011 1

0.008 1

0.006 1

0.004 1

0.003

15

0.932 0.907 0.878 0.844 0.806

0.764 0.718 0.669 0.619 0.568

25

"

"

"

"

1 .o00 0.999

0.999 0.998 0.997 0.996 0.994 "

- 6

"

0.102 0.079 0.060 0.046 0.035

0.026 0.019 0.014 0,010 0.008

16

0.960 0.944 0.924 0.899 0.869

0.835 0.798 0.756 0.711 0.664

26 -

1.N

1.W 0 . W 0.995 0.99t 0.99;

7

- 1.179 1.143 1.114 1.090 1.070

1.054 1.041 1.032 1.024 1.018

17 -

1.978 3.968 3.954 3.937 3.916

0.890 0.861 0.827 0.790 0.749

27

1 .o00 0.999 0.999 0.998

8

- 1.279 1.232 1.191 1.155 1.125

1.100 1.079 1.062 1.048 1.037

1.8

1.988 1.982 1.974 1.963 1.948

1.930 1.908 1.883 1.853 1.819

28

1.000 3.999 D.999

- 9

- 3.397 3.341 3.289 3.242 0.201

0.166 0.135 0.109 0.088 0.070

19 -

0.994 0.991 0.986 0.979 0.969

0.957 0.942 0.923 0.901 0.875

29 -

1 .o00 1.000

Page 379: ingenieria

TABLAS DE ESTADISTICA

Tabla II

FUNCION DE LA DISTRIBUCION DE POISSON (Continúa)

16 17 18 19 20 21 22 23 24 25

16 17 18

20 21 22 23 24 25

' is

16 17 18 19 I

m 21 22 23 2 4 25

19 20 21 22 23 24 25

-

4

- 0.000 O.Oo0 0.000 O.OO0 0.000 O.OO0 O.OO0 O.OO0 O.&O O.OO0

14

0.368 0.281 0.208 0.150 0.105 0.072 0.048 0.031 0.020 0.012

24

0.978 0.959 0.932 0.893 0.843 0.782 0.712 0.635 0.554 0.473

34

0.999 0.999 0.997 0.994 0.988 0.979 0.9ti(i

- -

- -

-

-

-

__

5

- 0.001 0.001 0.000 O.OO0 O.OO0 0.000 0.000 O.OO0 0.000 O.OO0

15

0.467 0.371 0.287 0.215 0.157

0.077 0.052 0.034 0.022

25

0.987 0.975 O. 955 0.927 0.888 0.838 0.777 0.708 0.632 0.553

35

1 .o00 0.999 0.998 0.996 0.993 0.987 0.978

- -

0 . w

- -

-

-

____

6

- 0.004 0.002 0.001 0.001 0.000 0.000 O.OO0 O.OO0 0.000 O.Oo0

16

0.566 0.468 0.375 0.292 0.221 0.163 0.117 0.082* 0.056 0.038

26

0.993 0.085 0.972 0.96) 0.922 0.883 0.832 0.772 O. 704 0.629

36

- -

- -

- -

1 .o00 0.999 0.998 0.996 0.992 0.985 -

7

- 0.010 0.005 0.003 0.002 0.001 O.OO0 O.OO0 O.OO0 0.000 O.Oo0

17

0.659 0.564 0.469 0.378 O . 297 0.227 0.169 0.123 0.087 0.060

27

0.996 0.991 0.!)83 O. 96!1 0.948 0.917 0.877 0.827 0.768 O. 700

37

_L_

-

-

""

-

-

0.999 0.999 0.997 0.995 0.991 __

8

- 0.022 0.013 0.007 0.004 0.002 0.001 0.001 0.000 O.OO0 O.OO0

18

0.742 0.655 0.562 0.469 0.381 0.302 0.232 0.175 0.128 0.092

28

0.998 0.905 o. 9'30 0.980 0.96G 0.944 0.913 0.873 0.823 0.763

38

__.

-

-

-

-

-

1.000 0.999 0.999 0.997 0.994

~

9

- 0.043 0.026 0.015 0.009 0.005 0.003 0.002 0.001 0.000 O.OO0

19

0.812 0.736 0.651 0,561 0.470 0.384 0.306 0.238 0.180 0.134

29

0.999 0.997 0.994 0.988 0.9781 0.963 0.940 0.908 0.868 0.818

39

-

-

-

-

-

-

1.000 0.999 0.998 D.997 __

10

0.077 0.049 0.030 0.018 0.011 0.006 0.004 0.002 0.001 0.001

20

0.868 0.805 0.731 0.647 0.659 0.471 0.387 0.310 0.243 0.185

30

-

__

0.999 0.999 0.997 0.993 0.987 0.976 0.959 0.936 0.904 0.863

40 -

1 .o00 0.999 0.998 -

11

0.127 0.085 0.055 0.035 0.021 0.013 0.008 0.004 0.003 0.001

21

0.911 0.861 0.799 0.725 0.644 0.558 0.472 0.389 0.314 0.247

31

-

-

1 .o00 0.999 0.998 0.996 0.992 0.985

0.956 0.932 0.900

0.973

41 -

0.999 0.999

12

0.193 0.135 0.092 0.061 0.039 0.025 0.015 0.009 0.005 0.003

22

0.942 0.905 0.855 (ai793 0.721 0.640 0.556 0.472 0.392 U,318

32

-

-

1 .o00 0.999 0,998 0.995 0.w1 0.983 0.971 0.953 0.929

42 -

1 .o00 3.999

371

--

13

"

0.275 0.201 0.143 0.098 0.066 0.043 0.028 0.017 0.011 0.006

23

0.963 0.937

0.849 0.787 0.716 0.637 0.555 0.473 0.394

33

- -

0:899

- -

1 .o00 0.999 0.997 0.994 0.989 0.981 0.9G9 0.950

43 -

-

1 .o00

Page 380: ingenieria

372 TABLAS DE ESTADISTICA

Tabla 111

FUNCION DE DISTRIRUC‘ION NORMAL

-3 0.0 0.1 0.2 0.3 0.4

0.5 0.6 0.7 0.8 0.9

1.0 1.1 1.2

1.4 1.3

1.5 1.6 1.7 1.8 1.9

2.0 2.1

2.3 2.2

2.4

2.6 2.6 2.7 2.8 2.9

3.0 3.1 3.2 3.a a.4

0.00 0.01 0.02

0.5OoO 0.5398 0.5793 0.6179 0.6554

0.6915 0.7257 0.7580 0.7881 0.8159

0.8413 0.8643 0.8849

0.9192 0.9032

0.93?2

0.9654 0.9452

0.9641 0.9713

0.9772 0.9821 0.9861 0.9693 0.9918

0.9938 0.9953 0.9965 0.9974 0.9981

0.9987 0.9990 0.9993 0.9996 0 . W

0.5040 0.5438 0.5832 0.6217 0.6591

0.6950 0.7291 0.7611 0.7910 0.8186

0.8438 0.8665 0.8869 0.9049 0.9207

0.9345 0.9463

0.9649 0.9564

0.9719

0.9778 0.9826 0.9864 0.9896 0.9920

0.9940 0,9955 0.9966 0.9975 0.-

0.9987 0 . m 1 0.9993 0.- 0.9997

0.5080 0.5478 0.5871 0.6255 0.6628

0.6985 0.7324 0.7642 0.7939 0.8212

0.8461 0.8686 0.8888 0.9066 0.9222

0.9357 0.9474 0.9573 0.9656 0.9726

0.9783 0.9830 0.9888 0.9698 0.9922

0.9941 0.9956

0.9976 0.9967

0.9982

0.9987

0.9994 0.9991

0.9995 0.9997

0.03 0.04

0.5120 0.51liO 0.5517 0.5557 0.T91.0 0.5948 0.6293 0.6331 O.GGG4 0.67W)

0.7019 0.7054 0.7357 0.7389 0.7673 0.7704 0.7967 0.7995 0.8238 0.8264

0.8708 0.8129 0.8485 0.8508

‘0.8907 0.8925 0.9082 0.9099 0.9236 0.9251

0.9370 q.9382

0.9582 0.9591 0.9484 0.9495

0.9732 0.9738 0.9664 0.9671

0.9788 0.9793 0.9834 0.8838

0.9901 0.9904 0.9871 I 0.9875

0.9925 0.9927

0.9943 0.9945 0.9957 0.9959 0.9968 0.9969 0.9977 0.9977 0.9983 0.9984

0.9988 0.9988 0.9991 0.9992 0.9994 0.9994 0.9996 0.9996 0.9997 0.9997

0.05 0.oti

0.51!)9 0.3238 0.55!J(; 0.5Ii:Hi

0.lW8 O.I;4W 0.5087 O.(i020

0.1~73fi O.lii72

0 . i O Y Y 0.7123

0.7734 0.7764 0.7422 0.7454

0.8023 0.8051 0.8289 0.8315

0.8531 0.8554 0.8749 0.8770 0.8944 0.8962 0.9115 0.9131 0.9Z65 0.9279

0.9394 0.9406

0.9599 ~ 0.9608 0.9505 0.9515

0.9744 0.9750 0.9678 0.9686

0.9798 0.9803 0.9842 0.9846 0.9878 0.9881

0.990s: 0.9909 0.9929 0.9931

0.9946 0.9948 0.9960 0.9961 0.9970 0.9971

0.9984 0.9985 0.9978 0.9979

0 . m 2 0.9992 0.9989 0.9989

0.9996 0.9996 0.9994 0.9994

0.9989 0.9997

0.07

0.9279 0.5075

0.íi443 0.0004

0.6808

0.7157

0.7794 0.7486

0.8078 0.8340

0.8577 0.8790 0.8980 0.9147 0.9292

0.9418

0.9616 0.9525

0.9693 0.9766

0.9850 0.9808

0.9911 0.9884

0.9932

0.9949 0.9962 0.9972

0.9985 0.9979

0.9992 0.9989

0.9995

0.9997 0 . p

0.08

0.5714 0.5319

O.ti4Y0 O.Iill)3

0.6844

0.7190 0.7517 0.7823 0.8106 0.8365

0.8599 0.8810 0.8997 0.9162 0.9306

0.9429

0.9625 0.9535

0.9761 0.9699

0.9812 0.9854 0.9887 0.9913 0.9934

0.9951 0.9963 0.9973 0.9980 0.9986

0.9990 0.9993 0.9995 0.9996 0.9997

O.@f

0.53.’r!l 0.575:{ 0.014 1 0.6517 0.6879

0.7224 0.7549 0.7852 0.8133 0.8389

0.8621 0.8830 0.9015 0.9177 0.9319

0.9441

0.9633 0.9645

0.9706 0.8967

0.9817 0.9857

0.9916 0.9890

0.9936

0.9952 0.9904 0.9974

0.9986 0.9981

0.9990

0.9995 0.9993

0.0907 0.9998 -

Page 381: ingenieria

TABLAS DE ESTADISTICA 373

- Y - 1 2 3 4 5

6 7 8 9 .

10

11. 12 13 14 15

16 17 18 19 2 0 :

21 22 28 24 25

26 27 28 29 id. -

Tabla IV

VALORES DE la*

a 7 0.10 a = 0.05 a = 0.025 , . a 0.01 (Y 0:005

3.078 1.886 1 .GS8 1.53 1.476

1.440 1.415 1.397 1.383 1.372

1.363 1.356 1.350 1.345 1.341

1.337 1.333 1.330 1.328 1.325

1.323 1.321 1.319 1.318 1.316

1.315 1.314 1.313 1.311 1.282

6.314 . 2.920 2.353 2.132 2.015

1.943 1.895 1.860 1.833 1.812

1.796 1.782 1.771 1.761 1.753

1.746 1.740 1.734 1.729 1.725

1.721 1.717 1.714 1.711 1.708

1.706 . . 1.703 1.701 1.699 1.645

12.706 4.303 3.182 2.776 2.571

2.447 2.365 2.306 2.262 2.228

2.201 2.179 2.160 2.145 2.131

2.120 2.110 2.101 2.093 2.086

2.080 2.074 2.069 2.064 2.060

2.056 2.052 2.048 2.045 1.960

311821 6.9G5 4.541 3.747 3.365

3.143 2.998 2.896 2.821 2.764

2.718 2.681 2.650 2.624 2.602

2;583 2.567 2.552 2.539 2.528

2.518 2.508 2.500 2.492 2.485

. 2.479 2.473 2.467 2.462 2.326

63.657 9.925 5.841 4.604 4.032

3.707 3.499 3.355 3.250 3.169

3.106 3.055 3.012 2.977 2.947

2.921 2.898 2.878 2.861 2.845

2.831 2.819 2.807 2.797 2.787

2.779 2.771 2.763 2.756 2.576

Y - 1 2 3 4 5

6 7 8 9

10

11 12 13 14 15

16 17 18 19 20

21 22 23 24 25

26 27 28 29 inf. -

o Esta tabla ea una abrwiacih de la tabla IV de R. A. Fisher, Statisrical Methods for Re- search Workers, publicado por Oliver y Boyd, Ltd., Edinburgh, con autorización del autor y los editores.

Page 382: ingenieria

TABLAS DE ESTADISTICA

c

Page 383: ingenieria

TABLAS DE ESTADISTICA 375

Page 384: ingenieria

TABLAS DE ESTADISTICA

I -

Page 385: ingenieria

TABLAS DE ESTADISTICA 377

1306 0422 6597 7965 7695 5160 2961 14% 3666 6543 9975 4866 8239 8722 1330 2296 3582 5872 1134 1403 3393 1137 7437 8414 8398 0995 6657 8875 8399 6703 4730 8400 3647 6789 2630 1374 1572 9678 0882 0006 461 1 1093 3374 3650 7292 2353 1094 0568 5606 8285

1189 2431 2022 6541 6937 7851 0551 4183 5642 6799 6080 0956 7068 9191 91 20 2952 7052 9207 6324 4497 7025 7896 5198 8820 5224 8935 0755 8369 6702 1024 1653 6834 8002 5197 2721 8625 7625 2877 6781 4205 9861 3784 3545 9676 6749 8319 2009 4002 4070 7537

5731 0649 6168 5645 0406 8464 0539 4312 4539 7454 7423 7545 6694 3386 8785 4764 3132 7222 6201 7390 3381 3602 8772 3917 2749 2939 9685 7868 0586 2064 9032 3187 6726 8037 2810 1644 9110 7579 3538 2389 7916 4190 6865 1436 7977 2850 8919 0587 5233 1181

Tabla VI1

DIGITOS AL AZAR* 3968 8085 5060 6243 8894 6789 8288 5445 1561 9052 3175 7723 5168 3443 8382 9070 4519 6494 3792 8503 3553 0060 6927 7238 7311 3092 4017 o190 6428 0393 9855 8688 0877 2354 2185 3342 4409 4935 4090 4365 9305 6332 8819 4374 760 2 40 26 5676 7165 4339 2300

5606 5053 8656 7658 0441 3938 7478 4854 7849 6689 9377 8085 3117 0434 2929

6356 9250 8973 5651 8239 2128 7850 8527 9821 5740 2496 6581 9278 7985 6815 0957 1079 4552 9262 6323 1587 0239 0440 3092 1981 2074 1175 3342 4716 9205 3027 7283 1094 6543 5294

5084 4722 6733 6903 8135 4197 7565 9157 7520 1946 6951 4948 1586 4586 7089 9192 2486 3545 0538 4236 1021 7626 6851 6073 9771 0359 7292 1709 2979 8502 7366 1480 3 238 5497 5679 0762 7059 8119 2365 8158 9462 8599 1676 5548 3599 1708 4082 2006 6695 6892

8947 6598 6364 991 1 9797 651 1 5581 9158 2547 2574 6519 2228 0237 4150 3109 4012 0830 6967 4676 8022 8353 0854 2709 6658 7826 0318 5643 4253 4513 1375 03 25 6776 7542 0005 493 1 6057 3415 6969 6001 7784 0254 9735 2264 8276 3880 3518 9642 747 1 5799 1627

3897 5044 7649 5740 7285 0407 5771 5218 0756 9386 8287 9583 6160 1224 6742 0618 8472 8490 2064 2914 6413 6565 5992 1280 9533 4697 5064 9346 1970 4171

5178 9888 7804 3986 8336 8011 5537 5383 3446 6256 4827 8584 6014 6235 9537 7034 7235 0940 56'21 3372

1636 9040 1871 7824 5905 9239 5442 1464 1206 0304

8994 4415 9585 6204 2468 2219 2160 5264 0584 4368 5161 4260 7383 9643 3800 7181 1142 4335 1989 6970 7959 7585 3933 1767 6662 2666 2250 1717 9985 3842 9198 6581 501 2 6742 4423 7132 8167 4366 3953 1952

7810 5121 43 28 8820 9539 2232 8761 3634 2033 7945 5532 7065 1133 0937 7025 1109 7046 9821 7996 4529 8583 6220 1071 7761 4553 4035 1297 3760 3105 1201

5371 9998 9475 7981 3566 3759 7292 6719 6007 5603 3974 7194 2458 2154 2330 6903 3366 9554 9458 3028

De Donald B. Owen, Handbook of Statistical Tables. Reading, Mass; Addison Wesley, 1962

Page 386: ingenieria

378 TABLAS DE ESTADISTICA

2444 5748 7761 6838 6440

8829 9845 5072 9035 5562

2757 6397 9208 2418 7300

6870 2914 0868 7994 8587

8016 5581 2015 73 27 3589

21% 2924 1961 2393 7585

0197 9719 8866 5744 7149

7710 5246 3576 3026 6691

0402 7105 7181 3655 5121

3618 ,

0166 6187 1234 8949

WN 7767 8583 9280 2631

0094 4796 9000 0553 1080

2650 1848 7641 9289 9006

2535 7309 8657 6579 0764

8345 5775 3364 8987 1991

6454 0472 1669 9637 4424

4021 5336 4785 3957 5721

8479 5651 0013 1464 4365

3257 7654 4140 3282 6717

3098 3638 9653 1448 8731

4803 2800 0852 2654 3033

2887 2951 3887 1272 2222

8727 1476 3575 6120 5659

8916 4045 8118 6461 6687

2257 7517 6688 5741 1764

7319 9878 2219 0410 2648

9207 5532 6007 8786 1389

9345 043 2 7381 2671 8717

0480 4745 1046 2178 3117

9208 4947 3658 0276 4875

Tabla VI!

DIGITOS AL AZAR (C

8568 1590 2420 6289 2814 8381 5619 6864 8506 0812 3988 2146 9167 4998 7036

3802 5497 0318 4449 1999 2691 5739 7920 6074 2600 3828 8197 0336 1411 0303

3953 9579 2442 0787 4990 4666 4279 1282 1840 8141 3908 5577 8258 3662 0332

3245 2256 4350 7513 3195 4166 6340 9452 7460 2292 9554 8309 9150 1642 2050

5084 8004 7949 M76 4699 8313

O102 1173 7350 2K31 2152 32'30

8355 9684 9423

1215 0473 6589 7966 2491 5662 1113 9175 0260 7536 0972 5153 6728 2233 3518

7327 9212 7015 8537 2980 8252 8006 9043 4109 9023 1472 7275 6581 7196 7072

7773 9086 1202 8644 6341 9661 0124 8559 9813 4691 0353 5289 2365 5686 8377

5038 1998 2935 4482 8471 1424 0885 1264 7755 8134 3291 7262 1901 5184 6467

7429 1578 1917 1414 4799 9189 4730 1652 8096 7290 1667 2823 5724 2962 1182

'onrinúo)

2547 1549 9643 5095 0133

5168 5328 4715 8852 7424

8041 1208 5999 3590 5369

6064 0878 3291 5036 4934

3205 8401 1637 7080 7101

2355 5635 4046 0708 7267

8060 4971 5570 1014 6360

8845 2361 9080 8754 8675

1306 2031 1653 8229 8954

7927 2459 8288 3755 2930

2470 9519 7763 0150 7428

63 77 7674 3681 9092 3713

9869 2769 1806 2317 3640

2438 5184 5778 0974 0027

3972 7147 8333 7420 1063

9579 2789 8142 1935 1732

6216 O110 9249 1104 3084

3163 8377 6984 2442 9798

1190 7803 8924 2866 3884

2696 5056 '3368

7539 5642

8179 4617 3341 1192 9611 1289 8043 9079 9702 1376

9216 2802 7004 6212 2721 2701 8037 6144 9278 1918

2887 3933 3922 1158 7809 5885 8975 4593 0563 7939

2002 1272 6680 2855 1167 0312 9517 8293 1376 5040

7640 3478 9416 7184 4838 5699 1847 0741 4151 4875

7004 6209 2564 1249 4432 2664 1143 1704 1926 3833

1942 6817 6209 1556 9905 2152 0832 7680 7009 0239

7937 6163 8673 6098 0926 2160 7799 8953 7745 6360

2406 2596 4367 6816 5822 4401 7065 4806 0279 8635

3704 O833 5982 6154 5531 7588 4854 8844 .I526 7252

Page 387: ingenieria

TABLAS DE ESTADISTICA 379

Tabla VI1

DIGITOS AL AZAR (Confinúa)

4357 5339 6583 6564 481 1

6931 8755 6742 6655 8514

8135 4414 3727 5434 7195

2705 1547 3424 8969 5225

6432 3085 O264 8710 5736

7529 5133 3170 3024 4398

0082 4351 3268 4391 7328

3835 8731 2995 5592 3081

7406 5969 4765 3219 6906

7993 2549 3672 2217 3162

4146 7325 8433 3526 1933

7236 3390 2260 3930 4806

5004 6855 7959 7342 8828

8245 8981 1435 7551 8720

9861 5903 1246 2419 9001

1339 7995 9915 o080 3121

5419 6516 0086 8487 0705

2938 4981) 7868 9028 5876

4439 9442 9647 2532 8859

3141 3737 7033 02w

8353 6862 0717 2171 3763

1230 6120 3443 9014 4124

7299 0127 5056 0314 9869

6251 4972 1354 3695 X898

1516 8319 3687 6065 3132

4802 8030 6960 1127 7749

7659 6814 7580 4884 0652

2671 8674 0683 5660 8150

5683 7696 4364 7577 5044

0103 7686 4844 3978

9952

0606 3809 6265

0441 7825 0190 6032 9286

8981 5489 5983 7252 2785

9611 1280 7631 4915 2478

2849 2744 9759 0036 4521

5751 7408 2621 8088 8191

2061 5898 1337 1488 9424

4691 4506 3768 5006 1360

6877 7510 1037 2815 8826

4528 0723 0149 5933 1258

7584 80c4 7945 8634 3485 9284 2719 3428 5523 8931 0649

4013 1352 9005 7012 9278 1816 7574 1685 0449 5051

4689 1950 5157 6386 8021 0204 0067 2800 3186 8375

1077 0641 4286 5678 7260 7361 7921 2913 3342 9200

2539 2208 0814 7318 6995 6565 9650 2027 9973 5070

3785 7125 2186 0725 6718 4059 0200 5868 2087 8270

2506 7573 5973 8103 3884 5679 22.39 6661 7082 8579

o m a382 7262 8127 0625 9887 8325 9677 1868 9265

2920 9588 1620 4973 4975 1998 8696 9248 6218 3206

7988 4635 4505 6841 7412 6370 1032 5192

1530 2278 1888 9078 8085

6563 1643 7697 5258 4772

2271 7492 761 6 6292 7414

0195 0338 0151 3840 8836

4595 8619 3949 6042 8078

4922 5554 9919 0084 5233

1.157 36i6 4830 5774 5647

2825 2022 7060 2169 3277

3002 1911 1359 9410 9034

8478 137Y 1884 1732

5207 4730 5632 0612

0648 7768 6177 4450

1499 ,7332 9934 4044 7933 0067 3100 5358 4651 0038

2201 '8344 3736 7164 4325 7454 4706 3454 7232 0401

7024 6202 8096 8284 gh.7 9056 9031 9747 7269 2992

8616 6170 7614 3265 1012 ,0179 5467 1839 4150 2276

8877 9530 5664 ' 6791 1007 ti469 6362 6808 3980 6774

3979 2309 2049 7843 4509 9587 7205 2717 5571 96G7

4928 5379 2178 7463 0514 0034 3196 0357 8465 7502

2869 3746 1288 6160 1346 6125 9282 6572 0843 9832

9094 9077 6460 1869 0717 5740 2137 9357

2889 0285

1967 8118 2765 3326 2139

3068 7022 2906 1929 1580

3852 0498 5039 6881 2483

3899 7010 8684 9735 6281

5865 5999 0059 5577 5059

6499 9677 5410 3727 8522

081 1 O568 2184 0730 5855

8635 48&2 8000 781 1 6458

3690 9797 5078 3940 2703

5306 5700 8.177 5'3.11

Page 388: ingenieria

380 TABLAS DE ESTADISTICA

1758 6430 4893 1516 4950

0549 1018 2241 1602 5840

1676 6048 5549 5317 2532

2300 1409 620 1 6839 0092

1862 9886 5289 2685 6055

4092 5951 7687 8665 3193

9181 9459 9874 7729 4699

1872 9636 6403 4433 2361

4077 6678 6499 6663 9999

9048 5136 9900 4198 2030

1489 8803 8857 2733 3171

6775 7027 9965 0708 8381

0367 4175 9621 4584 7784

5412 8699 3791 9736 5537

3253 6744 9071 7104 7092

4995 4937 3849 3463 3011

7365 2175 5278 2099 8102

7244 o123 9054 32% 3933

8463 0006 2582 9021 4503

6982 9653 1070 7035 5878

2774 0478 1717 7326 5756

9360 7569 9729 2201 1549

7484 8940 2563 9418 6469

3106 4534 2946 8312 1933

6515 3097 1231 7193 4786

0280 3670 4821 2055 8899

9135 5728 2849 7513 3001

3954 2438 763 2 2314 802G

6580 3686 5207 0319 6105

3845 3654 5693 8182 8989

Tabla VI1

DIGITOS AL AZAR (Confincia)

6033 4157 1533 8674 3036

6639 7549 7092 9848 9902

1595 9029 0515 4600 4793

4877 5367 2863 8068 3186

6299 8894 0651 5506 6847

9371 5797 2373 4872 6721

1669 4933 3163 2774 794 7

7422 1757 7469 743 1 043 1

6983 8478 4627 7908 5525

6865 2863 3012 0270 0789

9813 5626 6572 9233 9047

o990 2539 4891 6241 6935

5693 8306 0560 O640 5957

6936 7557 5684 7339 8482

2929 0446 9109 2993 4543

3375 5030 1157 2702 0086

2007 o111 6372 6030 1659

2688 4204 8973 2389 8012

0181 9187 0456 1241 1068

9029 5505 1218 M61 4 : w

1052 1603 8408 1799 8719

0037 2315 9239 1084 3681

3008 8892 9021 9668 41 23

4109 2701 5517 5395 6680

2219 3494 7448 7028 7448

3503 6524 4208 1807 2623

7784 6703 2600 8260 6571

8649 1650 3332 4094 3214

3327 2291 4245 9977 6272

8700 8923 7309 2079 1 Y20

1816 1339 2173 5281 8498

7309 8030 0738 8142 6420

9816 4127 0632 6379 6555

8060 2587 7448 9559 2656

9145 8211 2228 4830 2017

4496 2265 3623 9056 7977

6363 1234 9887 9023 1969

0156 2486 0294 506 2 8927

681 2 9032 3583 7042 7036

o349 5596 4361 2998 S!)(;:{

7484 4666 4754 0797 1312

4702 7663 1804 8555 0214

7311 1709 4309 6515 3237

1896 2521 2227 3416 1864

7511 1723 9700 3866 4114

8642 7748 9399 8576 7578

6913 2410 7060 1368 7152

1965 0002 5062 O118 7355

1755 9852 8996 6923 O200

3416 8389 3041 5507 9l!N

1699 1207 0272 0885 7124

0812 3881 3025 7291 8489

6162 4043 4044 6310 6915

6881 2159 8991 6169 4535

2146 6138 0224 8698 8385

5388 7875 7349 4237 4024

6017 1620 3919 9513 7356

501 2 4724 0303 0046 0585

3387 1450 1006 2539 6291

8236 9927 4327 m 5 7751

7350 2135 1305 0947 4787

4195 8264 1030 5016 591 1

1024 6591 7010 7916 6960

7028 6991 7505 5484 2193

4962 3181 4595 0277 3625

1831 6976 6663 8757 1997

6588 4859 1111 6122 1062

2461 7412 7315 6070 7638

4569 7940 5839 2103 2841

1129 9092 8423 6734 OR37

Page 389: ingenieria

TABLAS DE ESTADISTICA 381

Tabla Vlll(a)

0.95 INTERVALOS DE CONFIANZA PARA PROPORCIONES' - x/n too 0.9E 0.94 0.90 0.86 0.82 (

zE" 0.00 0.04 '.0.08 0.12 0.16 o. 2

* Reproduccicjn de la tabla 41 de Biornerrika Tables f o r Sfarisricians, Vol. T [New York: Cambridge University Pres, 1954) con autorizacijn de Biometrika fideicomiso.

Page 390: ingenieria

382 TABLAS DE ESTADISTICA

Tabla Vlll(b)

0.99 INTERVALOS DE CONFIANZA PARA PROPORCIONES*

* Reproducckjn de l a tabla 41 de Biometrika Tables for Statisticians, Vol. I (New York: Cambridge University Press, 1954) con autorización de Biometrika fideicomiso.

Page 391: ingenieria

TABLAS DE ESTADISTICA 383

Número de muestra

)2

1 2 3 4 5

6 7 8 9 10

11 12 13 14 15

16 17 18 19 20

25 30

Tsbla tX

VALORES CRITICOS DE D*

D.la

0.950 0.776 0.642 0.564 0.510

0.470 0.438 0.41 1 0.388 0.368

0.352 0.338 0.325 0.314 0.304

0.295 0.286 0.278 0.272 0.264

0.24 0.22

D.06

0.975 0.842 0.708 0.624 0.565

0.521 0.486 0.457 0.432 0.410

0.391 0.375 0.361 0.349 0.338

0.328 0.318 0.309 0.301 0.294

0.27 O. 24

D.ot

0.995 0.929 0.828 0.733 0.669

0.618 0.577 0.543 0.514 0.490

0.468 0.450 0.433 0.418 0.404

0.392 0.381 0.371 0.363 0.356

0.32 0.29

Adaptado de F. J. Massey, Jr., "The Kolgornorov-Smilnov test for goodness of flit" J. Amer. Sfatist. Ass., Vol. 46 (1951), p. 70 con autorización de autor y editores.

Page 392: ingenieria

384 TABLAS DE ESTADISTICA

1 2 :Jl ,I 5

6 7 8 9

10

11 12 13 14 15

16 17 18 19 20

24 30 40 60

120

m

Tabla Xta)

VALORES DE rp PARA a! = 0.05*

2 3 4 5 6 7 8 9 10

7.97 .) .O9

I .50 3 . ! ) 3 3.64

3.46 3.34 3 . x ; 3.20 3.15

3.11 3.08 3.06 3.03 3.01

3.00 2.98 2.97 2.96 2.95

2.92 2.89 2.86 2.83 2.80

2.77

6.09 4.52 4.01 3.75

3.59 3.48 3.40 3.34 3.29

3.26 3.23 3.20 3.18 3.16

3.14 3.13 3.12 5.11 3.10

3.07 3.03 3.01 2.98 2.95

2.92

4.52 4.03 3 .SO

3.65 3.55 3.48 3.42 3.38

3.34 3.31 3.29 3.27 3.25

3.23 3.22 3.21 3.20 3.19

3.16 3.13 3.10 3.07 3.04

3.02

4.03 3.81

3.68 3.59 3.52 3.47 3.43

3.40 3.37 3.35 3.33 3.31

3.30 3.28 3.27 3.26 3.25

3.23 3.20 3.17 3.14 3.12

3.09

3.81

3.69 3.61 3.55 3.50 3.47

3.44 3.41 3.39 3.37 3.36

3.34 3.33 3.32 3.31 3.30

3.28 3.25 3.22 3.20 3.17

3.15

3.70 3.62 3.57 3.52 3.49

3.46 3.44 3.42 3.40 3.39

3.38 3.37 3.36 3.35 3.34

3.31 3.29 8.27 3.24 3.22

3.19

3.63 3.57 3.54 3.51

3.48 3.46 3.44 3.43 3.41

3.40 3.39 3.38 3.38 3.37

3.35 3.32 3.30 3.28 3.25

3.23

3.58 3.54 3.52

3.49 3.47 3.4B 3.44 3.43

3.42 3.41 3.40 3.40 3.39

3.37 3.35 3.33 3.31 3.29

3.27

3.55 3.52

3.50 3.48 3.47 3.46 3.45

3.44 3.43 3.42 3.41 3.41

3.39 3.37 3.35 3.33 3.31

3.29

H. L. Harter. Contiene algunos valores corregidos para reemplazar a los dados por D. B. * Esta tabla se reproduce de “Critical values for Duncan’s new multiple range test”, por

Duncan en su “Multiple Range and Multiple F Tests”, Biometrics, Vol. I1 (1955). La tabla anterior se reproduce con permiso del autor Y el editor de Biometrics.

Page 393: ingenieria

TABLAS DE ESTADISTICA 385

1 2 3 4 5.

6 7 8 9

10

11 12 13 14 15

16 17 18 19 20

24 30 40 60

1 20

m

Tabla X(b)

VALORES DE rp PARA a = 0.01*

0.02 4.04 14.04 8.26 8.32 6.51 6.68 5.70 5.90

5.24 5.44 4.95 5.15 4.74 4.94 4.60 4.79 4.48 4.67

4.39 4.58 4.32 4.50 4.26 4.44 4.21 4.39 4.17 4.34

4.13 4.31 4.10 4.27 4.07 4.25 4.05 4.22 4.02 4.20

3.96 4.13 3.89 4.06 3.82 3.99 3.76 3.92 3.70 3.S

3.64 3.80

8.32 6.74 5.99

5.55 5.26 5.06 4.91 4.79

4.70 4.62 4.56 4.51 4.46

4.43 4.39 4.36 4.33 4.31

4.24 4.17 4.10 4.03 3.07

3 .(a

6.76 6.04

5.62 5.33 5.13 4.99 4.88

4.78 4.71 4.64 4.59 4.55

4.51 4.47 4.45 4.42 4.40

4.32 4.35 4.18 4.11 4.04

3.08

6.07

5.66 5.38 5.19 5L04 4.93

4.84 4.77 4.71 4.66 4.61

4.57 4.54 4.51 4.48 4.46

4.39 4.31 4.24 4.18 4.11

4.04

5.68 5.42 5.44 5.23 5.26 5.28 5.09 5.12 5.14 5.16 4.98 5.01 5.04 5.06

4.89 4.92 4.95 4.97 4.81 4.85 4.88 4.91

4.70 4.74 4.77 4.80 4.66 4.70 4.73 4.76

4.63 4.66 4.70 4.72 4.59 4.63 4.66 4.69 4.56 4.60 4.64 4.66 4.53 4.57 4.61 4.64 4.51 4.55 4.59 4.62

4.44 4.48 4.52 4.55 4.36 4.41 4.45 4.48 4.29 4.33 4.38 4.41 4.23 4.27 4.31 4.34 4.16 4.20 4.24 4.27

4.00 4.13 4.17 4.21

4.75 4.79 4.82 4.85

H. L. Harter. Contiene algunos valores corregidos para reemplazar a los dados por D. B. * Esta tabla se reproduce de "Critical values for Duncan's new multiple range test", por

Duncan en su "Multiple Range and Multiple F Tests", Biometrics, Vol. I1 (1955). La tabla anterior se reproduce con permiso del autor Y el editor de Biometrics.

Page 394: ingenieria

386 TABLAS DE ESTADISTICA

observaciones Número de

muestra. n en la

2 3 4 5

6 7 8 9

10

11 12 13 14 15

"-

Tabla XI

TABLA DE CONSTANTES DE CONTROL' ""

Tabla para promedios 1 Tabla para desviaciones standard -

I- [Factor

lfmites de control

A AI AP ea

2.121 3.760 1.880 0.5642 1.732 2.394 1.023 0.7236 1.500 1.883 0.729 0.7979 1.342 1.596 0.577 0.8407

1.225 1.410 0.483 0.8686 1.134 1.277 0.419 0.8882 1.061 1.175 0.373 0.9027

0.949 1.028 0.308 0.9227 1.ooO 1.094 0.337 0.9139

0.905 0.973 0.285 G.9300 0.866 0.925 0.266 0.9359

0.802 0.848 0.235 0.9453 0.832 0.884 0.249 0.9410

0.775 0.816 0.223 0.9490

limites de control Factor para

BI

O O O O

0.026 0.105 0.167 0.219 0.262

0.299 0.331 0.359 0.384 0.400

- Bz

2.266 O 1.808 2.089 O 1.756

2.568 O 1.8558 3.267 O 1.843

Bs 1 B4

1.711 0.030 1.970 1.672 0.118 1.882 1.638 0.185

0.239 1.609 1.815

1.718 0.284 1.584 1.761

1.561 .0.321 1.679 1.541 0.354 1.646 1.523 0.382 1.618 1.507 0.406 1.594 1.492 0.428 1.572

-

"__

. . Tabla para hderas

Factor !

les

dr DI "-

"

1.128

O 2.059

O 1.693 O

2.326 O

2.534 O 2.704 0.205 2.847 0.387 2.970 0.546 3.078 0.687

3.258 0.924 3.173 0.812

3.336 1.026 3.407 1.121 3.472 1.207

- Da

3.686 4.358 4.69X 4.918

5.078 5.203 5.307 5.394 5.469

5.534 5.592 5.646 5.693 5.737

-

_.

Da Dd

O 3.267 O

2.282 O 2.575

2.115 O

0.376 1.924 o 2.004

0.136 1.864 0.184 1.816 0.223 1.777

0.256 1.744 0.284 1.716 0.308 1.692 0.329 1.671 0.348 1.652

" __

of Materials, American Society Cor Testing of Materials, Philadelphia, Pa., 1951. * Esta tabla se reproduce con permiso de la ASTM, de su Manual on Quality Control

Page 395: ingenieria

TABLAS DE ESTADISTICA 387

.;

-

2 3 4 5 6 7 8 9

10

-

Tabla XI1

FACTORES PARA LIMITES DE TOLERANCIA POR AMBOS LADOS*

2 3 4 5 6 7 8 9

10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

100 I50 200 50 # O 0

O0 ' 0 0

O0 00 o0 O0 00 m

T 0.90

32.019 8.380 5.369 4.275 3.712 3.369 3.136 2.967 2.839 2.737 2.655 2.587 2.529 2.480 2.437 2.400 2.366 2.337 2.310 2.208 2.140 2.090 2.052 2.021 1.996 1.976 I .958 1.943 1.929 1.917 1.907 1.S97 1.889 1.881 1 .S74 1.825 1.798 1.780 1.767 1.749 1.737 1.729 1.722 1.717 1.712 1.709 1.645

1 - (Y = 0.95

0.95

37.674 9.916 6.370 5.079 4.414 4.007 3.732 3.532 3.379 3.259 3.162 3.081 3.012 2.954 2.903 2.858 2.819 2.784 2.752 2.631 2.549 2.490 2.445 2.408 2.379 2.354 2.333 2.315 2.299 2.285 2.272 2.261 2.251 2.241 2.233 2.175 2.143 2.121 2.106 2.084 2.070 2.060 2.052 2.046 2.040 2.036 1.960

0.99

48.430 12.861 8.299 6.634 5.775 5.248 4.891 4.631 4.433 4.277 4.150 4.044 3.955 3.878 3.812 3.754 3.702 3.656 3.615 3.457 3.350 3.272 3.213 3.165 3.126 3.094 3.066 3.042 3.021 3.002 2.986 2.971 2.958 2.945 2.934 2.859 2.816 2.788 2.767 2.739 2.721 2.707 2.697 2.688 2.682 2.676 2.576

- 1 - a = 0.99

"

"

I

-

0.90

160.193 18.930 9.393 6.612 5.337 4.613 4.147 3.822 3.582 3.397 3.250 3.130 3.029 2.945 2.872 2.808 2.753 2.703 2.659 2.494 2.385 2.306 2.247 2.200 2.162 2.130 2.103 2.080 2.060 2.042 2.026 2.012 1.999 1.987 1.977 1.905 1.865 1.839 ~

1.820 1.794 1.777 1.764 1.755 1.747 1.741 1.736 1.645

0.95

188.491 22.401 11.150 7.855 6.345 5.488 4.936 4.550 4.265 4.045 3.870 3.727 3.608 3.507 3.421 3.345 3.279 3.221 3.168 2.972 2.841 2.748 2.677 2.621 2.576 2.538 2.506 2.478 2.454 2.433 2.414

2.382 2.397

2.368 2.355 2.270 2.222 2.191 2.169 2.138 2.117 2.102 2.091 2.082 2.075 2.068 1.960

-1 ____

0.99

242.300 29.055 14.527 10.260 8.301 7.187 6.468 5.966 5.594 5.308 5.079 4.893 4.737 4.605 4.492 4.393 4.307 4.230 4.161 3.904 3.733 3.611 3.518 3.444 3.385 3.335 3.293 3.257 3.225 3.197 3.173 3.150 3.130 3.112 3.096 2.983 2.921 2.880 2.850 2.809 2.783 2.763 2.748 2.736 2.726 2.718 2.576

Adaptado con permiso de Techniques of Sratistical Analysis by C. Eisenhart, y M. W. Hastay, and W. A. Wallis. Copyright 1947, McGraw-Hill Company, Inc.

Page 396: ingenieria

388 TABLAS DE ESTADISTICA

Tabla Xlll

CODIGO DE LETRAS PARA TAMANO DE LA MUESTRA DE MIL-STD-I05 D

Lofe

2 a 8 9 a 15 16 a 26

26 a M) 51 a 90 91 a 150

151 a 280 281 a 500 501 a 11m

1,201 a 3,200 3,201 a 10,Ooo 10,001 a 35,000

35,001 a 150,OOO 150,001 a 500?000 500,001 y superlores,

I Niveles de inspección general

I

A A B

C C D

E F G

H J K

L M N

I1

A B C

D E F

G H J

K L M

N P Q

I11

B C D

E F G

H J K

L M N

P Q R

-

Page 397: ingenieria

TABLAS DE ESTADISTICA 389

Page 398: ingenieria
Page 399: ingenieria

RESPUESTAS A LOS'PROBLEMAS I ' . '

CON NUMEROS IMPARES

I .

i

. .

En los ejercicios que requieren cdlculos rluméricos extensos. el lector puede llegar a resul- tados diferentes a l o s que aparecen a continuación, debido a los redondeos que se halt hecho en los pasos intermedios. , .

Page 400: ingenieria

392

1.

3. 5.

7.

9.

11. 13.

15. 17. 19.

1.

3. 5. 7.

11. 15.

1.

3.

9. 11. 13.

RESPUESTAS A LOS PROBLEMAS CON NUMEROS IMPARES

Página 21

4, M n G/, M n G, M’ n G, M’ n G’, M , ( M n G’) u (M’ n c), e , a, (M n G) u (M’ n G / ) , M’, M’ u G, M’ u G’, M u G‘, M u G, s. (a) 85; (b) 40; (c) 70; (d) 55; (e) 10; (f) 30. (a ) Sí; (b) No; ( c ) NO; (d) Sí.

(a) 0.30; (b) 0.10; (c) 0.20; (d) W6;(e) 0.44; (f) 0.73.

(a) 1/26; (b) 1/2; (c) 3/13; (d) 1/13. .I

(a) 13/25; (b) 31/75; (c) 9/25; (d) 8/75. (a) 0.92; (b) 0.14; (c) 0.84; (d) 0.62. 0.0051. (a) P ( A Cj C ) no puede ser menor que P(A ) ; (b) P ( B n C) no puede ser mayor que P ( B ) ; ( c ) P ( A 0 B ) = P ( A ) puesto que A y B son mutuamente excluyentes.

Página 30

2/3 y 4/7.

(a) 16/31; (b) 4/13; (c) 8/13; (d) 2/11; (e ) 2/3; (f) 25/49. (a) 6/25; (b) 1/2; (c) 394/709. (a) 16/25; (b) 156/245. 9. 0.415. 0.651 y 0.274. 13. 0.51. 5/13.

PBgina 41

f ( 0 ) = 1/20, f(1) = 2/20, f(2) = 3/20, f(3) = 4/20, f(4) = 4/20, f(5) = 3/20, f ( G ) = 2/u),f(7) = 1/20. (a ) Sí; (b) Sí; (c) No; (d) No.

(a) 0.4032; (b) 0.18.59; (c) 0.5075; (d) 0.2312; (e) 0.0432; ( f ) 0.9997,

(a) 0.3741; (b) 0.9912; (c) 0.2078. (a) 0.9410; (b) 0.7338; (c) 0.4797; (d) 02713.

PSpinr 47

1. (a) 60/143; (b) 102/143; (c) 102/143; (d) 999/1001.

3. (a) 385/969; (b) 682,469: (c) 53/9G9

Page 401: ingenieria

RESPUESTAS A LOS PROBLEMAS CON NWMEROS IMPARES 393

5. (a) 0.5120; (b) 0.2160; (c) 0.0640; (d) 0.0080.

7. 0.135, 0.271, 0.271, 0.180, 0.090, 0.036, 0.012, 0.004, 0.001, 0.000, etc.

9. (a) 0.070; (b) 0.033; (c) 0.900.' '

> . .

11. 0.368, 0.368, y L 0.184. 13. 0.005.

Página 55, . .'

1. p = 26/31 y = 1122/961. 3. p = 2.4 y U' = 0.24.

9. 0.8889 y 0.9994.

11. 250. I, .

Página 57

1. 35/34,992. t. 3. ,0.003, . ,

Pagina 63

3. (a) k = 1/5; (b) F(z) = O para 2: 5 O y F(z) = 1 - paraz > O; ( c ) 0.1809; ' (d) 0.5507; (e) 0.3012.

5. l/r. 7. /l = 4,'s y U? = 2j25.

9. /l = 1/2 y u2 = 1/20.

PSgina 68

3. (a) 0.9772; (b) 0.0250; (c) 0.0049; (d) 0.9901; (e) 0.3413; (í') 0.2640; (6) 0.1510;

7. (a) 0.04G5; (b) 0.2743; (c) 0.G594; (d) 0.1979.

9. (a) 0.0202; (b) 0.8788. ' s . 11. 0.8$31. , , ' . . < . ' .

(h) 0.9608.

*, ,

13:. 18.1%. . , !. . . . \

Página 74 , , . d '

1. P(z) = O para 2: 5 a, I:($) = - P - f f para a < z <.PI F(z) , = 1 para X 2 p.

3. 0.76. ,. -, ' /

2--a!

. 5. F(z) = O para z 5 0, P(z) = 1 - e--t'fi para 2: > O: 0.135.

13. 0.007. ,

Page 402: ingenieria

394 RESPUESTAS A LOS PROBLEMAS CON NUMEROS IMPARES

PBgina 77

1. (a) 3/256; (b) 1/2. 3. (a) k = 1; (b) 2 (1 - ;); (o) l/e*. 1 1

Mgina 83

1. No, lo esperado es sólo $ 12.1 8. 3. ( b ) A obtiene $11 y B obtiene $ 5 .

5. Cuando el 3% es de defectuosos es mls barato hacer la instalación sin comprobar; cuan- do hay un 6%, es mls barato comprobar.

7. Almacén 3, el provecho máximo esperado es $ 3.825

9. 50%.

Peina 90

1. 0.082. 5. (a) 2; (b) 4/3; (c) 2/3; (d) 5/9.

7. 11/16. 9. (a) 1/3; (h) 1/3. 11. (a) 0.94; (b) 0.76; (c) 0.57; cuando los impares estan contra .usted, apueste lo máximo

posible cada vez.

PBgina 106

1. Una posible respuesta es: El intervalo de clase es 2; el límite inferior de clase es 15.0, 17.0, 19.0, 21.0, 23.0, 25.0, 27.0, 29.0; los límites superiores de clases son 16.9, 18.9, 20.9, 22.9, 24.9, 26.9, 28.9, 30.9; las fronteras de clase son 14.95, 16.95, 18.95, 20.95, 22.95, 24.95, 26.95, 28.95, 30.95; las marcas de clase son 15.95, 17.95, 19.95, 21.95, 23.95, 25.95, 27.95, 29.95.

3. Las clases 0.10-0.14, 0.15 -0.19,. . . y 0.45 -0.49 tienen, respectivamente, las frecuen- cias 2, 5, 14, 28, 32, 13, 5 y 1.

5, Sí, pr6ximo a una distribuci6n normal.

9. Si, siguen el patrón de una distribución normal. 13. (a) O, 1, 2, 3, 4, 5 y 6 impedecciones con frecuencias de .12, 11, 9, 6, 8, 3 y 1, respecti-

vamente; las frecuencias acumulativas “O más” son 50, 38, 27, I S , 12, 4, 1 y O.

15, Cada dimensión debe multiplicarse por %% en lugar de por 2.

Page 403: ingenieria

RESPUESTAS ALOS PROBLEMAS CON NUMEROS IMPARES 3%

Pdgina 114

7. 5 = 45,753 y 8 = 14,203. 9. f = 2.00 y S = 1.69. 11. 8 = 0.0665. 13. (a) $29,500.

PBgina 125

7. /.ts = 2.5 y U$ 0.625. 11. 0.8664.

13. 0.8904.

Pagina 131

1. t = --.OX, ia informacibn refuta la afirmación,

3. t = 4.74, e1 proceso está fuera de control. 5. 0.95.

7. 0.02. 9. 0.308.

Pdgina 139

1. El error no excederá de 0.0067 calorías.

3. (a) El error no excederá de 1.55 minutos; ( b ) 41.1 - 43'9.

5. n = 246. 7. 12.79 - 12.83.

9. El mayor error es 0.181; 5.50 - 5.86.

11. 0.92. 13. n = 18.

i5. (a> (3,319 {3,6>, (3, 91, (3, 121, . (3, 151, {6,6>, {6,9>, (6, 12}; (6, 15}, (9, o), (9, 121, (9, 1-51, f lz , la:, 32, 151, (15, 15).

17. Las probabilidades para p = 46, p = 50, y u = 55 , son. respectivarncnte. 0 . 0 1 I8 0.2436 y 0.7446; la estimación Bayesiana de p es 53.7.

PBgina 149

Page 404: ingenieria

396 RESPUESTAS A LOS PROBLEMAS CON NUMEROS IMPARES

7. t = -1.95; no se puede rechazar I!,.

11. (a) I.( = 0.006 y u = 0.0036; (b) 0.0475.

13. t = -3.74; rechazar la hipbtesis nula.

15. z = 3.77; rechazar la hipjtesis nula.

17. t = 1.91; no se puede aceptar la hipótesis de que los bolos de plástico duren 1000 horas más en promedio.

19. t = 2.20; l a diferencia no es significativa.

[(n, - 1)s: + (?2? - I)s;l(nl + nz), n1n2(7L, + n2 - 2)

Página 166

1. (a) 31.0; (b) 35.5. 3. 1.15 - 5.52. 5. (5) 13.2 - 23.6; (b) 13.3 - 23.4. 7. 0.033 - 0.057.

Página 171

1. x2 = 5.12; no se puede rechazar l a hiphtesis de que = 1.5.

3. X' = 5.5; n o se puede rechazar la hipótesis de quc u = 0.01. 5. z = -2.01; rechazar la hip6tesis nula.

7. E' = 1.1s; l a afirmación no es razonable sobre la base de los datos dados.

9. F = 2.25; no se puede rechazar la hip6tesis nula.

Página 178

3. 0.58 - 0.71.

7. n = 385; TI = 351. 11. 0.0155.

5. (a) 0.48 - 0.61; (b) 0.490 - 0.614.

9. 0.181 - 0.407,

Página 184

1. 2 = 2.47; el nuevo relajante muscular es eficaz.

3. (b) 0.035. 5. -3.13; se refuta la afirrnacihn.

9. 2 = -2.79; rechazar la hipjtesis nula.

11. z = -1.84; sí

13. X? = 3.18; las diferencias no son significativas.

15, x* = 11.51; sí.

Page 405: ingenieria

RESPUESTAS A LOS PROBLEMAS CON NUMEROS IMPARES 397

Página 190

1, X' 7.69; no se puede rechazar la hipbtesis nula.

3. X* 15.0; las diferencias son significativas.

5. xs = 4.80; rechazar Ho. 9. (a) 0.0305, 0.1056, 0.2171, 0.2812, 0.2171, 0.1056, 0.0805;

(b) 3.0, 10.6, 21.7, 28.2, 21.7, 10.6, 3.0; (c) xe = 2.22; buen ajuste

Página 197

1. F11r = 57.2, Flit = 68.5, FSlr = 76.0, FI,lo = 49.1, F,e/w = 94.9. 3. 45,250 Y 45,750. 5. 0.297 y 0.294. 7. 2724 Y 2785; 8 = 2716; 2558. 9. O.OG9 y 0.0675.

Página 203

1. a = -4.88; rechazar la hipótesis nula.

3. La probabilidad de 7, o mPs, o menos, 4 signos más, es 0.34; no se puede rechazar la hipbtesis nula.

5. No se puede rechazar la hipjtesis nula.

7. z = 0.14; no se puede rechazar la hipótesis nula.

9. z = 3.44; rechazar la hipótesis nula.

11. H = 0.86; no hay diferencia en la eficacia

Página 208

1. z = 2.59; no hay azar. 3. z = 0.02; no se puede rechazar.

5. z = O; no es significativo.

7. D mPximo es 0.24; no se puede rechazar Ho. . ,

PSgina 220

1. (a) y' = 0.41 + 0.0392; (b) 14.1. 3. a = 3.01 y b = 14.14; 11.26 < ,9 <:17.02. 5. g' = 26.7 + 9.982; 14.2 - 39.2. 7. (a) 47.6 - 57.4.

9. (a) 2; (b) 14.8. 11. X' = -2.44 f 0.10y.

Page 406: ingenieria

sa RESPUESTAS A LOS PROBLEMAS: CON NUMEROS IMPARES

1. 5. 9.

13.

1. 3.

3. 7.

9.

13.

1 .

3 .

5.

7.

9.

Página 232

U = 30.0 y b = 0.0000375. 3. (b) a = 12.7 y h = 41.9.

(a) 1.49; (b) 1.38 - 1.60. 7. 1.002.

!ai Un polinomio de tercer grado: ( b ) parte más baja a 652 pies .y cima a 303 pies

Y = 162.2 + 32.521 - 0.086322.

Phgina 240

( 4 = -0.60: (b) z = -2.56; correlacitm significativa

-0.82 a -0.22. 9. r' = -0.28.

Página 251

184, 45. y 136. 5. F' = 11.3; significativo en el nivel 0.01.

(a) F = 20.7; las diterencias son significativas. (b) /I = 51.80, = -4.55, &t = -2.22, & S = 6.S0, 8' = 13.88. Las medias estimadas son 73.5, 69.8 y 80.4; F = 2.96; las diferencias no son significa. tivas.

k ni

2: ,Z ( y i j - p.)' = Z 2 (yij - L, )2 + .Z ni(& - y.)' k ni k

i s 1 ) = 1 j = 1 r = l

Página 261

F = 55.2: slgnlflcativo en el nivel 0.01

Para los días. F = 4.3, para los turnos, E' = 5.6; ambos significativos en el nivel 0.05.

Error cuadrado medio se ha reducido de 0.2375 a 0.0742. Para los tratamientos, F = 47.2, significativo en el nivel 0.01; para los bloques. F = 9.8, significativo en el nivel 0.05.

n b 7

i = l ]=1 k = l + br 2: (jj,.. - g...)' + ar Z (p . i . - U... )' + ab Z ( a . . k - J...)'

n h r n

(b) C = T2./abr, SST = 2: Z: Z: utik - C, SS(Tr) = L: ,Tt_dbr - C, i = l j=1 k-1 i = l

h r

j=l k-1 SS(B1) = ?: T:./ar - C, SSR = Z T2JaD - C,

S S R = SST - SS(Tr) - SS(B1) - $SR (c) abr - a - b - r + 2. Ganancia en grados de libertad para S S E : oh - h; ( h ) Ganancia en grados de libertad para S S E : uh - 1. .

Page 407: ingenieria

RESPUESTAS A LOS PROBLEMAS CON NUMEROS IMPARES 399

13. A B C 47.2 49.6 58.6

15. C A B D 7.33 10.67 12.33 15.00

Página 270

1. Para los combustibles, F = 56.8 y para los mecánicos, F = 21.5, a.mbos son significatl- vos en el nivel 0.01; la prueba Duncan para combustibles fcon a = 0.01 ) nos da

C A B 15.67 20.11 24.67

3. Para ios hilos, F E 30.7 y para los técnicos, F = 8.3, ambos significativos en el nivel 0.01; la prueba Duncan para los hilos, con a = 0.01, nos da

E C D B A 22.46 22.64 22.72 23.08 31.68

S. Para dinero gastado en perijdico, añadir F = 17.5. y por localización en almacbn. F ~

99.4; ambos significativos en el nivel 0.01.

Página 287

1. ( a ) Para tratamientos. F = 51.0; significativo en el nivel 0.01:

(b) Grados de Fuente de

variacidn libertad - "" -. - ___" ____"

Réplicas

Error

G Interaccibn

2 Vibraciones

3 Diseño

1

." . . " ___-

. - - .- .- . . . . - "

". .. " ~"

. . . ~ . . I l1 ' .

! Total ! 23

Suma de cuadrados

6

1,457,408

1,345,912

138,332

57,606

~ _ _ _

2,999,354

Cuadrado medio P

6 <I

485,803 92.6

672,956 128.3

23,055

5,245

(c ) Los efectos principales son significativos en el nivel,0.01 y, la intcraccidn. cn cl ni- vel 0.05.

3. Para el proyecto de los cascos, F = 8.1, y para los días, F = 22.9; ambos significativos cn el nivel 0.01.

5. (al SST = 3,305, SS(Tr) = 3,188, S S R = 14, SSh' = 103; ( h ) Si A representa los detergentes, B el tiempo de lavado y C la temocratura del agua: SS.4 = 645.5, SSLJ = 324,SN: 1,936, &'3(:1fi) y 10, SS(:lC) = 108.5, sS(~~(') 161, y SS(:lBC) = 3.

Page 408: ingenieria

400 RESPUESTAS A LOS PROBLEMAS CON NUMEROS IMPARES

Fuettte de variación

- Replicas I princ.i,palcs Efectos

B C

Dos factores

'4 13 dC /IC

Tres factores interacción

A liC

lnteracciones

~ _ _ _ -

" .

Error

Total

Grados de Suma de Cuadrados libertad cuadrados medios

_ _ ~ - _ _ _ _ _ -

2 14 7

2 645.5 322.75 1 324 324 1 1,936 1 1,936

2 10 5 2 108.5 54.25 1 161 161

~ _ _

2 3 1.5

F

1.50

69.0 69.1

413.7

1.1 11.6 34.4

<1

"___

Todos los efectos principales y las interacciones AC y BC son significativas en el nivel 0.01.

7. P = q(P1ll + Plll + P2ll + I*.L21), a1 = t(P111 + PI21 - PZll - P221),

PI = t ( ~ ~ ~ ~ - pIz1 + pZll - P d , = 4 ( ~ ~ ~ ~ - plZ1 - pzll + P L E ~

Pdgina 297

1. (a) SST = 110.44, SS(Tr) = 103.94, SSIZ = 1.56, SSE = 4.94; (b) [dl = "1, [U] = -13, [:In] = 3, [C] = -25, [ A C ] = 3, [BC] = -29,

[ABC] = 3; (c> = 0.06, 8ki"j' = 10.56, S$(A4B) = 0.56, SSC = 39.06, SS(AC) = 0.86,

SS(BC) = 52.56, sS(ABC) = 0.56;

14.9, 55.0 y 74.0. ( e ) B. C y BC son significativas en el nivel 0.01; los valores correspondientes de F son

3. Para el efecto B. F = 8.1 y, para la intcracción ABC, F = 5.6, ambos significativos en el nivel 0.05; para las replicas, F = 9.1, significativo en el nivel 0.01.

Page 409: ingenieria

RESPUESTAS A LOS PROBLEMAS CON NUMEROS IMPARES 401

Página 309

1. (a) Block 1: a, b, e, abc, d, ahd, acd, bcd; Block B: 1, ab, m, bc, a d , bd, cnl, ab&; (b) Block i: a , b, acd, bcd; Block 2: c, abc, d, abd;

Block S: ac, bc, ad, bd; Block 4: 1, ab, cd, abcd; CD tarnbikn confundidas

3. Block 1: abc, bd, ae, cde, cf, adf, bef, abcdef; Block 2: a, cd, abce, bde, bf, abcdj, cef, adef; Block 3: b, abcd, ce, ade, af, cdj, abcej, bdef; Block 4: 1, acd, bce, abde, abf, bcdf, acef, def; Block 6. bc, abd, e, acde, acf, df, abef, bcdef; Block G: ac, d , nbe, bcde, bcf, abdf, ef, acdef; Rloclc 7: c, ad, he, abcde, abcf, bdf, aef, cdef; Block 6: ob, hcd, ace, de, f, acdf, beef, abdej; CDE, ADF, BBF, y ACEF son tambien confundidas

5. La S S E interno de bloques es 4.39; B, C y BC son significativas en el nivel 0.01, con 10s valcres correspondientes de F de 14.5, 53.5 y 72.0.

7. (a) Block i r 1, be, abd, acd, abe, ace, de, bcde; Block 2: ab, ac, dl bcd, e, bce, abde, acde; Block S: b, c, ud, abcd, ae, abce, bde, cde; Block 4: a, ubc, bd, cd, be, ce, adt, ahcde;

fb) La SSE interno de bloques es 41 5.8; A y E son significativas en el nivel 0.01. con valores de F de 12.3 y 16.7; R. C , A D . A C D y BCD son significativas en el nivel 0.05, can valores de F correspondientes, de 5.5, 5.8, 6.1, 4.6 y 5.5.

11. (a)A y BCD, B y ACD. C y ABD, D y .4BC, A B y C D , A C y B D . A D y BC;

(b) A y BCD, B y ACD, C y A B D y ABC y D , A C y BD y BC y A D .

13. 1, be, adf, aeg, defg, abcdj, abceg, bcdefg, bdg, bef, cef, abfg, acfg, abde, acde, cdg, ab, ac, bdj, beg, cdf, ceg, acdefg, abdefg, de, j g , adg, aef, bcde, bcfg, abcdg, abcej.

15. (a) 4920, "360, -420, -144, -84, -68, 12, -40, -374, 118, -126,122, 22, 2, -22, -22, -84, 16, -32, 64, -80, 44, -24, 120, "138, 70, -90, 42, -54, 18, -2, 82;

(b) [ZI, L-41, [BI, [ A B ] , [CI, [~icl, [BCI, error, P I , [:201, [BW, error, [CDI, error, error, [ E F ] , [E], [AE] , [BE], error, [CE], error, error, [DJ'], [DE] , error, error,' [CF] trror, [BF] , [AF!, [ F ] ;

.' ( C ) MSE = 123.41; A , B y D. son significativas en el nivel 0.01, con valores de F de 32.8. 44.7 y 35.4, respectivamente; A B es significativa en el nivel 0.05, con un valor de P de 5.2.

Página 323

1. (a) Linea central = 1.500, UCL = 1.513, LCE = 1.487; (b) Linea centra.1 = 0.0233, UCL = 0.0492, LCL = o.

3. (a) Linea centra! = 58.10, UCL = 61.12, LCL = 55.08; (b) Linea central = 2.95, t;CL = 7.60, LCL = o; !d) z = - 3.1, hay una tendencia significativa; (e ) El proceso esta fuera de control.

Page 410: ingenieria

402 RESPUESTAS A L O S PROBLEMAS CON NUMEROS IMPARES

5. (a) Para la gráfica 3: Línea central = 21.70, UCL = 24.44, LCL = 18.96; para la grafica u: Línea central = 1.16, UCL = 3.30, LCL = 0.

7. Línea central = 0.0024, UCL = 0.0068, LCL = O. 9. (a) Línea central = 0.076, UCL = 0.187, LCL = O.

11. Linea central = 4, UCL = 10, LCL = O; en control.

\

Página 327

1. 34.9 - 50.1. 3. (a) 0.1274 - 0.1294; (b) 0.1283 - 0.1285.

PBgina 336

1. (a) c = 13; (h) 0.063. 3. (a) 0.03; (b) 0.13.

9. a = 0.15. 11. 71 = 80 y c = 3.

13. a, = -1.67 -I- 0.19n, T, = 2.14 + 0.19n; rechazado el octavo ensayo

Página 346

1. 0.60. 3. 0.99963.

5. (a) F ( t ) = 0, + (1 - O, - O,) - t - a

8 - a para a 5 t 5 p.

7. (a) 0.632; (b) 0.368. 9. 141 horas

11. (a) 0.301; (b) 0.9095; (c) 0.368. 13. (b) F(z) = 1 - (1 - p)* for z = 1, 2, 3, . . .; (c) 0.189.

Página 355

1. (a) 206 - 2,412; (b) T, = 2,600 < 4,575 no se puede rechazar la hipótesis nula.

3. (a ) 128 - 535; (b) T, = 1,849 cae entre 771 y 5,140, no se puede rechazar la hipóte- sis nula.

5. (a) ¿* = 63.3; (b) t* = 12.1. 7. 166,917 < p.

9. ji = 500; usando el modelo exponcncial p = 7:G.

Page 411: ingenieria

INDICE

A Contraste de definicibn, 307 Cuadrado, greco-latino. 268

Alternativq de un sentido, 151 latino, 264

Analisis de superficies de respuesta, 229 Cuartil, 110 Axiomas de probabilidad. 15. 31-32 Curva, característica de operacihn. 145

en los dos sentidos, 152 Cuantilas, 192

B de regresibn. 2)1

Bloques. 254

C

Calidad promedio de salida. 330 Coeficiente, binomial, 37

de correlación, 237 estimador de. 138 tests de significacijn, 239

intervalo de Confianza. 217 de regresijn. 215

de variación, 110 Confianza. al nivel

para la proporción, 174, I 78 para la varianza, 165, 166

D

Densidad, condicional, 236 de probabilidad. 60

marginal, 77

ramificado, 7

conjunta, 7.5

Diagramas, de Venn, I I

Diferencia entre dos medias. 154 Diseños de equilibrio, 263 Distribución, F , 130

binomial, 36, 37 de frecuencias, 97

de Poisson, 44 totales acumulativos, 99

media y varianza. 51 403

Page 412: ingenieria

de probabilidad. 34 de Weibull. 7s. 343. 351

media y varianza. 352 exponencial. 74. 85 gamma, ?2 geométrica, X7 hlpergeométrica. 43

multinomial. 56 normal

media y varianza. 50. 52

medias y varlanzas. 73 hivariante, 237 logaritmica. 71

media y varianza. 73 sesgada. 41. 46 1. 127 uniforme, 69. 73

discreta. 1 19 X cuadrado (chi-cuadrado). 119

E

I.~'!i,iclones normales. 214. 226 ~ ~ C C [ C I . aleado. 307

} . I 101. dentro de los bloques. 303 [<)tal . 292

t l p ~ c o . de estimacibn. 216 de la media, 122

tjpo 1 y tipo 11. 142 Espacios, de muestras. 5. 7

muestral, continuo. 7

Esperanza matemática, 81 Estimaci6n puntual. 17.7 Estimador. centrado. I34

discreto, 7

de intervalo. 137 Experimcnto de dos factores. 274

F

Forma gcncIal dc la distrlhucion normal. 66 Frmtcraa de clascs. 99 FunciOn, aditiva de conjunto. I 3

de conjunto. 1 3 de distribuciOn. 35. 60

conjunta. 76 de fiabilidad. 341

G

número de defectos. 320. 321 para la media. 3 1 7 para desv~aciones tiplcas. 325

distribucldn P . 131, Grados de libertad

1 , 127 X cuadrado (chl-cuadrado ' . 129

H

Histograma. 35 simétrico. 40

I

Inferencia hayeslana. I 3 5 Interacción. 275

generalizada. 301 Intervalo, de clase, 99

de confianza para medias. 1 3 X

L

Ley, del producto de fiabilidad, 339 de infiabilidad, 340 débil de los grandes números, 55 general. de adiciht. I O

de multiplicacibn. 25 Límites de clase, 98

de la calidad promedio de salida, 330 de prediccih, 219 de tolerancia. 326

Marca de clase. 99 Media, mayor. 246

binomial, 50 densidad de prohahilidad. 62 distrihucihn, de prohabilidad, 4Y

muestras de, I O X muestrat de la. . I 19

Mediana, 109, 197 Medio tipificado y redudido, 123 Métodos paramétricos, 195 Mezclado, 301 Military Standard 105D Tables, 313 Mínimo recorrido de significaci6n. 259 M odes, 102 Momento, 49, 52 M ucstras. I 17- I I X

Page 413: ingenieria

INDICE 405

aleatorias, 117 del tests I , 153

Muestreo secuencial, 334

N

Nivel, 275 de calidad aceptable, 329 de significacih, l>1

Número de la muestra promedio, 333

O

Orden normal. 291

P Papel, cuadriculado de probabllidad. 103

'Parámetros, 37 Plan de muestreo, doble, 331

múltiple, 33 I simple, 329

finita," 117 infinita, I17

de probabilidad aritmética, 103

P o b l a c h , 116, I17

Poligono ds frecuencias, 101 Probabilidad, condicional, 25

Problemas de colas, 85 Proceso de Poisson, 84 Proyecto de bloques incompletos equilibra.

normal centrada y reducida. 65

dos, 269

R

Región critica, 146 Regla de Bayes, 29 Regresih, curvilínea. 223

múltiple, 228 polinomial. 235

fraccionales, 306

del productor, 329

Réplica, 258

Riesgo, del consumidor. 329

Kuina de los jugadores, X9

S

Scrics medias por encima y por dchajo dc las

206

Sistema, en paralelo. 339

Sucesos, 9 en serie, 339

independientes, 26 mutuamente excluyentes, 9

T

Tablas de contingencia. I83 Tablas de itgnos, 293 Tasa de fallos, 341 Teorema de C'hebyshev, 53

de Gauss-Markov, 215 de limite central. 123

Teoría de la decisih, 149 Tests, con remplazamiento, 348

de dos colas, 147 de Duncan, 259 de duracibn de vida acelerada. 348 de Kolmogorov-Smirnov, 207 de los signos, 198

de muestras apareadas, 199 de una sola muestra. 198

de Mann-Whitney, 200 de &gnificación, I51 de una cola, 146 del recorrido múltiple. 159 H . 202 Kruskal-Wallis, 202 sin remplazamiento. 34% I , dos muestras ,157 f . de muestras apareadas. I 58 u, 200

medio entre fallos, 343 Tiempo, de espera, 85

Tolerancia del porcentaje de defectuosos del

Trayectoria aleatoria. 87-88 lote, 329

V

Variable alcatoria. 34 centrada y reducida. h4 independientes, 76

de la distribucih de prohahilidad. 52 densidad de probabilidad. 62 muestras de. 109

Varianza

Page 414: ingenieria

Publicaciones Clantificus y ¿e Tecnología aplicada de Editorial Reverid, S. A.

ELEMENTOS DE

PROBABILIDAD Y

E S T A D ~ S T I C A

Elmer B. Mode Profesar de Matemiticas de la Universidad de Boston

Un volumen de 367 páginas. Formato 22 X 16 cm.

En años recientes, ha ido en aumento el deseo de enseñar probabilidad y estadístico en un solo curso: primero, porque la probabilidad por sí mismo ha llegadc a ser una herramienta necesario en muchos campos de la ac.;i- vidad intelectual y, segundo, porque constituye la piedra angular sobre 10

que descansa la vasta estructura de la estadística moderna. El objetivo principal de este libro es desarrollar los conceptos básicos y 13s reglas de la prcbabilidad matemótica y mostrar cómo esto nos proporciona modelos para la solución de problemas prácticos, especialmente para los de natura- leza estadística.

Este texto no se inclina por ninguna órea de aplicación en particular. Los ejemplos y ejercicios han sido seleccionados de muchos c3mpos, tales como la biología, la educación, la economía, la genética, la pslcología y la sociología. Como prerrequisito matemótico, se requiere el conocimiento de lo cantidad usual de matemáticas que se imparten en cursos profesionales, alrededor de dos años de álgebra, como mínimo. Sin embarga, en la sec- cien 9.6 se consideró conveniente incluir una definición formal del integral definido, pero esta parte puede omitirse, a discreción del instructor. El ca- pítulo referente a las cadenas de Markov está asociado más bien can los capítulos 2 a 5 relativos a probabilidad, pero se consideró prudente colo- carlo al final del libro, ya que muchos cursas no disponen del tiempo nece- saria para incluirlo.

EXTRACTO DEL INDICE

blemer mlscellneos. - 6. lntroduccldn a la ertadlstica. - 7. Dlstrlbuclones de frecuencia y funclones de t . Introduccl6n. - 2. Conluntos. - 3. Probabilldad. - 4. Teoremas du probabllided, - 5. Algunos pro.

probabllldd: El cam dlscreto. - 8. La funcl6n blnomlal de prohbllldrd. - 9. Dlrtrlbuciones de fracuencla y funcbbn denaldad de probobilldad: El ceso continuo. - 10. La funcl6n denaldad normal de prohbilldad. - 1 1 . Lar dlstrlbucloner multlnomlal y JI cuadrada. - 12. Otras dlatrlbucloner relacionadas con la normal y la blnomlal. - 13. lnferencla a partlr de Ira medlas arltmdtlcar de las muestras. - 14. La fUWl6n binomial blvarlante de probabllldad. - 15. Funclones blvarlantes dlscretas. de probsbllidad. - 16. E8tlm~Cl6n. - 17.

matem6tlcss. - Reapuestes a elerclcloa de numero Impar. - IndlCe. A)uate de una Ilner: Regrerlbn. - 18. Correlecl6n. - 19. Cadenas de Markov. - Referencias. - Tablar