ntc 2062-1 terminos estadisticos generales

65
NORMA TÉCNICA NTC COLOMBIANA 2062-1 2008-05-28 ESTADÍSTICA. VOCABULARIO Y SÍMBOLOS. PARTE 1: TÉRMINOS ESTADÍSTICOS GENERALES Y TÉRMINOS UTILIZADOS EN EL CÁLCULO DE PROBABILIDADES E: STATISTICS. VOCABULARY AND SYMBOLS. PART 1: GENERAL STATISTIC TERMS AND TERMS USED IN PROBABILITY. CORRESPONDENCIA: esta norma es idéntica por traducción (IDT) de la ISO 3534-1:2006. DESCRIPTORES: estadística - vocabulario; estadística - terminología; estadística - probabilidad. I.C.S.: 03.120.30 Editada por el Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC) Apartado 14237 Bogotá, D.C. - Tel. (571) 6078888 - Fax (571) 2221435 Prohibida su reproducción Segunda actualización Editada 2008-06-10

Upload: fernando-rodriguez-herrera

Post on 24-Nov-2015

243 views

Category:

Documents


23 download

TRANSCRIPT

  • NORMA TCNICA NTC COLOMBIANA 2062-1

    2008-05-28

    ESTADSTICA. VOCABULARIO Y SMBOLOS. PARTE 1: TRMINOS ESTADSTICOS GENERALES Y TRMINOS UTILIZADOS EN EL CLCULO DE PROBABILIDADES E: STATISTICS. VOCABULARY AND SYMBOLS. PART 1:

    GENERAL STATISTIC TERMS AND TERMS USED IN PROBABILITY.

    CORRESPONDENCIA: esta norma es idntica por traduccin

    (IDT) de la ISO 3534-1:2006. DESCRIPTORES: estadstica - vocabulario; estadstica -

    terminologa; estadstica - probabilidad. I.C.S.: 03.120.30 Editada por el Instituto Colombiano de Normas Tcnicas y Certificacin (ICONTEC) Apartado 14237 Bogot, D.C. - Tel. (571) 6078888 - Fax (571) 2221435

    Prohibida su reproduccin Segunda actualizacin Editada 2008-06-10

  • PRLOGO El Instituto Colombiano de Normas Tcnicas y Certificacin, ICONTEC, es el organismo nacional de normalizacin, segn el Decreto 2269 de 1993. ICONTEC es una entidad de carcter privado, sin nimo de lucro, cuya Misin es fundamental para brindar soporte y desarrollo al productor y proteccin al consumidor. Colabora con el sector gubernamental y apoya al sector privado del pas, para lograr ventajas competitivas en los mercados interno y externo. La representacin de todos los sectores involucrados en el proceso de Normalizacin Tcnica est garantizada por los Comits Tcnicos y el perodo de Consulta Pblica, este ltimo caracterizado por la participacin del pblico en general. La NTC 2062-1 (Segunda actualizacin) fue ratificada por el Consejo Directivo de 2008-05-28. Esta norma est sujeta a ser actualizada permanentemente con el objeto de que responda en todo momento a las necesidades y exigencias actuales. A continuacin se relacionan las empresas que colaboraron en el estudio de esta norma a travs de su participacin en el Comit Tcnico 4 Aplicacin de mtodos estadsticos. CHALLENGER S.A. COMPAA COLOMBIANA DE CERMICAS S.A. -COLCERMICA- COMPAA NACIONAL DE CHOCOLATES S.A. GLOBAL PLASTIK S.A.

    INDUSTRIA DE ALIMENTOS ZEN S.A. INDUSTRIAS HUMCAR LTDA. SIKA COLOMBIA S.A. UNIVERSIDAD PEDAGGICA NACIONAL

    Adems de las anteriores, en Consulta Pblica el Proyecto se puso a consideracin de las siguientes empresas: ACERAS DE CALDAS S.A. -ACASA- ACERAS PAZ DEL RO S.A. ALPINA PRODUCTOS ALIMENTICIOS S.A. ALMACENAMIENTO Y TRANSPORTE ESPECIALIZADO LTDA. -ALTE LTDA- ANHDRIDOS Y DERIVADOS DE COLOMBIA S.A. -ANDERCOL- ASEO TCNICO S.A. ASOCOLCAUCHOS ASOCRETO ATLANTIC MINERALS AND PRODUCTS CORPORATION ATOFINA COLOMBIA S.A. BAVARIA S.A. CABLES DE ENERGA Y DE TELECOMUNICACIONES S.A. -CENTELSA- CALZADO ATLAS S.A. CARBOQUMICA S.A.

    CENTRO TECNOLGICO PARA LAS INDUSTRIAS DEL CALZADO, CUERO Y AFINES -CEINNOVA- CEMENTOS DEL VALLE S.A. CODENSA S.A. ESP COLOMBIANA DE AUTO PARTES S.A. COLOMBIANA DE EXTRUSIN S.A. -EXTRUCOL- COMPAA COLOMBIANA DE TABACO S.A. -COLTABACO- COMPAA DE GALLETAS NOEL S.A. COMPAA NACIONAL DE LEVADURAS -LEVAPN S.A.- CONCONCRETO S.A. CORPACERO- CORPORACIN DE ACERO COTECMAR - CORPORACIN DE CIENCIA Y TECNOLOGA PARA EL DESARROLLO DE LA INDUSTRIA NAVAL, MARTIMA Y FLUVIAL

  • CRISTALERA PELDAR S.A. CYGA DOCTOR CALDERN ASISTENCIA TCNICA AGRCOLA LTDA. EMPRESA COLOMBIANA DE PETRLEOS S.A.-ECOPETROL- ECSI S.A. EDITORIAL VOLUNTAD S.A. ELECTROMANUFACTURAS S.A. ELGMA SISTEMAS DE COLOMBIA LTDA- EMPRESA DE ACUEDUCTO Y ALCANTARILLADO DE BOGOT ESP EMPRESAS PBLICAS DE MEDELLN S.A. ESP ENZIPAN DE COLOMBIA LTDA. ESCOBAR Y MARTNEZ S.A. ESCUELA COLOMBIANA DE INGENIERA ETERNA S.A. EXXON MBIL DE COLOMBIA S.A. FINCA S.A. FRIGORFICO GUADALUPE S.A. FRIGORFICO SUIZO S.A. FUNDACIN CENTRO DE CALIDAD Y METROLOGA GAS NATURAL S.A. ESP INALCEC - CORPORACIN INSTITUTO NACIONAL DE CONSULTORA EN CALIDAD INDEPENDIENTE FERNANDO NGEL INDEPENDIENTE HERNN DARO LZATE INDEPENDIENTE JAIRO NGEL INDEPENDIENTE JULIO GARCA SAMPEDRO INDUSTRIA COLOMBIANA DE ELECTRNICOS Y ELECTRODOMSTICOS S.A. -INCELT S.A.- INDUSTRIA COLOMBIANA DE LLANTAS S.A. -ICOLLANTAS- INDUSTRIA FARMACUTICA SYNTOFARMA S.A. INDUSTRIAS ALIADAS S.A. INGENIERA DE DESARROLLO Y TECNOLOGA -IDT LTDA- INGENIO PICHICH S.A. INSTITUTO COLOMBIANO AGROPECUARIO -ICA- INSTITUTO COLOMBIANO DE PRODUCTORES DE CEMENTO -ICPC- INSTITUTO NACIONAL DE SALUD -INS- INVESA S.A. IVONNE BERNIER LABORATORIO LTDA

    LARKIN LTDA. LHAURAVET LTDA. MATRICES, TROQUELES Y MOLDES CA LTDA. MERCADEO DE ALIMENTOS DE COLOMBIA S.A. -MEALS S.A.- METALRGICA CONSTRUCEL COLOMBIA S.A. -METACOL- MINERALES INDUSTRIALES S.A. MOLINO EL LOBO LTDA MONMEROS COLOMBO VENEZOLANOS E.M.A. NUTRIANLISIS LTDA. PAPELERA MNACO LTDA. PARABOR COLOMBIA LTDA. PETROQUMICA COLOMBIANA S.A. POSTOBN S.A. PRODUCTORES DE ENVASES FARMACUTICOS S.A. -PROENFAR- PROFICOL S.A. QUIMIA LTDA. RAZA S.A. RENTASISTEMAS LTDA. RONELLY S.A. SCHNEIDER ELECTRIC DE COLOMBIA S.A. SENA CENTRO NACIONAL TEXTIL SENA CENTRO NACIONAL DE LA MADERA SENA REGIONAL BOGOT SIEMENS S.A. SOCIEDAD DE ACUEDUCTO ALCANTARILLADO Y ASEO DE B/QUILLA E.S.P. - TRIPLE A SYNGENTA S.A. TECNOLOGA EMPRESARIAL DE ALIMENTOS S.A. THOMAS GREG & SONS DE COLOMBIA S.A. IMPRESOR DE VALORES TRANSPORTES VIGA S.A. UNIVERSIDAD DE ANTIOQUIA UNIVERSIDAD DE BOYAC -UNIBOYAC- UNIVERSIDAD DEL VALLE UNIVERSIDAD JORGE TADEO LOZANO UNIVERSIDAD MANUELA BELTRN UNIVERSIDAD NACIONAL DE COLOMBIA SEDE-MEDELLIN UNIVERSIDAD NACIONAL DE COLOMBIA, BOGOT - REVISTA COLOMBIANA DE ESTADSTICA

  • ICONTEC cuenta con un Centro de Informacin que pone a disposicin de los interesados normas internacionales, regionales y nacionales y otros documentos relacionados.

    DIRECCIN DE NORMALIZACIN

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    CONTENIDO

    Pgina

    0. INTRODUCCIN ..........................................................................................................1 1. OBJETO .......................................................................................................................2 2. TRMINOS ESTADSTICOS GENERALES ................................................................2 3. TRMINOS USADOS EN PROBABILIDAD ..............................................................20 DOCUMENTO DE REFERENCIA..........................................................................................60 ANEXOS ANEXO A (Informativo) SMBOLOS.............................................................................................................................45 ANEXO B (Informativo) DIAGRAMA DE CONCEPTOS ESTADSTICOS...................................................................46 ANEXO C (Informativo) DIAGRAMA DE CONCEPTOS DE PROBABILIDAD............................................................52 ANEXO D (Informativo) METODOLOGA USADA EN EL DESARROLLO DEL VOCABULARIO .............................56 TABLAS Tabla 1. Resultados para el ejemplo 1..................................................................................9 Tabla 2. Ejemplo de distribucin binomial.........................................................................26 Tabla 3. Ejemplo de distribucin normal estandarizada...................................................26 Tabla 4. Ejemplo de distribucin hipergeomtrica............................................................37

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    1 de 60

    ESTADSTICA. VOCABULARIO Y SMBOLOS. PARTE 1: TRMINOS ESTADSTICOS GENERALES Y TRMINOS UTILIZADOS EN EL CLCULO DE PROBABILIDADES 0. INTRODUCCIN Las versiones vigentes de la NTC 2062-1 (ISO 3534-1) y de la NTC 2062-2 (ISO 3534-2) estn propuestas para ser compatibles. Ellas comparten el objetivo comn de restringir sus niveles matemticos respectivos a los mnimos necesarios para alcanzar definiciones concisas, coherentes y correctas. La Parte 1 sobre los trminos usados en probabilidad y estadstica es fundamental, tambin por necesidad, que est presentada en un nivel matemtico un poco complejo. Reconociendo que los usuarios de la NTC 2062-2 (ISO 3534-2) o de otras normas de estadstica aplicada pueden consultar ocasionalmente esta primera parte de la NTC 2062 (ISO 3534) para la definicin de ciertos trminos, algunos de stos son descritos de una manera menos tcnica en las notas y son ilustrados con ejemplos. Aunque estas descripciones informales no substituyen las definiciones formales, pueden suministrar una definicin tcnica de conceptos para un principiante, sirviendo a las necesidades de los mltiples usuarios de estas normas de terminologa. Para hacer esta primera parte de la NTC 2062 (ISO 3534) ms accesible al usuario aplicado, quien normalmente estara involucrado con normas tales como la NTC 2062-2 (ISO 3534-2) o la serie NTC 3529 (ISO 5725), se ofrecen, por ejemplo, notas y ejemplos adicionales. Para el desarrollo y uso efectivo de normas de estadstica es esencial una serie bien definida y razonablemente completa de trminos de probabilidad y estadstica. Las definiciones suministradas aqu deben ser suficientemente precisas y de complejidad matemtica para que los desarrolladores de normas de estadstica sean capaces de evitar ambigedades. De hecho, se pueden encontrar en libros de texto de estadstica y de probabilidad explicaciones ms detalladas de conceptos, de sus contextos y de sus campos de aplicacin. En un anexo informativo se suministran los diagramas de concepto para cada grupo de trminos: 1) trminos estadsticos generales (en el Anexo B), y 2) trminos usados en probabilidad (en el Anexo C). Hay seis diagramas de concepto para trminos estadsticos y cuatro diagramas de concepto para trminos relacionados con probabilidad. Algunos trminos aparecen en diagramas mltiples que suministran una relacin entre una serie y otra de conceptos. El Anexo D suministra una introduccin breve sobre los Diagramas de Concepto y su interpretacin. Estos diagramas fueron herramientas en la construccin de esta revisin ya que ayudaron en el delineamiento de las interrelaciones de varios trminos. Estos diagramas son tambin tiles en la traduccin de la norma a otros idiomas.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    2

    Como comentario general con respecto a gran parte de la norma, a menos que se indique de otra manera, las definiciones relacionan el caso unidimensional (de una variable). Se admite esta disposicin para eliminar la necesidad de mencionar repetitivamente el objeto unidimensional para la mayora de las definiciones. 1. OBJETO Esta norma define trminos estadsticos generales y trminos usados en el clculo de probabilidades, que se pueden usar para la redaccin de otras normas. Adems, define los smbolos para un nmero limitado de estos trminos. Los trminos estn clasificados bajo los siguientes ttulos: - Trminos estadsticos generales (vase el numeral 2). - Trminos usados en clculo de probabilidades (vase el numeral 3). El Anexo A suministra una lista de smbolos y abreviaturas recomendados para uso con esta norma. Las entradas de esta primera parte de la NTC 2062 (ISO 3534) estn organizadas en asociacin con los diagramas de conceptos presentados en los Anexos B y C. 2. TRMINOS ESTADSTICOS GENERALES 2.1 Poblacin (Population). Totalidad de los elementos bajo consideracin. NOTA 1 Una poblacin puede ser real y finita, real e infinita o completamente hipottica. Algunas veces el trmino "poblacin finita", especialmente en muestreo de muestreo por encuestas. Igualmente, el trmino "poblacin infinita" se usa en el contexto de muestreo continuo. En el numeral 2 la poblacin se considerar en un contexto probabilstico como el espacio muestral (vase el numeral 3.1). NOTA 2 Una poblacin hipottica permite imaginar la naturaleza de datos futuros con base en diferentes hiptesis. En consecuencia, las poblaciones hipotticas son tiles en la etapa de diseo de las investigaciones estadsticas, particularmente para determinar tamaos de muestra apropiados. Una poblacin hipottica puede tener un nmero finito o infinito. Es un concepto particularmente til en estadstica inferencial para ayudar a evaluar la solidez de la evidencia en una investigacin estadstica. NOTA 3 El contexto de una investigacin puede determinar la naturaleza de la poblacin. Por ejemplo, si se seleccionan tres poblaciones para un estudio demogrfico o de salud, entonces la poblacin consiste en los residentes de estos poblaciones en particular. Como alternativa, si las tres poblaciones fueron seleccionadas aleatoriamente de los poblaciones de una regin especfica, entonces la poblacin estara compuesta de todos los residentes de la regin. 2.2 Unidad de muestreo (Sampling Unit). Una de las partes individuales en las que est dividida una poblacin (vase el numeral 2.1). NOTA Dependiendo de las circunstancias, la parte de inters ms pequea puede ser un individuo, una familia, un distrito escolar, una unidad administrativa, etc. 2.3 Muestra (Sample). Subconjunto de una poblacin (vase el numeral 2.1) compuesto de una o ms unidades de muestreo (vase el numeral 2.2). NOTA 1 Las unidades de muestreo pueden ser elementos, valores numricos o incluso entidades abstractas que dependen de la poblacin de inters.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    3

    NOTA 2 La definicin de muestra de la NTC 2062-2 (ISO 3534-2) incluye un ejemplo de base de muestreo que es esencial al tomar una muestra aleatoria de una poblacin finita. 2.4 Valor observado (Observed Value). Valor obtenido de una propiedad asociada con un elemento de una muestra (vase el numeral 2.3). NOTA 1 Los sinnimos comunes son "resultado" y "dato". NOTA 2 La definicin no especifica el origen ni la forma en la que se ha obtenido este valor. El valor puede representar un resultado de una variable aleatoria (vase el numeral 2.10), pero no de manera exclusiva. Puede ser uno de varios de estos valores que sern sometidos posteriormente a anlisis estadstico. Aunque las inferencias apropiadas requieren alguna sustentacin estadstica, no hay nada que impida elaborar resmenes o descripciones grficas de los valores observados. Slo en el caso de aspectos concomitantes, tales como la determinacin de la probabilidad de observar un conjunto especfico de realizaciones, los mecanismos estadsticos llegan a ser tanto pertinentes como esenciales. La etapa preliminar de un anlisis de valores observados se denomina comnmente anlisis de datos. 2.5 Estadstica descriptiva (Descriptive Statistics). Descripcin grfica, numrica u otro anlisis de sntesis de los valores observados (vase el numeral 2.4). EJEMPLO 1 Los resmenes numricos incluyen el promedio (vase el numeral 2.15), rango (vase el numeral 2.10), desviacin estndar de la muestra (vase el numeral 2.17), entre otros. EJEMPLO 2 Los ejemplos de resmenes grficos incluyen grficos de cajas, diagramas, grficos Q-Q, diagramas de cuantila normal, diagramas de dispersin mltiple e histogramas. 2.6 Muestra aleatoria (Random Sample). Muestra (vase el numeral 2.3) que ha sido seleccionada usando un mtodo de seleccin aleatoria. NOTA 1 Esta definicin es menos limitante que la presentada en la NTC 2062-2 (ISO 3534-2) y prev poblaciones infinitas. NOTA 2 Cuando la muestra de n unidades de muestreo se selecciona de un espacio muestral (vase el numeral 2.1) finito, cada uno de cuyas combinaciones posibles de n unidades de muestreo tendr una probabilidad particular (vase el numeral 3.5) de ser tomada. Para los planes de muestreo por encuesta, la probabilidad particular para cada combinacin posible se puede calcular por adelantado. NOTA 3 Para muestreo por encuesta de un espacio muestral finito, se puede seleccionar una muestra aleatoria mediante diferentes planes de muestreo tales como muestreo aleatorio estratificado, muestreo aleatorio sistemtico, muestreo por etapas mltiples, muestreo con probabilidad de muestreo proporcional al tamao de una variable auxiliar y muchas otras posibilidades. NOTA 4 La definicin generalmente hace referencia a valores observados reales (vase el numeral 2.4). Estos valores observados se consideran como resultados de variables aleatorias (vase el numeral 2.10), en donde cada valor observado corresponde a una variable aleatoria. Cuando los estimadores (vase el numeral 2.12), las estadsticas de ensayo para pruebas estadsticas (vase el numeral 2.48) o intervalos de confianza (vase el numeral 2.28) se obtienen de una muestra aleatoria, la definicin hace referencia a las variables aleatorias que surgen de entidades abstractas en la muestra, y no a los valores reales observados de estas variables aleatorias. NOTA 5 Las muestras aleatorias de poblaciones infinitas se generan con frecuencia mediante tomas repetidas del espacio muestral, lo que conduce a una muestra compuesta de variables aleatorias distribuidas en forma idntica usando la interpretacin de esta definicin mencionada en la Nota 4. 2.7 Muestra aleatoria simple (Simple Random Sample). muestra aleatoria (vase el numeral 2.6), tal que cada subconjunto de un tamao dado tiene la misma probabilidad de seleccin. NOTA Esta definicin concuerda con la definicin dada en la NTC 2062-2 (ISO 3534-2), aunque la redaccin aqu es ligeramente diferente.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    4

    2.8 Estadstico (Statistic). Funcin completamente especificada de variables aleatorias (vase el numeral 3.10). NOTA 1 Un estadstico es una funcin con variables aleatorias en una muestra aleatoria (vase el numeral 2.6), en el sentido indicado en la Nota 4 del numeral 2.6. NOTA 2 Con referencia a la Nota 1, si {X1, X2, ..., Xn} es una muestra aleatoria de una distribucin normal (vase el numeral 3.50) con una media desconocida (vase el numeral 3.35) y la desviacin estndar desconocida (vase el numeral 3.37) , entonces la expresin (X1 +, X2 + ... + Xn)/n es una funcin estadstica, la media de la muestra (vase el numeral 2.15), mientras que [(X1 + X2, .+.., Xn)/n] - no es un estadstico, ya que involucra el valor desconocido del parmetro (vase el numeral 3.9) . NOTA 3 La definicin dada aqu es tcnica, corresponde al tratamiento encontrado en estadstica matemtica. En aplicaciones, la palabra estadstica puede hacer referencia a la disciplina tcnica que involucra las actividades de anlisis descritas en las normas internacionales del comit ISO/TC 69. 2.9 Estadstico de orden (Order Statistic). Estadstico (vase el numeral 2.8) determinado por su jerarquizacin en un orden no decreciente de variables aleatorias (vase el numeral 3.10). EJEMPLO Sean los valores observados de una muestra 9, 13, 7, 6, 13, 7, 19, 6, 10 y 7. Los valores observados del estadstico de orden son 6, 6, 7, 7, 7, 9, 10, 13, 13, 19. Estos valores constituyen resultados de X(1) a X(10). NOTA 1 Sean los valores observados (vase el numeral 2.4) de una muestra aleatoria (vase el numeral 2.6) {X1, X2, ..., Xn}, clasificados en un orden no decreciente designado como x(1) ... x(k) ... x(n). Entonces (x(1) , x(k), ... x(n) ) es el valor observado del estadstico de orden (X(1), ... X(k), ..., X(nk) ) y x(k) es el valor observado de la estadstica de orden (X(1), ... , X(k), ..., X(n) y x(k) es el valor observado del estadstico de orden ksimo. NOTA 2 En trminos prcticos, el estadstico de orden para un conjunto de datos se obtiene ordenando los datos como se describe formalmente en la Nota 1. La forma ordenada del conjunto de datos permite obtener estadsticas resumidas tiles como se describe en las siguientes definiciones. NOTA 3 Los estadsticos de orden involucran valores de muestra identificados por su posicin despus de jerarquizar en orden no decreciente. Como en el ejemplo, es ms fcil entender la clasificacin de los valores de muestra (resultados de variables aleatorias) que la clasificacin de las variables aleatorias no observadas. Sin embargo, es posible concebir variables aleatorias de una muestra aleatoria (vase el numeral 2.6), dispuestas en un orden no decreciente. Por ejemplo, el mximo de n variables aleatorias se puede estudiar antes de su valor resultante. NOTA 4 Un estadstico de orden individual es un estadstico que es una funcin completamente especificada de una variable aleatoria. Esta funcin es simplemente la funcin de identidad con la identificacin de la posicin o rango en el conjunto ordenado de variables aleatorias. NOTA 5 Los valores ligados presentan un problema potencial, especialmente para variables discretas aleatorias y para resultados que se expresan con una resolucin baja. La palabra "no decreciente" se usa en vez de "ascendente" como un enfoque sutil del problema. Se debe enfatizar que los valores ligados se conservan y no se agrupan en un solo valor ligado. En el ejemplo anterior, los dos resultados de 6 y 6 son valores ligados. NOTA 6 El ordenamiento ocurre con referencia a la lnea real y no a los valores absolutos de las variables aleatorias. NOTA 7 El conjunto completo de estadsticos de orden consta de una variable aleatoria dimensional n, en donde n es el nmero de observaciones en la muestra. NOTA 8 Los componentes del estadstico de orden tambin se designan como estadsticos de orden, pero con un calificativo que da el nmero de la secuencia de los valores ordenados de la muestra. NOTA 9 El tamao mnimo de muestra, el mximo, y para los tamaos de muestra impares, la mediana de la muestra (vase el numeral 2.13), son casos especiales de estadsticos de orden. Por ejemplo, para un tamao de muestra 11, X(1) es el mnimo, X(11) es el mximo y X(6) es la mediana de la muestra. 2.10 Rango de la muestra (Sample Range). El mayor estadstico de orden (vase el numeral 2.9) menos el estadstico de menor orden. EJEMPLO Retomando el ejemplo del numeral 2.9, el rango de la muestra observado es 19 - 6 = 13.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    5

    NOTA En control estadstico de procesos, el rango de la muestra se usa con frecuencia para monitorear la dispersin durante el tiempo de un proceso, particularmente cuando los tamaos de muestra son relativamente pequeos. 2.11 Rango medio (Mid-Range). Promedio (vase el numeral 2.15) de los estadsticos de orden (vase el numeral 2.9) menor y mayor. EJEMPLO El rango medio observado para los valores del ejemplo en 2.9 es (6 + 19)/2 = 12,5. NOTA El rango medio brinda una evaluacin rpida y simple de la mitad de un pequeo conjunto de datos.

    2.12 Estimador (Estimator) . Estadstico (vase el numeral 2.8) usado en la estimacin

    (vase el numeral 2.36) del parmetro . NOTA 1 Un estimador puede ser la media de la muestra (vase el numeral 2.15) prevista para estimar la media de la poblacin (vase el numeral 3.35), que se puede denotar mediante . Para una distribucin (vase el numeral 2.11) tal como la distribucin normal (vase el numeral 2.50), el estimador "natural" de la media de la poblacin es la media de la muestra. NOTA 2 Para estimar una propiedad de la poblacin [por ejemplo, la moda (vase el numeral 2.27) para una distribucin con una variable (vase el numeral 2.16)], un estimador apropiado puede estar en funcin del (los) estimador(es) del (los) parmetro(s) de una distribucin o pueden ser una funcin compleja de una muestra aleatoria (vase el numeral 2.6). NOTA 3 El trmino "estimador" se usa aqu en un sentido amplio. Incluye el estimador puntual de un parmetro, al igual que el estimador por intervalos, utilizado eventualmente para prediccin (algunas veces se denomina predictor). El estimador tambin puede incluir funciones tales como los estimadores tipo ncleo y otras funciones estadsticas con propsito especial. En las notas del numeral 2.36 se suministran comentarios adicionales. 2.13 Mediana de la muestra (Sample Median). Estadstico de orden [(n+1)/2]-simo (vase el numeral 2.9) si el tamao de la muestra (vase la NTC 2062-2 (ISO 3534-2), numeral 2.2.26) n es impar; la suma del estadstico de orden (n/2)-simo y [(n/2) + 1]-simo dividido por 2, si el tamao de la muestra n es par. EJEMPLO Continuando con el ejemplo del numeral 2.9, el valor de 8 es el resultado de la mediana de la muestra. En este caso (tamao de muestra par de 10), los valores quinto y sexto fueron 7 y 9, cuyo promedio es igual a 8. En la prctica, esto se reportara como "la mediana de la muestra es 8", aunque estrictamente hablando, la mediana de la muestra se define como una variable aleatoria. NOTA 1 Para una muestra aleatoria (vase el numeral 2.6) de tamao de muestra n cuyas variables aleatorias (numeral 2.10) estn dispuestas en orden no descendente desde 1 hasta n, la mediana de la muestra es la variable aleatoria (n+1)/2-sima si el tamao de la muestra es impar. Si el tamao de la muestra n es par, entonces la mediana de la muestra es el promedio de las variables aleatorias (n/2)-sima y (n+1)/2-sima. NOTA 2 Conceptualmente, puede parecer imposible realizar un ordenamiento de variables aleatorias que no han sido observadas an. No obstante, la estructura para comprender los estadsticos de orden se puede establecer de manera que al llevar a cabo la observacin es posible realizar el anlisis. En la prctica se obtienen los valores observados y mediante la clasificacin de los valores se obtienen los resultados del estadstico de orden. Estos resultados se pueden interpretar entonces a partir de la estructura de los estadsticos de orden de una muestra aleatoria. NOTA 3 La mediana de la muestra suministra un estimador de la mitad de una distribucin, con la mitad de la muestra a cada lado de ella. NOTA 4 En la prctica, la mediana de la muestra es til para brindar un estimador que sea insensible a valores muy extremos en un conjunto de datos. Por ejemplo, los ingresos medianos y los precios medianos de las viviendas se reportan con frecuencia como valores resumidos. 2.14 Momento de la muestra de orden k (Sample Moment of Order k). E(Xk). Suma de la potencia ksima de las variables aleatorias (vase el numeral 2.10) en una muestra aleatoria (vase el numeral 2.6) dividida por el nmero de observaciones en la muestra (vase el numeral 2.3).

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    6

    NOTA 1 Para una muestra aleatoria del tamao de la muestra n, es decir, {X1, X2,... Xn}, el momento de la muestra de orden k, E(Xk) es

    =

    n

    i

    KiXn 1

    1

    NOTA 2 Adems, este concepto se puede describir como el momento de la muestra de orden k en relacin con cero. NOTA 3 El momento de la muestra de orden 1 se ver en la definicin siguiente como la media de la muestra (vase el numeral 2.15). NOTA 4 Aunque la definicin se da para k arbitrario, los ejemplos usados comnmente en la prctica involucran a k = 1 [media de la muestra (vase el numeral 2.15)], k= 2 [asociado con la varianza de la muestra] (vase el numeral 2.16) y la desviacin estndar de la muestra (vase el numeral 2.17)], k= 3 (relacionado con el coeficiente de asimetra de la muestra (vase el numeral 2.20)] y k = 4 [relacionado con el coeficiente de curtosis de la muestra (vase el numeral 2.21)]. NOTA 5 La "E" en E (Xk) proviene del "valor esperado" o "expectativa" de la variable aleatoria X. 2.15 Media de la muestra, promedio, media aritmtica (Sample Mean, Average, Arithmetic Mean). Suma de las variables aleatorias (vase el numeral 3.10) en una muestra aleatoria (vase el numeral 2.6), dividida por el nmero de trminos de la suma. EJEMPLO Continuando con el ejemplo del numeral 2.9, el resultado de la media de la muestra es 9,7 ya que la suma de los valores observados es 97 y el tamao de la muestra es 10. NOTA 1 Considerada como un estadstico, la media de la muestra es una funcin de las variables aleatorias de una muestra aleatoria en el sentido dado en la Nota 3 del numeral 2.8. Se debe diferenciar este estimador del valor numrico de la media de la muestra calculada de los valores observados (vase el numeral 2.4) en la muestra aleatoria. NOTA 2 La media de la muestra considerada como un estadstico se usa con frecuencia como un estimador de la media (vase el numeral 3.35) de la poblacin. Un sinnimo comn es media aritmtica. NOTA 3 Para una muestra aleatoria de un tamao de muestra n, es decir, {X1, X2,..., X n}, la media de la muestra es:

    =n

    iKiXn

    X1

    1

    NOTA 4 La media de la muestra se puede reconocer como el momento de la muestra de orden 1. NOTA 5 Para un tamao de muestra 2, la media de la muestra, la mediana de la muestra (vase el numeral 2.13) y el rango medio (vase el numeral 2.11) son los mismos. 2.16 Varianza de la muestra (Sample Variance), S2. Suma de las desviaciones al cuadrado de variables aleatorias (vase el numeral 3.10) en una muestra aleatoria (vase el numeral 2.6) respecto a su media de la muestra (vase el numeral 2.15), dividida por el nmero de trminos en la suma, menos uno. EJEMPLO Continuando con el ejemplo numrico del numeral 2.9, la varianza de la muestra se puede calcular como 17,57. La suma de los cuadrados en relacin con la media de la muestra observada es 158,10 y el tamao de la muestra 10 menos 1 es 9, lo que da un denominador apropiado. NOTA 1 Considerada como un estadstico (vase el numeral 2.8), la varianza de la muestra S2 es una funcin de las variables aleatorias de una muestra aleatoria. Es necesario diferenciar este estimador (vase el numeral 2.12) del valor numrico de la varianza de la muestra calculada de los valores observados (vase el numeral 2.4) en la muestra aleatoria. El valor numrico se denomina varianza emprica de la muestra o varianza observada de la muestra y se designa usualmente por s2.

    NOTA 2 Para una muestra aleatoria de tamao de muestra, n, es decir, {X1, X2, ..., Xn,) con la media de la muestra X , la

    varianza de la muestra es:

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    7

    =

    =n

    ii XXn

    S1

    22 )(1

    1

    NOTA 3 La varianza de la muestra es una funcin estadstica que es "casi" el promedio de los cuadrados de las desviaciones de las variables aleatorias (vase el numeral 3.10) respecto a su media de muestra (solo "casi", ya que n - 1 se usa en vez de n en el denominador). Al utilizar n - 1 se obtiene un estimador sin sesgo (vase el numeral 2.34) de la varianza de la poblacin (vase el numeral 3.36). NOTA 4 La cantidad n - 1 se conoce como los grados de libertad (vase el numeral 3.54). NOTA 5 La varianza de la muestra se puede reconocer como el segundo momento de la muestra de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19). 2.17 Desviacin estndar de la muestra, S. (Sample Standard Deviation, S). Raz cuadrada no negativa de la varianza de la muestra (vase el numeral 2.16). EJEMPLO Continuando con el ejemplo numrico del numeral 2.9, la desviacin estndar de la muestra observada es 4,192, ya que la varianza de la muestra observada es 17,57. NOTA 1 En la prctica, la desviacin estndar de la muestra se usa para estimar la desviacin estndar (vase el numeral 3.37). De nuevo, es conveniente hacer nfasis en que S tambin es una variable aleatoria (vase el numeral 3.10) y no un resultado de una muestra aleatoria (vase el numeral 2.6). NOTA 2 La desviacin estndar de la muestra es una medida de la dispersin de una distribucin (vase el numeral 3.11). 2.18 Coeficiente de variacin de la muestra (Sample Coefficient of Variation). Desviacin estndar de la muestra (vase el numeral 2.17) dividida por la media de la muestra (vase el numeral 2.15). NOTA Al igual que con el coeficiente de variacin (vase el numeral 3.38), la utilidad de esta funcin estadstica est limitada a poblaciones que se valoran positivamente. El coeficiente de variacin se reporta comnmente como un porcentaje. 2.19 Variable aleatoria normalizada de la muestra (Standardized Sample Random Variable). Variable aleatoria (vase el numeral 3.10) menos su media de la muestra (vase el numeral 2.15), dividida por la desviacin estndar de la muestra (vase el numeral 2.17). EJEMPLO Para el ejemplo del numeral 2.9, la media de la muestra observada es 9,7 y la desviacin estndar de la muestra observada es 4,192. En consecuencia, las variables aleatorias normalizadas (a dos lugares decimales) son: -0,17; 0,79; -0,64; -0,88; 0,79; -0,64; 2,22; - 0,88; 0,07; - 0,62. NOTA 1 La variable aleatoria normalizada de la muestra se diferencia de su contraparte terica la variable aleatoria normalizada (vase el numeral 3.33). La intencin de la normalizacin es transformar variables aleatorias con el fin de obtener medias iguales a cero y desviaciones estndar unitarias, y facilitar la interpretacin y la comparacin. NOTA 2 Los valores observados normalizados tienen una media observada de cero y una desviacin estndar observada de 1. 2.20 Coeficiente de asimetra de la muestra (Sample Coefficient of Skewness). Media aritmtica de la tercera potencia de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19) de una muestra aleatoria (vase el numeral 2.6). EJEMPLO Continuando con el ejemplo del numeral 2.9, el coeficiente de asimetra observado de la muestra se puede calcular como 0,971 88. Para un tamao de muestra de 10 en este ejemplo, el coeficiente de asimetra de la muestra es considerablemente variable, de manera que se debe usar con precaucin. Al usar la frmula alternativa de la Nota 1, el valor calculado es 1,349 83.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    8

    NOTA 1 La frmula correspondiente a la definicin es

    3

    1

    1 =

    n

    i

    i

    SXX

    n

    Algunos paquetes estadsticos utilizan la siguiente frmula para el coeficiente de asimetra de la muestra para corregir el sesgo (vase el numeral 2.33):

    =n

    iiZnn

    n

    1

    3

    )2()1(

    en donde

    SXXi

    Zi

    = Para una muestra tamao grande, la diferencia entre los dos estimados es insignificante. La relacin del estimado sin sesgo al estimado con sesgo es 1,389 para n = 10, 1,031 para n = 100 y 1,003 para n = 1 000. NOTA 2 Asimetra designa la falta de simetra. Los valores de esta funcin estadstica cercanos a cero sugieren que la distribucin subyacente es aproximadamente simtrica, mientras que los valores diferentes de cero corresponderan a una distribucin con valores extremos ocasionales a un lado del centro de la distribucin. Los datos asimtricos tambin se reflejaran en valores de la media de la muestra (vase el numeral 2.15) y la mediana de la muestra (vase el numeral 2.13) que son distintos. Los datos con asimetra positiva (asimetra hacia la derecha) indican la presencia posible de algunos valores extremos altos. En forma similar, los datos con asimetra negativa (asimetra a la izquierda) indican la presencia posible de algunos valores extremos bajos. NOTA 3 El coeficiente de asimetra de la muestra se puede reconocer como el tercer momento de la muestra de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19). 2.21 Coeficiente de curtosis de la muestra (Sample Coefficient of Kurtosis). La media aritmtica de la cuarta potencia de las variables aleatorias normalizadas de la muestra (vase el numeral 2.19) de una muestra aleatoria (vase el numeral 2.6). EJEMPLO Continuando con el ejemplo del numeral 2.9, el coeficiente de curtosis observado de la muestra se puede calcular como 2,674 19. Para un tamao de muestra de 10 en este ejemplo, el coeficiente de curtosis de la muestra es considerablemente variable, de manera que se debe usar con precaucin. Los paquetes estadsticos usan diversos ajustes para calcular el coeficiente de curtosis de la muestra (vase la Nota 3 del numeral 3.40). Usando la frmula alterna dada en la Nota 1, el valor calculado es 0,436 05. Los dos valores 2,674 19 y 0,436 05 no son comparables directamente. Para hacerlo, tome 2,674 19 - 3 (para relacionarlo con la curtosis de la distribucin normal, que es 3) que es igual a -0,325 81 y ahora se puede comparar apropiadamente con 0,436 05. NOTA 1 La frmula correspondiente a la definicin es:

    4

    1

    1 =

    n

    i

    i

    SXX

    n

    Algunos paquetes estadsticos usan la frmula siguiente para el coeficiente de curtosis de la muestra para hacer la correccin de sesgo (vase el numeral 2.33) y para indicar la desviacin de la curtosis en relacin con la distribucin normal (que es igual a 3):

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    9

    )3()2()1(3

    )3()2()1()1( 2

    1

    4

    + = nn

    nZ

    nnnnn

    n

    ii

    en donde

    SXX

    Z ii

    = El segundo trmino de la expresin es aproximadamente 3 para un n grande. Algunas veces la curtosis es reportada como un valor tal como se define en el numeral 3.40, menos 3, para hacer nfasis en las comparaciones con la distribucin normal. Obviamente, el profesional necesita conocer estos ajustes, si los hay, en los clculos de paquetes estadsticos. NOTA 2 La curtosis designa la mayor ponderacin de las colas de una distribucin (unimodal). Para la distribucin normal (vase el numeral 3.50), el coeficiente de curtosis es aproximadamente 3, sujeto a la variabilidad de la muestra. En la prctica, la curtosis de la distribucin normal brinda un valor de referencia. Las distribuciones (vase el numeral 3.11) con valores menores de 3 tienen colas con menor ponderacin que la distribucin normal; las distribuciones con valores mayores de 3 tienen ponderaciones mayores que la distribucin normal. NOTA 3 Para los valores de curtosis observados mucho mayores de 3, existe la posibilidad de que la distribucin subyacente tenga colas con ponderacin mayor que la distribucin normal. Otra posibilidad por investigar es la presencia de datos atpicos potenciales. NOTA 4 El coeficiente de curtosis de la muestra se puede reconocer como el cuarto momento de la muestra de las variables aleatorias centradas de la muestra reducida. 2.22 Covarianza de la muestra, SXY. (Sample Covariance, SXY.). Suma de los productos de las desviaciones de pares de variables aleatorias (vase el numeral 3.10) en una muestra aleatoria (vase el numeral 2.6) respecto a su media de la muestra (vase el numeral 2.15), dividida por el nmero de trminos en la suma, menos uno. EJEMPLO 1 Sea la representacin numrica siguiente utilizando 10 valores observados en tres tripletas de valores. Para este ejemplo considere solamente x y y.

    Tabla 1. Resultados para el Ejemplo 1

    i 1 2 3 4 5 6 7 8 9 10 x 38 41 24 60 41 51 58 50 65 33 y 73 74 43 107 65 73 99 72 100 48 z 34 31 40 28 35 28 32 27 27 31

    La media de la muestra observada para X es 46,1 y para Y es 75,4. La covarianza de la muestra es igual a:

    [(38 - 46,1) x (73 - 75,4) + (41 - 46,1) x (74 - 75,4) + ...+ (33 - 46,1) x (48 - 75,4)]/9 = 257,178 EJEMPLO 2 En la tabla del ejemplo anterior, considere solamente y y z. La media de la muestra observada para Z es 31,3. La covarianza de la muestra es igual a:

    [(73 - 75,4) x (34 - 31,3) + (74 - 75,4) x (74 - 31,3) + (48 - 75,4) x (31-31,3)]/9 = 54,356 NOTA 1 Considerado como un estadstico (vase el numeral 2.8), la covarianza de la muestra es una funcin de pares de variables aleatorias [(X1, Y1), (X2, Y2), ..., (Xn, Yn)] de una muestra aleatoria de tamao n en el sentido dado en la Nota 3 del numeral 2.6. Este estimador (2.12) necesita diferenciarse del valor numrico de la covarianza de la muestra calculada de los pares de valores observados de las unidades de muestra (vase el numeral 2.2) [(x1, y1), (x2 , y2), ... , (xn, yn)] en la muestra aleatoria. Este valor numrico se denomina covarianza de la muestra emprica o covarianza de la muestra observada.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    10

    NOTA 2 La covarianza de la muestra SXY est dada como:

    =

    n

    iii YYXXn

    1

    )()(1

    NOTA 3 La utilizacin de n - 1 proporciona un estimador sin sesgo (vase el numeral 2.34) de la covarianza de la poblacin (vase el numeral 3.43). NOTA 4 El ejemplo de la Tabla 1 consta de tres variables, en donde la definicin hace referencia a un par de variables. En la prctica, es comn encontrar situaciones con mltiples variables. 2.23 Coeficiente de correlacin de la muestra rxy. (Sample Correlation Coefficient, rxy). Covarianza de la muestra (vase el numeral 2.22) dividida por el producto de las desviaciones estndar de la muestra (vase el numeral 2.17) correspondientes. EJEMPLO 1 Continuando con el Ejemplo 1 del numeral 2.22, la desviacin estndar observada es 12,495 para X y 21,329 para Y. En consecuencia, el coeficiente de correlacin de la muestra observada (para X y Y) est dado por:

    257,118/(12,948 x 21,329) = 0,931 2 EJEMPLO 2 Continuando con el Ejemplo 2 del numeral 2.22, la desviacin estndar observada es 21,329 para Y y 4,165 para Z. En consecuencia, el coeficiente de correlacin de la muestra observada (para Y y Z) est dado por:

    -54,356/(21,329 x 4,165) = -0,612 NOTA 1 En trminos de notacin, el coeficiente de correlacin de la muestra se calcula como:

    = =

    =

    n

    i

    n

    iii

    n

    iii

    YYXX

    YYXX

    1 1

    22

    1

    Esta expresin es equivalente a la relacin de la covarianza de la muestra con la raz cuadrada del producto de las desviaciones estndar. Algunas veces el smbolo rxy se usa para designar el coeficiente de correlacin de la muestra. El coeficiente de correlacin de la muestra observada se basa en los datos (x1, y1), (x2, y2), ..., (xn, yn). NOTA 2 El coeficiente de correlacin de la muestra observada puede tomar valores dentro de [-1, 1], en donde los valores cercanos a 1 indican una correlacin positiva fuerte y los valores cercanos a -1 indican una correlacin negativa fuerte. Los valores cercanos a 1 -1 indican que los puntos estn prcticamente alineados. 2.24 Error estndar, (Standard Error, ). Desviacin estndar (vase el numeral 2.37) de un estimador, (vase el numeral 2.12). EJEMPLO Si la media de la muestra (vase el numeral 2.15) es el estimador de la media de la poblacin (vase el numera 3.35) y la desviacin estndar de una variable aleatoria simple (vase el numeral 3.10) es entonces el error estndar de la media de la muestra es n/ , donde n es el nmero de observaciones en la muestra. Un estimador del error estndar es nS / , donde S es la desviacin estndar de la muestra (vase el numeral 2.17) NOTA 1 En la prctica, el error estndar proporciona un estimado natural de la desviacin estndar de un estimador. NOTA 2 No hay un trmino complementario (apropiado) para "error no estndar". El error estndar se puede considerar como una abreviatura de la expresin "desviacin estndar de un estimador" Comnmente, en la prctica error estndar hace referencia implcitamente a la desviacin estndar de la media de la muestra. La notacin para el error estndar de la media de la muestra es

    X

    )

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    11

    2.25 Estimador por intervalos (Interval Estimator). Intervalo cuyos lmites son una funcin estadstica con lmite superior (vase el numeral 2.8) y una funcin estadstico con lmite inferior. NOTA 1 Uno de los puntos extremos puede ser +, - un lmite natural del valor de un parmetro. Por ejemplo, 0 es un lmite inferior natural para un estimador por intervalos de la varianza de la poblacin (vase el numeral 3.36). En estos casos, los intervalos se designan comnmente como intervalos unilaterales. NOTA 2 Un estimador por intervalos se puede suministrar junto con una estimacin (vase el numeral 2.36) de un parmetro (vase el numeral 3.9). Se supone que el estimador por intervalos contiene un parmetro en una proporcin declarada de situaciones, bajo condiciones de muestreo repetido, o en algn otro sentido probabilstico. NOTA 3 Tres tipos comunes de estimadores por intervalos incluyen intervalos de confianza (vase el numeral 2.28) para parmetro(s), intervalos de prediccin (vase el numeral 2.30) para observaciones futuras, e intervalos estadsticos de tolerancia (vase el numeral 2.26) para la proporcin de una distribucin (vase el numeral 3.11) contenida. 2.26 Intervalo de tolerancia estadstica (Statistical Tolerance Interval). Intervalo determinado a partir de una muestra aleatoria (vase el numeral 2.6) de manera que puede existir un nivel determinado de confianza en que el intervalo cubre al menos una proporcin especificada de la poblacin sometida a muestreo (vase el numeral 2.1). NOTA La confianza en este contexto es la proporcin a largo plazo de intervalos construidos de esta manera, que incluirn al menos la proporcin especificada de la poblacin sometida a muestreo. 2.27 Lmite de tolerancia estadstica (Statistical Tolerance Limit). Estadstica (vase el numeral 2.8) que representa un punto final externo de un intervalo estadstico de tolerancia (vase el numeral 2.26). NOTA Los intervalos estadsticos de tolerancia pueden ser: - Unilaterales (con uno de sus lmites fijos al lmite natural de la variable aleatoria), en cuyo caso tienen un

    lmite estadstico de tolerancia superior e inferior, o - Bilaterales, en cuyo caso tienen ambos. Un lmite natural de la variable aleatoria puede brindar un lmite para un lmite unilateral. 2.28 Intervalo de confianza (Confidence Interval). Estimador por intervalos (vase el numeral 2.25) (T0, T1) para el parmetro (vase el numeral 3.9) T0 y T1 con las funciones estadsticas (vase el numeral 2.8) T0 y T1 como lmites de intervalos y para los cuales se estipula que: [ ]

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    12

    NOTA 1 La definicin del numeral 2.28 se aplica a T0 fijado en -, T1 fijado en + Los intervalos de confianza unilaterales surgen en situaciones en las que el inters se enfoca estrictamente en una sola direccin. Por ejemplo, en una prueba de seguridad sobre volumen de audio en telfonos celulares, un lmite de confianza superior sera el inters que indica un lmite superior para el volumen producido en condiciones de seguridad supuestas. Para los ensayos mecnicos estructurales, sera de inters un lmite de confianza inferior sobre la fuerza a la cual el dispositivo falla. NOTA 2 Otro ejemplo de intervalos de confianza unilaterales se presenta en situaciones en las que un parmetro tiene un lmite natural, como por ejemplo cero. Para una distribucin de Poisson (vase el numeral 3.47) involucrada en el modelado de quejas de los clientes, cero es un lmite inferior. Otro ejemplo: un intervalo de confianza para la fiabilidad de un componente electrnico puede ser (0, 98, 1) en donde 1 es el lmite superior natural. 2.30 Intervalo de prediccin (Prediction Interval). Rango de valores de una variable obtenidos de una muestra aleatoria (vase el numeral 2.6) de valores de una poblacin continua, dentro del cual se puede asegurar con una confianza dada que fallar no menos de un nmero dado de valores en una muestra aleatoria ulterior posterior de la misma poblacin (vase el numeral 2.1). NOTA Generalmente, el inters se enfoca en una sola observacin ulterior que surge de la misma situacin que las observaciones que son la base del intervalo de prediccin. Otro contexto prctico es el anlisis de regresin, en el cual un intervalo de prediccin se construye para un espectro de valores independientes. 2.31 Estimado (Estimate). Valor observado (vase el numeral 2.4) de un estimador (vase el numeral 2.12). NOTA Un estimado hace referencia a un valor numrico obtenido a partir de valores observados. Con respecto a la estimacin (vase el numera 2.36) de un parmetro (vase el numeral 3.9) a partir de una distribucin de probabilidad (vase el numeral 3.11) supuesta, el estimador hace referencia a la funcin estadstica (vase el numeral 2.8) destinado a estimar el parmetro, y el estimado hace referencia al resultado obtenido con los valores observados. Algunas veces al estimado se le coloca el adjetivo "puntual", para hacer nfasis en que se produce un solo valor, no un intervalo de valores. En forma similar, la expresin "por intervalos" se coloca antes de "estimado", cuando se realiza una estimacin por intervalos. 2.32 Error de estimacin (Error of Estimation). Estimado (vase el numeral 2.31) menos el parmetro (vase el numeral 3.9) o propiedad de la poblacin que se prev estimar. NOTA 1 La propiedad de la poblacin puede ser una funcin del parmetro o parmetros u otra cantidad relacionada con la distribucin de probabilidad (vase el numeral 3.11). NOTA 2 El error del estimador se puede deber al muestreo, a la incertidumbre de la medicin, al redondeo o a otras fuentes. En efecto, el error del estimador representa para los usuarios el desempeo de base de inters. La determinacin de las principales contribuciones al error del estimador es un elemento crtico en los esfuerzos de mejora de la calidad. 2.33 Sesgo (Bias). Valor esperado (vase el numeral 3.12) de un error de estimacin (vase el numeral 2.32). NOTA 1 Esta definicin es diferente de las que se encuentran en la NTC 2062-2 (en el numeral 3.3.2 de la norma ISO 3534-2) y en el VIM:1993 (vense los numerales 5.25 y 5.28 del VIM). Sesgo se usa aqu en un sentido genrico, como se indica en la Nota 1 del numeral 2.34. NOTA 2 La existencia de sesgo puede conducir a consecuencias desafortunadas en la prctica. Por ejemplo, subestimar la resistencia de materiales debido al sesgo puede conducir a fallas inesperadas en un dispositivo. En muestreo por encuesta, el sesgo puede conducir a decisiones incorrectas a partir de un sondeo poltico. 2.34 Estimador sin sesgo (Unbiased Estimator). Estimador (vase el numeral 2.12) que tiene un sesgo (vase el numeral 2.33) igual a cero. EJEMPLO 1 Para una muestra aleatoria (vase el numeral 2.6) de n variables aleatorias independientes (vase el numeral 3.10), cada una con la misma distribucin normal (vase el numeral 3.50) con media (vase el numeral 3.35) y desviacin estndar (vase el numeral 3.37) , la media de la muestra X (vase el numeral 2.15) y la varianza de la

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    13

    muestra (vase el numeral 2.16) S2 son estimadores sin sesgo para la media y la varianza (vase el numeral 2.36) 2, respectivamente. EJEMPLO 2 Como se mencion en la Nota 1 del numeral 2.37, el estimador del mximo de verosimilitud (vase el numeral 2.35) de la varianza 2 usa el denominador n en lugar de n - 1, y de esta manera es un estimador con sesgo. En la prctica, la desviacin estndar de la muestra (vase el numeral 2.17) se usa considerablemente, pero es importante observar que la raz cuadrada de la varianza de la muestra utilizando n -1 es un estimador con sesgo de la desviacin estndar de la poblacin (vase el numeral 3.37). EJEMPLO 3 Para una muestra aleatoria de n pares independientes de variables aleatorias, cada par con la misma distribucin normal con dos variables (vase el numeral 3.65) con covarianza (vase el numeral 3.43) igual a XY, la covarianza de la muestra (vase el numeral 2.22) es un estimador sin sesgo para la covarianza de la poblacin. El estimador del mximo de verosimilitud usa n en lugar de n - 1 en el denominador, y de esta manera tiene sesgo. NOTA Los estimadores sin sesgo son tiles, ya que en promedio dan un valor correcto. Sin duda, los estimadores sin sesgo brindan un punto de partida til en la bsqueda de estimadores "ptimos" de los parmetros de poblacin. La definicin dada aqu es de naturaleza estadstica. En la prctica cotidiana, los usuarios intentan evitar la introduccin de sesgo en un estudio asegurndose, por ejemplo, de que la muestra aleatoria sea representativa de la poblacin de inters. 2.35 Estimador del mximo de verosimilitud (Maximum Likelihood Estimator). Estimador (vase el numeral 2.12) que asigna el valor del parmetro (vase el numeral 3.9), en donde la funcin de verosimilitud (vase el numeral 2.38) alcanza o se aproxima a su mayor valor. NOTA 1 La estimacin del mximo de verosimilitud es un mtodo bien establecido para obtener estimados de parmetros cuando se ha especificado una distribucin (vase el numeral 3.11) [por ejemplo, normal (vase el numeral 3.50), gamma (vase el numeral 3.56), Weibull (vase el numeral 3.63), etc.] Estos estimadores tienen propiedades estadsticas tiles (por ejemplo, invariancia en transformacin montona) y en muchas situaciones proporcionan el mtodo de seleccin. En casos en que el estimador del mximo de verosimilitud tiene sesgo, puede tener lugar una correccin simple del sesgo (vase el numeral 2.33). Como se mencion en el ejemplo 2 del numeral 2.34, el estimador del mximo de verosimilitud para la varianza (vase el numeral 3.36) de la distribucin normal tiene sesgo pero se puede corregir usando n - 1 en vez de n. El alcance del sesgo en estos casos se reduce cuando se incrementa el tamao de la muestra. NOTA 2 La abreviatura EMV se usa comnmente para estimador del mximo de verosimilitud y para estimacin del mximo de verosimilitud, en donde el contexto indica la opcin apropiada. 2.36 Estimacin (Estimation). Procedimiento para obtener una representacin estadstica de una poblacin (vase el numeral 2.1) a partir de una muestra aleatoria (vase el numeral 2.6) tomada de esta poblacin. NOTA 1 En particular, el procedimiento involucrado al pasar de un estimador (vase el numeral 2.12) a un estimado especfico constituye la estimacin. NOTA 2 La estimacin se entiende en un contexto bastante amplio para incluir estimacin puntual, estimacin por intervalos o estimacin de las propiedades de las poblaciones. NOTA 3 Con frecuencia, una representacin estadstica hace referencia a la estimacin de un parmetro (vase el numeral 3.9) o parmetros, o de una funcin de estos a partir de un modelo asumido. De manera ms general, la representacin de la poblacin puede ser menos especfica, tales como las funciones estadsticas relativas a los impactos de desastres naturales (vctimas, lesiones, prdidas de propiedades y prdidas en la agricultura, todas las que el responsable de las emergencias podra querer estimar). NOTA 4 La consideracin de una funcin estadstica descriptiva (vase el numeral 2.5) puede sugerir que un modelo supuesto brinda una representacin inadecuada de los datos, como se indica por una medida del ajuste del modelo a los datos. En estos casos, se pueden considerar otros modelos y continuar el proceso de estimacin.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    14

    2.37 Estimacin del mximo de verosimilitud (Maximum Likelihood Estimation). Estimacin (vase el numeral 2.36) basada en el estimador del mximo de verosimilitud (vase el numeral 2.35). NOTA 1 Para la distribucin normal (vase el numeral 3.50), la media de la muestra (vase el numeral 2.15) es el estimador del mximo de verosimilitud (vase el numeral 2.35) del parmetro (vase el numeral 3.9) , mientras que la varianza de la muestra (vase el numeral 2.16), usando el denominador n en vez de n - 1, proporciona el estimador del mximo de verosimilitud de 2. El denominador n -1 se usa habitualmente, ya que este valor proporciona un estimador sin sesgo (vase el numeral 2.34). NOTA 2 La estimacin del mximo de verosimilitud se usa algunas veces para describir la obtencin de un estimador (vase el numeral 2.12) a partir de la funcin de verosimilitud. NOTA 3 Aunque en algunos casos el uso de la estimacin del mximo de verosimilitud da lugar a una expresin analtica, existen otras situaciones en las que el estimador del mximo de verosimilitud requiere una solucin iterativa a un conjunto de ecuaciones. NOTA 4 La abreviatura EMV se usa comnmente para estimador del mximo de verosimilitud y para estimacin del mximo de verosimilitud, dependiendo del contexto. 2.38 Funcin de verosimilitud (Likelihood Function). Funcin de densidad de probabilidad (vase el numeral 3.26) evaluada a los valores observados (vase el numeral 2.4) y considerada como una funcin de los parmetros (vase el numeral 3.9) de la familia de distribuciones (vase el numeral 3.8). EJEMPLO 1 Considere una situacin en la cual se seleccionan aleatoriamente 10 elementos de una poblacin muy grande (vase el numeral 2.1) y se encuentra que 3 elementos tienen una caracterstica especfica. De esta muestra, 0,3 (3 de 10) es un estimado (vase el numeral 2.31) intuitivo de la proporcin de poblacin que tiene la caracterstica. Dentro de un modelo de distribucin binomial (vase el numeral 3.46), la funcin de verosimilitud (funcin de masa de probabilidad como una funcin de p con n fijado en 10 y x en 3) logra su mximo en p = 0,3, que concuerda con la intuicin. [Esto se puede verificar posteriormente graficando la funcin de masa de probabilidad de la distribucin binomial (vase el numeral 3.46) 120 p3 (1 - p)7 con relacin a p]. EJEMPLO 2 Para la distribucin normal (vase el numeral 3.50) con una desviacin estndar (vase el numeral 3.37) conocida, se puede demostrar en general que la funcin de verosimilitud alcanza su mximo cuando es igual a la media de la muestra. 2.39 Funcin de verosimilitud parcial (Profile Likelihood Function). Funcin de verosimilitud (vase el numeral 2.38) considerada con base en un solo parmetro (vase el numeral 3.9), con todos los dems parmetros fijados para maximizarla. 2.40 Hiptesis, H (Hypothesis, H). Declaracin acerca de una poblacin (vase el numeral 2.1). NOTA Comnmente, la declaracin acerca de la poblacin concierne a uno o ms parmetros (vase el numeral 3.9) en una familia de distribuciones (vase el numeral 3.8) o acerca de la familia de distribuciones. 2.41 Hiptesis nula, H0 (Null Hiptesis, H0). Hiptesis (vase el numeral 2.40) que se debe poner a prueba por medio de una prueba estadstica (vase el numeral 2.48). EJEMPLO 1 En una muestra aleatoria (vase el numeral 2.6) de variables aleatorias independientes (vase el numeral 3.10) que tienen la misma distribucin normal (vase el numeral 3.50), con una media desconocida (vase el numeral 3.35) y una desviacin estndar desconocida (vase el numeral 3.37), una hiptesis nula para una media puede ser que la media es menor o igual a un valor dado 0 y esto se escribe usualmente de la siguiente forma; H0: 0. EJEMPLO 2 Una hiptesis nula puede ser que el modelo estadstico para una poblacin (vase el numeral 2.1) es una distribucin normal. Para este tipo de hiptesis nula no se especifican la media y la desviacin estndar.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    15

    EJEMPLO 3 Una hiptesis nula puede ser que el modelo estadstico para una poblacin sea una distribucin simtrica. Para este tipo de hiptesis nula no se especifica la forma de la distribucin. NOTA 1 Explcitamente, la hiptesis nula puede consistir en un subconjunto de un conjunto de distribuciones de probabilidades posibles. NOTA 2 Esta definicin no se debera considerar independientemente de la hiptesis alternativa (vase el numeral 2.42) y la prueba estadstica (vase el numeral 2.48), ya que la aplicacin apropiada de la puesta a prueba requiere todos estos componentes. NOTA 3 En la prctica jams se demuestra una hiptesis nula, sino que la evaluacin en una situacin dada puede ser inadecuada para rechazar la hiptesis nula. La motivacin original para poner a prueba la hiptesis probablemente ha sido que el resultado de la esperanza matemtica de que el resultado favorezca una hiptesis alternativa especfica para el problema en cuestin. NOTA 4 La decisin de no rechazar la hiptesis nula no es una prueba de su validez, sino puede ser ms bien una indicacin de que hay evidencia insuficiente para rechazarla. La hiptesis nula (o una cercana a ella) puede ser verdadera, o el tamao de la muestra es insuficiente para detectar una diferencia con relacin a sta. NOTA 5 En algunas situaciones, el inters inicial est enfocado hacia la hiptesis nula, pero la posibilidad de una desviacin puede ser de inters. La consideracin apropiada del tamao de la muestra y su capacidad para detectar una desviacin o alternativa especfica puede conducir a la construccin de un procedimiento de ensayo para evaluar apropiadamente la hiptesis nula. NOTA 6 La aceptacin de la hiptesis alternativa, contrariamente a la decisin de no rechazar la hiptesis nula, es un resultado positivo en el sentido en que apoya la conjetura de inters. El rechazo de la hiptesis nula a favor de la alternativa es un resultado con menos ambigedad que un resultado de "no se rechaza la hiptesis nula esta vez". NOTA 7 La hiptesis nula es la base para construir el estadstico de prueba (vase el numeral 2.52) correspondiente usada para evaluar la hiptesis nula. NOTA 8 La hiptesis nula se denota con frecuencia H0 (H con subndice 0). NOTA 9 El subconjunto que identifica la hiptesis nula de ser posible debera seleccionarse de manera que la declaracin sea incompatible con la conjetura por estudiar. Vase la Nota 2 del numeral 2.48 y el ejemplo del numeral 2.49. 2.42 Hiptesis alternativa, HA, H1 (Alternative Hypotesis, HA, H1). Declaracin que selecciona un conjunto o subconjunto de todas las posibles distribuciones de probabilidad (vase el numeral 3.11) admisibles posibles que no pertenecen a la hiptesis nula (vase el numeral 2.41). EJEMPLO 1 La hiptesis alternativa a la hiptesis nula dada en el ejemplo 1 del numeral 2.41 es que la media (vase el numeral 3.35) es mayor que el valor especificado, que se expresa as: HA : > 0. EJEMPLO 2 La hiptesis alternativa a la hiptesis nula presentada en el ejemplo 2 del numeral 2.41 es que el modelo estadstico de la poblacin no es una distribucin normal (vase el numeral 3.50). EJEMPLO 3 La hiptesis alternativa a la hiptesis nula dada en el Ejemplo 3 del numeral 2.41 es que el modelo estadstico de la poblacin es una distribucin asimtrica. Para esta hiptesis alternativa no se establece la forma especfica de la asimetra. NOTA 1 La hiptesis alternativa es el complemento de la hiptesis nula. NOTA 2 La hiptesis alternativa tambin se puede designar como H1 o HA sin preferencia clara en tanto que el simbolismo sea paralelo a la notacin de la hiptesis nula. NOTA 3 La hiptesis alternativa es una declaracin que contradice la hiptesis nula. El estadstico de prueba (vase el numeral 2.52) correspondiente se usa para decidir entre las hiptesis cero y la alternativa. NOTA 4 La hiptesis alternativa no se debera considerar aislada de la hiptesis nula ni del estadstico de prueba (vase el numeral 2.48). NOTA 5 La aceptacin de la hiptesis alternativa, contrariamente a la decisin de no rechazar la hiptesis nula, es un resultado positivo en el sentido en que apoya la conjetura de inters.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    16

    2.43 Hiptesis simple (Simple Hypothesis). Hiptesis (vase el numeral 2.40) que especifica una sola distribucin en una familia de distribuciones (vase el numeral 3.8). NOTA 1 Una hiptesis simple es una hiptesis nula (vase el numeral 2.41) o una hiptesis alternativa (vase el numeral 2.42) para la cual el conjunto seleccionado consta de una distribucin de probabilidad simple (vase el numeral 3.11). NOTA 2 En una muestra aleatoria (vase el numeral 2.6) de variables aleatorias independientes (vase el numeral 3.10) con la misma distribucin normal (vase el numeral 3.50) con una media desconocida (vase el numeral 3.35) y una desviacin estndar conocida (vase el numeral 3.37) , una hiptesis simple para la media es que la media es igual a un valor dado '0 y esto se escribe usualmente de la siguiente forma: H0: = 0. NOTA 3 Una hiptesis simple especifica completamente la distribucin de probabilidad (vase el numeral 3.11). 2.44 Hiptesis compuesta (Composite Hypothesis). Hiptesis (vase el numeral 2.40) que especifica ms de una distribucin (vase el numeral 3.11) en una familia de distribuciones (vase el numeral 3.8). EJEMPLO 1 La hiptesis nula (vase el numeral 2.41) y las hiptesis alternativas (vase el numeral 2.42) dadas en los ejemplos de los numerales 2.41 y 2.42 son todos ejemplos de hiptesis compuestas. EJEMPLO 2 En el numeral 2.48, la hiptesis nula en el Caso 3 del Ejemplo 3 es una hiptesis simple. La hiptesis nula del Ejemplo 4 tambin es una hiptesis simple. Las otras hiptesis del numeral 2.48 son compuestas. NOTA Una hiptesis compuesta es una hiptesis nula o una hiptesis alternativa para la cual el subconjunto seleccionado consta de ms de una distribucin de probabilidad simple. 2.45 Nivel de significacin, (Significance Level, ). . Probabilidad mxima (vase el numeral 3.5) de rechazar la hiptesis nula (vase el numeral 2.41) cuando en realidad es verdadera. NOTA Si la hiptesis nula es una hiptesis simple (vase el numeral 2.43), entonces la probabilidad de rechazar la hiptesis nula si fuera verdadera, llega a ser un valor simple. 2.46 Error Tipo I (Type I Error). Rechazo de la hiptesis nula (vase el numeral 2.41) cuando en realidad es verdadera. NOTA 1 De hecho, un error Tipo I es una decisin incorrecta. En consecuencia, se desea mantener la menor probabilidad posible (vase el numeral 3.5) de tomar una decisin incorrecta. Para obtener una probabilidad cero de un error Tipo I, nunca se rechazara la hiptesis nula. En otras palabras, independientemente de la evidencia, se toma la misma decisin. NOTA 2 En algunas situaciones (por ejemplo, en el ensayo del parmetro binomial p) es posible que no se pueda alcanzar un nivel de significacin especificado tal como 0,05, debido a la discontinuidad de los resultados. 2.47 Error tipo II (Type II Error). Decisin de no rechazar la hiptesis nula (vase el numeral 2.41) cuando en realidad sta no es verdadera. NOTA De hecho, el error Tipo II es una decisin incorrecta. En consecuencia, se desea mantener la menor probabilidad posible (vase el numeral 3.5) de tomar una decisin incorrecta. Los errores Tipo II ocurren comnmente en situaciones en las que el tamao de la muestra es insuficiente para revelar una desviacin de la hiptesis nula. 2.48 Prueba estadstica, prueba de significacin (Statistical Test, Significance Test). Procedimiento para decidir si una hiptesis nula (vase el numeral 2.41) debe ser rechazada a favor de una hiptesis alternativa (vase el numeral 2.42). EJEMPLO 1 A manera de ejemplo, si una variable aleatoria continua (vase el numeral 3.29) real puede tomar valores entre - y + y se sospecha que la distribucin de probabilidad verdadera no es una distribucin normal (vase el numeral 3.50), entonces se formularn las siguientes hiptesis:

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    17

    - El alcance de la situacin son todas las distribuciones de probabilidad continuas (vase el numeral 3.23) que pueden tomar valores entre - y + .

    - La conjetura es que la distribucin de probabilidad verdadera no es una distribucin normal. - La hiptesis nula es que la distribucin de probabilidad es una distribucin normal. - La hiptesis alternativa es que la distribucin de probabilidad no es una distribucin normal. EJEMPLO 2 Si la variable aleatoria sigue una distribucin normal con una desviacin estndar conocida (vase el numeral 3.37) y se sospecha que su valor esperado se desva de un valor dado 0, entonces las hiptesis se formularn de acuerdo con el Caso 3 en el siguiente ejemplo. EJEMPLO 3 Este ejemplo considera tres posibilidades en el ensayo estadstico. Caso 1. Se supone que la media del proceso es mayor que la media objetivo de 0. Esta conjetura conduce a las siguientes hiptesis. Hiptesis nula: H0 : 0 Hiptesis alternativa: H1 : 0 Caso 2. Se supone que la media del proceso es inferior a la media objetivo de 0. Esta conjetura conduce a las siguientes hiptesis. Hiptesis nula: H0 : 0 Hiptesis alternativa: H1 : 0 Caso 3. Se supone que la media del proceso no es compatible con la media del proceso, pero no se especifica la direccin. Esta conjetura conduce a las siguientes hiptesis. Hiptesis nula: H0 : = 0 Hiptesis alternativa: H1 : 0 En todos los tres casos, la formulacin de las hiptesis se basa en una conjetura concerniente a la hiptesis alternativa y a su desviacin de su condicin de referencia. EJEMPLO 4 Este ejemplo considera como su alcance todas las proporciones p1 y p2 entre cero y una proporcin de defectuosos en los lotes 1 y 2. Se podra sospechar que los dos lotes son diferentes, y por tanto, suponer que las proporciones de defectos en los dos lotes son diferentes. Esta conjetura conduce a las siguientes hiptesis: Hiptesis nula: H0 : p1 = p2 Hiptesis alternativa: H1 : p1 p2 NOTA 1 Una prueba estadstica es un procedimiento que es vlido bajo condiciones especificadas, para decidir, por medio de observaciones de una muestra, si la distribucin de probabilidad verdadera pertenece a la hiptesis nula o a la hiptesis alternativa. NOTA 2 Antes de llevar a cabo una prueba estadstica, se determina primero el conjunto posible de distribuciones de probabilidad con base en la informacin disponible. Posteriormente se identifican las distribuciones de probabilidad que pueden ser verdaderas con base en la conjetura por estudiar, para elaborar la hiptesis alternativa. Finalmente, la hiptesis nula se formula como complemento a la hiptesis alternativa. En muchos casos, el conjunto posible de distribuciones de probabilidad, y en consecuencia tambin la hiptesis nula y la hiptesis alternativa se pueden determinar por referencia a conjuntos de valores de parmetros pertinentes. NOTA 3 Cuando la decisin se toma con base en observaciones de una muestra, existe el riesgo de cometer un error Tipo I (vase el numeral 2.46), rechazar la hiptesis nula cuando de hecho es correcta, o un error Tipo II (vase el numeral 2.47), decidir no rechazar la hiptesis nula a favor de la hiptesis alternativa, cuando esta ltima es verdadera. NOTA 4 El Caso 1 y 2 del Ejemplo 3 anterior son casos de pruebas unilaterales. El Caso 3 es un ejemplo de una prueba bilateral. En todos los tres casos, la seleccin entre unilateral contra bilateral se determina considerando la regin del parmetro correspondiente a la hiptesis alternativa. Ms generalmente, las ensayos unilaterales y bilaterales pueden ser controlados por la regin para rechazo de la hiptesis nula, correspondiente a la funcin estadstica de ensayo escogida. Es decir, la funcin estadstica de ensayo tiene una regin crtica asociada que favorece la hiptesis alternativa, pero es posible que no est relacionada directamente con una simple descripcin

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    18

    del espacio del parmetro, como en los Casos 1, 2 y 3. NOTA 5 Se debera prestar mucha atencin a las suposiciones subyacentes, o la aplicacin de las pruebas estadsticas no tendr fundamento. Las pruebas estadsticas que conducen a inferencias estables incluso en el caso de posibles especificaciones defectuosas de las suposiciones subyacentes se denominan robustos. El ensayo t de una muestra para la media es un ejemplo de una prueba considerada muy robusta en condiciones no normales. El ensayo de Bartlett para homogeneidad de las varianzas es un ejemplo de un procedimiento no robusto que posiblemente conduce al rechazo excesivo de la igualdad de varianzas en casos de distribucin para las cuales las varianzas fueron en realidad idnticas. 2.49 Valor p (p-value). Probabilidad (vase el numeral 3.5) de observar el valor del estadstico de prueba (vase el numeral 2.52) observado o cualquier otro valor desfavorable para la hiptesis nula (vase el numeral 2.41). EJEMPLO Considere el ejemplo numrico introducido originalmente en el numeral 2.9. Suponga, a manera de ilustracin, que estos valores son observaciones de un proceso que se espera nominalmente que tenga una media de 12,5 y que con base en su experiencia previa el ingeniero asociado con el proceso considere que ste era constantemente ms bajo que el valor nominal. Se realiz un estudio y se recolect una muestra aleatoria de tamao 10, con los resultados numricos de del numeral 2.9. Las hiptesis apropiadas son: Hiptesis nula: H0 : 12,5 Hiptesis alternativa: H1 : < 12,5 La media de la muestra es 9,7, que parece concordar con la conjetura, pero, est lo suficientemente alejada de 12,5 para apoyar la conjetura? Para este ejemplo, el estadstico de prueba (vase el numeral 2.52) es -1,976 4 con su correspondiente valor p de 0,040. Esto significa que hay menos de 4 oportunidades en cien de observar un valor de funcin estadstica de -1,976 4 inferior, si de hecho la media del proceso verdadero es 12,5. Si el nivel de significacin pre-especificada original hubiera sido 0,05, entonces habitualmente se rechazara la hiptesis nula a favor de la hiptesis alternativa. Como alternativa, suponga que el problema fuera formulado en una forma un poco diferente. Imagine que el problema fuera que el proceso est alejado de la meta de 12,5 pero la direccin no se ha especificado. Esto conduce a las siguientes hiptesis: Hiptesis nula: H0 : = 12,5 Hiptesis alternativa: H1 : 12,5 Dados los mismos datos recolectados de una muestra aleatoria, la funcin estadstica de ensayo es el mismo, -1,976 4. Para esta hiptesis alternativa, una pregunta importante es "cul es la probabilidad de observar un valor as de extremo u otro ms extremo?" En este caso hay dos regiones pertinentes: valores menores o iguales a -1,9764, o valores mayores o iguales a 1,9764. La probabilidad de que ocurra una funcin estadstica de ensayo t en una de estas regiones es 0,080 (el doble del valor unilateral). Hay ocho oportunidades en 100 de observar un valor de una funcin estadstica de ensayo as de extremo o todava ms. As, la hiptesis nula no es rechazada al nivel de significacin de 0,05. NOTA 1 Por ejemplo, si el valor p resulta ser 0,029, entonces hay menos de tres oportunidades en cien de que este valor extremo de la funcin estadstica de ensayo, o uno ms extremo, ocurra bajo la hiptesis nula. Con base en esta informacin es posible tener que rechazar la hiptesis nula, ya que este es un valor p bastante pequeo. Ms formalmente, si el nivel de significacin se hubiera establecido en 0,05, entonces definitivamente el valor p de 0,029, al ser inferior a 0,05 conducira al rechazo de la hiptesis nula. NOTA 2 El valor p del trmino algunas veces se denomina probabilidad de significacin, que no se debera confundir con el nivel de significacin (vase el numeral 2.45) que es una constante especificada en una aplicacin. 2.50 Potencia de una prueba (Power of a Test). Uno menos la probabilidad (vase el numeral 3.5) del error Tipo II (vase el numeral 2.47).

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    19

    NOTA 1 La eficiencia de una prueba para un valor especificado de un parmetro desconocido (vase el numeral 3.9) en una familia de distribuciones (vase el numeral 3.8) es igual a la probabilidad de rechazar la hiptesis nula (vase el numeral 2.41) para el valor del parmetro. NOTA 2 En la mayora de casos de inters prctico, al incrementar el tamao de la muestra se incrementar la eficiencia de la prueba. En otras palabras, la probabilidad de rechazar la hiptesis nula cuando la hiptesis alternativa (vase el numeral 2.42) es verdadera aumenta al incrementarse el tamao de la muestra, reduciendo de esta manera la probabilidad de un error Tipo II. NOTA 3 En situaciones de ensayo es recomendable que cuando la muestra de ensayo es extremadamente grande, deberan detectarse incluso desviaciones pequeas de la hiptesis nula, lo que conduce al rechazo de la hiptesis nula. En otras palabras, la eficiencia de la prueba se debera aproximar a 1 para cualquier alternativa a la hiptesis nula cuando el tamao de la muestra llega a ser infinitamente grande. Estos ensayos se denominan consistentes. Al comparar dos pruebas con respecto a su eficiencia potencia, la prueba con la mayor eficiencia potencia se considera la ms eficiente, siempre y cuando los niveles de significacin sean idnticos, al igual que las hiptesis nulas y alternativas particulares. Hay descripciones matemticas ms formales de los trminos "consistencia" y "eficiencia" que se encuentran fuera del alcance de esta norma. (Consulte las diferentes enciclopedias de estadstica o libros de estadstica matemtica). 2.51 Curva de potencia (Power Curve). Conjunto de valores de la eficiencia de una prueba (vase el numeral 2.50) en funcin del parmetro de la poblacin (vase el numeral 3.9) de una familia de distribuciones (vase el numeral 3.8). NOTA La funcin de eficiencia es igual a uno menos la curva caracterstica de operacin. 2.52 Estadstico de prueba, estadstico de contraste (Test Statistic). Estadstico (vase el numeral 2.8) usado conjuntamente con una prueba estadstica (vase el numeral 2.48). NOTA La funcin estadstica de ensayo se usa para evaluar si la distribucin de probabilidad (vase el numeral 3.11) considerada es coherente con la hiptesis nula (vase el numeral 2.41) o la hiptesis alternativa (vase el numeral 2.42). 2.53 Funcin estadstica descriptiva grfica (Graphical Descriptive Statistics). Estadstica descriptiva (vase el numeral 2.5) representada en forma grfica. NOTA Generalmente, la intencin de la funcin estadstica descriptiva es reducir un gran nmero de valores a algunos valores fciles de manejar, o presentar los valores de manera que se facilite su visualizacin. Los ejemplos de resmenes grficos incluyen grficos de cajas, grficos de probabilidad, grficos Q-Q, diagramas de cuantila normal, grficos de dispersin (nube de puntos), grficos de dispersin mltiple (nube de puntos mltiple), e histogramas (vase el numeral 2.61). 2.54 Funcin estadstica descriptiva numrica (Numerical Descriptive Statistics). Funcin Estadstica descriptiva (vase el numeral 2.5) en forma numrica. NOTA La estadstica descriptiva numrica incluye el promedio (vase el numeral 2.15), el rango de la muestra (vase el numeral 2.10), la desviacin estndar de la muestra (vase el numeral 2.17), el rango intercuartila, etc. 2.55 Clases (Classes) NOTA Se supone que las clases son mutuamente exclusivas y exhaustivas. La lnea real son todos los nmeros reales entre - y + . 2.55.1 Clase (Class). Subconjunto de elementos de una muestra (vase el numeral 2.3). 2.55.2 Clase (Class). Conjunto de una o ms categoras adyacentes en una escala ordinal. 2.55.3 Clase (Class). Intervalo de la lnea real.

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    20

    2.56 Lmites de clase (Class limits, Class boundaries).

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    21

    de falla de algunas horas. Por tanto, el espacio muestral est compuesto de los resultados {la batera falla en el intento inicial} y {la batera falla despus de x horas, en donde x es mayor que cero horas}. Este ejemplo se usar en todo el numeral. En particular, en el numeral 3.68 se presenta un explicacin amplia de este ejemplo. EJEMPLO 2 Una caja contiene 10 resistencias etiquetadas 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. Si se hiciera un muestreo aleatorio de 2 resistencias de este conjunto de resistencias, sin reemplazarlas, el espacio muestral constara de los siguientes resultados: (1,2), (1,3), (1,4), (1,5) (1,6), (1,7), (1,8), (1,9), (1,10), (2,3), (2,4), (2,5) (2,6), (2,7), (2,8), (2,9), (2,10), (3,4), (3,5) (3,6), (3,7), (3,8), (3,9), (3,10), (4,5) (4,6), (4,7), (4,8), (4,9), (4,10), (5,6), (5,7), (5,8), (5,9), (5,10), (6,7), (6,8), (6,9), (6,10), (7,8), (7,9), (7,10), (8,9), (8,10), (9,10). El evento (1,2) se considera idntico a (2.1), de manera que el orden de muestreo de las resistencias no importa. Por el contrario, si el orden tiene significacin, de manera que (1,2) se considera diferente de (2,1), entonces hay un total de 90 resultados en el espacio muestral. EJEMPLO 3 Si en el ejemplo anterior el muestreo se ha realizado con reemplazo, entonces sera necesario incluir los eventos adicionales (1,1), (2,2), (3,3), (4,4), (5,5), (6,6), (7,7), (8,8), (9,9) y (10,10). En el caso en que el orden no es de importancia, habra 55 resultados en el espacio muestral. En la situacin en la que el orden es importante, habra 100 resultados en el espacio de la muestra. NOTA 1 Los resultados posibles pueden provenir de un experimento real o de uno completamente hipottico. Este conjunto puede ser, por ejemplo, una lista explcita, un conjunto contable, tal como los enteros positivos, {1, 2, 3,...}, o la lnea real. NOTA 2 El espacio muestral es el primer componente de un espacio de probabilidad (vase el numeral 3.68). 3.2 Evento, A (Event, A). Subconjunto del espacio muestral (vase el numeral 3.1). EJEMPLO 1 Continuando con el ejemplo 1 del numeral 3.1, los siguientes son ejemplos de los eventos {0}, (0,2), {5, 7} [7, + ), correspondiente a una batera que fall inicialmente, una batera que trabaja al comienzo pero falla a las dos horas, una batera que falla exactamente a las 5,7 h, y una batera que no ha fallado a las 7 h. El {0} y el {5, 7} son cada uno conjuntos que contienen un solo valor; (0, 2) es un intervalo abierto de la lnea real; [7, + ] es un intervalo infinito cerrado a la izquierda, de la lnea real. EJEMPLO 2 Continuando con el ejemplo 2 de 3.1, el inters se limita a la seleccin sin reemplazo y sin registrar el orden de la seleccin. Un evento posible es A definido por {al menos una de las resistencias 1 2 est incluida en la muestra}. Este evento contiene 17 resultados (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (1,8), (1,9), (1,10), (2,3), (2,4), (2,5), (2,6), (2,7), (2,8), (2,9) y (2,10). Otro evento posible B es {ninguna de las resistencias 8, 9 10 est incluida en la muestra}. Este evento contiene los 21 resultados (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (2,3), (2,4) (2,5), (2,6), (2,7), (3,4), (3,5), (3,6), (3,7), (4,5), (4,6), (4,7), (5,6), (5,7), (6,7). EJEMPLO 3 Continuando con el ejemplo 2, la interseccin de eventos A y B (es decir, que al menos una de las resistencias 1 y 2 est incluida en la muestra, pero ninguna de las resistencias 8, 9 y 10) contiene los siguientes 11 resultados (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (2,3), (2,4), (2,5), (2,6), (2,7). Incidentalmente, el nmero de resultados en la unin de los eventos A, y B (es decir, que al menos una de las resistencias 1 y 2, ninguna de las resistencias 8, 9 y 10 est incluida en la muestra) es 27, que tambin es igual a 17 + 21 - 11, a saber, el nmero de resultados en A ms el nmero de resultados en B, menos el nmero de resultados en la interseccin es igual al nmero de resultados en la unin de los eventos. NOTA Dado un evento y un resultado de un experimento, se dice que el evento ocurri si el resultado pertenece al evento. Los eventos de inters prctico pertenecern a la suma algebrica de eventos (vase el numeral 3.69), el segundo componente del espacio de probabilidad (vase el numeral 3.68). Los eventos ocurren naturalmente en contextos de juego (pquer, ruleta, etc.) en donde la determinacin del nmero de resultados que pertenecen a un evento determina las probabilidades de pares. 3.3 Evento complementario, Ac (Complementary Event, Ac). Espacio muestral (vase el numeral 3.1), exceptuando el evento dado (vase el numeral 3.2). EJEMPLO 1 Continuando con el ejemplo 1 del numeral 3.1 sobre la batera, el complemento del evento {0} es el evento (0, + ), que es equivalente al complemento del evento en el cual la batera no funcion inicialmente, es el evento en que la batera funcion inicialmente. En forma similar, el evento [0,3) corresponde a los casos en que la batera no estaba funcionando inicialmente o funcion menos de tres horas. El complemento de este evento es [3, ), que corresponde al caso en que la batera funcion durante 3 h y su tiempo de falla es mayor que este valor. EJEMPLO 2 Continuando con el ejemplo 2 del numeral 3.2, el nmero de resultados en B se puede encontrar fcilmente considerando el evento complemento a B = {la muestra contiene al menos una de las resistencias 8, 9 y 10}. Este evento contiene los 7 + 8 + 9 = 24 resultados (1,8), (2,8), (3.8), (4,8), (5,8), (6,8), (7,8), (1,9), (2,9), (3,9),

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    22

    (4,9), (5,9), (6,9), (7.9), (8,9), (1,10), (2,10), (3,10), (4,10), (5,10), (6,10), (7,10), (8,10), (9,10). Ya que todo el espacio muestral contiene 45 resultados en este caso, el evento B contiene 45 - 24 = 21 resultados [a saber: (1,2), (1,3), (1,4), (1,5), (1,6), (1,7), (2,3), (2,4), (2,5), (2,6), (2,7), (3,4), (3,5), (3,6), (3,7), (4,5),(4.6), (4,7), (5,6), (5,7), (6,7)]. NOTA 1 El evento complemento es el suplemento del evento en el espacio muestral. NOTA 2 El evento complementario tambin es un evento. NOTA 3 Para un evento A, el evento complementario a A se designa usualmente por el smbolo AC. NOTA 4 En muchas situaciones puede ser ms fcil calcular la probabilidad del complemento de un evento que la probabilidad del evento. Por ejemplo, el evento definido por "al menos ocurre un defecto en una muestra de 10 elementos escogidos aleatoriamente de una poblacin de 1 000 elementos, con un porcentaje supuesto de elementos defectuosos" tiene un nmero considerable de resultados por enumerar. El complemento de este evento (no se encuentra ningn defecto) es mucho ms fcil de abordar. 3.4 Eventos independientes (Independent Events). Par de eventos (vase el numeral 3.2), tal que la probabilidad (vase el numeral 3.5) de la interseccin de dos eventos es el producto de las probabilidades individuales. EJEMPLO 1 Considere una situacin en la que se lanzan dos dados, uno de ellos rojo y el otro blanco, para diferenciar los 36 posibles resultados con probabilidad de 1/36 asignada a cada uno. D1 se define como el evento en donde la suma de los puntos en el dado rojo y en el blanco es i. W se define como el evento en que el dado blanco muestra un punto. Los eventos D7 y W son independientes, mientras que los eventos Di y W no son independientes para i = 2, 3, 4, 5 6. Los eventos que no son independientes se denominan eventos dependientes. EJEMPLO 2 Los eventos independientes y dependientes surgen naturalmente en las aplicaciones. En casos en donde los eventos o circunstancias son dependientes, es bastante til conocer el resultado de un evento relacionado. Por ejemplo, un individuo que debe ser sometido a una ciruga del corazn puede tener posibilidades de xito muy diferentes, si el individuo tiene historia de fumador u otros factores de riesgo. As, el tabaco y el riesgo de muerte por procedimientos invasivos pueden ser dependientes. En contraste, es probable que la muerte sea independiente del da de la semana en que la persona naci. En el contexto de confiabilidad, los componentes que tienen una causa de falla comn no tienen tiempos de falla independientes. Las barras de combustible de un reactor tienen una probabilidad presumiblemente baja de que presenten grietas, pero si una barra de combustible se agrieta, la probabilidad de agrietamiento de la barra adyacente se puede incrementar sustancialmente. EJEMPLO 3 Continuando con el ejemplo 2 del numeral 3.2, suponga que el muestreo se ha llevado a cabo mediante muestreo aleatorio simple, de manera que todos los resultados tienen la misma probabilidad 1/45. Entonces P(A) = 17/45 = 0,377 8, P(B) = 25/45 = 0,4667 y P(A y B) = 11/45 = 0,244 4. Sin embargo, el producto P(A) x P(B) = (17(45) x (21/45) = 0,176 3 es diferente de 0,244 4, de manera que los eventos A y B no son independientes. NOTA Esta definicin se aplica en el contexto de dos eventos, pero se puede ampliar. Para los eventos A y B la condicin de independencia es P(A B) = P (A) P(B). Para que tres eventos, A, B y C, sean independientes, se requiere que:

    )()()(

    )()()(

    )()()(

    )()()()(

    CPBPCBP

    yCPAPCAP

    BPAPBAP

    CPBPAPCBAP

    ===

    =

    En general, para ms de dos eventos, A1, A2, ... An son independientes si la probabilidad de la interseccin de cualquier subconjunto dado de eventos es igual al producto de los eventos individuales. Esta condicin se aplica a todos los subconjuntos. Es posible construir un ejemplo en el cual cada par de eventos sea independiente, pero los tres eventos no son independientes (es decir, independencia por pares, pero no completa). 3.5 Probabilidad de un evento A, P(A) (Probability of an Event A, P(A)). Nmero real en el intervalo cerrado [0,1] asignado a un evento (vase el numeral 3.2). EJEMPLO Continuando con el ejemplo 2 del numeral 3.1, la probabilidad para un evento se puede encontrar sumando las probabilidades de todos los resultados que componen el evento. Si todos los 45 resultados tienen la

  • NORMA TCNICA COLOMBIANA NTC 2062-1 (Segunda actualizacin)

    23

    misma probabilidad, cada uno de ellos tendr una probabilidad 1/45. La probabilidad de un evento se puede encontrar contando el nmero de resultados y dividiendo este nmero por 45. NOTA 1 La medida de la probabilidad (vase el numeral 3.70) suministra la atribucin de nmeros reales a cada evento de inters en el espacio muestral. Si consideramos un evento individual, la atribucin dada por la medida de probabilidad da la probabilidad asociada con el evento. En otras palabras, la medida de la probabilidad da el conjunto completo de atribuciones para todos los eventos, mientras que la probabilidad representa una atribucin especfica para un evento individual. NOTA 2 Esta definicin se refiere a la probabilidad como probabilidad de un evento especfico. La probabilidad puede estar relacionada con una frecuencia relativa de ocurrencias a largo plazo, o con un grado de creencia en la ocurrencia probable de un evento. Habitualmente, la probabilidad de un evento A se designa por P(A). La notacin (A) usando la letra se usa en contextos en donde existe la necesidad de considerar explcitamente la formalidad de un espacio de probabilidad (vase el numeral 3.68). 3.6 Probabilidad condicional, P(A|B) (Conditional Probability, P(A|B)). Probabilidad de un evento (vase el numeral 3.5) de la interseccin de A y B dividida por la probabilidad de B. EJEMPLO 1 Continuando con el ejemplo de la batera del numeral 3.1,