manual infostat

Upload: lausegura

Post on 13-Jul-2015

889 views

Category:

Documents


15 download

TRANSCRIPT

InfoStat Software Estadstico Manual del Usuario Versin 2008 InfoStatManual del Usuario Versin 2008 ElsoftwareyladocumentacindeInfoStateselresultadodelaparticipacinactivay multidisciplinariadetodoslosmiembrosdelGrupoInfoStat,quienessontitularesdel Copyright. La asignacin de roles y actividades principales son: Programacin: Julio A. Di Rienzo Algoritmos estadsticos: Mnica G. Balzarini, Julio A. Di Rienzo, Carlos W. Robledo Control de calidad: Fernando Casanoves Direccin editorial del Manual del Usuario: Mnica G. Balzarini. Edicin electrnica del Manual: Laura A. Gonzalez Ayuda en lnea: Elena M. Tablada La cita bibliogrfica correcta para este manual es como sigue: BalzariniM.G.,GonzalezL.,TabladaM.,CasanovesF.,DiRienzoJ.A.,RobledoC.W. (2008). Manual del Usuario, Editorial Brujas, Crdoba, Argentina. Losderechosdeautordeestemanual,correspondena:MnicaG.Balzarini,LauraA. Gonzalez, Elena M. Tablada, Fernando Casanoves, Julio A. Di Rienzo, Carlos W. Robledo. La obra de software a la que se refiere este manual debe citarse en bibliografa como sigue:DiRienzoJ.A.,CasanovesF.,BalzariniM.G.,GonzalezL.,TabladaM.,RobledoC.W. (2008).InfoStat,versin2008,GrupoInfoStat,FCA,UniversidadNacionaldeCrdoba, Argentina. Queda prohibida la reproduccin total o parcial de este libro en forma idntica o modificada porcualquiermediomecnicooelectrnico,incluyendofotocopia,grabacinocualquier iiisistema de almacenamiento y recuperacin de informacin no autorizada por los titulares del Copyright. Prlogo InfoStat es un software estadstico desarrollado por el Grupo InfoStat, un equipo de trabajo conformado por profesionales de la Estadstica Aplicada con sede en la Facultad de CienciasAgropecuariasdelaUniversidadNacionaldeCrdoba.PorlaCtedrade Estadstica y Biometra participaron en la elaboracin de InfoStat los profesores. Julio A. Di Rienzo,MnicaG.Balzarini,FernandoCasanoves,LauraA.Gonzalez,ElenaM. TabladayporlaCtedradeDiseodeExperimentosparticipelProf.CarlosW. Robledo. InfoStat, como proyecto de investigacin y desarrollo representa una sntesis de la experienciaacumuladadesde1982enlaUnidaddeProcesamientoElectrnicodeDatosy enlaCtedrasdeEstadsticaydeDiseodeExperimentos.Laborenriquecidaporlatarea docente de grado y postgrado, la consultora estadstica y la formacin de recursos humanos en estadstica aplicada realizada por los miembros del equipo de desarrollo. Nos enorgullece hoyelniveldeaceptacinqueInfoStattieneenelmbitouniversitario,encentrosde investigacin y tecnologa y en empresas de produccin de bienes y servicios. Elpresentemanualconstadecuatrocaptulos:ManejodeDatos,Estadsticas,Grficosy Aplicaciones.ElcaptuloManejodeDatoscontieneinformacinacercadecmooperarel programa para la utilizacin de archivos y describe las acciones que se pueden realizar sobre tablasdedatos.ElcaptuloEstadsticasdescribelasherramientasmetodolgicasqueel usuariopuedeseleccionarparaelanlisisdesusdatos.Estasdescripcionesestn acompaadasdeejemplosdesuimplementacinenInfoStatconstruidoapartirde numerosas situaciones reales donde la aplicacin de una o ms tcnicas estadsticas resulta beneficiosa.El captulo Grficos describe tambin a travs de la ejemplificacin diferentes tiposderepresentacionesgrficasdisponibles.ElcaptuloAplicacionespresentamtodos estadsticos usados en el control estadstico de la calidad, la cuantificacin de biodiversidad yherramientascomputacionalesparafacilitarelprocesodeenseanzaaprendizajede conceptos clsicos de la estadstica. El presente manual refleja el estado de avance de InfoStat al momento de su impresin, sin embargoInfoStatestcreciendo,actualizandoymejorandocontinuamentealgoritmose interfases con el usuario. En elmen ayuda de InfoStat encontrar acceso a la versin a la versin electrnica de este manual y a un link para su actualizacin en lnea. 6 ndice de contenidos Instalacin____________________________________________________________10 Actualizacin _________________________________________________________10 Requerimientos________________________________________________________10 Aspectos generales _____________________________________________________12 Manejo de datos _______________________________________________________15 Archivo___________________________________________________________________ 15 Nueva tabla______________________________________________________________ 15 Abrir tabla ______________________________________________________________ 15 Guardar tabla ____________________________________________________________ 18 Guardar tabla como _______________________________________________________ 18 Cerrar tabla______________________________________________________________ 18 Edicin ___________________________________________________________________ 19 Datos_____________________________________________________________________ 20 Nueva fila_______________________________________________________________ 20 Insertar fila ______________________________________________________________ 20 Eliminar fila _____________________________________________________________ 21 Desactivar caso___________________________________________________________ 21 Activar caso _____________________________________________________________ 21 Invertir activacin ________________________________________________________ 21 Seleccionar caso__________________________________________________________ 21 Nueva columna___________________________________________________________ 23 Insertar columna__________________________________________________________ 23 Eliminar columna _________________________________________________________ 23 Editar Etiquetas __________________________________________________________ 23 Leer etiquetas desde_____________________________________________________ 24 Tipo de dato _____________________________________________________________ 24 Alineacin ______________________________________________________________ 24 Decimales_______________________________________________________________ 24 Ajuste automtico de columnas ______________________________________________ 24 Ordenar_________________________________________________________________ 24 Categorizar ______________________________________________________________ 25 Editar categoras__________________________________________________________ 27 Transformar _____________________________________________________________ 28 Crear variables auxiliares (dummy) ___________________________________________ 30 Llenar con... _____________________________________________________________ 31 Frmulas________________________________________________________________ 36 Buscar__________________________________________________________________ 40 Remuestreo______________________________________________________________ 41 Colorear seleccin ________________________________________________________ 41 Unir tablas ______________________________________________________________ 41 Ubicar columnas una debajo de la otra_________________________________________ 42 Reubicar filas como columnas _______________________________________________ 42 Crear nueva tabla con los casos activos ________________________________________ 42 Cruzar categoras _________________________________________________________ 42 Resultados_________________________________________________________________ 43 7Cargar resultados __________________________________________________________43 Guardar resultados_________________________________________________________43 Decimales _______________________________________________________________43 Separador de campos_______________________________________________________43 Tipografa _______________________________________________________________43 Exportar resultados como tabla _______________________________________________44 Estadsticas ___________________________________________________________ 45 Estadstica descriptiva ________________________________________________________46 Medidas resumen__________________________________________________________46 Tablas de frecuencias_______________________________________________________48 Probabilidades y cuantiles ___________________________________________________50 Estimadores de caractersticas poblacionales_______________________________________51 Definiciones de trminos relacionados al muestreo________________________________51 Muestreo aleatorio simple ___________________________________________________53 Muestreo estratificado ______________________________________________________55 Muestreo por conglomerados ________________________________________________58 Clculo del tamao muestral ___________________________________________________60 Estimar una media _________________________________________________________60 Para detectar una diferencia mnima significativa_________________________________61 Estimar una proporcin _____________________________________________________61 Para la estimacin de la diferencia entre dos proporciones __________________________62 Inferencia en una y dos poblaciones _____________________________________________62 Inferencia basada en una muestra _____________________________________________62 Inferencia basada en dos muestras_____________________________________________69 Anlisis de la varianza ________________________________________________________82 Modelo__________________________________________________________________84 Diseo completamente aleatorizado ___________________________________________84 Diseo en bloques _________________________________________________________87 Diseo en cuadrado latino ___________________________________________________89 Diseos con estructura factorial de tratamientos __________________________________91 Diseo con estructura anidada de tratamientos ___________________________________96 Diseo en parcelas divididas _________________________________________________98 Diseo en Parcelas Subdivididas _____________________________________________102 Comparaciones Mltiples __________________________________________________106 Contrastes ______________________________________________________________109 Supuestos del ANAVA ____________________________________________________113 Anlisis de covarianza_____________________________________________________117 Anlisis de la varianza no paramtrico __________________________________________119 Prueba de Kruskal-Wallis __________________________________________________119 Prueba de Friedman_______________________________________________________120 Anlisis de regresin lineal ___________________________________________________122 Modelo_________________________________________________________________122 Validacin de los supuestos_________________________________________________130 Regresin con variables auxiliares (dummy)____________________________________136 Anlisis de regresin no lineal _________________________________________________141 Modelos predeterminados __________________________________________________142 Anlisis de correlacin_______________________________________________________144 Coeficientes de correlacin _________________________________________________144 Coeficientes de correlacin parcial ___________________________________________145 Coeficientes de sendero (path analysis) _______________________________________146 8 Correlacin entre matrices de distancia _______________________________________ 148 Datos Categorizados ________________________________________________________ 149 Tablas de contingencia ____________________________________________________ 149 Regresin logstica _______________________________________________________ 160 Sobrevida de Kaplan-Meier ________________________________________________ 162 Anlisis multivariado__________________________________________________167 Estadstica descriptiva multivariada ____________________________________________ 168 Anlisis de conglomerados ___________________________________________________ 173 Mtodos de agrupamiento jerrquicos ________________________________________ 177 Mtodos de agrupamiento no jerrquicos______________________________________ 181 Distancias ______________________________________________________________ 182 Componentes principales ____________________________________________________ 182 Biplot _________________________________________________________________ 188 Arboles de Recorrido Mnimo (ARM) ________________________________________ 189 Anlisis discriminante ______________________________________________________ 189 Correlaciones cannicas _____________________________________________________ 197 Regresin por Mnimos Cuadrados Parciales _____________________________________ 201 Anlisis de la varianza multivariado____________________________________________ 204 Correlacin-distancias-similitudes _____________________________________________ 212 Anlisis de correspondencias _________________________________________________ 217 Anlisis de coordenadas principales ____________________________________________ 221 rboles de clasificacin y rboles de regresin ___________________________________ 223 Biplot y rbol de mnimo recorrido ____________________________________________ 225 Procrustes generalizado _____________________________________________________ 227 Series de Tiempo _____________________________________________________233 Simulacin y transformaciones________________________________________________ 234 Prueba de raz unitaria ______________________________________________________ 236 Correlaciones cruzadas ______________________________________________________ 237 Espectro de potencia________________________________________________________ 239 Metodologa ARIMA de Box y Jenkins _________________________________________ 241 Suavizados y ajustes ________________________________________________________ 255 Tcnicas de suavizado ____________________________________________________ 256 Grficos _____________________________________________________________258 Herramientas Grficas ______________________________________________________ 259 Solapa Series ___________________________________________________________ 259 Solapa Eje X____________________________________________________________ 262 Solapa Eje Y____________________________________________________________ 263 Solapa Herramientas _____________________________________________________ 264 Ventana Grficos __________________________________________________________ 265 Suscripcin y copia de formatos grficos______________________________________ 266 Leyendas ______________________________________________________________ 266 Lneas de texto __________________________________________________________ 267 Diagrama de dispersin _____________________________________________________ 268 Grfico de Puntos __________________________________________________________ 270 Grfico de barras __________________________________________________________ 271 Grfico de cajas (box-plot) ___________________________________________________ 273 Grfico de densidad de puntos ________________________________________________ 274 Q-Q plot _________________________________________________________________ 275 Grfico de la distribucin emprica ____________________________________________ 276 9Histograma________________________________________________________________277 Diagrama de perfiles multivariados _____________________________________________278 Grfico de estrellas _________________________________________________________280 Grfico de Sectores _________________________________________________________281 Grfico de barras apiladas ____________________________________________________284 Matriz de diagramas de dispersin______________________________________________286 Graficador de funciones______________________________________________________287 Aplicaciones _________________________________________________________ 288 Control de calidad __________________________________________________________288 Diagrama de control para atributos ___________________________________________291 Diagramas de control de variables____________________________________________295 Diagrama de Pareto _______________________________________________________300 Capacidad de Proceso _____________________________________________________301 Aplicaciones Didcticas______________________________________________________302 Grficos de funciones de densidad continuas ___________________________________302 Intervalos de confianza ____________________________________________________308 Todas las muestras posibles_________________________________________________310 Muestrear desde la distribucin emprica ______________________________________312 Remuestreo _____________________________________________________________313 Indices ___________________________________________________________________316 Indices de biodiversidad ___________________________________________________316 Bibliografa __________________________________________________________ 325 Indice de contenidos___________________________________________________ 331 10 Instalacin Para la instalacin de InfoStat desde la pgina web www.infostat.com.ar se deben seguir las instruccionesqueallsedetallan.ParalainstalacindesdeunCDdedistribucin,la computadorarequiereunossegundosparaleerlosarchivosdeiniciacin.Esteproceso puededemorarhasta2minutosenalgunasmquinas.Unavezqueseiniciaelprocesode instalacin slo apriete la teclaen cada ventana de opciones que se le presente en pantalla. Cuando el proceso concluye exitosamente entonces el instalador habr creado una carpetaInfoStatdentrodeC:\Archivosdeprograma\yunconodeacceso directoenInicioProgramasInfoStat.SieventualmenteelCDnoinicia el proceso de instalacin automtica entonces abra el directorio del mismo, busque el cono que tiene como leyenda InfoStatInstaller.exe y haga doble click sobre l. DentrodelacarpetadeInfoStat,C:\ArchivosdePrograma\InfoStat,se encontrar la siguiente informacin: Carpeta Datos: contiene todos los archivos de datos a los que hace referencia este manual. Carpeta Ayuda: contiene el archivo de ayuda en lnea. ArchivoManual.pdf:contieneelmaterialimpresoqueserecibijuntoconelC.D.La versin electrnica del manual puede contener actualizaciones de este material impreso. Actualizacin PuedeaccederalasinstruccionesdeactualizacinatravsdelmenAYUDA.Laopcin ACTUALIZARabrelapginawebdeInfoStatdesdedondepuedebajarlasltimas actualizaciones. Requerimientos Procesador requerido: Tipo Pentium o superior Memoria mnima sugerida: 128 Mb Sistemas operativos: Windows98, 2000, XP, NT, Vista. 11Configuracindelmonitor:definicinmnima800x600pxeles,fuentespequeas.Silas fuentes de la configuracin del monitor son grandes se pueden presentar problemas para ver parte de las ventanas que InfoStat despliega durante el trabajo. Bajo Windows 98 las fuentes pequeasseespecificanpidiendoPropiedadesdelmonitoryseleccionandolasolapa Configuracin. All apretar el botn Avanzada, lo que conducir a una ventana de dilogo en la que se puede especificar el tamao de las tipografas del monitor. IMPORTANTE:InfoStatreconoceautomticamentelaconfiguracinregionaldela computadora.Esta,defineentreotrascosas,elsmboloautilizarcomoseparadordecimal, ya sea coma, o punto .. Por defecto, las versiones enespaol de Windows configuran susistemaparaquereconozcaalacomacomoseparadordecimal.Silacomputadoraest configurada para reconocer comas, cuando se use punto como separador decimal durante el ingresodedatosdesdeelteclado,InfoStatconsiderarqueseingresunconjuntode caracteres alfanumricos y no un valor numrico y por lo tanto no podr tratarlos para hacer clculos.EstecomportamientoescomnatodaslasaplicacionesWindows,perosehace crtico cuando la aplicacin procesa datos numricos cargados por el usuario. Si Ud. quiere cambiar la configuracin regional para utilizar punto (o coma), debeentraraPaneldeControl(MenInicioConfiguracinPanelde Control)ylocalizarelconodelaconfiguracinregional.Hagadobleclick sobreeseconoyaparecerunaventanacuyapartesuperiorsemuestraa continuacin. Una opcin es simplemente cambiar la configuracin regional eligiendo Estados Unidos, por ejemplo. La otra es tocando la solapa Nmero y cambiando allelsmbolodecimal.Estaopcinesprobablementemsrecomendableyaquelasotras pueden cambiar los estilos de fechas y criterios de ordenamiento alfabtico. 12 Aspectos generales InfoStat ofrece distintas herramientas para que el usuario pueda explorar su informacin de maneramuysencilla.AlabrirInfoStat, sevisualizarunabarradeherramientaslocalizada enlapartesuperiordelaventanadelprograma,laquecontienelossiguientesmenus: Archivo,Edicin,Datos,Resultados,Estadsticas,Grficos,Ventanas,Ayuday Aplicaciones.Pordebajodelosmenes,labarradeherramientascontieneunaseriedebotonesque permiten invocar acciones de manera rpida. Todas las acciones que se llevan a cabo con los botones tambin pueden ser realizadas a partir de alguno de los menes listados arriba. Posicionndose sobre un botn, sin presionar el ratn, el usuario visualizar una etiqueta de ayudasobreelbotnyunaleyendaalpiedelapantallaindicandoeltipodeaccinque puede realizar con ese botn. Estas son (para los botones ordenados de izquierda a derecha) lassiguientes:Nuevatabla,Abrirtabla,Guardartabla,ExportarTabla,Imprimir, Agregarnuevacolumna, Ordenar,EditarCategoras,Fuente, Alineacinaizquierda, Alineacin al centro y Alineacin a derecha. Alpiedelapantallaelusuariovisualizartresventanasminimizadas,unadenominada Resultados,otraGrficosyotraHerramientasgrficas.Sisemaximizalaventana Resultadoscuandorecinseabreelprograma,InfoStatreportarquenohayresultados disponibles.Estaventanairrecibiendocontenidoamedidaqueseejecutenacciones (anlisis) que produzcan resultados. Las ventanas Grficos y Herramientas Grficas slo se activan cuando se ha producido un grfico. En el men ARCHIVO InfoStat permite abrir y guardar archivos de datos de distintos tipos. Por ejemplo, si se acciona Nueva Tabla se visualizar la siguiente pantalla: Elusuariopodringresarinformacin,desdeelteclado,enlatablaoarchivodenominado temporariamentecomoNueva.Sobreesatablapodrrealizaranlisisdedatosyproducir resultadosygrficos.EnelmenARCHIVOtambinseencuentraelcomandoSalirpara cerrar la aplicacin. 13En el men EDICIN se encuentran los comandos para cortar, copiar y pegar informacin desdeventanasdedatos,resultadosygrficos.ElmenDATOSpermiterealizar operacionesdediversandolesobrelagrilladedatos;entreotras,esposibleordenarel archivo,transformarcolumnas,generarnuevascolumnasapartirdefrmulas,simular realizacionesdevariablesaleatorias,buscaryreemplazarinformacindemanera automtica.DesdeelmenRESULTADOSsepuedeninvocaraccionesrelacionadasala presentacin y a la exportacin de resultados en formato de tabla. Todos los resultados producidos (tablas y grficos) pueden ser copiados utilizando el men EDICIN(Copiar)yluegopegadosenelprocesadordetexto,siendostalamanerams simple de transportar los resultados de InfoStat a un documento o informe escrito. El uso de loscomandosCopiaryPegartambineslaformamssencilladeimportaryexportar datosentreInfoStatyunprocesadordetextoounaplanillaelectrnicacomoporejemplo Excel. Para simplificar la migracin de planillas de datos, InfoStat provee al usuario con los comandosCopiaryPegarconnombresdecolumnasparaconservarlosnombreso etiquetasdecolumnas.Tambinesposibleimportaryexportarinformacinenformato ASCII.LasopcionesdelosmenesARCHIVO,EDICIN,DATOSyRESULTADOSse detallan y ejemplifican en este captulo. InfoStattrabajacontrestiposdeventanas:laventanadondeseencuentranlosdatos (Datos),aquelladondesemuestranyacumulanlosresultadosdelosprocedimientos solicitados (Resultados) y la ventana donde se muestran y acumulan los grficos realizados porelusuario(Grficos).Variasventanasdedatospuedenmantenerseabiertas simultneamente.Entalcasolaventanaactivaesaquellaquepresentaelmarcosuperior coloreado(nogris).Todaslasaccionessernejecutadassobrelaventanadedatosactiva. LasventanasResultadosyGrficoscontienenunahojaparacadaresultadoy/ogrfico producido. El usuario puede moverse a travs de las distintas hojas haciendo un click sobre las solapas que se encuentran al pie de la ventana y que indexan las salidas. En el men ESTADSTICAS InfoStat ofrece la posibilidad de implementar de manera casi automtica(atravsdeventanasdedilogo)unaampliaseriedeanlisisestadsticos.El usuario podr realizar estadstica descriptiva, calcular probabilidades, estimar caractersticas poblacionalesbajodistintosplanesdemuestreo,estadsticainferencialparaunaydos muestrasmediantediversostiposdeintervalosdeconfianzaypruebasdehiptesis (paramtricaynoparamtrica),utilizarmodelosderegresinyanlisisdevarianzapara distintos tipos de experimentos diseados y estudios observacionales, estadstica inferencial para datos categorizados, estadstica multivariada, anlisis de series de tiempo, suavizados y ajustes.Despus de seleccionar la aplicacin estadstica que se desea utilizar para analizar los datos de un archivo abierto (tabla activa), se presenta una ventana (Selector de Variables) donde a la izquierda se listan todas las columnas del archivo para que el usuario seleccione la o las columnas que participarn en el anlisis, ya sea como variable de inters o como criterio de clasificacin. Las columnas seleccionadas debern transportarse a la lista de Variables que seencuentraaladerechadelaventanautilizandoelbotnquecontienelaflecha.Si una variable fue seleccionada equivocadamente o ya no es necesaria puede eliminarse de la listadevariablesyagregarsenuevamentealalistadecolumnasdelarchivooprimiendola tecla despus de seleccionar la variable o haciendo doble click sobre la misma.14 Elselectordevariablesfacilitaeltrabajoyaquenosedebenrecordarniescribirlos nombres de las variables cada vez que se quieren utilizar. En el men GRFICOS, InfoStat brinda herramientas grficas de ndole profesional para la presentacinderesultados.Lastcnicasgrficasimplementadassonvariadasyse encuentran documentadas en el captulo Grficos. El graficador permite incluir en un mismo grficovariasseriesyeditarvirtualmentetodossusatributosatravsdelaventana Herramientas Grficas que se abre automticamente al solicitar un grfico. InfoStat cuenta conunalgoritmodecopiaysuscripcindeformatoquefacilitalacreacindeseriesde grficosconidnticascaractersticas.LosgrficoscreadosporInfoStatpuedenser guardadosocopiadosypegadosacualquieraplicacinWindowsquesoporteimgenes (metarchivomejorado)usandolosclsicoscomandosWindowsdecopiadoypegado(o pegadoespecial).TodaslasherramientasdelmenGRFICOSseencuentrandisponibles en todas las versiones de InfoStat. A travs del men VENTANAS el usuario puede migrar de una ventana a otra. Otra forma de acceder a una ventana, es simplemente moviendo el cursor hacia la ventana deseada. El menventanastambinpermiteseleccionarelmodoenquelasventanasabiertassern presentadasenpantalla.Estaspuedenestarencascada,presentacinverticaluhorizontal segnelusuariohagaunclicksobrelaopcinCascada,OrdenarverticaluOrdenar horizontal,respectivamente.Apartirdeestemensepuedeaccederalaventana Resultados, donde se acumulan los resultados de una sesin que el usuario no haya borrado deliberadamente.DelamismamanerasepuedemigraralaventanaGrficos.Ademsse listan los nombres de las tablas de datos abiertas.EnelmenAYUDAsepuedeaccederadocumentacinenlneasobreprocedimientosy anlisisestadsticosposiblesdeimplementardesdecualquiermenhabilitadoyalmanual de InfoStat en formato electrnico. Adems es posible usar este men para tener un acceso rpido a la actualizacin del software. Bajo el men APLICACIONES se presentan herramientas de anlisis tradicionales que son utilizadasparalaexploracindeinformacinenconjuntosdedatosprovenientesdereas especficas del conocimiento. Las aplicaciones disponibles son: CONTROL DE CALIDAD,DIDCTICAS,NDICESyMICROMATRICESDEADN.LaaplicacinDIDCTICAS estorientadaabrindarelementosclsicosparalaenseanzayelaprendizajedela estadsticaaplicada.Algunasherramientasfrecuentementeusadasenelcontrolestadstico de calidad, se encuentran en CONTROL DE CALIDAD. Bajo el tem NDICES, el usuario puedecalcularnumerososndicesdebiodiversidadcomnmenteusadosenEcologa.En MICROMATRICESDEADNestndisponiblesprocedimientosdenormalizacin, transformacin,filtrado,agrupacinyordenacindegenes,ordenacindemicromatrices, correccin de p valor para controlar tasa de descubrimientos falsos (FDR), test de hiptesis, entre otros. Cuandounaopcindecualquiermensepresentaencolorgrisenvezdenegrosignifica quelamismanoesthabilitada.Puedesucederqueelusuarionohayacumplimentadoun pasopreviorequeridoparaesaaccinoquelamismanoseencuentredisponibleenla versin de InfoStat adquirida. Manejo de Datos 15Manejo de datos InfoStatprocesalainformacinprovenientedeunatabla.Unatablasedefinecomoun agrupamientodedatosdispuestosenfilasycolumnas.Lascolumnasrepresentan usualmente a las variables y las filas a las observaciones. Las etiquetas de las columnas son los nombres con que se designan las variables. Archivo Las acciones (submenes) que se aplican al manejo de tablas en el men ARCHIVO son:NUEVATABLA,ABRIR,GUARDARTABLA, GUARDARTABLACOMO...yCERRARTABLA. Tambin en esta ventana se dispone de la opcin SALIR y de una lista de los ltimos archivos trabajados. Nueva tabla MenARCHIVONUEVATABLA,creaunanuevatabla.Tambinpuede presionarousarelbotnconlahojaenblancodelabarrade herramientas(botnNuevaTabla).Aparecerunatablaconunafilaydos columnasquepodrampliarseparaingresarsusdatos.Lastablasnuevastienenensu nombre numeracin consecutiva (Nueva tabla, Nueva tabla _1, Nueva tabla_2, etc.). Abrir tabla MenARCHIVOABRIR,invocaunatablaexistente.Tambinpuede presionarousarelbotnconeldibujodeunacarpeta(botnAbrir Tabla),delabarradeherramientas.Activando+botnAbrirTablase accede directamente a la carpeta Datos la cual contiene los archivos de los ejemplos dados enestemanual.Paraabrirunatabla,enlaventanadedilogocompletelainformacin solicitada. InfoStat permite abrir archivos con los siguientes formatos: InfoStat (*.IDB, *.IDB2)Excel (*.XLS)Grficos (*.IGB) Textos (*.TXT, *.DAT)Dbase (*.DBF)Resultados (*.ITRES) InfoGen (*.IGDB)Paradox (*.DB)EpiInfo (*.REC) Manejo de Datos 16 InfoStat asume queen la estructura de los datos las columnas representan a las variablesy lasfilasalasobservaciones.Paracadavariabletodoslosvaloresdeberncorresponderal mismo tipo de dato (entero, real, categora o fecha). SideseaabrirunarchivoASCII,conextensinTXToDAT,seactivarlaventanadel Importador de texto. Con el Importador de texto se podr indicar: el o los caracteresSeparadores de campos quedeseautilizar(tabulador,coma,puntoycoma,espaciouotros).Losdatosaimportar puedenconteneronoelnombredelasvariables(columnas).Silosdatoscontienenel nombredelascolumnas,sepuedeindicarsiloqueapareceenlaPrimerafilaserel nombredelasfuturascolumnasdelatabladedatos(InfoStatmuestraestaopcinpor defecto).Sienelencabezadofiguraalgntextoantesdelosnombresdelascolumnas,se deberindicarqulneacontieneelnombredelascolumnas;estosehacecambiandoel nmeroqueestalladodelaopcinPrimerafila,hastaquesevisualicelalneaconel nombre de las columnas en primera fila. Si los datos no contienen nombre de columnas, se deber deseleccionar la opcin Usar primera fila como nombre de columna. En este caso lasvariablessernencabezadascomoColumna1,Columna2,etc.Paraobservarla informacin,queconstituirlatablaunavezimportada,presionarelbotnPrevisualizar Tabla.SilaestructuraescorrectapresionarAceptar,casocontrario,cambiaropcionesy probar nuevamente con Previsualizar tabla hasta obtener el resultado deseado. Sialprevisualizarlatablaseobservaquelosnombresdelascolumnasaparecen desplazados respecto del contenido de la tabla, se pueden acomodar los nombres utilizando losbotonesdedesplazamientoqueseencuentranenlapartesuperiordelacolumnaque identifica a las filas de la tabla que se previsualiza. Manejo de Datos 17Nota: cuando se importan tablas de archivos Microsoft Excel que han sido grabados como texto (con extensin.TXT),lasceldasvacasenelarchivooriginalsemuestrancomodosseparadores consecutivos en el archivo de texto, en tal caso la opcin Separadores consecutivos se consideran uno solo, no debe ser seleccionada. Por defecto, InfoStat muestra esta opcin no seleccionada cuando abre archivos de texto. Por otra parte si el archivo contiene datos numricos y alfanumricos, en una misma columna, InfoStat slo reconocer el primer carcter de la columna, si es un nmero borrar losalfanumricosdelacolumnayviceversa.Laformamssencilladeleerarchivosdesdeotro programa es con las funciones Copiar y Pegar. InfoStat ofrece las opciones Copiar con nombre de columna y Pegar con nombre de columnapara facilitar la importacin y exportacin de datos. Por ejemplo,paraimportarunarchivoExcelsimplementecopielosdatosquedeseallevaraInfoStat incluyendo el nombre de las columnas desde Excel y abra una nueva tabla en InfoStat donde deber pegar usando la opcin Pegar con nombre de columna el contenido copiado. Barra de herramientas de la tabla Al ubicar el cursor sobre una tabla, si se presiona el botn derecho del ratn se dispone de varias opciones entre las cuales se halla Barra de herramientas. Con esta opcin se agrega,a la tabla activa, una barra de botones: Estos botones, de izquierda a derecha, permiten: aumentar el tamao de la fuente, disminuir el tamao de la fuente, quitar decimales (previamente se debe hacer clic en una celda de la columnadeinters),agregardecimales(previamentesedebehacerclicenunaceldadela columna de inters), insertar una fila (antes de una fila previamente seleccionada), eliminar unafilapreviamenteseleccionada,agregarunacolumnaalfinaldelatabla,insertaruna columna(antesdeunacolumnapreviamenteseleccionada),eliminarunacolumna previamente seleccionada y colorear una seleccin. EltamaodelafuentetambinpuedesermodificadosisepresionanlasteclasCtrl.y| (para agrandar), o Ctrl. y + (para disminuir). Administracin de variables Estaventanaaparececuandosetieneunatabla activaysepresionanlasteclas.El conjunto de acciones disponibles en el dilogo son:Renombrarvariables:haciendodobleclicsobre unnombredelalistadevariables,sepuede modificar el mismo. Moverlaposicindeunaomsvariables:dela listaseseleccionanlasvariablesyteniendo presionadalateclaCtrl.,semueveelbloque seleccionadoutilizandolasteclasdedireccin(| muevehaciaarribay+muevehaciaabajo).Los Manejo de Datos 18 cambios de posicin realizados en la lista se actualizan automticamente en la tabla. Marcarunaomsvariablesparaeliminar:seseleccionanlasvariablesdelalistayse hace clic en el botn Marcar para eliminar. Las variables son eliminadas de la lista y de la tabla. Desactivar- activar una o mas variables: La condicin de desactivada se indica cuando el cuadro de chequeo a la izquierda de la etiqueta aparece sin el tilde (en el ejemplo estn todas activadasyseleccionadastodaslasquecontienenun1enlaetiqueta).Lasvariables desactivadas no aparecen en la tabla ni en el selector de variables). Formargruposdevariables:seleccionandovariablesyapretandoelbotnAgrupar seleccin,sepuedenformargruposdevariablesqueluegopuedenactivarse-desactivarse conjuntamente, colorearse, borrarse, etc.Guardar tabla MenARCHIVOGUARDARTABLA,guardalatablaactivaenformato InfoStat(conextensin.IDB2),eneldirectorioenuso.Tambinpuedepresionar , o el botn Guardar Tabla de la barra de herramientas. Guardar tabla como Men ARCHIVO GUARDAR TABLA COMO, guarda la tabla activa con el formato y en el directorio requerido por el usuario. Los formatos son: InfoStat (*.IDB, *. IDB2)Excel (*.XLS)Dbase (*.DBF) ASCII (*.TXT)InfoGen (*.IGDB)Paradox (*.DB) Tambin se puede utilizar el botn Exportar Tabla de la barra de herramientas. En la ventana de dilogo indique el nombre, lugar y el tipo de archivo. Si elige el formato ASCII deber seleccionar el separador de campos, indicar si desea usar la primerafilacomonombredecolumnas(etiquetas)yopcionalmenteindicaruncarcter(o grupo de caracteres) para identificar una observacin faltante en el archivo exportado. Cerrar tabla Men ARCHIVO CERRAR TABLA cierra la tabla activa. Tambin se puede presionar .Silatablahasidomodificadaynohasidoguardada,InfoStatlepedirque confirme si desea guardarla. Manejo de Datos 19Edicin Lasacciones(submenes)quese aplicanalmanejodetablasInfoStaten elmenEDICINson:Cortar, Copiar,Pegar,Copiarconnombre decolumna,Pegarconnombrede columna,DeshacerySeleccionar todo.Lasaccionesseutilizanpara edicindeceldas,columnasy/ofilas, como es usual en edicin de textos bajo Windows.Las modificaciones de datos ingresados en una tabla de InfoStat se hacen en la celda activa. Presioneparaqueloscaracteresingresadosseancargadosenlatabla.Siantesde presionarsepresionalatecla,seestablecerdenuevoelcontenido anteriormentecargadoenlacelda.Parasalirdelaedicindelaceldauselasteclasde direccionamiento (las flechas arriba, abajo, izquierda o derecha), tabulador o seleccione con el ratn otra celda. Paraseleccionarunconjuntodeceldasseleccioneconelratnelreadeseada. Tambin puede seleccionar celdas con el teclado manteniendo presionada la tecla mayscula () y movindose con las teclas de direccin. Las reas pintadas pueden ser impresas apretando el botn de Impresin de la barra de herramientas. Es posible elegir el tipo, estilo, tamao y color de letra en toda la tabla, slo basta seleccionarunaceldaypresionarelbotnconelcarcterAdelabarrade herramientas para obtener el men apropiado para realizar esta accin. Tambin existenbotonesparaalineacinderecha,izquierdayalcentrodelacolumnadedatos. Dichos botones se encuentran al lado del botn A. Entablasconformato.IDB2se puedeguardarunadescripcin acercadelosdatosquecontienela tabla.Ladescripcinseedita presionandoF2.Apareceuncampo enelqueseescribeladescripcin, lacualserincrustadaenelarchivo si se presiona el segundo botn de la barradeherramientasdelaventana dedilogo.Paraincorporar definitivamenteladescripcinal archivo de datos, se debe guardar la tabla. Una descripcin puede ser cargada desde un archivo con formato txt o rtf, si se presiona el primer botn de la mencionada barra de herramientas. Manejo de Datos 20 DatosLasacciones(submenes)queseaplicanal manejodetablasInfoStatenelmenDATOS son:Nuevafila,Insertarfila,Eliminarfila, Desactivarcaso,Activarcaso,Invertir activacin,Seleccionarcasos,Nuevacolumna, Insertarcolumna,Eliminarcolumna,Editar Etiquetas,Leeretiquetasdesde,Tipode dato,Alineacin,Decimales,Ajustarancho columna,Ordenar,Categorizar,Editar categoras,Transformar,Crearvariables auxiliares(dummy),Llenarcon...,Frmulas, Buscar,Remuestreo,Colorearseleccin,Unir tablas, Ubicar columnas una debajo de la otra, Reubicarfilascomocolumnas,Crearnueva tabla con los casos activos, Cruzar Categoras y Actualizar. Estasaccionestambinpuedenserinvocadas presionando el botn derecho del ratn, cuando se est posicionado en la tabla de datos. Parailustraralgunasdelasaccionesejecutadas porlossubmenesseutilizarelsiguiente ejemplo: Ejemplo 1: se dispone de un conjunto de observaciones que hacen referencia al tamao de lasemilla(Tamao),colordelepisperma(Episperma),porcentajedegerminacin(PG), nmerodeplntulasnormales(PN)ypesoseco(PS)desemillasdeAtriplexcordobensis, unarbustoforrajero.LosdatosseencuentranenelarchivoAtriplex.idb(gentilezaDra, M.T. Aiazzi, Facultad de Ciencias Agropecuarias, U.N.C.). Nota:enC:\ArchivosdePrograma\InfoStat\Datos,seencuentranlosarchivosutilizadosenel presente manual. Nueva filaMenDATOSNUEVAFILA,agregaalfinaldelatablalacantidaddefilasque especifiqueelusuarioenlaventanaemergente.Tambinpuedeposicionarseenlaltima fila y presionar la tecla para generar nuevas filas. Insertar filaMen DATOS INSERTAR FILA, inserta una fila por encima de lafila seleccionada. Manejo de Datos 21Eliminar filaMenDATOSELIMINARFILAS,eliminalafilaofilasdelatablaqueseencuentran seleccionadas.EstaaccinsepuederevertirusandoelsubmenDeshacerdelmen Edicin. Desactivar casoMenDATOSDESACTIVARCASO,permiteexcluirdelprocedimientoaejecutarlas filas que se seleccionen. Para desactivar una fila de la tabla basta hacer doble clic sobre su nmerodecaso.Lasobservacionesdesactivadasmuestranelnmerodecasoentre parntesis y la fila est coloreada.Activar casoMenDATOSACTIVARCASO,haceactivos(participanenelanlisis)casosquese encuentran desactivados. Para activar una nica fila basta hacer doble clic en su nmero de caso.Sisequierenactivarvarioscasossimultneamentebastaseleccionaralgunaceldade cada una de las filas a activar y aplicar esta accin desde el men DATOS o desde el men queaparecealpresionarelbotnderechodelratn.Pordefecto,todosloscasosse encuentran activados. Invertir activacinMen DATOS INVERTIR ACTIVACIN,vuelveactivos (desactivados)los casos que se encuentren desactivados (activados). Seleccionar casoMenDATOSSELECCIONARCASO permiteestableceruncriterioparala seleccin de casos. Ejecutada la accin, los casosnoseleccionadossemuestran desactivados.Primerohayqueestablecer sobrequvariablesseaplicarelcriterio de seleccin y luego especificar el criterio. EnlaventanadedilogodelSelectorde casos, aparece la lista de las variables de la tablaactiva.Dedichalistaseeligenlas variablessobrelasqueseaplicarla seleccindecasos,ingresndolasenel correspondientecuadrodelasolapa Variables(sepuedeindicarunaparticin en la correspondiente solapa). Manejo de Datos 22 Si se trabaja con muchas variables se dispone de procedimientos que agilizan la eleccin de lasmismas.Alpiedelalistadevariableshayopcionesparaelegirlassegnalguna caracterstica comn de sus nombres. Si las variables comparten algn carcter osucesin de caracteres, se pueden elegir simultneamente. En la figura se ilustra la eleccin de todas lasvariablescuyosnombrescontienenlaletraP,yaqueseactivlacasilladelaopcin (). Para especificar que el carcter o sucesin de caracteres est al inicio de la etiqueta se activa la opcin [); para indicar que est al final de la etiqueta se activa la opcin (]. Se pueden usar caracteres tipo comodn. Por ejemplo, al ingresar la secuencia **1 quedarn seleccionadasdelalistatodaslasvariablescuyas etiquetastengan2caracteresantesdel1.Sise especifica ??1 se seleccionarn todas las variables cuyasetiquetascontienenun1precedidodedos caracteres alfabticos y si se especifica ##1, sern seleccionadastodaslasvariablescuyasetiquetas contienenun1precedidodedoscaracteres numricos. Sisehanformadogrupos(usandolaventanadeAdministracindevariables),estardisponiblela casillaconelrtulo{g}.Alactivarestacasilla aparece un campo que contiene la lista de los grupos disponibles, permitiendo la seleccin de los mismos. Otraformadeelegirvariablesesutilizandounalista almacenadaenunarchivodetexto.Deestaformase seleccionarn todas las variables contenidas en dicho archivo. Paraello,sedebepresionarelbotnderechodelratn ubicandoelcursorsobreelcuadroquecontienealas variablesdelatablaactiva.Sedespliegaunmendondese elige la opcin Seleccionar desde una listay a continuacin laopcinArchivodetexto.Enestemismomenhayuna opcin para ordenar la lista de variables en forma alfabtica. Unavezelegidaslasvariables,seestablecenloscriteriosparaseleccionarloscasos.Enla ventana de dilogo aparecen las variables que intervienen en el procedimiento de seleccin y hay un campo para escribir el criterio. En caso de que este criterio se establezca en base a ms de una variable, Se selecciona una de las variables, se escribe la sentencia que indica el criterio, por ejemplo x=mediasino 0, 1 si >=medianasino 0 y Acumular. Si se eligen dos o ms variables se pueden obtener otras transformaciones que figuran en la lista Combinacin de variables. Estandarizar:permiteobtenerlaestandarizacindelaolasvariablesseleccionadas.La estandarizacinserealizasustrayendodecadaobservacinlamediadelacolumnay dividiendo el resultado por la desviacin estndar de los valores en la columna. Estandarizarporfilas:sielusuarioseleccionamsdeunavariableenelmen transformar, se habilita la opcin estandarizar por filas. En este caso cada entrada en la tabla estransformadaasuvalorestandarizadoconlamediaydesviacinestndardelos elementos de la fila correspondiente. Centrar: esta transformacin realiza un centrado por columna. Es decir, a cada observacin de la variable seleccionada, se le sustrae el valor de la media de dicha variable obtenida con los datos de la correspondiente columna. Centrarporfilas:enestecasoacadavalordeunavariableseleccionadaselesustraela media obtenida por fila con los datos de todas las variables que fueron seleccionadas. Escoresnormales:alavariableseleccionadaseleaplicalatransformacinrango.Luego, cada valor de rango es dividido por (n+1), siendo n el total de datos de la muestra. Para cada cociente se obtiene la funcin de distribucin inversa correspondiente a una Normal (0;1). ResiduosExtEstud.(residuosexternamenteestudentizados):paraunmodelodeposicin se definen como: ( )( )( ) i iiREE y y S = donde yi es el valor de la observacin que no se considera, ( ) iyes la media de los datos sin laobservacinyi,siendoS(-i)eseldesvoestndardelosdatoscalculadodespusdela eliminacin de la observacin. Rangos: esta funcin asigna a los datos originales la posicin que cada uno ocupa en la serie ordenada en forma ascendente. En un grupo de n datos al menor le corresponde el rango 1, al segundo ms pequeo el rango 2 y as sucesivamente. El valor ms alto tendr el rango n. Sidosomsobservacionesmuestranunmismovalor(empate),elrangoasignadoacada una es el promedio de los rangos consecutivos correspondientes a ese valor. Por ejemplo para la serie 10, 20, 20, 30, 40, 50, 50, 50, 60; la serie transformada es: 1, 2.5, 2.5, 4, 5, 7, 7, 7, 9. Transformacinlogaritmo:InfoStatpermitegenerarvariablesapartirdelasfunciones Log10(logaritmoenbase10),Log2(logaritmoenbase2)yLn(logaritmonatural).Siel valor a transformar es menor o igual que cero el resultado es un valor faltante. En este caso se puede usar log(y+c), donde c es una constante. Raz cuadrada:yo bieny c +donde c es una constante. Recproca:1 y . Potencia: y con =0 donde es la potencia deseada. Manejo de Datos 30 ArcoSeno(Raz(p)):( )

-1Sen p conpe[0,1](arcosenodelarazcuadradadela proporcin) Probit:sedefinecomoProbit(p)=u -1(p)conpe(0,1),dondeu -1eslainversadela funcin normal acumulada. Logit: se define como Logit (p)=ln(p/(1-p)) con p e (0,1). Complemento log-log: se define como CLL(p)=ln[-ln(1-p)]con p e (0,1). Llevar al intervalo (0,1): dado un conjunto {y1,...,yn} de observaciones, la transformacin consisteenrestarleacadavalorelmnimode{y1,...,yn}ydividirloporelrecorrido (diferencia entre el mximo y el mnimo). 1si>=mediasino0:permitedicotomizarlosdatosenfuncindelamediadelas observaciones. Los datos mayoreso iguales que la media tendrn valor 1. 1si>=medianasino0:permitedicotomizarlosdatosenfuncindelamedianadelas observaciones. Los datos mayoreso iguales que la mediana tendrn valor 1. Acumular:Generaunacolumnadondeelelementot-simorepresentalasumadelos primeros t elementos. Por ejemplo si la columna contiene los valores 10, 12 y 20, aplicando esta opcin se obtendr 10, 22 y 42. Combinacindevariablespermiteaplicarfuncionesqueinvolucranvariascolumnasdel archivo. En el selector de variables se debern especificar las variables que intervienen en la evaluacindelafuncinseleccionada.Lafuncinaseleccionarpuedeserunadelas siguientes: Suma, Media, Mediana, Varianza, Desviacin estndar, Mnimo, Mximo y Combinacinlineal.LafuncinSumarealizarlasumadelosvaloresdelascolumnas seleccionadas en cada fila del archivo y generar una nueva variable que se denomina Suma. Deigualmanera,sepuedesolicitarlaMedia,Mediana,Varianza,DesviacinEstndar, Mnimo y Mximo de los valores en cada fila. Cuando se selecciona combinacin lineal se debenindicarloscoeficientesdelacombinacinenlaventanaCoeficientes.Los coeficientessedebeningresardeaunoporvezdando.As,sisetienendos columnas, digamos X e Y, y se especifican los nmeros 2 y 3 en la ventana coeficientes, se generar una nueva columna denominada combinacin lineal igual a 2X+3Y.Crear variables auxiliares (dummy)Enalgunasaplicacionesestadsticas,porejemploaquellasrelacionadasamodelosde regresin,esnecesariotransformarunavariablecategricaXconkcategorasenk-1 variablesbinarias(convalor01).Unavariablebinariadeestetipoesconocidaconel nombredevariableauxiliarovariabledummy.Elconjuntodek-1variablesauxiliareses utilizadoparaidentificarcadaunadelascategorasdelavariableoriginalX.Aspor ejemplo,siXtienek=3categoras,dosvariablesauxiliaresD1yD2sernsuficientespara representarcadaunadelascategorasdeX.Porejemplo,lacombinacinD1=1yD2=0 puede identificar la primera categora, D1=0 y D2=1 la segunda categora y D1=0 y D2=0 la Manejo de Datos 31terceracategora.Enestecaso,alaterceracategora(aquelladondetodaslasvariables auxiliares asumen el valor cero) se la suele llamar categora de referencia.Paracrearvariablesauxiliares,seleccionarlavariablecategricaoriginal,alAceptar, aparecer la pantalla Generador de variables auxiliares donde se listar la o las variables originales y las categoras disponibles para cada una de ellas. La primera categora aparecer automticamenteseleccionadaparaserusadacomocategoradereferencia.Sielusuario desea que otra sea la categora de referencia deber mover el curso hasta esa categora para seleccionarla.InfoStatgenerarlask-1variablesauxiliares,queseagregarnalatablade datos,alasquedenominarconelnombredelavariableoriginalseguidosporuna extensin para su diferenciacin. LaopcinMultiplicarporqueapareceenlapantallaGeneradordevariables auxiliares sirve para obtener el producto entre las variables auxiliares y alguna variable de inters.Dichosproductossemostrarnennuevascolumnasdelatabladedatos,conun nombrequeindiquesuorigen.Unejemplodeaplicacindeestaopcinpuedeconsultarse en Regresin con variables auxiliares. Llenar con...Elllenadoautomticocompletaunconjuntodeceldasseleccionadassegnlaopcinde llenado especificada. Para llenar celdas, seleccinelas y del men principal elija DATOS LLENAR CON... y especifique el tipo de llenado.Advertencia:estasaccionesreemplazanlosvaloresdelacolumnaseleccionada,porloquesise quierepreservarelcontenidodelacolumnaoriginalsedeberduplicarlamismayaplicarla distribucin sobre sta. Completando hacia abajo Lasceldasvacasrecibenelcontenidodelaprimeraceldanovacaquelasantecedeenla misma columna. Esta accin tambin se puede realizar con las teclas CTRL+D. Con secuencia 1, 2,... Lasceldasseleccionadas,comenzandodesdelaprimeraceldaseleccionada,recibenun nmero natural con una secuencia en sentido ascendente y siguiendo con las columnas de la derecha sin volver la numeracin al punto inicial cuando se cambia de columna. Con Uniforme (0,1) Alelegirestaopcinlasceldasseleccionadasrecibirnunvalordeunavariablealeatoria continua con distribucin uniforme, entre 0 y 1. Con Normal (0,1) Al elegir esta opcin las celdas seleccionadas sernreemplazadas con realizaciones de una variable aleatoria con distribucin normal con media = 0 y varianza = 1. Manejo de Datos 32 Otros... Paraunaamplialistadedistribucionesdevariablesaleatorias,InfoStatpermitellenarlas celdasseleccionadascon:1)realizacionesdelavariablealeatoria,2)funcinde distribucinacumuladapara argumentosledosdesdelasceldas seleccionadas,3)funcinde distribucininversa,evaluadade acuerdo a los valores seleccionados y 4) funcindeprobabilidad,evaluadade acuerdo a los valores seleccionados. Lasdistribucionesdisponiblesson: Uniforme,Normal,TdeStudent,Chi cuadrado,Fnocentral,Exponencial, Gamma,Beta,Weibull,Logstica, Gumbel, Poisson, Binomial, Geomtrica, Hipergeomtrica y Binomial negativa. Tambinseencuentralaopcin Secuencia(inicio,salto),conlaquese podr llenar celdas con una secuencia de nmeros reales con un inicio y distancia entre dos nmeros consecutivos a definir porelusuarioenlasubventana Parmetros(inicioysalto)quese habilita al seleccionar Secuencia (inicio-salto). Por ejemplo si el nmero de inicio es 1 y el saltode2,lacolumnaseleccionadacomenzarcon1seguircon3,luegocon5yas sucesivamente. Parallenarconrealizaciones,funcindedistribucin,funcindedistribucininversao funcin de probabilidad de una de las variables aleatorias disponibles, seleccione la variable aleatoria y en el panel denominado Parmetros, especifique las constantes que caracterizan a la distribucin elegida.Seleccionar semilla: por defecto InfoStat utiliza una semilla aleatoria para generar nmeros aleatorios,sinembargoenalgunoscasosestilpodergenerarunamismasecuencia aleatoria. Esto se logra especificando un mismo nmero arbitrariamente elegido, distinto de cero, en el campo de edicin que se activa cuando se presiona el botn Seleccionar semilla. Siseponecomosemillaelnmerocero,estoindica aInfoStatquelasemillaesdeorigen aleatorio y por lo tanto las secuencias sern siempre diferentes. A continuacin se presenta una breve descripcin de las distribuciones disponibles: Nota:sedesignarcomoE(X)yV(X)alaesperanzaylavarianzadelavariablealeatoria(X) respectivamente. Manejo de Datos 33Uniforme(a,b):SedicequeunavariablealeatoriacontinuaXtienefuncindedensidad uniforme en el intervalo [a,b] si: 1( ; , )I ( )[ , ]f x a b xa bb a= conI ( )[ , ]xa bfuncinindicadora,dondelosparmetrosaybsatisfacen-0y>0ydondeI(.)eslafuncingamma.La E(X)=r/ y V(X)=r/2. Beta (a,b): La variable aleatoria continua X tiene distribucin beta si su funcin de densidad est dada por: 1 1(0,1)1( ; , ) (1 )( )( , )a bf x a b x x xB a b = Icon (0,1)( ) x Ifuncin indicadora, a>0, b>0 y B(a,b) es la funcin beta, dada por la siguiente expresin: 21 10( , ) (1 )0, 0a bB a b x x dx para a b = > >} La E(X)=a/(a+b) y V(X)=ab/((a+b+1)(a+b) 2). Weibull (a,b): La variable aleatoria X tiene distribucin Weibull si su funcin de densidad es: Manejo de Datos 35 1(0, )( ; , ) ( )bb axxf x a b x abx e = Icon (0, )( )xx I funcinindicadora,a>0yb>0.LaE(X)=(1/a)1/bI(1+b-1)yV(X)=(1/a)2/b [I(1+2b-1)-I2(1+b-1)], donde I(.) es la funcin gamma. Logstica(a,b):LavariablealeatoriaXtienedistribucinlogsticasisufuncinde distribucin acumulada est dada por: ( )( )1/; , 1x a bx a b F e ( = + donde -< a0. La E(X)=a y la V(X)=(t2b2)/3. Gumbelovalorextremo(a,b):LavariablealeatoriaXtienedistribucinGumbelsisu funcin de distribucin acumulada est dada por: ( ) /( ; , ) ( )x a bF x a b exp e = donde -0. La E(X)= y Var(X)=. Binomial (n,p): Esta distribucin tiene origen cuando ocurren las siguientes condiciones en formasimultnea:a)serealizannensayosBernoulli,b)elparmetrop(probabilidadde xito) se mantiene constante entre ensayos y c) los ensayos son independientes entre s. DistribucinBernoulli:enciertosexperimentospuedeocurrirqueexistanslodosresultados posibles: xito o fracaso, presencia o ausencia, si o no, etc. Una variable Bernoulli es aquella variable binaria que identifica estos eventos. Por ejemplo, se puede tomar x=1 para representar el xito y x=0 para representar al fracaso. La E(X)=p y la V(X)=p(1-p), donde p es la probabilidad de xito. SedicequeunavariablealeatoriadiscretaXtienedistribucinBinomialsisufuncinde densidad est dada por: | | ( )0,1,...,( ; , )Inx n xnxx f x n p p q= | | |\ . con | |( )0,1,...,Inx funcinindicadorayelparmetro0sps1,q=1-pyn=1,2,...eseltotalde ensayos. La E(X)=np y Var(X)=npq. Manejo de Datos 36 Geomtrica(p): Esta distribucin es de especial inters en lamodelizacin del nmero de ensayosnecesarioshastaqueaparezcaelprimerxito.UnavariablealeatoriadiscretaX tiene distribucin geomtrica (o de Pascal) si su funcin de densidad est dada por: ( ) ( )| | ( )0,1,...; 1Ixf x p x p p = donde | |( )0,1,...I x funcinindicadorayelparmetro0sps1,q=1-p.LaE(X)=q/py Var(X)=q/p2. Hipergeomtrica(m,k,n):Estadistribucinestligadaasituacionesdemuestreosin reposicin, es decir, situaciones en que se elige al azar un elemento de una poblacin y as sucesivamente hasta completar la muestra sin restituir los elementos extrados. Considrese comopoblacinaunconjuntodemelementosdeloscualeskposeenunodedosestados posibles (xito) y m-k presentan el otro (fracaso). Al igual que en la distribucin Binomial el problema de inters es hallar la probabilidad de obtener x xitos en una muestra de tamao n.UnavariablealeatoriadiscretaXtienedistribucinHipergeomtricasisufuncinde densidad est dada por: ( )| |( )0,1..,n; , , Ik m kx n xmnf x m k n x=| | | | ||\ . \ .| | |\ . donde | |( )0,1,...I xes una funcin indicadora, el parmetro m=1,2,..., el parmetro k=0,1,...m y n=1,2,...,m. La E(X)=n(k/m) y Var(X)=n(k/m) ((m-k)/m) ((m-n)/m-1). Binomialnegativa(m,k):EnconexinconlarepeticindeensayosBernoulli,ciertos problemas,comunesenestudiosdepoblacionesnaturales,centransuatencinenla probabilidaddeencontrarxindividuosenunaunidadmuestralbajosituacionesdondelos individuostiendenaestaragregados(distribucindecontagio).InfoStatpermitecalcular esasprobabilidadesatravsdelafuncinBinomialnegativa.Sedicequeunavariable aleatoria discreta X tiene distribucin Binomial negativa si su funcin de densidad est dada por: ( )( )( ) ( )| | ( )0,1,...1 2 ... 1 1 I!( ; , )xk k k k x pxkx q qf x m k| | | |+ + + | | || | ||\ .\ . \ .=donde | | ( )0,1,...I x esunafuncinindicadora,p=m/kyq=p+1.Losparmetrosmyk satisfacen: m>0 (nmero promedio de individuos por unidad muestral) y k>0 (parmetro de contagio o agregacin). FrmulasPermiteespecificarunafrmulacuyosresultadospuedensustituirelcontenidodeuna columna existente o ser contenidos en una nueva. Manejo de Datos 37Advertencia:losnombresdelasvariablesinvolucradasenelclculonodebentenerparntesis, smbolosdeoperadoresmatemticosonombredefuncionesreservadas,perosipuedenconteneracentos y ees.La ventana de dilogo se muestra a continuacin: Durante una sesin de trabajo, las frmulas que se van escribiendo quedan almacenadas en una lista y estn disponibles para volver a utilizarlas. Para visualizarlas haga click sobre la esquina derecha del campo donde escribe las frmulas. Laventanadedilogomuestraunalistadelasvariablesdisponibles, lascualespuedenser incluidasenlafrmulahaciendoclicsobreelnombreenlalista.Cuandoseutilizaeste procedimiento para agregar las variables a la expresin que se est escribiendo, los nombres aparecenenmarcadosentrecorchetes.Estopermiteincluirenunafrmulanombresque contienen espacios o smbolos matemticos que no deben ser interpretados como tales. Se pueden usar funciones predefinidas o el usuario puede definir sus propias funciones. Para elltimocasodebeescribirlafuncinenelpanelqueaparecepordebajodelcampode edicindefrmulas.Porejemplo,lafuncincubo(x)noesunafuncinpredefinidapero puedeserespecificadaporelusuarioenelpanelFuncionesdefinidasporelusuario escribiendo:cubo(x)=x*x*x.Estadefinicinpermitiraplicarlafuncincuboacualquier otra variable de la tabla activa o a cualquier otra expresin vlida. Escribiendo en el campo de especificacin de las frmulas por ejemplo h=cubo(COLUMNA1), se aplicar la funcin cubo a los datos de la columna 1. Si las variables involucradas en la frmula tienen nombre muy largo se pueden sustituir esos nombres, en la frmula, con %# donde # es el nmero de la columna donde se encuentra la variable. Por ejemplo, si la tabla de datos posee 3 columnas, %1 representar al nombre de laprimercolumna,%2aldelasegundacolumnay%3alnombredelatercera.Para identificar las correspondencias entre el nombre y el nmero de columna se debe presionar lateclaAlt.Mientrasestateclasemantengaapretadalosnombresdelascolumnasdela tabla activa sern mostrados como %#. Manejo de Datos 38 Sisedeseaaplicarunafuncincomomedia(.),min(.),max(.),queaceptanmltiples argumentos,aunbloquedevariablesdebeusarselanotacinf(%a:%b)dondefdenotala funcin,%ay%bindicanelnmerodelacolumnadelcomienzoyfindelbloque, respectivamente. Ntese que el carcter que separa el comienzo y fin de un bloque es dos puntos (:). Siguiendo con el ejemplo de arriba, para calcular el promedio de las 3 primeras variablesdelarchivoseindicar:media(%1:%3).Otraformadeindicarquelafuncinse aplicar a un conjunto de variables como, por ejemplo, media (), es usar el formato media (nombre variable1:nombre variableN) indicando que se quiere obtener la media de todas las variablesentrelavariable1ylan-simavariable.Estaexpresinsepuedeescribir manualmenteoseescribeautomticamentesiseselecciona,enlalistadevariables,el bloque de variables. LastablasdedatosIDB2guardanlasfrmulasquedanorigenalcontenidodeuna columna. Es posible actualizar el contenido de la columna aplicando nuevamente la frmula. ParaestohayqueseleccionarlacolumnayelegirlaopcinActualizardelmenDatoso del men que se despliega al presionar el botn derecho del ratn. Aparece el dilogo en el modo Macros con la correspondiente frmula (o las frmulas, si se seleccion ms de una columna).Estasfrmulassepuedeneditaroejecutar,selectivaoconjuntamente,para actualizar el contenido de la columna. Sepuedenefectuarmodificacionesenlatabladedatosmanteniendoabiertalaventanade frmulas.Paraespecificarunafrmula,elijaenelmenDATOSFRMULASyenlaventana escriba la expresin, por ejemplo: Y=LN(COLUMNA1)+3. Los operadores y funciones predefinidas en InfoStat son: + : operador suma. -: operador resta. *: operador multiplicacin. /: operador divisin. ^ : operador exponente (solo nmeros positivos en la base). ( : abrir parntesis. ) : cerrar parntesis. e : constante 2.7172 PI: constante 3.141592653 ABS(x) : valor absoluto de x (Rango de x: -1e4932...1e4932). ARCOCOSENO(x) ARCCOSIN(x): Arcocoseno de x. ARCOSENO (x) ARCSIN (x):: Arco seno de x. AREAY(y1;;yn):Calculaelreabajolacurvadefinidaporlosparesordenados(Y,X) suponiendo quelos valores de X estn igualmente espaciados a una unidad. Manejo de Datos 39AREAYX(y1;x1;;yn;xn):Calculaelreabajolacurvadefinidaporlosparesordenados (Y,X). ATAN(x): Arco tangente de x (Rango de x: -1e4932...1e4932). COSENO(x) COS(x): Coseno de x (Rango de x: -1e18...1e18). CUADRADO(x) SQR(x): cuadrado de x (Rango de x: -1e2446... 1e2446). DESVIO(x1;x2;;xn)STDEV(x1;x2;;xn:Calculaladesviacinestndardelos valores de las variables indicadas. DISTNORMAL(x;m;v):Calculalaprobabilidadacumuladahastaxparaunanormalcon media m y varianza v. EXP(x): exponencial e^x (Rango de x: -11356...11356). FACTORIAL(x): nmero factorialde x.GAMMA(x): Asigna a los valores de la variable indicada, los valores de la funcin gamma. INVNORMAL(p;m;v): Calcula el valor de x tal que la P(X0.05. Los parmetros son estimados automticamente a partir de la muestra en estudio. Probabilidades y cuantiles InfoStat provee un calculador para obtener la probabilidad de valores menores o iguales que unvalorespecificado(ProbabilidadesAcumuladas),paraunaamplialistadevariables aleatorias.Losclculosdeprobabilidadespuedenrealizarsebajolossiguientesmodelos distribucionales:Uniforme(a,b),Normal(m,v),TdeStudent(v),Chi-cuadrado (v,lambda),Fnocentral(u,v,lambda),Exponencial(lambda),Gamma(lambda,r), Estadsticas 51Beta(a,b),Weibull(a,b),Logstica(a,b),Gumbel(a,b),Rangosestudentizados(k,v), Poisson (lambda), Binomial (n,p), Geomtrica (p), Hipergeomtrica (m,k,n) y Binomial negativa (m,k) (ver Captulo Manejo de Datos). Para cada modelo deben especificarse el o losvaloresdesusparmetros,cuyanotacinseencuentraentreparntesisalladodel nombre de la distribucin. InfoStat tambin provee cuantiles distribucionales bajo estos modelos. ParaobtenerunvalordeProbabilidadprimeroseleccioneladistribucintericasobrela quedeseacalcularprobabilidades,luegoingreselosparmetrosquelacaracterizan.Por ejemplo, para el caso de la distribucin normal ingrese la media (m) y la varianza (v) de la distribucin.Sideseaconocerlaprobabilidadacumuladahastaunciertovalor(x)deesadistribucin active el casillero Valor de x ingresando el valor de la variable aleatoria para el cual desea obtenerlaprobabilidadacumulada.PresionandoelbotnCalcularoaccionandolatecla Enter,podrleerenelcasilleroProb.(Xsx) laprobabilidaddeocurrenciadevalores menoresoigualesalvalorx,bajoelmodelo distribucional propuesto. En el casillero Prob. (X>x)semostrarelcomplementodeProb. (Xs x). En el casillero Prob. (X=x) se muestra laprobabilidaddequeunavariablediscreta asumavaloresigualesax,bajoelmodelo distribucionalpropuesto(siseseleccionaun modeloparavariablescontinuas,estevalor ser siempre cero).Si desea conocer el cuantil pdeladistribucinseleccionada,ingreseel valor p en el casillero Prob. (Xs x) y presione Calcular.SepodrleerenelcasilleroValor de x el cuantil p-simo del modelo distribucional propuesto, donde p e [0,1].Estimadores de caractersticas poblacionales Este mdulo permite estimar caractersticas poblacionales en estudios muestrales diseados bajolassiguientestcnicas:muestreoaleatoriosimple,muestreoestratificadoymuestreo por conglomerados.Definiciones de trminos relacionados al muestreo Una poblacin (o universo) es un conjunto de elementos o entidades que comparten algn atributoycuyoslmitestemporalesoespacialespuedenestablecerse.Laspoblaciones puedenserfinitasoinfinitassegnsutamao.Laspoblacionesfinitastienenunacantidad numerabledeobjetos.Elelementoounidadelementalesunobjetooindividuodela Estadsticas 52 poblacinsobreelcualsetomaefectivamentelalecturaomedicindelacaractersticaen estudio. Una muestra es todo subconjunto no vaco de la poblacin que simbolizaremos por {X1,X2,...,Xn}. No toda muestra es adecuada y pertinente para los objetivos de un estudio, de all la necesidad de disear el esquema de muestreo y obtener estimaciones de acuerdo a la tcnicautilizadaenlarecoleccindeinformacin.Loselementosoconjuntosdeellosque son objeto de seleccin por un proceso de muestreo se conocen como unidades muestrales. Elconjuntototaldeunidadesmuestralesenunapoblacinsedefinecomoelmarco muestral. Porejemplo,sedeseaconocerelniveldeinfestacinpormoscadelmediterrneodelos frutos de una plantacin de duraznos. La poblacin es la coleccin de todos los duraznos en la plantacin. El elemento muestral es el durazno. Puede ser dificultoso construir el marco muestral a partir de los duraznos individuales, pero se podra hacer a partir de cada planta, luegolasunidadesmuestralesseranlasplantasdedurazno.Elmarcomuestralesel conjunto de todas las plantas en la plantacin objeto de estudio. Los parmetros son constantes que caracterizan una poblacin, como por ejemplo la media poblacional, la proporcin de casos con un atributo dado, el total de un atributo y la varianza poblacional. Los estimadores son funciones definidas sobre el espacio de todas las muestras posibles de un tamao dado y sus imgenes tienen por objeto proveer informacin sobre el valordelosparmetrospoblacionales.Ejemplodeestimadoressonlamediaylavarianza muestral. InfoStatadmitedostiposdevariablesparaproducirestimacionesdeparmetros poblacionales.Lascaractersticasenestudiopuedensercontinuasodicotmicas. Caractersticasdicotmicaspermitenestimarparmetrospoblacionalesrelacionadosala proporcindexitosocasosenunaclasedeterminada.Sielusuariodeseaconvertiruna variablecontinuaenotradicotmica,InfoStatpermitedicotomizarvariablesapartirdela comparacin de cada uno de sus valores con un valor de referencia. El punto que permite la dicotomizacinpuedeserlamediadelacaracterstica,lamedianaounvalorarbitrario ingresadoporelusuario.Sepuededicotomizardenominandoxitoalosvaloresdela variable en estudio mayores, menores, mayores o iguales, menores o iguales que un valor de referencia ingresado por el usuario. Sea {X1, X2 ,..., XN } el conjunto de todos los valores en la poblacin (poblacin de tamao N), entonces definimos los parmetros total, media y varianza como: ( )11221 1

1NiiNiiNiiTotal XMedia XNVarianza XNto ====== Estadsticas 53EnunapoblacindetamaoN,elnmerodemuestrasposiblesdetamaon,conun muestreo sin reposicin es C(N,n) (combinatorio de N tomados de a n). Ejemplo si N=30 y n=2C(30,2)=435.Sisecalculaunestadsticomuestralapartirdecadamuestratendremos 435estimadoresmuestraleseventualmentediferentes.Estooriginaloquellamamosla distribucinmuestraldelestimador.Elerrorestndardeunestimadorcorrespondeala raz cuadrada de la varianza de dicha distribucin muestral. El coeficiente de variacin de un estimador de un parmetro poblacional se define como el cociente entre su error estndar y el verdadero valor del parmetro estimado. El cuadrado del coeficiente de variacin de un parmetro estimado es referido como la varianza relativa del parmetro estudiado. El error estndardeunestimadoresunamedidadelavariabilidadmuestraldelestimadorsobre todas las muestras posibles. Si se asume que la distribucin de los estimadores se aproxima, cuandoeltamaomuestralessuficientementegrande,aladistribucinnormal,esposible utilizarlateoranormalparaobtenerintervalosdeconfianzaaproximadosparalos parmetros que estn siendo estimados. El intervalo de confianza (1-o)% para el parmetro u ser: ( )21 Z EEou usiendo uel estimador deu ; 21Zo el percentil ( )21 100ode la distribucin normal estndar y( ) EEuel error estndar de u . Paralosdistintostiposdemuestreoyestimadoresdisponibles,InfoStatpermiteobtenerel error estndar, el coeficiente de variacin del estimador, la varianza relativa y el intervalo de confianzaparalosparmetrosestimadosconelcoeficientedeconfianzarequeridoporel usuario. Muestreo aleatorio simpleMenESTADSTICASESTIMACINDECARACTERSTICASPOBLACIONALES MUESTREOALEATORIOSIMPLE,permiteestimarparmetrospoblacionalesenel marco de un muestreo aleatorio simple. El muestreo aleatorio simple (m.a.s), es un plan de muestreoenelquesetomaunamuestradetamaon,conunprocedimientotalque,toda muestra de tamao n (de una poblacin de N elementos) tiene la misma probabilidad de ser elegida. El nmero total demuestras posibles es T=C(N,n). La probabilidad de eleccin de una muestra mj de tamao n es: P(mj)=1/Tconj=1,...,T InfoStat supone que los valores en las columnas de la tabla de datos corresponden a valores muestrales de una o ms caractersticas en estudio. En la ventana de dilogo del selector de variablessedebeindicarcualocualessonlascolumnasdelatablaquecontienenestas caractersticas.Cuandoexistendiversoscriteriosdeclasificacinenlapoblacin,peropor consideracionesterico-prcticasnoesconvenienterealizarunmuestreoestratificadose Estadsticas 54 pueden realizar estimaciones dentro de estos subdominios a travs de un muestreo aleatorio simple. La poblacin puede ser finita, y en tal caso hay que ingresar el tamao poblacional. Porconvenienciasedenotaraloselementosmuestralesdelprimeroalensimocon 1,...,nx x . Luego estos son los valores de la variable X para los elementos 1 al n. Despus de habertomadolamuestra,esposiblecalcularvalorescomo:totales,medias,proporciones, desvos estndares, etc. InfoStat estima, bajo muestreo aleatorio simple, el total, la media y la proporcin de xitos (y total de xitos), de la siguiente manera: 11111( )nmas iinmas iinmas iiNt xnX xnp xn====== I con( )ix I funcinindicadoraqueevaluadaenlaobservacinxidevuelveun1o0 conforme la observacin represente u xito o un fracaso respectivamente. Sepuedenrequeririntervalosdeconfianzaparalosparmetrospoblacionalesconunnivel de confianza especificado por el usuario. Por defecto el intervalo que se construye tiene un coeficientedeconfianzadel95%.Paraconstruirdichosintervalosseutilizanloserrores estndaresdelosestimadorescorrespondientes,loscualessoncalculadoscomolaraz cuadrada de las siguientes varianzas, 222( )( )(1 )( )1XmasXmasmasN n SV t NN nN n SV XN nN n p pV pN n== = donde 2XS eselestimadorinsesgadodelavarianzapoblacionaldelacaractersticaXen estudio, bajo el supuesto de poblacin infinita y se define como: ( )22111nX iiS X Xn== Los estimadores precedentes involucran un factor de correccin por finitud que es utilizado en caso de poblaciones finitas. Si no se especifica el tamao de la poblacin, InfoStat asume Estadsticas 55poblacin infinita y no utiliza factor de correccin por finitud. Tambin se pueden solicitar el coeficiente de variacin y la varianza relativa asociados a la estimacin obtenida. AlinvocarestesubmenenInfoStat,aparecelaventanaMuestreoaleatoriosimpleque permite elegir las variables y particiones deseadas. El criterio Particiones de InfoStat puede ser utilizado en este men, para obtener estimaciones para distintas particiones del archivo, definidas en funcin de una o ms variables. En caso de que existan subdominos se deber indicaraInfoStatculeslacolumnadelatabladedatosquelosidentifica.Siexisteuna columnadelarchivoconteniendofrecuenciasabsolutasparacadavalordelacaracterstica enestudioydichacolumnaesindicadaenlasubventanaFrecuencias,InfoStatusaresa informacinparaponderarlosvaloresdelacaractersticaporsufrecuenciaparacualquier estimacinquesesoliciteacontinuacin.Alaceptarsehabilitaotraventanaquepermite Ingresareltamaopoblacional.LaopcinCaractersticascontinuashabilitauna subventana Caractersticas poblacionales a estimar en la que se puede activar: Promedio, Total,ProporcindexitosyTotaldexitos.Cuandoseeligenalgunadeestasdos ltimas opciones se ingresa automticamente a Dicotomizar por y en Considerar xito los valoresestnlassiguientesopciones:mayoresquelamedia,mayoresoigualesquela media,menoresquelamedia,menoresoigualesquelamedia,mayoresquela mediana,mayoresoigualesquelamediana,menoresquelamediana,menoreso iguales que la mediana y mayores que, mayores o iguales que, menores que, menores o iguales que un valor determinado ingresado por el usuario en la ventana dispuesta para tal fin. En la parte inferior de la ventana principal aparecen las siguientes opciones: Error estndar delestimador,Intervalodeconfianzaparaelparmetropoblacional,Coeficientede variacin del estimador y Varianza relativa. Muestreo estratificadoMenESTADSTICASESTIMACINDECARACTERSTICASPOBLACIONALES MUESTREOESTRATIFICADO,permiteobtenerestimacionesenelmarcodeun muestreo estratificado. En este tipo de plan de muestreo, la poblacin es dividida en estratos y una muestra aleatoria simple es tomada de cada estrato. Si se denota por Nh al tamao del estrato h, con nh al tamao de la muestra obtenida desde ese estrato (con h=1,...,L), el total de muestras posibles de tamao n est dado por: 11... ...h Lh LN N NTn n n| | | | | |= |||\ . \ . \ . donde la 1hLhn n== Estadsticas 56 Porejemplo,sisetienen3estratosdesignadoscomoE1,E2yE3,detamao3,5y4 respectivamente,elnmerodemuestrasposiblesdetamao2,3y2paralosestratos mencionadossern:3,10y6.Unejemplodetallandotodaslasmuestrasposiblesparala conformacin de los estratos mencionados se presenta a continuacin: PoblacinEstrato X1 101 111 92 122 132 112 142 133 173 193 183 20 Muestras posiblesE2M1 10 11 M1 12 13 11 M1 17 19M2 10 9 M2 12 13 14 M2 17 18M3 11 9 M3 12 13 13 M3 17 20M4 12 11 14 M4 19 18M5 12 11 13 M5 19 20M6 12 14 13 M6 18 20M7 13 11 14M8 13 11 13M9 13 14 13M10 11 14 13E1 E3 Los estimadores por estrato (indexado por h) del total, media y proporcin poblacional son: 11111( )hhhnhh ihihnh ihihnh ihihNt xnX xnp xn====== I dondexiheseli-simovalordelavariableobservadaenelestratohyI(xih)esunafuncin indicadoraqueevaluadaenlaobservacinXidevuelveun1oun0conformela observacin representa un xito o un fracaso respectivamente. Estos estimadores tienen la misma forma que los estimadores para muestreo aleatorio simple dentro de cada estrato. Por ende la varianza de los estimadores promedio (me) a travs de L estratos se construye a partir de las varianzas de los estimadores por estrato. Estadsticas 57( )( )( )( )2212212111Lh h hme hhh hLh h h hmehh hLh h h h hmehh hS N nV t Nn NN S N nV XN n Np p N N nV pN n N===| | = |\ .| | | |= ||\ .\ . | | | |= ||\ .\ . donde 2hSes la varianza de la variable aleatoria en el estrato h.Enalgunascircunstancias,lasunidadesmuestralesnopuedenclasificarseaprioricomo pertenecientesaunestratodado.Siesainformacinesobtenidaenelpropioprocesode muestreo,seusaentoncesunmuestreopost-estratificado.Estatcnicasebasaenun muestreoaleatoriosimpleapartirdelcualseaplicanlosestimadoresparamuestreo estratificado,previaclasificacindelasunidadesmuestralesenlosdistintosestratos.La diferenciaconlaestimacinparasudominiosenelmarcodelmuestreoaleatoriosimplees que los tamaos de los estratos en este caso son conocidos. La varianza de los estimadores escorregidaparatenerencuentaquelostamaosmuestralesresultantesporestratosean aleatorios. AlinvocarelsubmenMUESTREOESTRATIFICADOenInfoStat,aparecelaventana Muestreo estratificado que permite seleccionar las variables a usar. El criterio particin de InfoStatpuedeserutilizadoenestemen,paraobtenerestimacionesparadistintas particionesdelarchivo,definidasenfuncindeunaomsvariables.Enestecasola declaracindelEstratoesobligatoria.Siexisteunacolumnadelarchivoconteniendo frecuenciasabsolutasparacadavalordelacaractersticaenestudioydichacolumnaes indicadaenlasubventanaFrecuencias,Infostatusaresainformacinparaponderarlos valoresdelacaractersticaporsufrecuenciaparacualquierestimacinquesesolicitea continuacin. Al aceptar se habilita otra ventana donde hay una Lista de los nombres de los estratos,enlaquesedebeingresarelTamaodelosestratos.Sielmuestreoespost-estratificado se debe activar el campo correspondiente. LaopcinCaractersticascontinuashabilitaunasubventanaCaractersticas poblacionalesaestimarenlaquesepuedeactivar:Promedio,Total,Proporcinde xitos y Total de xitos. Cuando se eligen alguna de estas dos ltimas opciones se ingresa automticamente a Dicotomizar por y en Considerar xito los valores estn las siguientes opciones:mayoresquelamedia,mayoresoigualesquelamedia,menoresquela media, menores o iguales que la media, mayores que la mediana, mayores o iguales que la mediana, menores que la mediana, menores o iguales que la mediana y mayores que, mayores o iguales que, menores que, menores o iguales que un valor determinado por el usuario en la ventana para tal fin. Estadsticas 58 Enlaparteinferiordelaventanaaparecenlassiguientesopciones:Errorestndardel estimador,Intervalodeconfianza,CoeficientedevariacindelestimadoryVarianza relativa. Muestreo por conglomeradosMenESTADSTICASESTIMACINDECARACTERSTICASPOBLACIONALES MUESTREOPORCONGLOMERADOS,permiteobtenerestimacionesdeparmetros en elmarcode un muestreo por conglomerado. Este tipo de muestreo se utiliza cuando no esposibleoesimprcticocontarconunmarcomuestraldelasunidadesmuestrales elementalesysepuede,encambio,obtener unmarcomuestraldegrupos(conglomerados) de unidades muestrales.Porejemplo, sisequiereestimarelgradodeataque demoscadelMediterrneoenplantas deduraznoyelmontecuentacon20plantas,cadaplantasepodraconsiderarun conglomerado. De estos conglomerados se seleccionan m al azar y en cada uno de ellos, se cuenta para cada una de las ramas principales el nmero de frutos sanos y nmero de frutos enfermos. Existen diversos planes de muestreo que genricamente se engloban bajo el ttulo muestreo por conglomerado, pero cada uno de ellos genera estimadores y errores diferentes. InfoStat realizalasestimacionescorrespondientesaunmuestreoporconglomeradossimpleenuna etapa.Elmuestreoporconglomeradossimpleenunaetapasecaracterizaporlaeleccin, segnunplandemuestreoaleatoriosimple,deunconjuntodemconglomerados.Luego estos conglomerados son censados. La notacin utilizada en el marco de este muestreo es la siguiente: M=nmero de conglomerados en la poblacin m=nmero de conglomerados muestreados nc=nmero de unidades en el conglomerado N=tamao de la poblacin N =tamao promedio de los conglomerados Los estimadores bajo este esquema de muestreo para caractersticas continuas son: 1 1cn mijj iMt xm= == | | |\ .= total en la poblacin 1 1cn mijj iMX xNm= == | | |\ .= media en la poblacin Estadsticas 591 1cn mijj icxtm= == = total por conglomerado 1 1cn mijj icxXmN= == = media por conglomerado Paracaractersticasbinarias,InfoStatpermiteestimarlaproporcindexitosyeltotalde xitos.Cuandolavariableescontinuasepuedecalcularlaproporcindexitosytotalde xitos previa dicotomizacin de la caracterstica continua. Las varianzas de los estimadores son obtenidas como sigue: 221 1221 12( )11( )1ccn mijj in mijj ix XM M mV tm m Mx XM M mV Xm m M N= == ===| | |\ .| | |\ . 21 121 121( )11( )1ccn mij cj icn mij cj icx tM mV tm m Mx tM mV Xm M mN= == ===| | |\ .| | |\ . AlinvocarestesubmenenInfoStat,aparecelaventanaMuestreoporconglomerados cuya funcin es permitir elegir las variables y particiones deseadas. El criterio particin de InfoStatpuedeserutilizadoenestemen,paraobtenerestimacionesparadistintas particionesdelarchivo,definidasenfuncindeunaomsvariables.Enestecasola declaracindelConglomeradoesobligatoria(indicarlacolumnadelatabladedatosque losidentifica).Siexisteunacolumnadelarchivoconteniendofrecuenciasabsolutaspara cadavalordelacaractersticaenestudioydichacolumnaesindicadaenlasubventana Frecuencias,Infostatusaresainformacinparaponderarlosvaloresdelacaracterstica porsufrecuenciaparacualquierestimacinquesesoliciteacontinuacin.Alaceptarse habilita otra ventana donde se debe ingresar el Nmero de conglomerados en la poblacin (M)yelTamaopromediodelosconglomerados(N).LaopcinCaractersticas poblacionales a estimar permite activar: Promedio, Total, Proporcin de xitos y Total Estadsticas 60 dexitos.CuandosedeseadicotomizarvariablescontinuasiraDicotomizarporyen Considerar xito los valores seleccionar alguna de las siguientes opciones: mayores que la media, mayores o iguales que la media, menores que la media, menores o iguales que la media,mayoresquelamediana,mayoresoigualesquelamediana,menoresquela mediana,menoresoigualesquelamedianaymayoresque,mayoresoigualesque, menores que, menores o iguales que un valor determinado por el usuario. Enlaparteinferiordeestaventanaaparecenmarcadaslassiguientesopciones:Error estndar del estimador, Intervalo de confianza, Coeficiente de variacin del estimador y Varianza relativa. Clculo del tamao muestralMen ESTADSTICAS CLCULO DE TAMAO DE MUESTRA, permite calcular el tamao de muestra necesario para estimar una media o una proporcin poblacional con una confianzayprecisindeterminadaporelusuario.Tambin,permitecalculartamaode muestra para detectar, en el contexto del ANAVA de efectos fijos a una va de clasificacin, una diferencia entre medias de grupos o poblaciones tan pequea como sea especificada por el usuario y el tamao de muestra para la estimacin de la diferencia entre dos poblaciones.Al ingresar a este submen se habilita la ventana Tamao muestral para... la cual presenta tressolapas:DetectarunaDMS,Estimarunamedia,.Estimarunaproporciny.Dif. Prop Estimar una media Estemtodopresuponeunm.a.s.(muestreoaleatoriosimple)ytieneporobjetodaruna aproximacin, basada en la distribucin normal, del tamao muestral necesario para estimar alamediaconunaconfianzayunaprecisindeterminada.Laaproximacinusadaparael clculo del tamao de muestra en InfoStat es: 2212Zncoo| |>| |\ . dondeoesladesviacinestndarpoblacional,paralaquesedebeingresarelvalorouna cotasuperior,ceslaamplitudrequeridaparaelintervalodeconfianzaconunaconfianza(1-o)%paralamediapoblacional.Elvalorcpuedeelegirsearbitrariamenteoexpresarse como una fraccin f de la media muestral( ) c xf = . Alternativamenteelusuariopuedeespecificarelerrorestndarmximoaceptableparala estimacin, como criterio para el clculo del tamao muestral. Estadsticas 61Para detectar una diferencia mnima significativa Para un diseo balanceado con a tratamientos o poblaciones bajo estudio (modelo de efectos fijos),InfoStatproveelostamaosdemuestrasasociadosavaloresdepotencia,parala pruebadeefectosdetratamientosnulos,especificadosporelusuario.Lostamaos muestralesportratamientosonderivadosapartirdelarelacinentre 22 12aiinao|o==yla potencia dada por P(F0 >Fo,a-1,N-a /H0 es falsa), donde ti es el efecto del tratamiento i-simo, o2 la varianza comn dentro de los tratamientos, a el nmero de tratamientos, o el nivel de significacindelapruebadeefectosdetratamientosnulos,Nelnmerototalde observaciones y F0 el estadstico del Anlisis de la Varianza. Para evitar que el usuario deba seleccionar el conjunto de ti, i=1,...,a, el clculo se basa en la expresin 2222nDa|o= dondeDeslamnimadiferenciaquesequieredetectarentredos medias. Si la diferencia entre dos medias es a lo sumo D, el valor de 2222nDa|o=y consecuentemente eltamaodemuestraqueseobtieneesconservador,estoes,proporcionaunapotenciaal menos igual a la especificada por el usuario. En la subventana Criterio para la obtencin del tamao muestral, se pueden especificar dos alternativas: Amplitud intervalo de confianza o Error estndar de la estimacin. En lamedidaquesecambienlasopcionesparaestasdosalternativas,enlaparteinferior aparecerunespacioparaponerlaCotasuperiorparalavarianzayasseestimarel Tamao muestral requerido. DetectarunaDMS(diferenciamnimasignificativa),permitecalcularlaPotencia alcanzadaparaunmodelodeanlisisdelavarianzadeefectosfijos,cuandosevan cambiando las siguientes opciones: Nmero de tratamientos, Varianza comn dentro de tratamientos,Niveldesignificacin,Mnimadiferenciaquesequieredetectary Repeticiones por tratamiento (n). Estimar una proporcin Presuponeunm.a.s.(muestreoaleatoriosimple)ytieneporobjetodarunaaproximacin, basadaenladistribucinnormal,deltamaomuestralnecesarioparaestimaruna proporcin con una confianza y una precisin determinada. Laaproximacinusada parael clculo del tamao de muestra en InfoStat es: 2212 (1 ) Z p pnco | |>| |\ . Estadsticas 62 donde p es la proporcin poblacional supuesta a priori, para la que se debe ingresar el valor atravsdeunabarrademovimientoenelrango0a1,ceslaamplitudrequeridaparael intervalo de confianza, expresadacomo un porcentajede p, con una confianza (1-o)% para la verdadera proporcinal.Para la estimacin de la diferencia entre dos proporciones Enelcontextodeunmuestreoaleatoriosimple,dondesedeseaestimarladiferenciaentre dos proporciones a partir de muestras de igual tamao, InfoStat provee el tamao de muestra aextraerdesdecadapoblacinylosvaloresasociadosdepotenciaparalapruebade hipotesisdenodiferenciasdeproporciones.Losclculossonrealizadosapartirdela aproximacin normal (ver estimacin de diferencia entre proporciones). Inferencia en una y dos poblacionesInfoStatpermitecontrastarhiptesisyobtenerintervalosdeconfianzaparaparmetrosde unmodeloestadsticoinvolucrandounaodospoblaciones.Losmenesdeestemdulo permitenindicarsilainferenciasebasaenunaodosmuestrasaleatorias.Lasacciones (submenes),quesepuedeninvocarenelcasodeunamuestrason:PruebaTparaun parmetro,Pruebaderachas,Intervalosdeconfianza,BondaddeAjuste (Kolmogorov)yPruebadenormalidad(Shapiro-Wilksmodificado).Enelcasodedos muestras:PruebaT(muestrasindependientes),PruebadeWilcoxon(Mann-Whitney U),PruebadeWald-Wolfowitz,PruebadeVanderWaerden(puntuacinnormal), PruebadeBell-Doksum(puntuacinnormal),PruebadeKolmogorov-Smirnov, PruebadeIrwin-Fisher,Pruebadelamediana,Pruebaparaladiferenciade proporciones,PruebaT(observacionesapareadas),PruebadeWilcoxon (observaciones apareadas), Prueba del signo y Prueba F para igualdad de varianzas. Encasodesolicitarelanlisisparamsdeunavariablerespuesta,losresultadosse informan para cada variable por separado. Inferencia basada en una muestra Prueba T para un parmetro Men ESTADSTICAS INFERENCIA BASADA EN UNA MUESTRA PRUEBA T PARAUNPARMETRO,permiteprobarunahiptesisacercadelaesperanzadeuna variablealeatoria,deltipoH0:=0.Lapruebautilizaunaestimacindelavarianzadela variable respuesta. InfoStatproveeelvalorpparaunapruebabilateral,p(Bilateral),oelvalorpparapruebas unilateralesderecha,p(UnilateralD),oizquierda,p(UnilateralI),segnseespecifique. Cuandoelvalorpessqueelniveldesignificacinnominal(oseleccionadoparala Estadsticas 63prueba), el estadstico pertenece a la regin de rechazo, es decir la prueba sugiere el rechazo de la hiptesis nula. El estadstico de la prueba es: T = 0XSn | | | | | |\ .que bajo H0 tiene distribucin T de Student con n-1 grados de libertad. EnInfoStatalactivarelsubmenPRUEBATPARAUNPARMETRO,apareceuna ventanaconelmismonombrequepermiteelegirlavariableenestudioysisedesealas variablesquedefinenparticiones.Laventanasiguientepermitesolicitarlainformacina mostraryelegireltipodepruebaarealizar:Bilateral,UnilateralderechaoUnilateral izquierda.Pordefecto,InfoStatmostrarlasiguienteinformacin:n(tamaomuestral), Media,DE(desviacinestndar),T(valordelestadstico)yp(valorp)yelintervalode confianza (por defecto la confianza es del 95% pero se puede optar por otro valor activando elcampocorrespondiente).Elcampoparmetropermiteintroducirportecladoelvalor hipotetizado para la media poblacional, es decir 0. Siguiendo con los datos del archivo Atriplex, se presentan los resultados de la prueba acerca delamediadelporcentajedegerminacin.SupongaquesedeseaprobarlahiptesisH0: =50. Luego, ingresando el valor 50 en el campo Parmetro y simplemente aceptando las opciones activadas, se obtuvieron los siguientes resultados (el anlisis se realiz dos veces, una usando una particin del archivo por tamao de semillas y la segunda sin particin. Como puede observarse, el porcentaje de germinacin es significativamente distinto de 50% slo para las semillas grandes. La media de germinacin sugiere que las semillas de mayor tamao tienen un porcentaje de germinacin mayor al 50%. Trabajando con todos los datos, sin particionar por tamao, tambin se rechaza la hiptesis nula. Tabla 6: Resultados prueba T para datos particionados por tamao de semillas. Archivo Atriplex. Prueba T para un parmetro Valor del Parametro Probado: 50 Tamao VariablenMedia DELI(95)LS(95) Tp(Bilateral) chicas Germin954.5626.34 52.25 56.860.520.6180 grandesGermin973.3319.28 73.33 73.333.630.0067 medianas Germin968.7832.81 68.78 68.781.720.1243 Tabla 7: Resultados prueba T para datos sin particionar. Archivo Atriplex. Prueba T para un parmetro Valor del Parametro Probado: 50 Variablen Media DE LI(95)LS(95)Tp(Bilateral) Germinacion2765.5626.93 63.50 67.613.000.0059___ Estadsticas 64 Prueba de rachas MenESTADSTICASINFERENCIABASADAENUNAMUESTRAPRUEBA DERACHAS,permiteprobarlahiptesisdeunordenamientoaleatoriocontrauna alternativa de tendencia (ordenamiento no aleatorio), mediante el uso de rachas. Unarachaesunasucesindeunoomselementos,queestprecediday/oseguidade elementos diferentes a los que componen la racha. Para variables dicotmicas se identificar una racha cuando exista una secuencia de valores de la variable que pertenecen a una misma categora.Porejemplo,sisetienelasiguienteserie:1000110011,dondehaytres rachas de unos (de largo 1, 2, y 2) y dos rachas de ceros (de largo 3 y 2). A modo de ejemplo, suponga que se toman medidas diarias de un indicador econmico. Se identificarunarachacuandoexistaungrupodemedidasconsecutivasdondecadaunode losvaloresdiariosseamsaltoqueeldeldaprevio.Aqulavariablenoesdicotmica. InfoStat permite generar variables dicotmicas para el anlisis de rachas, en estos casos. El usuariopuedeindicarunvalor,comopuedeserlamediana,paraestablecerlanuevaserie dicotmica mediante la comparacin de cada observacin original con dicho valor. El estadstico R se basa en el nmero de rachas, en el ejemplo presentado R=5. Cuando los tamaos muestrales tienden a infinito, Wald y Wolfowitz demuestran que la estandarizacin delestadsticoR,tiendeaunadistribucinnormalestndar(Lehmann,1975)yportanto puede utilizarse la aproximacin normal para el clculo de valores p. InfoStatpermiterealizarestapruebaactivandoelsubmenPRUEBADERACHAS