colegio don bosco estadística descriptiva univariables spss · 2b modelo 2c ajuste 3p.diseño 3a...

25
Colegio Don Bosco Estadística descriptiva Univariables SPSS Aclaración Este documento es una versión reducida del original por cuya razón muchas secciones y apartados han sido eliminados A Preliminares B Exploración preliminar C Diagramas en general D Tablas en general E Sintaxis Conceptos preparatorios 1.1 Introducción En este curso se enfatiza que es necesario aprender a pensar estadísticamente. Pensar significa poner énfasis en los conceptos y dejar de lado la memorización irreflexiva de las fórmulas. Se pueden saber muchas fórmulas sin entender nada. En la medida de lo posible se debe extraer de las mismas su lógica interna. ¿Y estadísticamente? La estadística provee los medios para poder tomar decisiones basadas en datos. Posibilita transformar los datos en conocimientos haciendo a un lado las opiniones personales, sobre una base de evidencia sistemática. Arsham (1996) sostiene que “pensar estadísticamente será algún día para un ciudadano eficiente, tan importante como leer o escribir”. 1

Upload: trandiep

Post on 16-Oct-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Colegio Don Bosco Estadística descriptiva Univariables SPSS

Aclaración

Este documento es una versión reducida del original por cuya razón muchas secciones y apartados han sido eliminados

A Preliminares B Exploración preliminar C Diagramas en general D Tablas en general E Sintaxis

Conceptos preparatorios

1.1 Introducción

En este curso se enfatiza que es necesario aprender a pensar estadísticamente. Pensar significa poner énfasis en los conceptos y dejar de lado la memorización irreflexiva de las fórmulas. Se pueden saber muchas fórmulas sin entender nada. En la medida de lo posible se debe extraer de las mismas su lógica interna. ¿Y estadísticamente? La estadística provee los medios para poder tomar decisiones basadas en datos. Posibilita transformar los datos en conocimientos haciendo a un lado las opiniones personales, sobre una base de evidencia sistemática. Arsham (1996) sostiene que “pensar estadísticamente será algún día para un ciudadano eficiente, tan importante como leer o escribir”.

1

Page 2: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

Sabemos que para realizar esta tarea la estadística necesita modelar la realidad, para lo cual requiere de la teoría de probabilidades pues las variaciones y la incertidumbre son inevitables. Pero también necesita de la informática pues la diversidad y cantidad de datos (demografía, negocios, educación, medicina, abogacía, física, etc.) aumenta día a día, de lo cual se desprende que las computadoras se convierten hoy por hoy en indispensables. La estadística es además, parte del método científico. Por algún medio el científico o investigador elabora una hipótesis sobre un aspecto de la realidad y diseña un experimento para verificar esa hipótesis. De esta forma se obtienen datos que proveen conocimiento de la población de donde partieron. Al conjunto de dichos datos se lo llama muestra de la población (observar la presencia de la incertidumbre en los resultados de distintas muestras). Finalmente se procesan y analizan estadísticamente infiriendo a partir de ellos el comportamiento de la población y por lo tanto rechazando o no rechazando la hipótesis. Esta última etapa se denomina estadística inferencial y origina distintas técnicas estadísticas. Se aprecia que en este proceso no importa lo que el investigador crea acerca de la veracidad de la hipótesis, pues se realiza una evaluación objetiva de la misma. El proceso luego se repite ya sea para validar o corregir la hipótesis. Veamos un ejemplo de inferencia tomado de la vida diaria: supongamos que el cocinero de un restaurant desea conocer la calidad de la sopa (población) que esta preparando. No necesita tomarse toda la sopa para probar dicha calidad, le basta revolver bien y luego saborear una cucharada de la misma (muestra representativa al haber revuelto completamente la sopa). Registrar de paso que no interesa el tamaño del recipiente en donde se encuentra la sopa para realizar la inferencia. En el mercado se encuentran disponibles muchos paquetes estadísticos de computación. En este capítulo utilizaremos las herramientas estadísticas proporcionadas por el programa profesional de estadística SPSS 11.0® (Statistical Package for the Social Sciences) y por la planilla de cálculo Microsoft EXCEL

1.2 Estructura de un diseño

Se puede decir que cualquier investigación científica sigue aproximadamente la siguiente estructura de 5 pasos (en este caso adaptada al problema de estadística inferencial):

1P.Problema

2P.Modelado 2a Supuestos 2b Modelo 2c Ajuste

3P.Diseño 3a Variables

3b Datos

4P.Análisis

4a Inferencia 4b Decisión 4c Verificar supuestos

5P.Validación

Como ya ser dijo, el objeto de la estadística no es otro que realizar una inferencia acerca de la población de donde provienen los datos. Por consiguiente, el esquema anterior (o alguno similar) es de uso corriente para todo investigador que utilice técnicas estadísticas. Todo proceso de diseño se encuentra asociado con una palabra llamada iteración. Esto significa que existe un lazo de realimentación entre cualquiera de los pasos, esencialmente entre los pasos 2 a 4 como se indica en la figura. Esto sin embargo no significa que necesariamente deba recorrerse el proceso en el orden indicado. Un prediseño aparentemente adecuado en el modelado del P2, puede resultar incorrecto en el análisis posterior

Jorge Carrá 2

Page 3: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

del P3 o en el diseño de otras variables del P4. Se deberá entonces regresar a un paso anterior o incluso a la fase inicial del P1 para redefinir el problema y poder generar mejores soluciones.

1P PROBLEMA

El problema a resolver deberá encasillarse en alguno de los 6 grandes temas que resuelve la estadística: • Análisis de comparación entre grupos • Análisis de asociación entre variables • Análisis de forma • Análisis de predicción de pertenencia a un grupo • Análisis de eventos temporales • Análisis de estructura

2P MODELADO

Un modelo es una representación (no única) de la realidad. Los modelos que se usan en tecnología se pueden clasificar en 2 grupos: • Modelos físicos • Modelos simbólicos Los modelos físicos conservan las características físicas de los objetos originales. • Ejemplos en 2D: dibujos, planos, fotografías, mapas, etc. • Ejemplos en 3D: maquetas, estatuas, etc.

Los modelos simbólicos en cambio no conservan las características físicas del objeto en estudio y suelen representar solo alguna de sus propiedades. Pueden ser: • esquemáticos o gráficos. Ejemplo: circuito eléctrico, diagramas cartesianos. • verbales. Ejemplo: cualquier descripción verbal del objeto. • matemáticos. Ejemplo: una ecuación matemática. En nuestro caso se trabajará con modelos matemáticos. Dado que se trata de resolver el comportamiento de un grupo grande de elementos (población) a partir de un subconjunto del mismo (muestra), se entiende que deberá conocerse alguna característica de esa población. En los capítulos 3 y 4 estudiaremos que los fenómenos aleatorios presentan ciertas regularidades estadísticas, siendo por lo tanto natural que un modelo matemático adecuado sea la distribución de probabilidades de la variable en estudio o de alguna variable relacionada.

2a Supuestos La mayoría de los modelos simplifican e idealizan la realidad para facilitar su tratamiento. Es imprescindible conocer entonces los supuestos o hipótesis del modelo, para establecer la zona de validez.

2b Modelo Se establece el modelo matemático y cualquier técnica matemática necesaria para estudiar el modelo.

2c Ajuste Consiste en nuestro caso en el ajuste de los datos de la muestra al modelo poblacional que se yaya elegido. Si por ejemplo se plantea el modelo de que los datos muestrales vinculan 2 variables según una ley lineal, el ajuste significa hallar la ecuación de esa recta.

3P DISEÑO

Diseño es el proceso de concebir o inventar formas, partes y detalles de un sistema para cumplir un determinado propósito. Es en esencia una actividad creativa, por lo cual no existe una única metodología que

3

Page 4: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

garantice una solución y además es inherentemente iterativo por lo cual algunos pasos se deberán repetir en la afinación del mismo. Se refiere en este caso al diseño experimental y de muestreo. Aquí se definen las variables y el tamaño n de la muestra.

3a Variables Se definen el tipo y número de variables a estudiar.

3b Datos Se define el tamaño adecuado de la muestra.

4P ANÁLISIS

4a Inferencia Aplicación de la técnica de inferencia para obtener resultados.

4b Decisión En base a los resultados del punto anterior el investigador podrá hacer predicciones (siempre sobre aspectos contenidos en la información original).

4c Verificar supuestos Con los resultados del análisis podrá verificar la validez o no de alguno de los supuestos iniciales.

5P VALIDACIÓN

El investigador constatará las predicciones con la realidad, ya sea con una nueva muestra o con una subdivisión de la actual. Esto medirá la eficacia del modelo no solo para explicar los hechos los hechos en estudio, sino también para predecir nuevas situaciones.

Informe estadístico Para facilitar al lector la comprensión rápida de un estudio, resulta imprescindible poder comunicar los resultados y conclusiones del trabajo en forma ordenada y precisa. Los informes de cualquier tipo deben ser concisos y en general siguen un patrón determinado. Tienen una estructura en general normalizada que solo puede ser modificada levemente y que consta de los siguientes elementos:

1° página

Título y autor

2° página

Resumen.

3° página en adelante: cuerpo del informe

Título (Introducción). Métodos. Resultados Análisis Conclusiones.

Los 5 componentes del cuerpo de un informe, siguen aproximadamente a los pasos de una investigación. El propósito de cada uno de los componentes de un informe se sintetiza en el archivo Informe. doc El mismo contiene un ejemplo ilustrativo elaborado por los alumnos del grupo Retama del Colegio Don Bosco de San Carlos de Bariloche. Para la acreditación de las habilidades aprendidas con el programa SPSS, se deben presentar al final de cada práctica los siguientes documentos en Word, en carpeta tipo Data Bank y en tamaño A4: • los trabajos prácticos que se indiquen (sin Internet) con el encabezamiento y pie de página del documento

TP1 Enc.doc

Jorge Carrá 4

Page 5: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

• los informes estadísticos sobre temas elegidos por el alumno (con Internet), realizados exclusivamente con computadora.

1.3 Entorno del SPSS

Ventana del Editor de Datos (Data View)

Si está leyendo este documento en forma electrónica, es recomendable seguir las prácticas corriendo SPSS en una ventana y este documento en otra. Una alternativa conveniente es presentar ambas ventanas en mosaico horizontal o vertical con: clic-derecho en la barra de tareas del escritorio > Mosaico horizontal o vertical. Otra posibilidad es utilizar Alt + Tab para cambiar entre los documentos abiertos. Existen dos formas de ejecutar el programa: hacer doble clic sobre el icono de un archivo de SPSS (extensión .sav), o bien hacerlo sobre el icono de SPSS. La ventana que se abre por defecto es la del Editor de Datos. Al pie de la misma se pueden observar dos pestañas: Data View y Variable View. Presionando en la primera se accede a una pantalla que tiene una estructura similar a una planilla de EXCEL: las variables del estudio (nota, peso, altura, nacionalidad, religión, etc) se encuentran en cada una de las columnas, en tanto que los casos individuales (1, 2, 3, etc) se encuentran en cada una de las filas. Presionando la pestaña Variable View, se observa el diccionario de propiedades de cada una de las variables (nombre, tipo, subgrupos, etc). Las opciones del menú y de la barra de herramientas se irán estudiando al recorrer las actividades de las prácticas. Para realizar cualquier procedimiento estadístico, se deben seguir 3 pasos:

1. poner los datos, 2. seleccionar un procedimiento (menú Analyze) o un gráfico (menú Graphs), 3. seleccionar las variables para el análisis (en un cuadro de diálogo que se abre posteriormente en cada

uno de los procedimientos o gráficos).

5

Page 6: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

La manipulación de los datos y variables del archivo para adecuarlos al estudio (separación, unión, selección de una muestra, operaciones entre variables, etc), se encuentran en los menús Data y Transform.

Básicamente en Data se encuentran comandos que modifican la administración de los datos y en Transform comandos que crean y transforman las variables. Tener en cuenta que a diferencia de EXCEL, no se pueden realizar cálculos ni introducir fórmulas en la misma planilla. Todos los procedimientos estadísticos se encuentran concentrados en Analyze y los gráficos en Graphs como se observa en las siguientes figuras.

Jorge Carrá 6

Page 7: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

Ventana de Salida (Output) o Visor (Viewer)

Al ejecutar un procedimiento estadístico con el menú Analyze, o un gráfico con el menú Graphs, todas las tablas y gráficos que se generan se muestran automáticamente en una nueva ventana llamada Output o Viewer. Para visualizar esta ventana, abrir un archivo *.sav cualquiera de los que se instalan por defecto en la carpeta SPSS, con File > Open > Data. Luego hacer clic en Analyze > Descriptive Statistics > Frequencies > pasar cualquier variable del cuadro de la izquierda al de la derecha (activo) > OK. Se abre una ventana como la de la figura llamada Viewer. Tiene su propia barra de menús y de herramientas (la de herramientas es flotante). La pantalla tiene dos paneles, el izquierdo tiene los títulos de todos los gráficos y tablas con una presentación arbolada similar al explorador de Windows, en tanto el derecho presenta los

7

Page 8: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

resultados del procedimiento o gráfico. En el visor se puede examinar y editar cada resultado para posteriormente exportarlo al documento final en el cual se compaginará el informe estadístico (en nuestro caso en Word). Tanto las tablas como los gráficos se seleccionan con un clic (para copiar) y se activan con un doble clic (para editar). El conocimiento de un programa de estadística habilita el acceso a otros programas comerciales, en general con solo recorrer el archivo Help del nuevo paquete. No todos ellos se superponen y algunos problemas son mejor manejados por alguno de ellos. El investigador es afortunado si tiene acceso a varios paquetes de programas estadísticos con lo cual podrá elegir el mas adecuado a sus propósitos. En el paquete Statistica 6.0 se llama por ejemplo: Spreadsheet a Data View Statistics a Analyze Workbook al Output. Notas: Para obtener información sobre cualquier control de un cuadro de diálogo, pulsar con el botón derecho del ratón sobre él. Se sugiere además recorrer el entrenamiento interactivo Tutorial que se encuentra en el menú Help

Es conveniente guardar periódicamente ambas ventanas pulsando Save o Save as en el menú File. Se sugiere además verificar antes de comenzar la sesión que el programa grabe correctamente (con Save) o genere correctamente el archivo (con Save as). Los datos del editor de datos se guardan desde la ventana Data view con la extensión *.sav y los resultados (tablas y gráficos) desde la ventana Output con la extensión *.spo Los archivos *.spo pueden guardarse con una contraseña para ser abiertos solo con ella, pulsar para esto: Save With Password...

Jorge Carrá 8

Page 9: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

El entorno se puede personalizar con Edit > Options..., en donde se tienen 10 solapas con gran cantidad de controles a los que se hará referencia en el futuro.

En el cuadro de diálogo previo a la ejecución del procedimiento estadístico se puede obtener la sintaxis del mismo en código SPSS presionando el botón Paste. Si se guarda, es posible ejecutar luego el procedimiento solo con este código. La barra de botones del editor de datos contiene por defecto los siguientes botones. La función de cada uno puede conocerse colocando el mouse sobre él.

Se puede personalizar agregando controles adicionales: View > Toolbars > New Toolbar > dar un nombre a la nueva barra y seleccionar Customize Toolbar > arrastrar los iconos deseados a la barra inferior. Cuando no hay un dato en la celda activa (perteneciente a una variable definida), SPSS coloca en dicha celda el símbolo de una coma o de un punto según la configuración.

B Exploración preliminar Distribuciones univariables

La forma rápida de adquirir el manejo de un programa de computación es con aplicaciones prácticas intensivas. Llamaré actividades o ejemplos a las aplicaciones dentro de la teoría y tutoriales o problemas resueltos a la teoría dentro de las aplicaciones. En ambos casos utilizaré letras de igual tamaño que las del texto general pero con fondo color cyan. Cada paso será documentado y todas las alternativas serán

9

Page 10: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

introducidas. Al final del capítulo complementario 1 se habrá realizado un completo análisis descriptivo con datos univariables y multivariables. El análisis estadístico comienza con la recolección de datos. En un curso básico de estadística básica se asume habitualmente que éstos ya han sido recolectados y que se encuentran disponibles. Si una decisión o conjetura debe extraerse de ellos resulta obvio que deben ser recolectados por un plan bien diseñado, este plan se denomina diseño del muestreo. Luego el trabajo sigue con la organización y presentación de estos datos. Al conjunto de procedimientos que se utilizan para lograr esto se les llama estadística descriptiva, objeto de esta práctica. Con el programa de computación SPSS se realizarán procedimientos de estadística descriptiva tales como resumen de datos con tablas, con gráficos y con medidas estadísticas numéricas. Algunas posibles presentaciones de los gráficos para una variable de escala pueden observarse en el archivo TP1 Ejemplo.doc Los vínculos hacia los principales ítems que se tratarán en la sección B se presentan a continuación: Importar y ExportarMuestreo Procedimiento frecuencias Variable ViewProcedimiento explorarProcedimiento descriptivos Gráficos desde Graph

1.4 Importar y exportar

Importar Particularmente en los trabajos con Internet, las bases de datos podrán estar en formato EXCEL, PDF, STATISTICA; SYSTAT ó en SPSS, por lo tanto para cuando se presente la necesidad se debe conocer como convertir de uno a otro formato. EXCEL, STATISTICA 6.0 ó SYSTAT a SPSS. Abrir SPSS y seguir: File > Open > Data. En la caja de diálogo habilitar los archivos *.xls, *.por o *.sys respectivamente. Para el caso de EXCEL, colocar en Range el rango de las celdas si se desea limitar la cantidad de datos a importar (dejarla vacía si se desea seleccionar todo el archivo). SPSS a STATISTICA 6.0 o EXCEL: Estando en SPSS seguir: File > Save as > seguir el procedimiento habitual eligiendo *.por ó *xls en el tipo de archivo. Estando los archivos abiertos de SPSS, STATISTICA 6.0 o EXCEL se pueden trasladar datos de uno a otro mediante copiar y pegar. PDF. Hoy en día es común la utilización de archivos *.pdf (de ADOBE) para presentar la información en Internet. No es poco común entonces que surja el deseo de procesar los datos de algún archivo *.pdf. En este caso los datos se encuentran en formato alfanumérico (string) en lugar de numérico (Numeric). La primera idea es copiar y pegar la tabla en EXCEL y convertir utilizando el formato de celda, pero al pegar se detecta que las celdas no se separan pues cada fila se pega en una sola celda de EXCEL. Este inconveniente puede resolverse copiando y pegando en Word y utilizar la función Convertir texto en tabla para lo cual previamente puede ser necesario asignar separadores entre los datos. Por la universalidad del idioma inglés es recomendable utilizar el punto decimal y no la coma decimal. En este caso si los datos presentan puntos de separación de miles anularlos con la función Edición > Reemplazar. Los datos pueden provenir también desde una base de datos como por ejemplo Acces (con extensión *mdb) o desde un archivo de texto (por ejemplo con extensión *.txt). En estos casos utilizar: File > Open Database para una base de datos o Read Text Data para un archivo de texto.

Exportar Las tablas pueden previamente editarse en el SPSS activando la misma (con un doble clic) y luego con un clic derecho elegir TableLooks > elegir un formato. La exportación se puede hacer de 2 formas:

Jorge Carrá 10

Page 11: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

Copiar y pegar a través del portapapeles: seleccionar la tabla o gráfico (con un solo clic) > ctrl + c. Para que se copie con formato en Word seguir con (dentro de Word): edición > pegado especial > imagen. Con el comando Export del menú File. Se crea un nuevo archivo y se debe elegir el formato de exportación como por ejemplo windows metafile (*.wmf). Para insertar luego la gráfica en el documento Word seguir (dentro de Word) con: Insertar > Imagen > Desde archivo. Esta forma es necesaria si: • se deben exportar todos juntos y no uno a uno, • se desea exportar en un formato determinado, por ejemplo una página web requiere *.jpg o *.bmp (como

los incorporados a esta página). En el documento Word se podrá luego confeccionar un informe con los títulos y agregados en texto que correspondan para cada una de las tablas o gráficos. Se recomiendan tres alternativas para colocar las imágenes en Word: • en posición relativa, es decir en línea con el texto, pudiendo colocar o arrastrar las imágenes al punto de

inserción deseado. Si no existe texto se debe preparar la hoja con la tecla enter y la barra espaciadora para llevar la imagen al punto deseado.

• en posición absoluta, con cualquiera de las opciones restantes, por ejemplo cuadrado, quedando flotantes y por lo tanto libres de moverse. Probar también con una combinación de ambas.

• en forma tabular (dentro de una tabla). Se genera una tabla sin bordes ni relleno (Formato > Bordes y sombreado) y luego se acomodan los gráficos en sus celdas.

En las primeras actividades trabajaremos con archivos SPSS o con datos directamente tecleados en el editor Data View. Elegir uno o dos archivos *.sav del conjunto de archivos contenido en la carpeta Base de Datos, cuyo detalle se comenta en la siguiente tabla.

N° Nombre Archivo Contenido 1 Ed física.sav Alumnos Rurales versus Urbanos 2000

Fuente: consultar Gabriel. 2 Diagnóstico Lengua 1.sav Departamento lengua CDB 2005

Fuente: consultar Graciela/Norma y Lengua1_2005.doc3 Cultura Juvenil.sav Encuesta alumnos CDB 2006

Fuente: consultar Norma/Gabriel. 4 GSS.sav Encuesta anual población EEUU

Fuente: General Social Survey GSS) 5 Trabajo.sav Encuesta laboral España 6 Encuesta.sav Encuesta España 7 Demo.sav Encuesta general España 8 Voto Cautivo.sav Voto versus empleos públicos, Argentina

Fuente: Voto Cautivo.pdf9 Gastos publicidad.pdf Gastos del gobierno en publicidad

Fuente: Poder Ciudadano 10 Supervivencia.sav Cáncer de pecho 11 Renal.sav Pacientes con patologías renales 12 Consulta.sav Encuesta juvenil española 13 Divorce.sav Relevamiento divorcios EEUU 14 Grades.sav Evaluación alumnos EEUU 15 Graduate.sav Resultados graduados PhD EEUU 16 Mundo.sav Datos demográficos de países 17 Country.sav Datos demográficos de paises 18 Edu Composición.xls Sistema Educativo Composición

Fuente: INDEC 19 Edu repitencia.xls Sistema Educativo Repitencia

Fuente: INDEC 20 Demografía.xls Demografía

Fuente: INDEC 21 TTerreno.sav Datos automóviles Todo Terreno

11

Page 12: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

De esos archivos elegir 2 variables, una categórica y la otra de escala (pueden ser de archivos distintos) y recorrer cada uno de los siguientes apartados aplicándoles a cada una los tratamientos más adecuados de acuerdo a su tipo. En cada ítem se explicarán las distintas alternativas que presenta SPSS. Se recomienda experimentar todas para que, además de resolver el tema específico, aprenda a dominar las distintas prestaciones del programa. Finalmente deberá exportar todos los gráficos y tablas a un documento Word agrupados en dos secciones: • variable categórica • variable de escala

Nota: El SPSS considera por defecto a las variables numéricas como de escala y a las alfanuméricas (nombre de una empresa, modelo de un coche, etc.) como nominales. Más adelante se verá la forma de cambiar el tipo de variable (Measure). Consideraremos al conjunto de datos del archivo como una población y realizaremos las siguientes actividades: • Comenzaremos por simular un muestreo al azar. • Procesaremos esos datos (distribución de frecuencias). • Utilizaremos los resúmenes logrados para responder a algunas preguntas concretas.

Tablas y diagramas preliminares

El corazón de la exploración preliminar se encuentra en el menú Analyze > Descriptive Statistics. Aquí se observan cuatro procedimientos que centralizan esta exploración. • Procedimiento Frequencies • Procedimiento Descriptives • Procedimiento Explore • Procedimiento Crosstabs Los tres primeros se aplican al tratamiento univariable y se describirán a continuación, dejando el cuarto para la parte b de este capítulo pues se refiere al análisis multivariable.

Jorge Carrá 12

Page 13: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

1.5 Procedimiento Frecuencias

Actividad 2 Procedimiento frecuencias Ejecutar: Analyze > Descriptive Statistics > Frequencies > seleccionar la variable de la lista y con un doble clic o con los botones de flecha desplazarla a la lista activa > seleccionar la información que se desee en los tres botones inferiores > OK. Observar que las variables se acompañan por un icono # si es numérica o cuantitativa (numeric) y A si es alfanumérica o cualitativa (string). Este listado se puede ordenar en forma alfabética o por el orden en que se encuentran en el archivo: seguir Edit > Options > General > Variable Lists. En este mismo lugar se puede optar por que se presente en el listado el nombre de la variable o su etiqueta seguida entre paréntesis por el nombre de la variable. Aclaraciones: • La varianza es la muestral (el divisor es n–1) • S.E.Mean es el error estándar de la media (sigma de la media, se verá en el capítulo 4) • Obtención de los percentiles p (n es el número de datos):

a) se descompone (n+1)·p/100 en una parte entera I y una parte decimal D b) el percentil se calcula con XI (1–D) + XI+1·D.

Para mostrar la tabla de frecuencias marcar Display frecuency table. Se muestra la tabla de frecuencias de elementos no agrupados. Se aclara que el valor Valid Percent se calcula excluyendo los valores missing. Tener muy en cuenta que el SPSS obedece rigurosamente a las indicaciones del usuario y por lo tanto no advierte si se le piden medidas sin sentido para la variable en cuestión como por ejemplo mediana de colores, percentiles de lugares de nacimiento, frecuencias acumuladas de variables nominales o barras de salarios. Es el usuario el que debe tener criterio estadístico para solicitar las medidas mas adecuadas al tipo de variable. Si la variable es de escala y se desea mostrar el histograma marcar Histograms en Charts... Si es categórica y se desea mostrar el diagrama de barras o el circular marcar Bar Charts o Pie Charts.

13

Page 14: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

La tabla de frecuencias no es muy útil cuando es muy larga por lo cual se debe optar por agrupar los datos. Para esto es necesario previamente recodificar la variable en otra definiendo a mano los límites de los intervalos, ver el procedimiento recode al final de este apartado. Vamos a editar el histograma ajustando el diseño con un número de intervalos aproximadamente igual a la n (ajustar al entero mas cercano) pero nunca menor que 5 o mayor que 20 (analizar luego el applet Histograma). Para ello activar el gráfico con: un doble clic sobre él > doble clic en cualquier valor del eje x > Custom > Define. Con el botón de rectángulos amarillos de la barra de herramientas se coloca la frecuencia absoluta en cada rectángulo. Si la altura de los rectángulos no permite presentar la frecuencia, reemplazarla con una grilla con una división adecuada, haciendo doble clic en la leyenda del eje vertical. Para utilizar posteriormente tildar: With normal curve. El histograma es la expresión gráfica de la agrupación (categorización) de la variable en intervalos y solo tiene vigencia para ese gráfico. ¿Se puede realizar esa agrupación de valores en el mismo editor de datos y poder así utilizarla para cualquier procedimiento? Si. Este proceso se llama recodificación y tiene múltiples utilidades.

Recodificar Existen 4 comandos en el SPSS que permiten recodificar una variable en otra, asignándole a cada caso un código numérico. Estos comandos se encuentran concentrados en la parte central del menú Transform:

Las variables generadas se colocan a continuación de la última existente. Veremos por ahora solo el comando Recode el cual realiza una recodificación manual a criterio del operador, (con o sin una condición lógica). Ver punto siguiente.

Actividad 3 Procedimiento recode Elegir una variable del archivo que requiera ser dividida en intervalos de frecuencias. Se generará otra variable como consecuencia de esta nueva recodificación. Ir a Transform > Recode > Into Differents Variables > Seleccionar la variable, nombrarla y etiquetarla > Old and New Values > Definir los intervalos de frecuencias con Range y codificar cada intervalo con New Value > Add. Si la variable es categórica elegir números arbitrarios para crear su nuevo valor por ejemplo 1, 2, 3, etc. Si es de escala como en el ejemplo del histograma anterior, lo correcto es utilizar las marcas de cada intervalo que se crea.

Jorge Carrá 14

Page 15: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

Las variables solo pueden tener un nombre que no supere los 8 caracteres. Para que en los gráficos y tablas aparezca un nombre que no tenga esta restricción, se debe etiquetar a cada una de las mismas. Para etiquetar tanto el nombre de la nueva variable como sus niveles (con los límites de cada intervalo como por ejemplo: menor10, 10-20, 20-30,….) se puede: • Utilizar las columnas Label y Values del editor de variables que se recorrerá en el punto siguiente • Utilizar la opción Label en el cuadro de diálogo que se presenta al recodificar en distintas variables. Solo

para el nombre de la variable, no se puede en este caso etiquetar sus niveles.

Applet - Histograma

Applet - Descriptivos

1.6 Variable view

Hasta ahora estuvimos esencialmente en el editor de datos (Data View). Para definir y editar las variables se deberá pasar al editor de variables (Variable View) con la pestaña que se encuentra en la parte inferior de la ventana. En la misma se observan opciones de edición en 10 columnas: • Name • Type • Width • Decimals • Label • Values • Missing • Columns • Align • Measure

15

Page 16: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

La información de la vista de variables también se encuentra en el menú Utilities > Variables…de la barra de menús. En el mismo menú se puede obtener con File Info un listado en el visor con todas las características de las variables. Si se hace clic en Variables se observa que en cada una de ellas se informa el contenido de las columnas: Name, Type, Width, Label, Values, Missing y Measurement.

Actividad 4 Elegir un archivo EXCEL de la base de datos e importarlo al SPSS. Luego editar el mismo con las funciones de la pestaña Variable View, en donde corresponda: etiquetas de la variable, etiqueta de sus valores, decimales, escala, etc. Repetir lo mismo para un archivo en formato *.pdf de ADOBE. Para esto releer el apartado Importar e Importar.

1.7 Procedimiento Explorar

Ejecutar: Analyze > Descriptive Statistics > Explore > seleccionar la variable de la lista y con un doble clic o con los botones de flecha desplazarla a la lista Dependent List. La variable colocada en Factor List divide al procedimiento de acuerdo a los niveles de esta variable, si se coloca más de una variable repite esta división en forma independiente de la anterior. Statistics • Descriptives Similares a los ya vistos con el agregado de los intervalos de confianza que se

estudiarán en el capítulo 5 • M–·Estimators Estimadores de posición de máxima verosimilitud (maximum-likelihood estimators • Outliers Valores extremos que se estudiarán más adelante

Jorge Carrá 16

Page 17: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

• Percentiles Si se edita la sintaxis se pueden aplicar otros criterios para calcularlos. Ver en la sección E una introducción a la sintaxis y el manual SPSSbase.pdf página 344 para las distintas alternativas.

Plots • Stem & leaf Diagrama de tallo y hojas • Boxplot Diagrama de caja • Histogram Histograma • Normality plots with tests Pruebas de comparación con una distribución normal. Se tratará en

el capítulo 8, estadística no paramétrica. El diagrama de tallo y hojas y el de caja son muy útiles en la etapa exploratoria Options • Exclude cases listwise Los casos con valores missing en alguna de las variables son

excluidos de todos los cálculos • Exclude cases pairwise Los casos con valores missing en alguna de las variables son

excluidos solo en los cálculos de esa variable • Report values Los valores missing de las variables colocadas en la Factor List son rotulados

como missing.

Diagrama de tallo y hojas

Actividad 5 Procedimiento explorar Analyze > Descriptive Statistics > Explore > mover la variable a la lista activa> Plots > Stem & Leaf. > Continue > OK. Para elegir los estadísticos más adecuados al tipo de variable en estudio: Repetir el Procedimiento frecuencias > pestaña Statistics

17

Page 18: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

Diagrama de caja: mediana/ cuartiles/ amplitud.

Actividad 6 Repetir el Procedimiento explorar > Boxplots. Editar luego este gráfico estándar activándolo con doble clic (por ejemplo rotar los ejes con el botón que tiene una flecha curva).

Con una O, SPSS marca los casos que caen entre 1.5 y 3 AIC desde el extremo de la caja (casos extremos), y con un * marca los casos que están a mas de 3 AIC del extremo de la caja (casos mas extremos).

Actividad 7 Para detectar cual es el número del caso que corresponde a cada asterisco activar el gráfico con un doble clic y en la ventana que se abre observar el botón de la izquierda, contiene un icono que al ser colocado sobre cualquier punto extremo permite leer los números identificatorios de los casos representados por ese punto al regresar al editor de datos. Luego se deberá ir al editor de datos para leer el valor de la variable correspondiente al caso. Si se desean visualizar en una tabla los 5 casos extremos de cada lado seguir el Procedimiento explorar > Statistics > Outliers. La presencia de casos extremos (outliers) puede comprimir mucho la caja y desvirtuarla. Alternativas para eliminar anticipadamente los casos mas extremos seleccionando una muestra que no los contenga:

Actividad 8 a) Alternativa extrema: eliminar el dato de la celda con Delete (aprender como hacerlo pero evitar aplicarla). b) Seleccionar todos los datos excepto los extremos: • En la misma variable:

Data > Select Cases > If condition is satisfied > colocar una condición que no comprenda a estos casos (si por ejemplo los casos extremos son superiores a 18, colocar If var < 18, donde var es el nombre de la variable). Aparecerá una diagonal cruzada en la columna izquierda que indica que esos casos no serán seleccionados y la indicación Filter On en la barra de tareas. Tener en cuenta que si ya se encuentran seleccionados casos, por ejemplo por un muestreo, esta nueva selección los modificará. En este caso cambiar a mano los 1 que se deseen por 0 en la variable

Jorge Carrá 18

Page 19: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

filter_$. Con esto aparecerá una diagonal cruzada en la columna izquierda que indica que esos casos no serán seleccionados

• Creando una nueva variable con Compute Transform > Compute > Colocar la variable en el cuadro de texto Numeric Expression > If > colocar la condición > Continue > dar un nombre a la nueva variable > OK. Observar que si la condición se coloca en la caja sin hacer clic previamente en If, la variable que se genera contiene 1 para los casos que cumple la condición y 0 para el resto, lo cual no es lo que se desea

• Creando una nueva variable con Recode. El resultado es similar al anterior y se obtiene con Transform > Recode > Into Differents Variables > darle un nombre > If > colocar la condición > Old and New Values > All other values > Copy old value(s) > Add > OK

Si en el estudio de la variable elegida se encuentra con outliers agregar un comentario al informe acerca del tratamiento que se les dio.

1.8 Procedimiento Descriptivos

Contiene estadísticos numéricos similares a los de los procedimientos frecuencia y explorar. LA particularidad es la opción Save standardized values as variables en la ventana Descriptives que genera en el editor la variable z correspondiente a las variables que se seleccionen.

1.9 Gráficos obtenidos desde Graph

Para cerrar la obtención de gráficos dentro de la fase exploratoria, veremos como obtener desde el menú Graph algunos de los gráficos anteriores. SPSS ofrece 2 alternativas generales que se analizarán en la sección siguiente: • Gráficos estándar • Gráficos interactivos

Gráficos estándar Graphs > elegir el gráfico tipo de gráfico> Define. Los gráficos que se obtuvieron en los procedimientos anteriores son gráficos estándar.

19

Page 20: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

Gráficos interactivos Graphs > Interactive > elegir el tipo de gráfico, Histogram por ejemplo > arrastrar la variable al eje x horizontal > OK. Como el nombre lo indica, los interactivos son gráficos dinámicos. En la sección C se ampliarán sus características, por ahora basta decir que para editarlos se hace doble clic en el gráfico y sin salir de la ventana del visor aparece alrededor del mismo una barra de herramientas con posibilidades de presentación en 3 D, rotación alrededor de los ejes espaciales, color etc.

Histograma Si se pide el histograma como gráfico estándar, se obtiene el mismo que en el procedimiento frecuencias. Si se pide como un diagrama interactivo, se observará que por ejmplo el rediseño de los intervalos se realiza a través de dos entradas: a) el número y el ancho de los intervalos haciendo un doble clic en cualquiera de las barras o b) los valores mínimo y máximo de la escala del eje, haciendo doble clic en cualquier número del eje.

Polígono de frecuencias acumulada, Ojiva.

Jorge Carrá 20

Page 21: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

Actividad 9 Alternativas: • Graphs > Line > Define > Cum % of cases > Mover la variable a la lista activa > OK.

El gráfico que se genera con este proceso es del tipo estándar. • Utilizar la tabla de frecuencias que se generó con el procedimiento frecuencias (ya sea agrupada o sin

agrupar). Activar la tabla con doble clic. Seleccionar las columnas de datos de frecuencia acumulada sin los encabezamientos (utilizar la tecla Ctrl si es necesario) > pulsar con el botón derecho del mouse > Create Graph > Line. El gráfico que se genera con este proceso es del tipo interactivo. Editar la Ojiva con un doble clic y luego con otro doble clic en las distintas zonas del gráfico. Utilizar luego los botones de formato que se encuentran a la izquierda de la ventana.

Diagrama de caja El diagrama de caja también puede solicitarse con el menú Graphs. Allí se puede elegir entre un gráfico estándar o uno interactivo.

Actividad 10 Solicitar uno interactivo con Graphs > Interactive > Boxplot. Con un doble clic se edita. Si se hace un clic derecho sobre el icono de un extremo se pueden realizar una serie de operaciones de edición.

Diagramas de barras de error

Los gráficos de barras de error Error Bar, solo se encuentran en el menú Graphs tanto estándar como interactivo, pero solo en los interactivos puede obtenerse para una sola variable.

Actividad 11 Solicitar graphs > Interactive > Error Bar > arrastrar la variable al eje y > elegir Standard Deviation Multiplier 2 > OK. Se generará una barra centrada en la media de la variable representando para ambos lados 2 veces la desviación estándar. La opción Estándar error of Mean se llama intervalo de confianza y se verá en el capítulo 5. Utilizaremos este gráfico para comparar visualmente las diferencias entre las medias de dos o más grupos. Colocar en el eje x una variable categórica (por ejemplo sexo como en la figura) y se obtendrán para este

21

Page 22: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

ejemplo 2 barras de error mostrando la ubicación de cada una de las medias (para varones y para mujeres) con su correspondiente dispersión. Tengamos siempre presente que el lector debe poder comprender una tabla o gráfico sin tener que recurrir al texto. Colocar por ejemplo etiquetas en lugar de códigos numéricos, utilizar un buen título, emplear colores o incluir datos numéricos que considere relevantes (como el tamaño de la muestra o la desviación estándar) en el caso de que el gráfico no los traiga por defecto.

Jorge Carrá 22

Page 23: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

Problemas

1–1 Abrir el archivo Estudiante.sav. Se tienen las calificaciones de 199 estudiantes que cursaron estadística en la universidad de Carolina del Norte en el último semestre. La calificación (GRADO) se califica según los siguientes códigos: Total Calificación

0-49 F 50-59 D 60-63 C- 64-69 C 70-73 C+ 74-75 B- 76-78 B 79-80 B+ 81-85 A- 86-100 A+

Los exámenes parciales y finales tienen un máximo de 75 puntos Los prácticos tienen un máximo de 137 puntos El total surge del promedio ponderado:

20 E.x1⋅ 20 E.x2⋅+ 40 Final⋅+

7520

T.p137⋅+

La universidad ha recibido muchas quejas sobre la calidad de la enseñanza que imparten los profesores graduados recién recibidos (nivel 1 de la variable INSTRUCT). Para investigar esto se pueden analizar las notas de los estudiantes que concurrieron a esas secciones del curso y verificar si resultaron peores que el resto. Las pruebas estadísticas adecuadas se tratarán mas adelante, pero podemos en principio comparar las distribuciones de frecuencias de las notas de todas las secciones y ver si existe algún patrón de comportamiento. Actividades para la variable TOTAL: Obtener una distribución de frecuencias con intervalos que comiencen con (20-30] recodificando en un nueva variable. a) Obtener cada uno de los histogramas de las 6 secciones, b) Obtener en un solo gráfico las barras de error para cada una de las 6 secciones agrupadas por PROFESOR.

Este gráfico es el más informativo para analizar la existencia o no de diferencias entre las medias de las distintas secciones pues presenta las incertezas en el valor de µ, σμ z± . Leer la nota siguiente. Entre otras opciones probar con: Graphs > Interactive > Error bar...o Boxplot…> agrupar por PROFESOR y por SECCIÓN. Para el gráfico de barras de error indicar para las barras una desviación estándar con multiplicador 2=z Para favorecer la comparación conviene presentar las 6 secciones en un mismo gráfico agrupadas por tipo de profesor. Se puede modificar el orden de los niveles de la variable sección con Categories > ordenar por profesor o en forma manual: by custom order. A este control se accede entre otras formas:

a. con un clic derecho en la leyenda (para barras de error y diagramas de caja), b. con un clic derecho en la región de datos (para histograma) o c. con un clic izquierdo en las categorías del eje x (para diagramas de líneas).

c) Obtener en un solo gráfico los diagramas de caja de cada una de las 6 secciones agrupadas por PROFESOR. Ver obtención en el punto anterior. Excluir los 5 casos extremos seleccionando una muestra que no los contenga.

23

Page 24: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Estadística Descriptiva Univariables

d) Obtener en un solo gráfico el perfil de líneas para las 6 medias. Una posibilidad es generar directamente

un gráfico interactivo de líneas. En este caso se pueden insertar al diagrama de líneas, las barras de error del punto 2 cliqueando el icono Insert Element.

e) Obtener los valores z. f) Calcular el promedio ponderado de cada estudiante y compararlo con la columna TOTAL. g) Comparar la nota más alta de las secciones 1 y 2. ¿Cuál es más representativa? h) ¿Apoyan los datos la preocupación expresada por las quejas recibidas en la universidad?

1–2 Una cadena de supermercados ha anunciado la política de ofrecer el pago de las compras de sus clientes con una nueva tarjeta de crédito, lo cual se agrega a las opciones normales de pago en efectivo o con cheque. Después del primer mes de funcionamiento se seleccionó una muestra de 100 clientes durante un período de una semana. Los datos se muestran en la siguiente tabla en donde los valores se expresan en pesos. Antes de la nueva política de tarjeta de crédito, más o menos un 50 % de los clientes pagaba al contado y el otro 50 % con cheque. (La tabla siguiente puede insertarse en la matriz de datos del SPSS con copiar y pegar).

Efectivo Cheque Tarjeta Efectivo Cheque Tarjeta 7.40 27.60 50.30 5.08 52.87 69.77 5.15 30.60 33.76 20.48 78.16 48.11 4.75 41.58 25.57 16.28 25.96 15.10 36.09 46.24 15.57 31.07 8.81 2.67 46.13 6.93 35.38 1.85 34.67 14.44 7.17 58.11 7.41 58.64 43.79 11.54 49.21 11.77 57.59 19.78 13.09 31.74 12.07 43.14 52.35 16.69 50.58 9.00 21.11 52.63 7.02 59.78 5.98 52.04 57.55 18.09 72.46 7.88 18.77 27.66 2.44 37.94 5.91 42.83 44.53 1.09 42.69 3.65 55.40 26.91 2.96 41.10 14.28 48.95 55.21 11.17 40.51 1.27 36.48 54.19 16.38 37.20 2.87 51.66 22.59 8.85 54.84 4.34 28.58 53.32 7.22 58.75 3.31 35.89 26.57 17.87 15.07 39.55 27.89 69.22

Previamente y utilizando la vista de variables editar el archivo con etiquetas y formatos. Aplicar todos los métodos tabulares, gráficos y numéricos de la estadística descriptiva para resumir los datos de la muestra en las 4 variables: método de pago, efectivo, cheque y tarjeta. Elaborar conclusiones referentes a los efectos de la nueva política que contengan al menos los siguientes resúmenes y descripciones. En particular obtener: a) Gráficas de barras, torta, histogramas, diagramas de tallo y hojas, diagramas de caja. b) Comparación e interpretación de las medidas de posición: medias y medianas. c) Comparación e interpretación de las medidas de dispersión: desviación estándar y amplitudes. d) ¿En cuál de las 3 variables de escala la media representa mejor a los datos? e) ¿Cuál de esas 3 variables tiene menor variabilidad absoluta y cuál mayor variabilidad relativa? f) Hallar la f(–2<z<2) para la variable TARJETA. g) Obtener los límites en valores z y x, correspondientes a los P80 y P20 para la variable CHEQUE.

Jorge Carrá 24

Page 25: Colegio Don Bosco Estadística descriptiva Univariables SPSS · 2b Modelo 2c Ajuste 3P.Diseño 3a Variables 3b Datos 4P.Análisis 4a Inferencia 4b Decisión 4c Verificar supuestos

Prácticas Asistidas por Computadora

1–3

Internet - ¿Cuánto gana un jugador de beisbol en USA?

1–4

Internet – ¿Cómo se diseña una encuesta?

1–5

Internet – ¿Por qué los tiburones atacan 94 varones de cada 100 personas?

1–6

Internet.-.¿Cómo se mide el grado de libertad económica de un país?

25