sesion 3 mbe tipos de variables

Introducción

Epidemiología

Estudio

Distribución

Determinantes

Salud Población

Prevenir Controlar

Problemas de salud

Investigación epidemiológica

Last JM. A dictionary of epidemiology, 4th ed. Oxford, Oxford University Press,2001.


Objetivos

Describir la distribución de

enfermedades y eventos en salud

Descubrimiento y caracterización de las leyes que los

gobiernan

Desarrollar conocimiento

Aplicar en la población


Información


Validez

Adecuado y apropiado de los

métodos utilizados

Precisión

Capacidad de un instrumento de dar el mismo resultado en mediciones diferentes

Mejor al aumentar el tamaño de la muestra

Validez y precisión

Straus SE, Richardson WS, Glasziou P, et al. Evidence-Based Medicine: How to Practice and Teach It. 4th ed. Churchill Livingstone; 2010.Greenhalgh T. How to read a paper the basics of evidence-based medicine, 4th ed. Wiley-Balckwell; 2010.

• Probabilidad de que la diferencia observada sea por azar

• <0.05 • <5%

p

• Rango dentro del cual se garantiza que se puede encontrar el valor real.

• Toma en cuenta un grado prefijado de seguridad (95%, 99%)

IC

Validez y precisión

Santana-Chávez LA, Lifshitz A, Castillo-Ayala JL. La docencia en el aprendizaje de la clínica. Edición de los autores: Guadalajara, México; 2014. Por publicar.

Ejemplo

McMurray JJ, Packer M, Desai AS, et al. Angiotensin-Neprilysin Inhibition versus Enalapril in Heart Failure. N Engl J Med. 2014 Aug 30. [Epub ahead of print]

¿Qué son?

¿Qué son?

Válido

¿Qué son?

Preciso

¿Qué son?

Preciso

Válido

¿Qué son?

Ni Preciso

Ni Válido

¿Qué son?

Válido

VálidoEj: p=0.003

¿Qué son?

Preciso

Ej: IC95(1.3 – 1.5)

¿Qué son?

Preciso

Ej: IC95(3.3 – 8.5)

¿Qué son?

Preciso

Ej: IC95(7.3 – 28.5)

¿Qué son?

Preciso

Válido

Ej: RR 2.5 IC95(2.3 – 2.8), p =0.0004

¿Qué son?

Preciso

No Válido

Ej: RR 1.3 IC95(0.9 – 1.4),

p =0.14

¿Qué son?

Ni Preciso

Ni Válido

Ej: RR 2.5 IC95(0.3 – 32.8), p =0.75

Ejercicio

Ejemplo

• ¿Cuál es el resultado más preciso?• A)RR, 2.03; IC95%, 0.90 a 84• B)RR, 2.03; IC95%, 0.05 a 3.8• C)RR, 2.03; IC95%, 1.18 a 4.3• D)RR, 2.03; IC95%, 2 a 2.06

Ejemplo

• ¿Qué estudio descartaría?• A)RR, 8.3; IC95%, 8 a 9.3• B)RR, 5.8; IC95%, 0.6 a 2.8• C)RR, 7.54; IC95%, 7.2 a 7.9• D)RR, 2.9; IC95%, 1.7 a 3.6

Ejemplo

• ¿Qué estudio descartaría?• A)RR, 8.3; p= 0.0008• B)RR, 5.8; p= 0.007• C)RR, 7.54; p= 0.06• D)RR, 2.9; p= 0.02

Ejemplo

• ¿Qué estudio es el más preciso?• A)RR, 8.3 (IC 95 7.4-8.4); p= 0.008• B)RR, 5.8 (IC 95 2.3-8.9); p= 0.002• C)RR, 7.54 (IC 95 0.05-10.4); p= 0.07• D)RR, 2.9 (IC 95 0.2-3); p= 0.08

Ejemplo

• ¿Qué estudio es el más preciso y es además, válido?

• A)RR, 8.3 (IC 95 7.4-8.4); p= 0.03• B)RR, 5.8 (IC 95 2.3-18.9); p= 0.2• C)RR, 7.54 (IC 95 0.05-10.4); p= 0.08• D)RR, 2.9 (IC 95 0.2-3); p= 0.09

Variables

Distribución Normal

Distribución Normal

Si las observaciones siguen una distribución normal se pueden utilizar muchas pruebas estadísticas. Es útil saber que aproximadamente 2 terceras partes de las observaciones que siguen una distribución normal difieren en

menos de una desviación estándar de la media; y cerca del 95% están a menos de 2 desviaciones estándar de la media

Estadística descriptiva (Medidas de tendencia central)

Media aritmética

Mediana

Moda

Se obtiene de sumar los valores individuales de la serie y dividir el resultado de esa suma entre el número de elementos de esa seriec

Es el valor que se encuentra justo en el centro de los valores de la serie

cuando estos son acomodados progresivamente

Es el valor que mas veces se repite en una serie

Estadística descriptiva (Medidas de dispersión)

Varianza

La varianza de la población se define como la suma de

cuadrados de las desviaciones de los datos con respecto a la

media de la población, dividida por el número de

observaciones de la población.

Desviación estándar

Es un estadístico universalmente empleado

para medir la variabilidad de una población o de una

muestra. Se interpreta como el valor absoluto que en

promedio se alejan los datos de las observaciones de la

media de la población, o de la muestra.

Rango o intervalo

El rango de un conjunto de datos numéricos es la

diferencia entre el mayor y el menor de todos ellos. La información que presenta es muy general, siendo útil en distribuciones normales para estimar la desviación

estándar, de manera aproximada.

Procesamiento y analisisTipo de pruebas estadisticas

Parametricas:Prueba t de StudentANOVA

No parametricas:P. (x2)P. de WilcoxonP. de Mann y WhitneyP. de Kruskal Wallis

Métodos estadísticos básicos

T de StudentX2 (Chi

Cuadrada)

Análisis de regresión

ANOVA

T de Student• Esta prueba se utiliza para comparar si la

media de dos distribuciones normales son iguales (H0-hipótesis 0) o diferentes una de otra (H1-hipótesis 1).

• Su finalidad es la de aceptar y rechazar hipótesis.

• Utilizada para variables cuantitativas• Tiene 2 colas de distribución

X2 Chi cuadrada

• Estima la probabilidad de que la magnitud con la que se desvían las observaciones de lo esperado, sea o no producto del azar.

• La X2 mide la desviación de lo observado con lo esperado• Si el valor de p es > 0.05 debe interpretarse como que la

desviación es aleatoria• En el caso opuesto (p<0.05) la desviación no es producto

del azar y debe tener otra explicación.

Análisis de Varianza (ANOVA)

• Esta prueba compara las medias entre los grupos de variables dependientes mediante el análisis de las fuentes de variación de la variable dependiente.

• El objetivo es encontrar la fuente de variación que determina cambios en la variable dependiente.

• Se pueden analizar mas datos a la vez

Waber RL, Shiv B, Carmon Z, Ariely D. Commercial features of placebo and therapeutic efficacy.JAMA. 2008 Mar 5;299(9):1016-7

• 82 voluntarios• Uso de un nuevo

analgésico opiode similar a codeína (en realidad placebo)

• Choques eléctricos en muñeca

Placebo barato vs placebo caro

• ¿Cómo puede el investigador controlar las variables de confusión en un estudio observacional?

• ¿Qué sucede cuando es necesario estratificar por muchas variables, o cuando para estratificar variables numéricas es necesario hacer categorizaciones a menudo arbitrarias?

• El análisis de regresión múltiple, conocido desde hacía muchos años, fue las solución a este problema. Su utilidad fue puesta de manifiesto en 1967 cuando fue empleado en el estudio Framingham

Regresión múltiple

• Análisis de regresión lineal múltiple: En este caso la variable dependiente o resultado es continua, las variables independientes pueden ser continuas o dicotómicas.

En el estudio INTERSALT fue analizada la relación entre el consumo de sal, medido por el Na en orina de 24hs, y la presión arterial. Otras variables formaron parte del modelo como el BMI, el consumo de alcohol y la edad

Análisis de regresión múltiple

• Análisis de regresión logística múltiple:

La variable dependiente es dicotómica y las variables independientes continuas o dicotómicas. Este tipo de análisis fue utilizado en el

estudio Modode nacimiento y riesgo de transmisión

del HIVLa regresión logística permite calcular el

odds ratio eIC, que tienen un importante valor

biológico porquecuantifican el incremento o decremento

del riesgo,ajustado por las demás variables.

Análisis de regresión múltiple

Furness S, Connor J, Robinson E, et al.Car colour and risk of car crash injury: population based

case control study. BMJ 2003;327:1455–6

Carros Plateados tienen menor riesgo de tener lesiones en accidentes

automovilísticos

El color de los carros y el riesgo de lesión en accidentes: estudio de casos y controles

Procesamiento y analisisTipo de pruebas estadisticas

Parametricas:Prueba t de StudentANOVA

No parametricas:P. (x2)P. de WilcoxonP. de Mann y WhitneyP. de Kruskal Wallis

Asociación de variables y estadístico

Correlación Spearman Regresión linealCuantitativaCuantitativa

2 Prueba T +3 ANOVA

categóricaCuantitativa

Regresión logísticacuantitativacategórica

chi-cuadradacategóricacategórica

Prueba Tipos de variableDependiente independiente

Asociación de variables y estadístico

chi-cuadrada

Kruskal wallis

ANOVA

McNemarchi-cuadrada*

Wilcoxon Mann-Whitney

Prueba t pareada

Prueba tCuantitativa

Ordinal

Categórica

Número de variables independientes 2 grupos datos pareados >2grupos

Variable

* Cuando 1 celda tiene <5 esperados, se usa prueba exacta de FischerCuando 1 de las celdas tiene <5 observados, se usa corregida de Yates

Procesamiento y análisis Selección de la prueba estadística para observaciones independientes

Variable de resultado

Nominal Categórica (>2 categorías)

Ordinal Cuantitativa discreta

Cuantitativa No-normal

Cuantitativa normal

Variable de entrada

Nominal X2 o de Fisher

X2 tendencia o Mann-Whitney

Mann-Whitney

Mann-Whitney o log-rank (a)

Prueba t de student

Categórica (>2 categorías)

Kruskal-Wallis (b)

Kruskal-Wallis (b)

Kruskal-Wallis (b)

Análisis de la varianza (ANOVA) (c)

Ordinal (categorías ordenadas)

X2 de tendencia o Mann – Whitney

(e) Rangos de Spearman

Rangos de Spearman

Rangos de Spearman

Rangos de Spearman o regresión lineal (d)

Cuantitativa Discreto

Regresión Logística

(e) (e) Rangos de Spearman

Rangos de Spearman

Rangos de Spearman o regresión lineal (d)

Cuantitativa no-normal


(e)

(e)

(e)

Ploteo de datos, Pearson o rangos de Spearman

Ploteo de datos, Pearson o Rangos de Spearman y regresión lineal

Cuantitativa normal


(e)

(e)

(e)

Regresión lineal (d)

Pearson y regresión lineal

X2

X2

X2

CorrelaciónEl coeficiente de correlación de Pearson es el calculado para variables continuas, si tenemos dos variables X e Y, la correlación entre ellas se la nombra r (X,Y), o solo r y está dada por: r = (xi-x) (yi-y ) Donde xi e yi son los valores de X e Y para el (xi-x)2(yi-y)2 individuo i

-1 +1 fuerte fuerte negativa positiva -0.5 +0.5 débil débil negativa positiva 0 Sin correlación

Correlación perfecta negativa Correlación perfecta positiva

Sin Correlación

Variables

Continuas Medias

2 T de student Edad entre 2 grupos

>2 ANOVA Edad entre >2 grupos

Discretas

Ordinal

2 U de Mann Whitney

Escolaridad

Numero de intentos

>2 Kruskal- Wallis

Nominal

Chi cuadrada Género

F Fisher

Todas las pruebas nos dan un valor de p

La estadística es como unos ciegos describiendo un elefante

sesion 3 mbe tipos de variables

Health & Medicine