sesion 3 mbe tipos de variables
TRANSCRIPT
Introducción
Epidemiología
Estudio
Distribución
Determinantes
Salud Población
Prevenir Controlar
Problemas de salud
Investigación epidemiológica
Last JM. A dictionary of epidemiology, 4th ed. Oxford, Oxford University Press,2001.
Investigación epidemiológica
Objetivos
Describir la distribución de
enfermedades y eventos en salud
Descubrimiento y caracterización de las leyes que los
gobiernan
Desarrollar conocimiento
Aplicar en la población
Investigación epidemiológica
Información
Investigación epidemiológica
Validez
Adecuado y apropiado de los
métodos utilizados
Precisión
Capacidad de un instrumento de dar el mismo resultado en mediciones diferentes
Mejor al aumentar el tamaño de la muestra
Validez y precisión
Straus SE, Richardson WS, Glasziou P, et al. Evidence-Based Medicine: How to Practice and Teach It. 4th ed. Churchill Livingstone; 2010.Greenhalgh T. How to read a paper the basics of evidence-based medicine, 4th ed. Wiley-Balckwell; 2010.
• Probabilidad de que la diferencia observada sea por azar
• <0.05 • <5%
p
• Rango dentro del cual se garantiza que se puede encontrar el valor real.
• Toma en cuenta un grado prefijado de seguridad (95%, 99%)
IC
Validez y precisión
Santana-Chávez LA, Lifshitz A, Castillo-Ayala JL. La docencia en el aprendizaje de la clínica. Edición de los autores: Guadalajara, México; 2014. Por publicar.
Validez y precisión
Santana-Chávez LA, Lifshitz A, Castillo-Ayala JL. La docencia en el aprendizaje de la clínica. Edición de los autores: Guadalajara, México; 2014. Por publicar.
Validez y precisión
Santana-Chávez LA, Lifshitz A, Castillo-Ayala JL. La docencia en el aprendizaje de la clínica. Edición de los autores: Guadalajara, México; 2014. Por publicar.
Validez y precisión
Santana-Chávez LA, Lifshitz A, Castillo-Ayala JL. La docencia en el aprendizaje de la clínica. Edición de los autores: Guadalajara, México; 2014. Por publicar.
Validez y precisión
Santana-Chávez LA, Lifshitz A, Castillo-Ayala JL. La docencia en el aprendizaje de la clínica. Edición de los autores: Guadalajara, México; 2014. Por publicar.
Ejemplo
McMurray JJ, Packer M, Desai AS, et al. Angiotensin-Neprilysin Inhibition versus Enalapril in Heart Failure. N Engl J Med. 2014 Aug 30. [Epub ahead of print]
¿Qué son?
¿Qué son?
Válido
¿Qué son?
Preciso
¿Qué son?
Preciso
Válido
¿Qué son?
Ni Preciso
Ni Válido
¿Qué son?
Válido
VálidoEj: p=0.003
¿Qué son?
Preciso
Ej: IC95(1.3 – 1.5)
¿Qué son?
Preciso
Ej: IC95(3.3 – 8.5)
¿Qué son?
Preciso
Ej: IC95(7.3 – 28.5)
¿Qué son?
Preciso
Válido
Ej: RR 2.5 IC95(2.3 – 2.8), p =0.0004
¿Qué son?
Preciso
No Válido
Ej: RR 1.3 IC95(0.9 – 1.4),
p =0.14
¿Qué son?
Ni Preciso
Ni Válido
Ej: RR 2.5 IC95(0.3 – 32.8), p =0.75
Ejercicio
Ejemplo
• ¿Cuál es el resultado más preciso?• A)RR, 2.03; IC95%, 0.90 a 84• B)RR, 2.03; IC95%, 0.05 a 3.8• C)RR, 2.03; IC95%, 1.18 a 4.3• D)RR, 2.03; IC95%, 2 a 2.06
Ejemplo
• ¿Qué estudio descartaría?• A)RR, 8.3; IC95%, 8 a 9.3• B)RR, 5.8; IC95%, 0.6 a 2.8• C)RR, 7.54; IC95%, 7.2 a 7.9• D)RR, 2.9; IC95%, 1.7 a 3.6
Ejemplo
• ¿Qué estudio descartaría?• A)RR, 8.3; p= 0.0008• B)RR, 5.8; p= 0.007• C)RR, 7.54; p= 0.06• D)RR, 2.9; p= 0.02
Ejemplo
• ¿Qué estudio es el más preciso?• A)RR, 8.3 (IC 95 7.4-8.4); p= 0.008• B)RR, 5.8 (IC 95 2.3-8.9); p= 0.002• C)RR, 7.54 (IC 95 0.05-10.4); p= 0.07• D)RR, 2.9 (IC 95 0.2-3); p= 0.08
Ejemplo
• ¿Qué estudio es el más preciso y es además, válido?
• A)RR, 8.3 (IC 95 7.4-8.4); p= 0.03• B)RR, 5.8 (IC 95 2.3-18.9); p= 0.2• C)RR, 7.54 (IC 95 0.05-10.4); p= 0.08• D)RR, 2.9 (IC 95 0.2-3); p= 0.09
Variables
Distribución Normal
Distribución Normal
Si las observaciones siguen una distribución normal se pueden utilizar muchas pruebas estadísticas. Es útil saber que aproximadamente 2 terceras partes de las observaciones que siguen una distribución normal difieren en
menos de una desviación estándar de la media; y cerca del 95% están a menos de 2 desviaciones estándar de la media
Estadística descriptiva (Medidas de tendencia central)
Media aritmética
Mediana
Moda
Se obtiene de sumar los valores individuales de la serie y dividir el resultado de esa suma entre el número de elementos de esa seriec
Es el valor que se encuentra justo en el centro de los valores de la serie
cuando estos son acomodados progresivamente
Es el valor que mas veces se repite en una serie
Estadística descriptiva (Medidas de dispersión)
Varianza
La varianza de la población se define como la suma de
cuadrados de las desviaciones de los datos con respecto a la
media de la población, dividida por el número de
observaciones de la población.
Desviación estándar
Es un estadístico universalmente empleado
para medir la variabilidad de una población o de una
muestra. Se interpreta como el valor absoluto que en
promedio se alejan los datos de las observaciones de la
media de la población, o de la muestra.
Rango o intervalo
El rango de un conjunto de datos numéricos es la
diferencia entre el mayor y el menor de todos ellos. La información que presenta es muy general, siendo útil en distribuciones normales para estimar la desviación
estándar, de manera aproximada.
Procesamiento y analisisTipo de pruebas estadisticas
Parametricas:Prueba t de StudentANOVA
No parametricas:P. (x2)P. de WilcoxonP. de Mann y WhitneyP. de Kruskal Wallis
Métodos estadísticos básicos
T de StudentX2 (Chi
Cuadrada)
Análisis de regresión
ANOVA
T de Student• Esta prueba se utiliza para comparar si la
media de dos distribuciones normales son iguales (H0-hipótesis 0) o diferentes una de otra (H1-hipótesis 1).
• Su finalidad es la de aceptar y rechazar hipótesis.
• Utilizada para variables cuantitativas• Tiene 2 colas de distribución
X2 Chi cuadrada
• Estima la probabilidad de que la magnitud con la que se desvían las observaciones de lo esperado, sea o no producto del azar.
• La X2 mide la desviación de lo observado con lo esperado• Si el valor de p es > 0.05 debe interpretarse como que la
desviación es aleatoria• En el caso opuesto (p<0.05) la desviación no es producto
del azar y debe tener otra explicación.
Análisis de Varianza (ANOVA)
• Esta prueba compara las medias entre los grupos de variables dependientes mediante el análisis de las fuentes de variación de la variable dependiente.
• El objetivo es encontrar la fuente de variación que determina cambios en la variable dependiente.
• Se pueden analizar mas datos a la vez
Waber RL, Shiv B, Carmon Z, Ariely D. Commercial features of placebo and therapeutic efficacy.JAMA. 2008 Mar 5;299(9):1016-7
• 82 voluntarios• Uso de un nuevo
analgésico opiode similar a codeína (en realidad placebo)
• Choques eléctricos en muñeca
Placebo barato vs placebo caro
• ¿Cómo puede el investigador controlar las variables de confusión en un estudio observacional?
• ¿Qué sucede cuando es necesario estratificar por muchas variables, o cuando para estratificar variables numéricas es necesario hacer categorizaciones a menudo arbitrarias?
• El análisis de regresión múltiple, conocido desde hacía muchos años, fue las solución a este problema. Su utilidad fue puesta de manifiesto en 1967 cuando fue empleado en el estudio Framingham
Regresión múltiple
• Análisis de regresión lineal múltiple: En este caso la variable dependiente o resultado es continua, las variables independientes pueden ser continuas o dicotómicas.
En el estudio INTERSALT fue analizada la relación entre el consumo de sal, medido por el Na en orina de 24hs, y la presión arterial. Otras variables formaron parte del modelo como el BMI, el consumo de alcohol y la edad
Análisis de regresión múltiple
• Análisis de regresión logística múltiple:
La variable dependiente es dicotómica y las variables independientes continuas o dicotómicas. Este tipo de análisis fue utilizado en el
estudio Modode nacimiento y riesgo de transmisión
del HIVLa regresión logística permite calcular el
odds ratio eIC, que tienen un importante valor
biológico porquecuantifican el incremento o decremento
del riesgo,ajustado por las demás variables.
Análisis de regresión múltiple
Furness S, Connor J, Robinson E, et al.Car colour and risk of car crash injury: population based
case control study. BMJ 2003;327:1455–6
Carros Plateados tienen menor riesgo de tener lesiones en accidentes
automovilísticos
El color de los carros y el riesgo de lesión en accidentes: estudio de casos y controles
Procesamiento y analisisTipo de pruebas estadisticas
Parametricas:Prueba t de StudentANOVA
No parametricas:P. (x2)P. de WilcoxonP. de Mann y WhitneyP. de Kruskal Wallis
Asociación de variables y estadístico
Correlación Spearman Regresión linealCuantitativaCuantitativa
2 Prueba T +3 ANOVA
categóricaCuantitativa
Regresión logísticacuantitativacategórica
chi-cuadradacategóricacategórica
Prueba Tipos de variableDependiente independiente
Asociación de variables y estadístico
chi-cuadrada
Kruskal wallis
ANOVA
McNemarchi-cuadrada*
Wilcoxon Mann-Whitney
Prueba t pareada
Prueba tCuantitativa
Ordinal
Categórica
Número de variables independientes 2 grupos datos pareados >2grupos
Variable
* Cuando 1 celda tiene <5 esperados, se usa prueba exacta de FischerCuando 1 de las celdas tiene <5 observados, se usa corregida de Yates
Procesamiento y análisis Selección de la prueba estadística para observaciones independientes
Variable de resultado
Nominal Categórica (>2 categorías)
Ordinal Cuantitativa discreta
Cuantitativa No-normal
Cuantitativa normal
Variable de entrada
Nominal X2 o de Fisher
X2 tendencia o Mann-Whitney
Mann-Whitney
Mann-Whitney o log-rank (a)
Prueba t de student
Categórica (>2 categorías)
Kruskal-Wallis (b)
Kruskal-Wallis (b)
Kruskal-Wallis (b)
Análisis de la varianza (ANOVA) (c)
Ordinal (categorías ordenadas)
X2 de tendencia o Mann – Whitney
(e) Rangos de Spearman
Rangos de Spearman
Rangos de Spearman
Rangos de Spearman o regresión lineal (d)
Cuantitativa Discreto
Regresión Logística
(e) (e) Rangos de Spearman
Rangos de Spearman
Rangos de Spearman o regresión lineal (d)
Cuantitativa no-normal
Regresión Logística
(e)
(e)
(e)
Ploteo de datos, Pearson o rangos de Spearman
Ploteo de datos, Pearson o Rangos de Spearman y regresión lineal
Cuantitativa normal
Regresión Logística
(e)
(e)
(e)
Regresión lineal (d)
Pearson y regresión lineal
X2
X2
X2
CorrelaciónEl coeficiente de correlación de Pearson es el calculado para variables continuas, si tenemos dos variables X e Y, la correlación entre ellas se la nombra r (X,Y), o solo r y está dada por: r = (xi-x) (yi-y ) Donde xi e yi son los valores de X e Y para el (xi-x)2(yi-y)2 individuo i
-1 +1 fuerte fuerte negativa positiva -0.5 +0.5 débil débil negativa positiva 0 Sin correlación
Correlación perfecta negativa Correlación perfecta positiva
Sin Correlación
Variables
Continuas Medias
2 T de student Edad entre 2 grupos
>2 ANOVA Edad entre >2 grupos
Discretas
Ordinal
2 U de Mann Whitney
Escolaridad
Numero de intentos
>2 Kruskal- Wallis
Nominal
Chi cuadrada Género
F Fisher
Todas las pruebas nos dan un valor de p
La estadística es como unos ciegos describiendo un elefante