Transcript
  • Cu

    adro

    12

    -1S

    ino

    psi

    s d

    e al

    gu

    no

    s m

    to

    do

    s es

    tad

    sti

    cos

    par

    a co

    mp

    rob

    ar h

    ip

    tesi

    s

    Tip

    o d

    e ex

    per

    imen

    to

    Tres

    o m

    s g

    rup

    os

    Do

    s g

    rup

    os

    tera

    pu

    tico

    sA

    nte

    s y

    des

    pu

    ste

    rap

    uti

    cos

    inte

    gra

    do

    s p

    or

    de

    aplic

    ar u

    n s

    olo

    Trat

    amie

    nto

    sR

    elac

    in

    Esc

    ala

    de

    inte

    gra

    do

    s p

    or

    div

    erso

    str

    atam

    ien

    to e

    n lo

    sm

    lt

    iple

    s en

    los

    entr

    e d

    os

    med

    ici

    nd

    iver

    sos

    ind

    ivid

    uo

    sin

    div

    idu

    os

    mis

    mo

    s in

    div

    idu

    os

    mis

    mo

    s in

    div

    idu

    os

    vari

    able

    s

    Inte

    rval

    o (o

    bten

    ido

    Pru

    eba

    no

    An

    lisis

    de

    la

    Pru

    eba

    empa

    reja

    da

    An

    lisis

    de

    la v

    aria

    nza

    Reg

    resi

    n li

    neal

    ,a

    part

    ir de

    empa

    reja

    da d

    eva

    rianz

    a (c

    ap. 3

    )de

    la t

    (cap

    . 9)

    con

    med

    idas

    corr

    elac

    in

    pobl

    acio

    nes

    dela

    t(c

    ap. 4

    )re

    petid

    as (c

    ap. 9

    )en

    tre

    prod

    ucto

    -di

    strib

    uci

    n no

    rmal

    *)m

    omen

    to d

    eP

    ears

    on o

    an

    lisis

    de

    Bla

    nd-A

    ltman

    (cap

    . 8)

    Nom

    inal

    Tabl

    a de

    an

    lisis

    de

    Tabl

    a de

    an

    lisis

    de-

    Pru

    eba

    de M

    cNem

    ar C

    ochr

    ane

    Q

    Rie

    sgo

    rela

    tivo

    o co

    ntin

    genc

    ia d

    e-co

    ntin

    genc

    ia d

    e la

    (Cap

    9)

    coci

    ente

    de

    la ji

    cua

    drad

    aji

    cuad

    rada

    (cap

    . 5)

    posi

    bilid

    ades

    (cap

    . 5)

    (cap

    . 5)

    Ord

    inal

    P

    rueb

    a de

    la s

    uma

    Est

    ads

    tica

    de

    Pru

    eba

    de lo

    sE

    stad

    stic

    a de

    C

    orre

    laci

    n o

    rdin

    alor

    dina

    l de

    Man

    n-K

    rusk

    al-W

    allis

    ra

    ngos

    con

    Fr

    iedm

    ande

    Spe

    arm

    anW

    hitn

    ey (c

    ap. 1

    0)(c

    ap. 1

    0)si

    gnos

    de

    (cap

    . 10)

    (cap

    . 8)

    Wilc

    oxon

    (c

    ap. 1

    0)S

    uper

    vive

    ncia

    Pru

    eba

    del o

    rden

    loga

    rtm

    ico

    o pr

    ueba

    de G

    ehan

    (cap

    . 11)

    *Si n

    o se

    ver

    ifica

    la s

    upos

    ici

    n de

    que

    las

    pobl

    acio

    nes

    tiene

    n un

    a di

    strib

    uci

    n no

    rmal

    , se

    ord

    enan

    las

    obse

    rvac

    ione

    s y

    se e

    m-

    plea

    n lo

    s m

    tod

    os p

    ara

    los

    dato

    s qu

    e se

    mid

    en e

    n un

    a es

    cala

    ord

    inal

    . O

    dat

    os d

    e in

    terv

    alo

    que

    no s

    iem

    pre

    tiene

    n un

    a di

    strib

    uci

    n no

    rmal

    .

  • BioestadsticaS E X TA E D I C I N

  • Stanton A. Glantz, PhDProfessor of Medicine

    Director, Center for Tobacco ControlResearch and Education

    Member, Cardiovascular Research InstituteMember, Institute for Health Policy Studies

    Member, Cancer CenterUniversity of California, San Francisco

    MXICO BOGOT BUENOS AIRES CARACAS GUATEMALA LISBOAMADRID NUEVA YORK SAN JUAN SANTIAGO SA O PAULOAUCKLAND LONDRES MILN MONTREAL NUEVA DELHISAN FRANCISCO SINGAPUR ST. LOUIS SIDNEY TORONTO

    TraduccinDra. Ana Mara Prez-Tamayo Ruiz

    BioestadsticaS E X TA E D I C I N

  • Editor sponsor: Javier De Len FragaCorreccin de estilo: Juan Carlos Muoz GmezSupervisora de edicin: Leonora Vliz SalazarSupervisora de produccin: Olga Adriana Snchez Navarrete

    BIOESTADSTICA

    Prohibida la reproduccin total o parcial de esta obra,por cualquier medio, sin la autorizacin escrita del editor.

    DERECHOS RESERVADOS 2006 respecto a la primera edicin en espaol porMcGRAW-HILL/INTERAMERICANA EDITORES, S.A. DE C.V.A subsidiary of The McGraw-Hill Companies, Inc.

    Prolongacin Paseo de la Reforma 1015, Torre A, Piso 17, Colonia Desarrollo Santa FeDelegacin lvaro Obregn. C. P. 01376, Mxico, D. F.Miembro de la Cmara Nacional de la Industria Editorial Mexicana, Reg. Nm. 736.

    ISBN 970-10-5701-5

    Traducido de la sexta edicin de: Primer of biostatisticsCopyright 2005, 2002, 1997, 1992, 1987, 1981 by The McGraw-Hill Companies, Inc.All rights reserved.Previous edition 2002.ISBN 0-07-143509-3

    1234567890 09875432106Impreso en Mxico Printed in Mexico

    Portada Pehrsson Design

    NOTALa medicina es una ciencia en constante desarrollo. Conforme surjan nuevos conocimientos, se re-querirn cambios de la teraputica. El(los) autor(es) y los editores se han esforzado para que loscuadros de dosificacin medicamentosa sean precisos y acordes con lo establecido en la fecha depublicacin. Sin embargo, ante los posibles errores humanos y cambios en la medicina, ni los edito-res ni cualquier otra persona que haya participado en la preparacin de la obra garantizan que la in-formacin contenida en ella sea precisa o completa, tampoco son responsables de errores u omisio-nes, ni de los resultados que con dicha informacin se obtengan. Convendra recurrir a otras fuentesde datos, por ejemplo, y de manera particular, habr que consultar la hoja informativa que se adjuntacon cada medicamento, para tener certeza de que la informacin de esta obra es precisa y no se hanintroducido cambios en la dosis recomendada o en las contraindicaciones para su administracin.Esto es de particular importancia con respecto a frmacos nuevos o de uso no frecuente.

  • A Marsha Kramar Glantz

  • Las corazonadas y la intuicin son indispensables para co-menzar cualquier investigacin, pero la verdad se descubreslo a travs de la calidad de los nmeros finales.*

    Lewis ThomasMemorial Sloan-Kettering Cancer Center

    *L. Thomas, Biostatistics in medicine, Science 198:675,1977.Copyright 1977 por la American Association for the Advancement of Science.

  • Contenido

    vii

    Resumen de algunos mtodos estadsticospara comprobar hiptesis Interior de la portada

    Cuadros sobre pruebas de significacin xv

    Prefacio xvii

    1. Bioestadstica y prctica clnica 1Medicina cientfica 2Qu expresan los procedimientos estadsticos? 5Por qu no confiar en las revistas? 7Por qu ha persistido el problema? 9

    2. Cmo resumir los datos? 11La media 13Medidas de variabilidad 14Distribucin normal 15Percentiles 16Obtencin de datos 21

    Muestras aleatorias 21Sesgos 24

  • Experimentos y estudios de observacin. 26Estudios clnicos aleatorizados 29

    Cmo calcular la media y la desviacin estndar de una muestra 30Qu tan valiosos son estos clculos? 31Resumen 38Problemas 38

    3. Cmo buscar diferencias entre varios grupos 40Mtodo general 41Dos maneras de calcular la varianza de poblacin 46Qu es una F grande? 48Tres ejemplos 56

    Glucemia en hijos de padres diabticos 56Halotano o morfina en la operacin de corazn abierto 60Disfuncin menstrual en corredoras de fondo 64

    Problemas 67

    4. El caso especial de dos grupos: la prueba de la t 73Mtodo general 75Desviacin estndar de una diferencia o una suma 77Aplicacin de la t para comprobar hiptesis sobre dos grupos 80Qu sucede si ambas muestras no son del mismo tamao? 87Ejemplos estudiados 88

    Glucemia en hijos de padres diabticos 88Halotano o morfina en la operacin de corazn abierto 88

    La prueba de la t es un anlisis de la varianza 92Errores comunes de la aplicacin de la prueba de la t y cmo

    compensarlos 95Cmo utilizar las pruebas de la t para aislar las diferencias entre

    grupos en el anlisis de la varianza 98Prueba de la t de Bonferroni 98Ms sobre menstruacin y ejercicio 100Un mejor mtodo para realizar comparaciones mltiples:

    prueba de la t de Holm 101Prueba de Holm-Sidak 104

    Otros mtodos para realizar pruebas comparativas mltiples:prueba de Student-Newman-Keuls 106

    Ms an sobre menstruacin y ejercicio 107Prueba de Tukey 110

    Qu mtodo comparativo mltiple se debe utilizar? 111Comparaciones mltiples contra un solo testigo 112

    Prueba de la t de Bonferroni 112

    viii CONTENIDO

  • Prueba de la t de Holm 113Prueba de Dunnett 113

    Significado de P 117Pensamiento estadstico o real (clnico) 119Por qu P 0.05? 121

    Problemas 123

    5. Cmo analizar razones y proporciones 126De regreso a Marte 127Clculo de las proporciones a partir de las muestras 132Pruebas de hiptesis para proporciones 137

    Correccin de Yates de continuidad 139Mortalidad por anestesia en la operacin de corazn abierto

    con halotano o morfina 140Prevencin de la trombosis en individuos sometidos

    a hemodilisis 142Otro mtodo para comprobar los datos nominales:

    anlisis de las tablas de contingencia 145Estadstica de la prueba de la ji cuadrada 148

    Aplicaciones de la ji cuadrada en experimentos con ms de dos tratamientos o resultados 152

    Subdivisin de las tablas de contingencia 155Prueba exacta de Fisher 158Medidas de relacin entre dos variables nominales 163

    Estudios prospectivos y riesgo relativo 164Estudios de casos y testigos, y cociente de posibilidades 166Tabaquismo pasivo y cncer de mama 168

    Problemas 170

    6. Qu representa en realidad no significativo? 179Un diurtico efectivo 180Dos tipos de errores 185Qu determina la potencia de una prueba? 186

    Dimensin del error de tipo I 187Dimensin del efecto teraputico 193Variabilidad de la poblacin 195Las muestras ms grandes significan pruebas ms potentes 197Qu es lo que determina la potencia? Resumen 201Otro vistazo al halotano y la morfina para la operacin

    de corazn abierto 203Potencia y tamao de la muestra para el anlisis de la varianza 204

    Potencia, menstruacin y ejercicio 206

    CONTENIDO ix

  • Potencia y tamao de la muestra para comparar dos proporciones 208

    Mortalidad por anestesia en la operacin de corazn abierto 210

    Tamao de la muestra para comparar dos proporciones 211Potencia y tamao de la muestra para el riesgo relativo y

    el cociente de posibilidades 211Potencia y tamao de la muestra para las tablas de

    contingencia 212Mdicos, sudacin y potencia 213

    Problemas prcticos al utilizar la potencia 214Qu hace la diferencia? 215Problemas 218

    7. Intervalos de confianza 219Magnitud del efecto teraputico calculado como la diferencia

    de dos medias 220El diurtico efectivo 223

    Ms experimentos 224Qu significa confianza? 227Los intervalos de confianza se pueden utilizar para comprobar

    hiptesis 229Intervalo de confianza para la media de poblacin 231Tamao del efecto teraputico calculado como la diferencia

    de dos ndices o proporciones 233Diferencia de la mortalidad por la anestesia utilizada

    en la operacin de corazn abierto 234Diferencia de la trombosis con cido acetilsaliclico

    en los individuos sometidos a hemodilisis 235Qu tan negativo es un estudio clnico negativo? 236Metaanlisis 236

    Intervalo de confianza para ndices y proporciones 240Calidad de la evidencia utilizada como base para

    las acciones destinadas a mejorar la prescripcin de antibiticos en los hospitales 241

    Intervalos exactos de confianza para ndices y proporciones 242Intervalos de confianza para riesgo relativo y cociente

    de posibilidades 245Diferencia de la trombosis con cido acetilsaliclico

    en individuos sometidos a hemodilisis 246Tabaquismo pasivo y cncer de mama 247

    Intervalo de confianza para la poblacin completa 247Problemas 251

    x CONTENIDO

  • 8. Cmo comprobar tendencias 253Ms sobre los marcianos 254

    Parmetros de la poblacin 257Cmo calcular la tendencia a partir de una muestra 259

    La mejor lnea recta a travs de los datos 259Variabilidad respecto de la lnea de regresin 267Errores estndar de los coeficientes de regresin 268Qu tan convincente es la tendencia? 272Intervalo de confianza para la lnea de medias 274Intervalo de confianza para una observacin 275

    Cmo comparar dos lneas de regresin 278Prueba global de coincidencia de dos lneas de regresin 280Relacin entre debilidad y desgaste muscular en la artritis

    reumatoide 281Correlacin y coeficientes de correlacin 285

    Coeficiente de correlacin de producto-momento de Pearson 287Relacin entre regresin y correlacin 290Cmo comprobar hiptesis sobre coeficientes de correlacin 292Alcance y selectividad de las revistas 293

    Coeficiente de correlacin por rangos de Spearman 296Uso variable de pruebas de laboratorio entre los internos:

    relacin con la calidad de la atencin 300Potencia y tamao de la muestra en la regresin y correlacin 302Comparacin de dos medidas diferentes de la misma cosa:

    mtodo de Bland-Altman 305Evaluacin de la insuficiencia mitral por medio de

    ecocardiografa 306Resumen 310Problemas 310

    9. Experimentos con individuos sometidos a varios tratamientos 321Experimentos con individuos observados antes y despus

    de un tratamiento nico: prueba emparejada de la t 322Tabaquismo y funcin plaquetaria 325

    Otro enfoque del anlisis de la varianza 330Una nueva notacin 331Explicacin de la variabilidad de las observaciones 339

    Experimentos con individuos observados despus de varios tratamientos: anlisis de la varianza con medidas repetidas 342

    Antiasmticos y endotoxinas 348Cmo aislar las diferencias en los anlisis de la varianza

    con medidas repetidas 352Potencia en el anlisis de la varianza con medidas repetidas 353

    CONTENIDO xi

  • Experimentos con medicin de los resultados en una escala nominal: prueba de McNemar 354

    Expresin del antgeno p7 en el cncer mamario 354Problemas 357

    10. Alternativas para el anlisis de la varianza y la prueba de la tbasadas en rangos 363Cmo elegir entre los mtodos paramtrico y no paramtrico 364Dos muestras distintas: la prueba de la suma de los rangos

    de Mann-Whitney 367Tcnica de Leboyer para la atencin del parto 374

    Cada individuo se observa antes y despus de un tratamiento:prueba de Wilcoxon para muestras emparejadas 378

    Tabaquismo y funcin plaquetaria 385Experimentos con tres o ms grupos de individuos distintos:

    estadstica de Kruskal-Wallis 386Exposicin prenatal a la marihuana y conducta infantil 389Comparaciones mltiples no paramtricas 390Ms sobre la marihuana 392

    Experimentos en los que cada sujeto recibe varios tratamientos:prueba de Friedman 395

    Antiasmticos y endotoxinas 399Comparaciones mltiples despus de la prueba de Friedman 401Efecto del tabaquismo secundario sobre la angina de pecho 401

    Resumen 405Problemas 406

    11. Cmo analizar los datos de supervivencia 413Exclusiones en Plutn 414Clculo de la curva de supervivencia 417

    Mediana de supervivencia 423Errores estndar y lmites de confianza para la curva de

    supervivencia 424Comparacin de dos curvas de supervivencia 427

    Trasplante de mdula sea como tratamiento de la leucemia en el adulto 429

    Correccin de Yates para la prueba del orden logartmico 436Prueba de Gehan 437Potencia y tamao de la muestra 438Resumen 440Problemas 440

    xii CONTENIDO

  • 12. Qu muestran los datos en realidad? 444Cundo utilizar cada prueba 445Distribucin aleatoria y seleccin de testigos 447

    Ligadura de la arteria mamaria interna como tratamiento de la angina de pecho 448

    Derivacin portocaval como tratamiento de la cirrosis heptica 449Es tica la distribucin aleatoria de las personas? 452Siempre es necesario realizar un estudio clnico comparativo

    con distribucin aleatoria? 454La distribucin aleatoria asegura la obtencin de conclusiones

    correctas? 455Problemas con la poblacin 460Cmo mejorar las cosas 462

    Apndice A Modelos para los clculos 466Apndice B Tablas de potencia 472Apndice C Respuestas a los ejercicios 481

    ndice 497

    CONTENIDO xiii

  • Cuadro 3-1 Valores crticos de F correspondientes a p < 0.05 y p < 0.01 52

    Cuadro 4-1 Valores crticos de t (dos colas) 90Cuadro 4-3 Valores crticos de q 108Cuadro 4-4 Valores crticos de q 114Cuadro 5-7 Valores crticos para la distribucin de 2 156Cuadro 6-2 Valores crticos de t (una cola) 190Cuadro 8-6 Valores crticos para el coeficiente de correlacin por

    rangos de Spearman 298Cuadro 10-3 Valores crticos (dos colas) de la suma de rangos de T

    de Mann-Whitney 371Cuadro 10-7 Valores crticos (dos colas) de la W de Wilcoxon 383

    Cuadro 10-10 Valores crticos de Q para las pruebas no paramtricas de comparaciones mltiples 393

    Cuadro 10-11 Valores crticos de Q para la prueba no paramtrica de comparaciones mltiples con un grupo testigo 394

    Cuadro 10-14 Valores crticos de la r2 de Friedman 399

    xv

    Cuadros sobre pruebas de significacin

  • Siempre me he considerado un poco subversivo y creador de problemas, de ma-nera que preparo con cierta humildad la sexta edicin de este libro, 24 aos des-pus de que apareciera la primera. Entonces, como ahora, la perspectiva del li-bro era inusitada: muchos artculos de las publicaciones mdicas contenanerrores evitables. En aquel tiempo, a la casa editorial McGraw-Hill le preocupa-ba que este enfoque de confrontacin pudiera alejar a los lectores y perjudicarlas ventas. Tambin les inquietaba que la organizacin del libro no fuera la tra-dicional.

    El tiempo ha demostrado que la comunidad biomdica estaba preparada pa-ra este enfoque y el libro ha sido un gran xito. Con el tiempo se han agregadoms temas, como la potencia y el tamao de la muestra, adems de pginas so-bre las tcnicas de comparaciones mltiples, riesgo relativo, cociente de posibi-lidades y anlisis de supervivencia. En lugar de aadir ms pruebas estadsticasa esta edicin, he extendido la descripcin de los asuntos cualitativos en el em-pleo de la estadstica, por ejemplo lo que es una muestra aleatoria, por qu esimportante, las diferencias entre los estudios experimentales y la observacin,los sesgos y la forma de evitarlos. Asimismo, rescrib el captulo sobre potenciacon la intencin de convertir este tema intimidante en algo intuitivo. Adems,esta edicin ha actualizado los ejemplos y problemas para incluir material mscontemporneo. De igual modo, muchos de los ejemplos originales de la prime-ra edicin se han conservado; han funcionado a lo largo del tiempo y no ganara-mos nada slo por cambiar las cosas.

    xvii

    Prefacio

  • Con mucho, el principal cambio de esta sexta edicin es el nuevo diseo delas ilustraciones. Yo deseaba usar el color desde el principio, puesto que ste fa-cilita la comunicacin de ciertas ideas intuitivas importantes sobre las poblacio-nes, las muestras, la distribucin aleatoria y la distribucin de muestras, queconstituyen la base de la bioestadsitica aplicada. La adicin de color no es sloun asunto de esttica; mejora en grado considerable la presentacin de las ideasdel libro.

    Esta obra naci en 1973, cuando me encontraba en el posdoctorado. Mu-chos amigos y colaboradores acudan a m en busca de consejo y explicacionessobre bioestadstica. Como la mayora saba menos de estadstica que yo, intentaprender lo esencial para ayudarles. De esta manera, la necesidad de crear expli-caciones rpidas e intuitivas, pero al mismo tiempo correctas, sobre las diversaspruebas y procedimientos evolucion poco a poco hasta plasmarse en una confe-rencia de dos horas de duracin con diapositivas (a color) sobre los errores esta-dsticos ms frecuentes en la bibliografa biomdica y la manera de atenuarlos.En vista del xito que tuvo esta conferencia, varias personas me sugirieron escri-bir un libro de introduccin a la bioestadstica, que se concret en la primeraedicin de Bioestadstica en 1981.

    En consecuencia, este libro est dirigido al lector individual trtese de unestudiante, becario de investigacin, profesor o mdico y al estudiante queacude a una conferencia formal.

    Esta obra se puede utilizar como libro de texto en varios niveles. Ha sido elmanual obligatorio para la seccin de bioestadstica del curso de epidemiologa ybioestadstica que llevan los estudiantes de medicina y el material de los primerosocho captulos puede estudiarse en ocho conferencias de una hora. Tambin se hausado para conferencias sobre bioestadstica de menor duracin (primeros trescaptulos) que reciben nuestros estudiantes de odontologa. Asimismo, nos haservido en un curso de cuatro unidades en el que se estudia el libro completo.Este curso conjunta cuatro horas de lectura y una sesin de una hora dedicada aresolver problemas. Est dirigido a una gran variedad de estudiantes, desde uni-versitarios hasta estudiantes de maestras y doctorados, as como algunos miem-bros del cuerpo docente.

    Puesto que este libro incluye el material tcnico que se lleva en cualquiercurso de introduccin a la estadstica, es adecuado como libro de texto primarioo como suplemento en el curso universitario general de introduccin a la esta-dstica (que es en esencia el nivel que se ensea en las escuelas de medicina), enespecial cuando el maestro intenta buscar la manera de darle importancia a la es-tadstica para los estudiantes que se gradan en el rea de ciencias.

    Este manual difiere de otros textos sobre introduccin a la bioestadstica devarias maneras y tales diferencias son las que explican su gran aceptacin.

    En primer lugar, se basa en la premisa de que gran parte del material publi-cado en la bibliografa biomdica emplea mtodos de estadstica dudosos, demanera que el lector acepta en realidad informacin incorrecta. La mayor parte

    xviii PREFACIO

  • de los errores (cuando menos en relacin con la estadstica) se debe al uso equ-voco de la prueba de la t, tal vez a causa de que las personas que realizaron lainvestigacin no conocan nada ms. Por lo general, la prueba de la t es la pri-mera tcnica que se describe en un libro de estadstica que tiene como resultadoun valor de P demasiado elevado. El anlisis de la varianza, cuando se describe,se deja para el final del libro, de tal forma que el lector lo ignora o lee rpida-mente al final del curso. Dado que existen tantas publicaciones que deben quizestudiarse por medio del anlisis de la varianza, y en virtud de que este anlisises en verdad el paradigma de las pruebas estadsticas paramtricas, yo lo descri-bo en primer lugar y luego me refiero a la prueba de la t como un caso especial.

    En segundo lugar, de acuerdo con los problemas que veo en las revistasmdicas, incluyo una descripcin de las pruebas comparativas mltiples.

    En tercer lugar, el libro se ha organizado en torno de la comprobacin dehiptesis y clculo de la dimensin de los efectos teraputicos, al contrario de laorganizacin ms tradicional (y lgica desde el punto de vista de la teora de la es-tadstica), es decir, la que se ajusta a la secuencia: clculo de una muestra, dosmuestras y k-muestras e hiptesis. Considero que mi mtodo afronta directa-mente los tipos de problemas que encontramos ms a menudo al leer o realizaruna investigacin biomdica.

    Los ejemplos se basan en buena media en estudios interesantes de la biblio-grafa y son razonablemente verdaderos en cuanto a los datos originales. Sinembargo, me tom la libertad de recrear los datos brutos para simplificar losproblemas estadsticos (p. ej., igual el tamao de las muestras) de manera quepudiera enfocarme en las ideas intuitivas ms importantes detrs de los procedi-mientos estadsticos en lugar de complicarme con el lgebra y la aritmtica.Cuando el texto slo describe el caso de muestras del mismo tamao, en unapndice aparecen las frmulas para los casos en que las muestras son distintas.

    Vale la pena mencionar ciertas cuestiones que no he aadido. Algunas per-sonas me sugirieron agregar una descripcin explcita del clculo de probabili-dad y los valores esperados, en lugar de la descripcin implcita que existe en ellibro original. Otros me sugirieron distinguir con mayor precisin entre P y .(Deliberadamente ocult esta distincin.) Tambin estuve tentado a utilizar laplataforma que este libro ha creado dentro de la comunidad de la investigacinpara popularizar los mtodos estadsticos con mltiples variables sobre todola regresin mltiple dentro de la comunidad biomdica. Estos mtodos sehan aplicado en extenso con buenos resultados en las ciencias sociales y los en-cuentro muy tiles en mi trabajo sobre la funcin cardaca y el control del taba-quismo. No obstante, decid no hacerlo puesto que se habra modificado de for-ma sensible el alcance y el tono del libro, que son clave para su xito.*

    PREFACIO xix

    *Sin embargo, estas sugerencias dieron lugar a un libro nuevo sobre regresin mlti-ple y anlisis de la varianza, escrito con el mismo enfoque de Bioestadstica. Se trata delPrimer of applied regression and analysis of variance (2a. ed.), S.A. Glantz y B.K. Slin-ker, Nueva York: McGraw-Hill, 2001.

  • Al igual que en cualquier libro, debo agradecer a muchas personas. JulienHoffman me imparti el primer curso realmente claro y prctico sobre bioesta-dstica y l me mantuvo un paso adelante de las personas que acudan a m parasolicitar ayuda. Su inters persistente y sus descripciones de los temas sobre es-tadstica me han ayudado tanto que incluso escrib este libro. Philip Wilkinson yMarion Nestle me han sugerido algunos de los mejores ejemplos incluidos en laedicin original, muchos de los cuales se conservan en sta. Adems, hicieronuna crtica muy til del manuscrito. Mary Giammona, Bryan Slinker, Jim Light-wood, Kristina Thayer, Joaquin Barnoya y Jennifer Ibrahim me asistieron en laformulacin de dos problemas. Virginia Ernster y Susan Sacks no slo me ofre-cieron sugerencias de gran utilidad, sino que tambin permitieron que sus 300estudiantes de primer y segundo ao de medicina leyeran el manuscrito de laprimera edicin para luego emplearlo como libro de texto obligatorio.

    Desde la primera edicin de este libro en 1981, han cambiado muchas co-sas. Cada vez se advierte ms la necesidad de utilizar mtodos estadsticos apro-piados en la investigacin biomdica, ms en todo caso que en 1981. Si bien elproblema persiste, en varias revistas se reconocen los problemas originados porla ignorancia de los cientficos en relacin con la estadstica e incluso contienenconsideraciones explcitas de bioestadstica en el proceso de revisin de los ma-nuscritos. En realidad, en un ejemplo tpico del sujeto que consigue quedarse alfrente porque se queja de manera ms enrgica, tuve el honor de ser editor aso-ciado del Journal of the American College of Cardiology durante 10 aos (1991-2001) y mi responsabilidad principal era buscar problemas estadsticos en losmanuscritos susceptibles de ser aceptados antes de su publicacin. Cerca de lamitad de los artculos tena algn tipo de defecto (de gravedad variable), perolos detectamos antes de su publicacin.

    Por ltimo, quiero agradecer a los que han utilizado este libro, sean estu-diantes o maestros de bioestadstica, que se tomaron la molestia de escribirmepreguntas, comentarios y sugerencias para mejorarlo. He hecho todo lo posiblepor seguir su consejo en esta sexta edicin.

    Muchas de las ilustraciones de este libro proceden de mis diapositivas ori-ginales. En verdad, conforme se lea el libro, debe imaginarse como una muestrade diapositivas impresas. La mayora de las personas que acude a mi exposicinse marcha con un mayor potencial crtico en relacin con lo que leen en las pu-blicaciones biomdicas. Cuando se la ofrec a los candidatos a la especialidad dela University of California, en San Francisco, escuch que stos empezaron ahacer la vida difcil de los conferencistas que reconocan el uso incorrecto delerror estndar de la media como resumen estadstico y el abuso de las pruebasde la t. Este libro ha tenido un efecto similar en muchos otros. Nada me es tanhalagador o satisfactorio. Espero que este libro contribuya a aumentar el poten-cial crtico de las personas y a mejorar la calidad de la bibliografa biomdica y,al final, la atencin de los pacientes.

    Stanton A. Glantz

    xx PREFACIO

  • BioestadsticaS E X TA E D I C I N

  • Captulo 1

    Bioestadstica y prctica clnica

    En un mundo ideal, los editores de las revistas mdicas haran un trabajoexcelente y garantizaran la calidad y precisin de los mtodos estadsti-cos de los artculos publicados; los lectores, sin un inters particular enese aspecto de la investigacin, daran por sentado que la informacin escorrecta. Sin embargo, si la historia es una gua, ese ideal tal vez jamsse consiga. Mientras tanto, los consumidores de la bibliografa mdicaclnicos y enfermeras practicantes, investigadores biomdicos y plani-ficadores de salubridad deben ser capaces de valorar los mtodos es-tadsticos para calificar la fuerza de los argumentos en favor o en contrade la prueba o tratamiento especficos estudiados.

    Esta necesidad parece desanimar a las personas que no se dedican ala estadstica, pero no es as. Gran parte de los errores de las publicacionesbiomdicas son desaciertos bsicos de diseo, como la ausencia de unadistribucin aleatoria adecuada o de un grupo testigo, o bien el uso inco-rrecto de los mtodos estadsticos bsicos que se describen en este libro,en particular el de la prueba de la t para comparaciones mltiples.Adems, una vez que se conocen los conceptos y mtodos bsicos de laestadstica, productores y consumidores de la investigacin biomdica es-

    1

  • tn en la mejor posicin para comprender (y objetar) los diseos y mto-dos estadsticos utilizados en la mayor parte de los artculos de investi-gacin.

    MEDICINA CIENTFICA

    Hasta el segundo cuarto del siglo pasado, el tratamiento mdico tenamuy pocos efectos positivos sobre la recuperacin de los enfermos eincluso sobre la recuperacin misma. Tras el descubrimiento de losprocedimientos para invertir las deficiencias bioqumicas que causanalgunas afecciones y la elaboracin de los antibiticos fue posible unacuracin de las personas enfermas. Estos primeros xitos y el optimismoteraputico que suscitaron llevaron a los investigadores mdicos a la pro-duccin de sustancias ms potentes para tratar las cardiopatas, el cncer,los trastornos neurolgicos y otras anormalidades. Estos xitos dieronlugar a que la sociedad incrementara los recursos destinados a los servi-cios mdicos. En 2004 se gastaron en Estados Unidos 1.8 billones dedlares (ms de 14% del producto interno bruto) en servicios mdicos.Adems, la cantidad absoluta de dinero y la fraccin del producto inter-no bruto destinada al sector mdico han crecido con rapidez (fig. 1-1).En la actualidad, numerosos lderes gubernamentales y financieros ob-servan esta explosin continua con preocupacin. Baste decir que ahoradecenas de millones de estadounidenses ya no pueden pagar una aten-cin mdica y se han incorporado a los crecientes grupos de personasque carecen de seguro mdico; hay que agregar que la necesidad deretener (o desviar) los costos de la atencin mdica se ha convertido enun punto central de los conflictos laborales. Ms an, estos costos ame-nazan con debilitar los programas gubernamentales populares prolonga-dos, como Medicare, que financia la atencin mdica para los ancianos,y Medicaid, que subvenciona los servicios de salud para los pobres.

    Con anterioridad se dispona de recursos suficientes para permitir alos mdicos y a otros profesionales de salubridad realizar pruebas, pro-cedimientos y tratamientos casi sin limitaciones. Como resultado, buenaparte de lo que ahora se considera una prctica mdica propicia se de-sarroll sin pruebas slidas que demostraran en realidad su contribucinteraputica. Incluso para los tratamientos efectivos, la evaluacin sis-temtica de los pacientes sometidos a terapias tiles es muy deficiente.*

    2 CAPTULO 1

    *A.L. Cochrane. Effectiveness and Efficiency: Random Reflections on Health Ser-vices, Nuffield Provincial Hospitals Trust, London, 1972.

  • Adems de ser costosas, estas acciones exponen a las personas a frma-cos potentes, operaciones u otras intervenciones con efectos colateralespotencialmente peligrosos en los casos en los que el tratamiento no su-ministra ninguna mejora.

    Qu relacin tiene esto con la bioestadstica?Con el fin de reducir los costos y los tratamientos innecesarios, se

    ha establecido un consenso sustentado en la medicina basada en eviden-cias, en la cual las pruebas diagnsticas y acciones teraputicas se limi-tan a los mtodos cuya eficacia est demostrada. En la actualidad, unaextensa bibliografa demuestra que el uso eficaz de los medicamentos y

    BIOESTADSTICA Y PRCTICA CLNICA 3

    Figura 1-1. A, gasto anual total de los servicios mdicos en Estados Unidos en-tre 1960 y 2004. B, gasto por servicios mdicos como porcentaje del producto in-terno bruto. (Fuente: Statistical Abstract of the United States, 2003. WashingtonDC: U.S. Department of Commerce, p. 103.)

  • otros tipos de teraputicas mejoran el resultado del paciente y reducenlos costos. Adems de valorar si la accin tuvo en verdad algn efecto,ahora es esencial mensurar la dimensin de ese efecto. Como resultado,ha crecido el nmero de formularios y otras formas de comprobar quelos frmacos y otras acciones teraputicas se utilizan de acuerdo con laevidencia disponible de eficacia. Muchas veces estos ideales tienen elapoyo de un sistema de aprobacin previa y revisin clnica, al parecerpara mejorar la calidad de la atencin y reducir los costos. En la realidadno se consigue este ideal, pero este sistema se ha implantado de formadefinitiva. Aunque el sistema sanitario se reorganice en grado sustancial,por ejemplo al sustituir el modelo dominante de cuota por servicio porel sistema nico de pago o algn otro tipo de seguro mdico nacional,an subsisten las cuestiones fundamentales acerca de la eficacia clnicay la asignacin de los recursos.

    En esencia, estos problemas son cuestiones estadsticas. No es posi-ble concluir que cierto tratamiento ha sido benfico tan slo con base enla experiencia a la luz de ciertos factores como las variaciones biolgi-cas naturales entre los pacientes y el efecto placebo.* La bioestadsticaproporciona las herramientas para convertir la experiencia clnica y delaboratorio en aseveraciones cuantitativas sobre los efectos que tiene untratamiento o procedimiento sobre un grupo de pacientes y su magnitud.

    Adems de estudiar los procedimientos y las teraputicas, los inves-tigadores examinan la forma en que los mdicos, enfermeras y otros pro-fesionales realizan su trabajo. Por ejemplo, en un estudio se demostrque los individuos con pielonefritis sin complicaciones (una infeccin re-nal frecuente) que recibieron tratamiento con apego a los principios delPhysicians Desk Reference permanecieron hospitalizados un promediode dos das menos respecto de quienes no se sometieron a un tratamientoadecuado. El costo de la hospitalizacin es un elemento considerable delos gastos mdicos totales, de manera que conviene reducir la estanciahospitalaria siempre y cuando no perjudique la recuperacin del paciente.

    4 CAPTULO 1

    *El efecto placebo es una respuesta atribuible al tratamiento y no a las propiedadesespecficas de la teraputica. Por ejemplo, cerca de 33% de las personas que recibe algnplacebo en lugar de un analgsico experimenta alivio. Algunos ejemplos de placebos sonla inyeccin de solucin salina, una pldora de azcar y la incisin y el cierre quirrgicossin practicar ninguna operacin especfica.

    D. E. Knapp, D. A. Knapp, M. K. Speedie, D. M. Yaeger y C. L. Baker, Relationshipof Inappropriate Drug Prescribing to Increased Length of Hospital Stay, Am. J. Hosp.Pharm., 36:1334-1337, 1979. Este estudio se describe con detalle en los captulos 3 a 5.

  • Por lo tanto, la evidencia obtenida y analizada a partir de los mtodosbioestadsticos puede modificar no slo la manera de ejercer la profesinmdica, sino las opciones disponibles del clnico. Para participar de modointeligente en estas decisiones es necesario conocer los mtodos y mode-los bioestadsticos que permitan evaluar la calidad de la evidencia y elanlisis de la evidencia utilizada para apoyar un punto de vista u otro.

    En general, los mdicos no participan en los debates sobre estas cues-tiones cuantitativas, quiz porque los temas parecen demasiado tcnicos yen apariencia repercuten muy poco sobre sus actividades diarias. No obs-tante, el mdico debe ser capaz de realizar observaciones ms informadassobre las aserciones de eficacia mdica para que participe de mejor formaen el debate sobre la asignacin eficiente de los recursos mdicos. En granparte, esas opiniones se basan en el razonamiento estadstico.

    QU EXPRESAN LOS PROCEDIMIENTOSESTADSTICOS?

    Es posible, por ejemplo, que algunos investigadores presuman que la ad-ministracin de cierto medicamento incrementa la produccin de orinade manera directamente proporcional a la dosis; para confirmar estefenmeno administran distintas dosis del frmaco a cinco personas yanotan en una grfica la produccin de orina y la dosis del medica-mento. Los datos obtenidos, que se muestran en la figura 1-2A, revelanque existe una relacin estrecha entre la dosis del agente y la produccindiaria de orina en las cinco personas estudiadas. Es probable que este re-sultado lleve a los investigadores a redactar un informe en el que sosten-gan que el medicamento es un diurtico efectivo.

    Sin embargo, la nica aseveracin que puede emitirse con absolutacerteza es que al aumentar la dosis del medicamento tambin se incre-menta la produccin de orina en las cinco personas del estudio. Con todo,la verdadera interrogante es: cules son los efectos probables del frmacoen todas las personas que lo reciban? Para aceptar la aseveracin de queel frmaco es efectivo a partir de la experiencia tan limitada de la figura1-2A se necesita un verdadero acto de fe. Desde luego, es imposible saberde qu modo reaccionarn todas las personas al medicamento.

    Ahora bien, presupngase que s se conoce la manera en que res-ponderan todos los individuos que alguna vez recibieran el frmaco. Lafigura 1-2B muestra esta informacin. No existe una relacin sistem-tica entre la dosis del medicamento y la produccin de orina! El agenteno es un diurtico efectivo.

    BIOESTADSTICA Y PRCTICA CLNICA 5

  • Cmo es posible una equivocacin tal? Los puntos sombreados dela figura 1-2B representan a las personas estudiadas para obtener los re-sultados que se muestran en la figura 1-2A. Si bien todos son miembrosde la poblacin de inters, los cinco sujetos estudiados consideradoscomo grupo, no son en realidad una muestra representativa de la formaen que el conjunto entero de personas responde al frmaco.

    Si se observa la figura 1-2B, no quedarn dudas de que no es muyprobable obtener esta muestra poco representativa de personas, si bienes posible. Existe un conjunto de procedimientos estadsticos, llamadoscomprobacin de la hiptesis, que permite calcular la probabilidad deconcluir que dos cosas estn relacionadas, como sugiere la figura 1-2A,cuando en realidad la relacin se debe a la mala suerte durante la selec-cin de los sujetos para el estudio y no a un efecto verdadero del fr-maco investigado. En este ejemplo es posible calcular que dicha muestra

    6 CAPTULO 1

    Figura 1-2. A, resultados de un experimento en el que los investigadores ad-ministraron cinco dosis distintas de un frmaco a cinco personas y midieron suproduccin diaria de orina. El gasto urinario aument conforme se increment ladosis del medicamento en las cinco personas, lo que indica que el agente es undiurtico efectivo en los individuos similares a los sujetos estudiados. B, si los in-vestigadores administraran el frmaco a todas las personas y cuantificaran elgasto urinario diario, observaran que no existe relacin alguna entre la dosis delmedicamento y el gasto urinario. Los cinco individuos seleccionados para el estu-dio se muestran en A como puntos sombreados. Es posible, aunque no probable,obtener una muestra tan poco representativa como la anterior que lleva a suponerque existe una relacin entre ambas variables cuando en realidad no la hay. Sinembargo, existen mtodos estadsticos denominados pruebas de hiptesis quepermiten calcular las posibilidades de obtener este tipo de muestra.

  • de individuos surgir de la poblacin en un estudio del frmaco slocinco veces en 1 000, cuando el agente en verdad carece de efectos.

    Desde luego, es importante reconocer que aunque la bioestadsticaes una rama de las matemticas, puede haber diferencias de opinin encuanto a la mejor forma de analizar un problema. Esto es as porque losmtodos estadsticos se basan en modelos matemticos de realidad relati-vamente sencillos, de manera que la precisin de los resultados de laspruebas estadsticas es directamente proporcional al grado de concordan-cia entre la realidad y el modelo matemtico en el que se basa la prueba.

    POR QU NO CONFIAR EN LAS REVISTAS?

    Adems de la experiencia personal, la mayora de los profesionales de lasalud confa en que las revistas mdicas suministren la informacin so-bre los conceptos actuales del diagnstico y el tratamiento. Muy pocosmiembros de la comunidad investigadora clnica o biomdica son versa-dos en la aplicacin e interpretacin de mtodos bioestadsticos, demanera que la mayora de los lectores supone que si un artculo apareceen una revista, los revisores y editores han examinado cada particulari-dad del manuscrito, incluida la aplicacin de la estadstica. Desafortu-nadamente, esto no sucede siempre.

    A principios del decenio de 1950, en varias revisiones crticas* so-bre el empleo de la estadstica en la bibliografa mdica general se en-contr que en casi 50% de los artculos se utilizaban mtodos estadsti-cos incorrectos. Esta situacin dio lugar a que las publicaciones msimportantes incorporaran escrutinios estadsticos formales (a travs de unestadstico) durante el proceso de revisin. Los estudios ms recientessobre el empleo de los mtodos estadsticos en las publicaciones mdicasse han concentrado en la realizacin eficaz de estas revisiones secun-darias de los artculos de inminente aparicin. Tales publicaciones hanrevelado que cerca de la mitad (o ms) de los artculos preliminaresacusa problemas estadsticos. La mayor parte de estos errores se re-

    BIOESTADSTICA Y PRCTICA CLNICA 7

    *O. B. Ross, Jr., Use of Controls in Medical Research. JAMA, 145:7275, 1951; R.F. Badgley, An Assessment of Research Methods Reported in 103 Scientific Articles fromTwo Canadian Medical Journals, Can M.A.J., 85:256260, 1961; S. Schor e I. Karten,Statistical Evaluation of Medical Journal Manuscripts, JAMA, 195:11231128, 1966; S.Gore, I. G. Jones, y E. C. Rytter, Misuses of Statistical Methods: Critical Assessment of Ar-ticles in B.M.J., enero-marzo, 1976, Br. Med. J. 1(6053):8587, 1977.

    Para mayores detalles sobre la experiencia de dos revistas, vase M. J. Gardner y J.Bond, An Exploratory Study of Statistical Assessment of Papers Published in the BritishMedical Journal, JAMA 263:13551357, 1990 y S. A. Glantz, It Is All in the Numbers,J. Am. Coll. Cardiol. 21:835837, 1993.

  • suelve antes de la edicin, al mismo tiempo que otras cuestiones identi-ficadas por los dems revisores (contenido), de manera que el ndice deproblemas estadsticos en la publicacin final es mucho menor.

    Hacia 1995, la mayor parte (82%) de las principales revistas de me-dicina general haba incorporado una revisin estadstica formal de susartculos. La probabilidad de que un artculo editado en algunas de esaspublicaciones se sometiera a una revisin estadstica antes de su aparicinera de 52%.* No obstante, entre las pequeas revistas de especialidad ysubespecialidad no suceda lo mismo. Slo 31% de estas publicacionespasaba primero por una revisin estadstica y 27% de los artculos edi-tados se someta a la revisin de un estadstico. En realidad, la revisinde las publicaciones de especialidad todava revela una gran frecuencia deproblemas estadsticos en sus artculos.

    Cuando una persona se enfrenta a esta observacin (o a la confusinque surge cuando dos artculos en apariencia similares llegan a conclu-siones distintas) concluye a menudo que el anlisis estadstico puede

    8 CAPTULO 1

    *S. N. Goodman, D. G. Altman, S. L. George, Statistical Reviewing Policies ofMedical Journals: Caveat Lector? J. Gen. Intern. Med. 13:753756, 1998.

    Las revisiones ms recientes, si bien incluyen una seleccin ms limitada de revis-tas, han demostrado que este problema persiste. Vase S. J. White, Statistical Errors in Pa-pers in the British Journal of Psychiatry, Br. J. Psychiatry, 135:336342, 1979; M. J.Avram, C. A. Shanks, M. H. M. Dykes, A. K. Ronai, W. M. Stiers, Statistical Methods inAnesthesia Articles: An Evaluation of Two American Journals during Two Six-MonthPeriods, Anesth. Analg. 64:607611, 1985; J. Davies, A Critical Survey of ScientificMethods in Two Psychiatry Journals, Aust. N.Z. J. Psych., 21:367373, 1987; D. F.Cruess, Review of the Use of Statistics in The American Journal of Tropical Medicine andHygiene for JanuaryDecember 1988, Am. J. Trop. Med. Hyg., 41:619626, 1990; C. A.Silagy, D. Jewell, D. Mant, An Analysis of Randomized Controlled Trials Published in theUS Family Medicine Literature, 19871991, J. Fam. Pract. 39:236242, 1994; M. H.Kanter y J. R. Taylor, Accuracy of Statistical Methods in Transfusion: A Review of Arti-cles from July/August 1992 through June 1993, Transfusion 34:697701, 1994; N. R.Powe, J. M. Tielsch, O. D. Schein, R. Luthra, E. P. Steinberg, Rigor of Research Methodsin Studies of the Effectiveness and Safety of Cataract Extraction with Intraocular Lens Im-plantation, Arch. Ophthalmol. 112:228238, 1994; A. M. W. Porter, Misuse of Correla-tion and Regression in Three Medical Journals, J. R. Soc. Med. 92:123128, 1999; L.Rushton, Reporting of Occupational and Environmental Research: Use and Misuse of Sta-tistical and Epidemiological Methods, Occup. Environ. Med. 57:19, 2000; J. B. Dimick,M. Diener-West, P. A. Lipsett, Negative Results of Randomized Clinical Trials Publishedin the Surgical Literature, Arch. Surg. 136:796800, 2001; M. Dijkers, G. C. Kropp, R. M.Esper, G. Yavuzer, N. Cullen, Y. Bakdalieh, Quality of Intervention Research Reporting inMedical Rehabilitation Journals, Am. J. Physical Med. & Rehab. 81:2133, 2002; G. E.Welch II, S.G. Gabbe, Statistics Usage in the American Journal of Obstetrics and Gyne-cology: Has Anything Changed? 186:584586, 2002; M. A. Maggard, J. B. OConnell, J.H. Liu, D. A. Etzioni, C. Y. Ko, Sample Size Calculations in Surgery: Are They Done Cor-rectly Surgery. 134:275279, 2003.

  • emplearse segn sean las necesidades individuales, que carece de impor-tancia o que es demasiado difcil de comprender.

    Por desgracia, con excepcin de los casos en que un procedimientoestadstico confirma de forma exclusiva un efecto evidente (o el artculoincluye slo los datos generales), el lector no puede saber si la informa-cin apoya en verdad las conclusiones del autor. Resulta irnico que loserrores rara vez comprenden cuestiones complejas que provoquen con-troversia entre los estadsticos profesionales, sino que se trata casi siem-pre de faltas simples, como la omisin de un grupo testigo, la asignacinno aleatoria de tratamientos a los sujetos o el uso incorrecto de ciertaspruebas elementales para las hiptesis. Estos errores sesgan al estudioen favor de los tratamientos.

    En los estudios clnicos son en particular importantes los errores deldiseo experimental y el uso equvoco de las tcnicas elementales de es-tadstica en una proporcin considerable de los artculos publicados. Es-tos errores pueden llevar a que los investigadores sostengan que untratamiento o estudio diagnstico tienen relevancia estadstica cuando,en realidad, los datos disponibles no sustentan esa conclusin. Si unmdico presupone que se ha comprobado la eficacia de una teraputicacon base en la publicacin de una revista acreditada, quiz lo utilice en-tre sus pacientes. Todo procedimiento mdico implica cierto riesgo, mo-lestia o costo, de manera que las personas que reciben un tratamientobasado en la publicacin de una investigacin errnea no mejoran, e in-cluso pueden empeorar. Por otro lado, los errores tambin pueden re-trasar en forma innecesaria el uso de un tratamiento til. Los estudioscientficos que demuestran la eficacia de las tcnicas mdicas cobranmayor importancia conforme aumentan los esfuerzos por reducir loscostos de la medicina sin sacrificar la calidad. Estos estudios se debendisear e interpretar de manera correcta.

    Estos errores, adems de sus costos indirectos, tienen costos directosde importancia: si los resultados no se interpretan de modo apropiado, segasta dinero, se sacrifican animales y se pone en peligro al paciente.

    POR QU HA PERSISTIDO EL PROBLEMA?

    La cantidad de individuos que comete estos errores es enorme, lo cualexplica que la presin sobre los investigadores acadmicos para queapliquen una tcnica estadstica cuidadosa sea mnima. Ms an, raravez se escucha alguna crtica. Por el contrario, algunos investigadores

    BIOESTADSTICA Y PRCTICA CLNICA 9

  • temen que sus colaboradores, sobre todo los revisores, consideren el an-lisis correcto una medida innecesariamente terica y complicada.

    Casi todos los editores asumen que los revisores examinan el m-todo estadstico del artculo con la misma atencin que conceden al proto-colo clnico o a la preparacin experimental. Si esta suposicin fueracorrecta, sera esperable que todos los artculos describieran con tododetalle, como puede verse en la relacin o preparacin de un protocolo,la manera como los autores han analizado sus datos. Pese a ello, en lasrevistas mdicas no es posible muchas veces ni siquiera identificar losmtodos estadsticos empleados para comprobar las hiptesis. Es difcilcreer que los revisores examinaran los mtodos para analizar los datoscon la misma diligencia puesta en la evaluacin del experimento apli-cado para recoger los datos.

    En suma, para leer la bibliografa mdica de manera inteligente, esnecesario comprender y evaluar la aplicacin de los mtodos estadsti-cos para analizar los resultados experimentales tan bien como los mto-dos de laboratorio usados para recoger los datos. Por fortuna, las ideasbsicas para ser un lector inteligente (y, en realidad, para ser un investi-gador inteligente) son bastante sencillas. En el siguiente captulo se des-criben estas ideas y mtodos.

    10 CAPTULO 1

  • Captulo 2

    Cmo resumir los datos

    El investigador que recoge datos tiene casi siempre dos objetivos: obte-ner informacin descriptiva sobre la poblacin a partir de la cual se ex-trajo la muestra y comprobar ciertas hiptesis sobre esa poblacin. Enesta seccin se discute el primer objetivo: resumir los datos recogidossobre una sola variable de tal manera que describa mejor a la poblacinms grande y no observada.

    Cuando el valor de la variable propia de cierto individuo tiene msprobabilidades de caer ms cerca de la media (promedio) respecto de to-dos los sujetos de la poblacin que se estudia, y es probable tambin quese encuentre por arriba y debajo de la media, la media y la desviacinestndar para las observaciones de la muestra describen la ubicacin yla dimensin de la variabilidad entre los miembros de la poblacin.Cuando es ms probable que el valor de la variable no caiga por debajo(o arriba) de la media, se deben presentar la mediana y los valores decuando menos otros dos percentiles.

    Para comprender estas reglas, supngase que se observa a todos losmiembros de la poblacin, no slo a una muestra limitada (representati-va en condiciones ideales) como sucede en un experimento.

    11

  • Por ejemplo, si se desea estudiar la talla de los marcianos sin adivi-nar, se visita Marte y se mide a la poblacin completa (a todos los 200).En la figura 2-1 se muestran los resultados; se redondea la talla de cadamarciano hasta el siguiente centmetro y se la representa con un crculo.Existe as una distribucin de tallas de la poblacin de marcianos. Lamayor parte de ellos mide 35 a 45 cm de altura y muy pocos (10 de cada200) 30 cm o menos, o 50 cm o ms.

    Una vez que se concluye este proyecto y se demuestra la metodolo-ga, se somete una propuesta para medir la talla de los venusinos. El an-tecedente del trabajo productivo asegura un patrocinio y entonces se ob-tienen las medidas. Con el mismo mtodo conservador se mide la tallade todos los 150 venusinos. En la figura 2-2 se muestran las tallas de lapoblacin completa de Venus y se utiliza la misma presentacin que enla figura 2-1. Al igual que en los marcianos, existe una distribucin detallas entre los miembros de la poblacin y los venusinos miden alrededorde 15 cm; casi todos tienen ms de 10 cm y menos de 20 cm.

    Al comparar las figuras 2-1 y 2-2 se observa que los venusinos sonms bajos que los marcianos y que la variabilidad de talla dentro de lapoblacin de los venusinos es menor. Mientras que casi todas las tallasde los marcianos (194 de 200) cayeron dentro de un lmite de 20 cm(entre 30 y 50 cm), el lmite de los venusinos (144 de 150) es de slo

    12 CAPTULO 2

    Figura 2-1 Distribucin de las tallas de 200 marcianos en la que la talla de cadamarciano est representada por un solo punto. Ntese que cualquier marcianoposee ms probabilidades de tener una talla cercana a la media de la poblacin(40 cm) y las mismas probabilidades de ser ms bajo o ms alto que el promedio.

  • 10 cm (10 a 20 cm). Pese a estas diferencias, las dos poblaciones poseensimilitudes notorias. En ambas, cualquier miembro tiene ms probabili-dades de encontrarse ms lejos que cerca de la media de la poblacin ytambin es probable que sean ms bajos o altos que el promedio. De he-cho, no obstante las diferencias del volumen de la poblacin, la tallapromedio y la variabilidad, las morfologas de las distribuciones de lasalturas de los habitantes de ambos planetas son casi idnticas. ste esun resultado sorprendente!

    Ahora es posible reducir esta informacin a unos cuantos nmeros,llamados parmetros de la distribucin. Puesto que las morfologas deambas distribuciones son similares, slo es necesario describir la mane-ra en que difieren; para ello se anotan la media de la talla y la variabili-dad de las tallas alrededor de la media.

    LA MEDIA

    Para indicar la ubicacin a lo largo de la escala de tallas, la media de po-blacin se define como la talla promedio de todos los miembros de la

    CMO RESUMIR LOS DATOS 13

    Figura 2-2 Distribucin de las tallas de 150 venusinos. Obsrvese que aunquela talla promedio y la dispersin de las tallas alrededor de la media difieren de lasde los marcianos (fig. 2-1), ambas tienen un aspecto semejante con forma decampana.

  • poblacin. Muchas veces las medias de poblacin se expresan con una, que es la letra griega mu. Cuando la poblacin est formada pormiembros definidos:

    La formulacin matemtica equivalente es:

    donde , la letra griega sigma mayscula, indica la suma del valor de lavariable X para todos los miembros N de la poblacin. Si se aplica estadefinicin a los datos de las figuras 2-1 y 2-2 se obtiene que la talla pro-medio de los marcianos es de 40 cm y la de los venusinos de 15 cm. Estascifras resumen la conclusin cualitativa de que la distribucin de talla delos marcianos es mayor que la de los venusinos.

    MEDIDAS DE VARIABILIDAD

    A continuacin se requiere una medida de dispersin de la media. Un va-lor que se encuentra a una distancia igual, por arriba o debajo de la me-dia, debe contribuir en la misma medida al ndice de variabilidad, aunqueen un caso la desviacin de la media sea positiva y en el otro negativa.Elevar un nmero al cuadrado lo hace positivo, de manera que para des-cribir la variabilidad de una poblacin en la media se anota la desviacinpromedio al cuadrado de la media. Esta desviacin promedio al cuadra-do de la media es ms grande cuanto mayor es la variabilidad entre losmiembros de la poblacin (comprese a los marcianos y venusinos). Seconoce como varianza de poblacin y se expresa con el signo 2, que esla letra sigma minscula al cuadrado. La definicin precisa de las pobla-ciones formadas por individuos definidos se expresa como sigue:

    suma de (valor propio de un miembrode la poblacin media de poblacin)2

    Varianza de poblacin nmero de miembros de la poblacin

    XN

    suma de valores (p. ej., tallas)para cada miembro de la poblacin

    Media de la poblacin nmero de miembros de la poblacin

    14 CAPTULO 2

  • La frmula matemtica equivalente es:

    2

    Ntese que las unidades de la varianza corresponden al cuadrado de lasunidades de la variable estudiada. De manera especfica, la varianza de latalla de los marcianos es de 25 cm2 y la de los venusinos de 6.3 cm2. Estascifras resumen la conclusin cualitativa de que existe una mayor variabili-dad en las tallas de los marcianos en comparacin con los venusinos.

    Puesto que suele ser difcil visualizar las varianzas, es ms frecuen-te presentar la raz cuadrada de la varianza, que puede llamarse raz cua-drada de la desviacin promedio al cuadrado de la media. Este nombrees complicado, de manera que se le ha denominado tan slo desviacinestndar s. En consecuencia, por definicin:

    Desviacin estndar de la poblacin varianzade lapoblacin

    5

    o, en trminos matemticos:

    donde los smbolos se definen como antes. Obsrvese que la desviacinestndar tiene las mismas unidades que las observaciones originales. Porejemplo, la desviacin estndar de las tallas de los marcianos es de 5 cmy la de los venusinos de 2.5 cm.

    DISTRIBUCIN NORMAL

    En el cuadro 2-1 se resumen los descubrimientos sobre los marcianos yvenusinos. Los tres nmeros del cuadro ofrecen una gran cantidad de in-formacin: tamao de la poblacin, talla promedio y variacin de las ta-llas respecto de la media. La distribucin de las tallas en ambos planetas

    2 (X )2

    suma de (valor propio de un miembrode la poblacin media de poblacin)2

    nmero de miembros de la poblacin

    (X )2N

    CMO RESUMIR LOS DATOS 15

  • tiene una morfologa similar, de modo que alrededor de 68% de las ta-llas se incluye dentro de una desviacin estndar de la media y cerca de95% dentro de dos desviaciones estndar de la media. Este patrn es tanfrecuente que los matemticos lo han estudiado y han encontrado que sila medida observada es la suma de varios factores aleatorios indepen-dientes pequeos, la medida resultante asume valores que se distribuyende la misma manera que las tallas observadas en Marte y Venus. Esta dis-tribucin se conoce como distribucin normal (o distribucin de Gauss).

    La talla ante cualquier valor de X es:

    Ntese que la distribucin est del todo definida por la media de pobla-cin y la desviacin estndar de la poblacin . Por lo tanto, la infor-macin que se proporciona en el cuadro 2-1 no es slo un buen resumende los datos, sino que constituye toda la informacin necesaria para des-cribir a la poblacin por completo si la distribucin de los valores sigueuna distribucin normal.

    PERCENTILES

    Una vez incorporados estos avances tericos, el patrocinio se renueva yahora se propone no slo medir la talla de los habitantes de Jpiter sinoadems calcular la media y la desviacin estndar de las tallas de esosindividuos. Los datos resultantes muestran que la talla promedio es de37.6 cm y la desviacin estndar de las tallas de 4.5 cm. Si se comparacon el cuadro 2-1, los habitantes de Jpiter tienen una altura muy similara la de los marcianos, puesto que estos dos parmetros especifican porcompleto una distribucin normal.

    Sin embargo, la distribucin real de las tallas en Jpiter es distinta.La figura 2-3A muestra que, a diferencia de los sujetos que habitan en

    12 exp

    12

    X )

    2

    16 CAPTULO 2

    Cuadro 2-1 Parmetros poblacionales para las tallas de losmarcianos y venusinos

    Tamao de Media de Desviacin estndar la poblacin la poblacin, cm de la poblacin, cm

    Marcianos 200 40 5.0Venusinos 150 15 2.5

  • los otros dos planetas, en los residentes de Jpiter la probabilidad de quela talla se encuentre por arriba y debajo del promedio no es igual; la dis-tribucin de la talla de los miembros de la poblacin ya no es simtricasino oblicua. Los pocos individuos que son mucho ms altos que los de-ms incrementan la media y la desviacin estndar, de tal forma que setiende a pensar que la mayor parte de las tallas y su variabilidad son ma-yores de lo que en realidad son. De forma especfica, la figura 2-3Bmuestra una poblacin de 100 sujetos cuyas tallas se distribuyen apega-

    CMO RESUMIR LOS DATOS 17

    Figura 2-3 Cuando los valores de una poblacin no tienen una distribucinsimtrica alrededor de la media, publicar la media y la desviacin estndar puededar una impresin errnea acerca de la distribucin de los valores poblacionales.En A se muestra la distribucin verdadera de las tallas de los 100 habitantes deJpiter (ntese que se inclina hacia las tallas superiores). En B se observa unapoblacin de distribucin normal que consta de 100 miembros y la misma mediay desviacin estndar que en A. Pese a que la media y la desviacin estndar soniguales, la distribucin de las tallas en ambas poblaciones es muy distinta.

  • das a una distribucin normal o de Gauss con la misma media y desvia-cin estndar que los 100 habitantes de Jpiter en la figura 2-3A. Esmuy distinta. Por consiguiente, aunque se puede calcular la media y ladesviacin estndar de las tallas de los habitantes de Jpiter (o de cual-quier poblacin), estas dos cifras no resumen la distribucin de las tallascon la misma efectividad que cuando las tallas seguan una distribucinnormal.

    El mtodo que describe mejor estos resultados consiste en presentarla mediana. Esta ltima es el valor en el que cae la mitad de los miem-bros de la poblacin. La figura 2-4A muestra que la mitad de los resi-dentes de Jpiter mide menos de 36 cm; 36 cm es la mediana. Puestoque 50% de la poblacin cae por debajo de la mediana, tambin se co-noce como percentil 50.

    Es fcil calcular la mediana y otros percentiles. En primer lugar hayque obtener una lista ordenada de las observaciones n. La mediana, quees el valor que define la mitad inferior de las observaciones, es tan slo laobservacin (n 1)/2. Cuando aparecen nmeros impares en las ob-servaciones, la mediana se incluye en alguna de estas observaciones. Porejemplo, si existen 27 observaciones, la mediana es (27 1)/2 obser-vacin 14 (enumerada de menor a mayor). Cuando el nmero de observa-ciones es par, la mediana se halla entre dos observaciones. Por ejemplo,si existen 40 observaciones, la mediana es (40 1)/2 observacin20.5. Puesto que no existe una observacin 20.5, se toma el promediode las observaciones 20 y 21.

    Los dems puntos de percentiles se definen en forma anloga. Porejemplo, el punto del percentil 25, que es el punto que define el cuartoinferior de las observaciones, corresponde slo a la observacin (n 1)/4.De nueva cuenta, si la cifra cae entre dos observaciones, se toma el pro-medio de las dos observaciones contiguas. En general, el punto del per-centil p es la observacin (n 1)/(100/p).

    Para proporcionar algn indicio de la dispersin de tallas en la po-blacin, se anota el valor que separa al 25% inferior (ms bajo) de la pobla-cin del resto y el valor que separa al 75% ms bajo de la poblacin delresto. Estos dos puntos se denominan puntos de los percentiles 25 y 75,respectivamente. Para los habitantes de Jpiter, la figura 2-4B muestraque estos percentiles son de 34, 36 y 40 cm. Si bien estos tres nmeros(los puntos de los percentiles 25, 50 y 75; 34, 36 y 40 cm) no descri-ben con precisin la distribucin de las tallas, s indican los lmites deestatura y la presencia de escasos habitantes muy altos y no muchosbajos.

    18 CAPTULO 2

  • CMO RESUMIR LOS DATOS 19

    Figura 2-4 Una manera de describir la distribucin sesgada consiste en emplearpercentiles. La mediana es el punto que divide a la poblacin a la mitad. En A se ob-serva que la mediana de la talla en Jpiter es de 36 cm. En B se reconocen los per-centiles 25 y 75, que son los puntos que ubican a los cuartos inferior y superior delas tallas, respectivamente. Que el percentil 25 se halle ms cerca de la medianaque el 75 indica que la distribucin se inclina hacia los valores ms elevados.

    P E R C E N T I L 2 5 P E R C E N T I L 7 5

    M E D I A N A ( P E R C E N T I L 5 0 )

    T A L L A , c m

  • A pesar de que estos percentiles se utilizan con frecuencia, tambin pue-den presentarse los puntos de percentiles 5 y 95 o, de igual forma, lospuntos de percentiles 5, 25, 50, 75 y 95.

    Una manera acertada de conocer qu tan cerca se encuentra una po-blacin de la distribucin normal consiste en calcular los percentiles.Recurdese que en una poblacin con una distribucin normal de valo-res, cerca de 95% de los miembros queda dentro de dos desviaciones es-tndar de la media y alrededor de 68% dentro de una desviacin estn-dar de la media. La figura 2-5 muestra que, para una distribucinnormal, los valores de los percentiles correspondientes son:

    percentil 2.5 media 2 desviaciones estndarpercentil 16 media 1 desviacin estndarpercentil 25 media 0.67 desviacin estndarpercentil 50 (mediana) mediapercentil 75 media 0.67 desviacin estndarpercentil 84 media 1 desviacin estndarpercentil 97.5 media 2 desviaciones estndar

    20 CAPTULO 2

    Figura 2-5 Puntos de los percentiles de la distribucin normal.

  • Si los valores de los percentiles no difieren demasiado entre s puede es-perarse que, con base en la media y la desviacin estndar, la distribucinnormal constituya una buena aproximacin de la poblacin verdadera ypor lo tanto la media y la desviacin estndar describen de manera ade-cuada a la poblacin.

    Por qu es importante que la distribucin normal sea una buenaaproximacin? Porque muchos de los mtodos estadsticos empleadospara comprobar hiptesis (incluidos los que se describen en los captu-los 3, 4 y 9) exigen que la poblacin tenga cuando menos una distribu-cin normal para que las pruebas sean confiables. (En los caps. 10 y 11se describen otras pruebas que no necesitan esta funcin.)

    OBTENCIN DE DATOS

    Hasta ahora, todo cuanto se ha hecho ha resultado exacto porque seajusta a un mtodo conservador de examinar a cada miembro de la po-blacin. Sin embargo, por lo general esto es imposible desde el punto devista fsico y slo se puede examinar una muestra de n individuos toma-da de la poblacin con la esperanza de que sea representativa de la po-blacin completa. Si no se conoce a la poblacin completa, no es posi-ble conocer la media ni de la poblacin ni de la desviacin estndar de la poblacin. No obstante, s es factible calcularlas a partir de la mues-tra; empero, para hacerlo la muestra debe ser representativa de la po-blacin de la que se obtiene.

    Muestras aleatorias

    Todos los mtodos estadsticos se han ideado con base en la presuposi-cin de que los individuos de la muestra representan una muestra alea-toria de la poblacin original (no estudiada). En una muestra aleatoriacada miembro de la poblacin tiene las mismas probabilidades de serseleccionado para la muestra. Esta suposicin se debe cumplir para quelos resultados de muchos de los mtodos aqu descritos sean confiables.

    La manera ms directa de crear una muestra aleatoria simple es ob-tener una lista de cada miembro de la poblacin que se desee estudiar,numerarla de 1 a N (donde N es el nmero de miembros de la poblacin)y luego utilizar un generador informtico de nmeros aleatorios paraseleccionar a los n individuos para la muestra. En el cuadro 2-2 figuran100 nmeros aleatorios del 1 al 150 creados con un generador de nme-

    CMO RESUMIR LOS DATOS 21

  • ros aleatorios. Cualquier nmero tiene las mismas posibilidades de apa-recer y no existe ninguna relacin entre los nmeros adyacentes.

    Este cuadro se puede utilizar para seleccionar una muestra aleatoriade venusinos de la poblacin que se muestra en la figura 2-2. Para ha-cerlo, se enumera a los venusinos del 1 al 150, primero con el individuode la extrema izquierda en la figura 2-2, que recibe el nmero 1; los si-guientes dos sujetos en la segunda columna de la figura 2-2 reciben losnmeros 2 y 3, los individuos de la siguiente columna los nmeros 4, 5,6 y 7, hasta alcanzar al sujeto de la extrema derecha, al que se le asignael nmero 150. Para obtener una muestra aleatoria simple de seis venu-sinos a partir de esta poblacin, se toman los primeros seis nmeros delcuadro (2, 101, 49, 54, 30 y 137) y se selecciona a las personas corres-pondientes. En la figura 2-6 se muestra el resultado de este proceso.(Cuando un nmero se repite, como sucede con los dos sietes de la pri-mera columna del cuadro 2-2, slo se omiten los nmeros repetidospuesto que el individuo correspondiente ya se ha seleccionado.)

    22 CAPTULO 2

    Cuadro 2-2 Cien nmeros aleatorios entre 1 y 150

    2 135 4 138 57101 26 116 131 7749 99 146 137 12954 83 4 121 12930 102 7 128 15

    137 85 71 114 740 67 109 34 1236 23 120 6 72

    112 7 131 58 3874 30 126 47 79

    108 82 96 57 12355 32 16 114 417 81 81 37 214 52 131 62 77 38 55 102 5

    37 61 142 42 8116 5 41 111 10976 83 51 37 40

    100 82 49 11 9383 146 42 50 35

  • Es posible crear una segunda muestra aleatoria si se contina en elcuadro y se empieza con la sptima entrada, 40, o si se comienza en otracolumna. Lo importante es no utilizar de nueva cuenta cualquier secuen-cia de miembros aleatorios ya empleada para seleccionar una muestra.(En la prctica quiz se use un generador informtico de nmeros alea-torios, que de manera automtica crea secuencias de nmeros aleatoriosque son independientes de las dems secuencias generadas.) De esa ma-nera se asegura que cualquier miembro de la poblacin tenga las mismasposibilidades de ser seleccionado para la muestra.

    La lista de los miembros de la poblacin a partir de la cual se obtie-ne la muestra aleatoria se conoce como marco de muestreo. Algunas ve-ces es posible obtener esta lista (p. ej., una lista de las personas hospita-lizadas cierto da en determinada institucin), pero es difcil. Cuando nose dispone de una lista, los investigadores utilizan otras tcnicas paracrear una muestra aleatoria, como marcar nmeros telefnicos al azar

    CMO RESUMIR LOS DATOS 23

    Figura 2-6 Para seleccionar de manera aleatoria a n = 6 venusinos, se numera ala poblacin completa de N = 150 venusinos de 1 a 150, al principio con el primerindividuo en la extrema izquierda de la poblacin, que es el nmero 1. A continua-cin se seleccionan seis nmeros aleatorios a partir del cuadro 2-2 y a los indivi-duos correspondientes de la muestra que se mantendrn bajo observacin.

  • para realizar encuestas de opinin pblica o seleccionar de modo aleato-rio ubicaciones geogrficas en los mapas. La manera como se construyeel marco de muestreo tiene gran relevancia potencial en relacin con laforma de extrapolar los resultados del estudio a las dems personas noincluidas en la muestra.*

    El mtodo descrito se conoce como muestra aleatoria simple. Enlos diseos ms complejos, sobre todo en las investigaciones o estudiosclnicos extensos, los investigadores emplean en ocasiones muestrasaleatorias estratificadas en las que primero dividen a la poblacin en di-versos subgrupos (p. ej., por sexo, raza o situacin geogrfica) y luegoconstruyen muestras aleatorias simples dentro de cada subgrupo (estra-to). Se recurre a esta tcnica cuando el nmero de personas en las diver-sas subpoblaciones es variable, de tal modo que la obtencin de unamuestra de tamao apropiado en los subgrupos ms pequeos ameritararecoger ms datos de los que se necesitan en las subpoblaciones msgrandes si se obtuviera la muestra en forma aleatoria simple. La estrati-ficacin abate los costos de la obtencin de muestras al reducir el tama-o de la muestra total necesaria para conseguir la precisin deseada enlos resultados, pero complica el anlisis de los datos. La necesidad bsi-ca de crear una muestra aleatoria en la que cada miembro de cada sub-poblacin (estrato) tenga las mismas posibilidades de ser seleccionadoes la misma que en la muestra aleatoria simple.

    Sesgos

    La razn principal por la que se obtiene una muestra aleatoria ya seauna muestra simple o una estratificada ms compleja es la de evitarlos sesgos al seleccionar a los individuos que comprenden la muestra. Elsesgo es la diferencia sistemtica entre las caractersticas de los miem-bros de la muestra y la poblacin de la que se obtuvo.

    Los sesgos se introducen de forma deliberada o por accidente. Porejemplo, supngase que existe un inters por describir la distribucin dela edad de la poblacin. La forma ms sencilla de obtener la muestraconsiste en seleccionar tan slo a las personas cuya edad se medir apartir de los individuos de la clase de bioestadstica. El problema con es-ta muestra de conveniencia radica en que excluye a todos los que no tie-

    24 CAPTULO 2

    *Este tema se trata otra vez en el captulo 12 y se destaca de manera especfica la in-vestigacin clnica enseada en los centros mdicos acadmicos.

  • nen la edad suficiente para aprender bioestadstica o a los que ya son de-masiado mayores para hacerlo. El resultado obtenido de esta muestra deconveniencia tal vez subestima la edad promedio de las personas y lamagnitud de las variaciones en esa poblacin. Tambin es posible intro-ducir sesgos al asignar en forma selectiva a los sujetos en un grupo uotro. Por ejemplo, cuando se realiza un experimento para comparar un fr-maco nuevo con el tratamiento convencional, es posible introducir unsesgo en los resultados si se asigna a las personas ms enfermas al grupoque recibir el tratamiento convencional, cuando se espera que el resul-tado sea peor que el de los individuos que no se encontraban tan gravesy que recibieron el nuevo tratamiento. Las muestras aleatorias protegencontra estos dos tipos de sesgos.

    Tambin es posible introducir sesgos cuando existe un error siste-mtico en el dispositivo de medicin, como sucede cuando el cero enuna bscula porttil es demasiado alto o bajo, de modo que cualquiermedida queda por arriba o debajo del peso real.*

    Las personas que realizan o notifican las mediciones, cuando de-sean o creen que el tratamiento bajo aprobacin es o no superior al gru-po testigo o al tratamiento convencional, son otra fuente de sesgos. Confrecuencia, en particular en la investigacin clnica, existe cierta censuraal efectuar y notificar las mediciones. Si el investigador desea que el re-sultado del estudio sea uno u otro, siempre existe la posibilidad de queinterprete los resultados demasiado reducidos en un grupo y demasiadoelevados en el otro.

    Para evitar este sesgo de medicin se mantiene a la persona que larealiza a ciegas respecto del tipo de tratamiento que origin los resulta-dos bajo medicin. Pngase por caso la comparacin de la eficacia dedos endoprtesis (pequeas sondas que se introducen en las arterias) paramantener abiertas las arterias coronarias (arterias del corazn). Para quelas mediciones se efecten a ciegas, la persona que interpreta los resulta-dos sobre el tamao de las arterias no debe saber si los resultados pro-vienen de una persona que pertenece al grupo testigo (no sometido alprocedimiento de la endoprtesis) o qu tipo de dispositivo se utiliz endeterminado paciente.

    Otro tipo de sesgo es el que resulta del efecto placebo, esto es, latendencia de las personas a manifestar un cambio de la enfermedad al

    CMO RESUMIR LOS DATOS 25

    *Para los fines de este libro se presupone que las medidas carecen de sesgos. Loserrores aleatorios vinculados con este proceso de medicin se absorben en otros elementosaleatorios relacionados con la obtencin de muestras.

  • recibir un tratamiento, aunque la teraputica no tenga efectos biolgicos.Por ejemplo, casi 33% de los sujetos a los que se inyecta una sustanciainerte, pero que ellos creen que se trata de un anestsico, experimentuna atenuacin del dolor dental. Para reducir este efecto en los experi-mentos clnicos se administra muchas veces placebo a un grupo paraque piense que recibe el tratamiento. Algunos ejemplos de placebos sonla inyeccin de solucin salina, una pldora de azcar o la prctica deuna incisin quirrgica y su cierre sin realizar ningn procedimiento es-pecfico en el rgano lesionado. Si se omite el testigo con placebo, losresultados de un experimento se pueden sesgar en grado considerable enfavor del tratamiento.* El sujeto del experimento tampoco debe saber sirecibe placebo o tratamiento activo. Cuando esto sucede se encuentra aciegas.

    En los casos en que ni el investigador ni el sujeto saben quin reci-bi el tratamiento, el estudio se conoce como doble ciego. Por ejemplo,en los estudios doble ciego de frmacos se asigna tratamiento aleatorio yni el sujeto ni la persona que administr el frmaco y mide los resulta-dos saben si el sujeto recibi un medicamento activo o un placebo. Losagentes se suministran slo con un cdigo que los identifica. Este cdi-go se conoce hasta que se obtienen todos los datos.

    Experimentos y estudios de observacin

    Existen dos formas de obtener datos: experimentos y estudios de obser-vacin. Los primeros permiten inferir conclusiones ms slidas que lossegundos, pero a menudo slo es posible realizar estos ltimos.

    En un experimento, el investigador selecciona a los individuos apartir de la poblacin de inters (mediante un marco de muestreo ade-cuado); con posterioridad asigna a algunos sujetos a ciertos grupos tera-puticos, aplica los tratamientos y cuantifica las variables de inters. Losestudios clnicos farmacolgicos en los que las personas reciben de for-ma aleatoria un tratamiento convencional o un frmaco nuevo son expe-rimentos biomdicos comunes. La nica diferencia sistemtica entre losdiversos grupos teraputicos es el propio tratamiento, de tal modo que esposible confiar en que la teraputica indujo las diferencias observadas.

    No siempre es posible o tico seleccionar a los individuos y asig-narles al azar diversas situaciones experimentales. En un estudio de ob-

    26 CAPTULO 2

    *En el captulo 12 se describe con detalle el efecto placebo.

  • servacin, el investigador selecciona a los sujetos a partir de la pobla-cin de estudio, mide las variables de inters y por ltimo asigna a laspersonas de la muestra a distintos grupos de acuerdo con otras caracte-rsticas de inters. Los epidemilogos han comparado el ndice de cn-cer pulmonar y cardiopata entre las personas que no fuman, pero cuyoscnyuges o colaboradores s lo hacen, con el ndice observado en los queno fuman y viven en un ambiente exento de humo. Estos estudios de-muestran que el ndice de cncer pulmonar y cardiopata es mayor entrelos individuos expuestos al tabaquismo secundario, por lo que se con-cluye que el tabaquismo pasivo incrementa el riesgo de padecer estasafecciones (fig. 2-7A).

    No obstante, al llevar a cabo un estudio de observacin, es posibledudar que la relacin observada en los datos no sea consecuencia de un

    CMO RESUMIR LOS DATOS 27

    Figura 2-7 En A se muestra la situacin que existira si el tabaquismo secundariocausara cncer pulmonar. En B se ilustra la situacin que habra si, tal y como losugiere un asesor de la industria del tabaco, las personas expuestas al tabaquismosecundario tuvieran ms probabilidades de tener pjaros y esas aves propagaranenfermedades que produjeran cncer pulmonar, siempre que no existiera conexinalguna entre el tabaquismo secundario y el cncer pulmonar. Puesto que tener unpjaro estara ligado al tabaquismo secundario y al cncer pulmonar, esta variabledesconcertante (no observada) hara parecer que el tabaquismo secundario causacncer pulmonar cuando, en realidad, no existe relacin alguna.

  • nexo causa-efecto entre ambas variables (en este caso, que el tabaquis-mo secundario provoque cncer pulmonar), sino que exista alguna va-riable desconcertante que tiene una relacin causal con las otras dos va-riables y da lugar a la existencia de una vinculacin aparente entreambas (fig. 2-7B). Por ejemplo, un consultor de la industria del tabacoafirma que las personas que no fuman y estn casadas con un fumadortienen ms probabilidades de tener pjaros y que las aves diseminan en-fermedades que elevan el riesgo de padecer cncer pulmonar.*

    La nica manera de excluir por completo la posibilidad de variablesdesconcertantes consiste en realizar un estudio clnico aleatorio en el quelos no fumadores se seleccionen al azar de la poblacin y se los asignetambin al azar para que se casen con otros no fumadores o fumadores yluego se vigilen durante varios aos para observar quin padece proble-mas cardacos o cncer pulmonar. (Puede pensarse que la posesin de p-jaros se distribuira de manera aleatoria entre las personas elegidas paracasarse con no fumadores o fumadores.) Este tipo de experimento jamsse podra realizar.

    Sin embargo, puede concluirse que existe una relacin causal entrela exposicin a determinado elemento (como el tabaquismo secundario)y un resultado (como el cncer pulmonar) a partir de un estudio de obser-vacin. Para hacerlo se necesitan estudios que respalden las variablesdesconcertantes conocidas, ya sea a travs de un diseo experimental quesepare a los individuos con base en el efecto de la variable desconcertan-te (al estratificar a la variable desconcertante) o bien mediante el controlde sus efectos por medio de tcnicas estadsticas ms avanzadas y con laconsideracin de otra evidencia experimental que ayude a explicar losmecanismos biolgicos que suscitan la enfermedad. Estas consideracio-nes han provocado que numerosos cientficos acreditados y autoridadessanitarias concluyan que el tabaquismo secundario origina cncer pulmo-nar y cardiopata.

    Las tcnicas estadsticas para analizar los datos recogidos de los ex-perimentos y estudios de observacin son las mismas. La diferencia ya-ce en la manera de interpretar los resultados, sobre todo el grado de con-fianza concedido a la palabra causa.

    28 CAPTULO 2

    *A. Gardiner y P. Lee, Pet Birds and Lung Cancer, BMJ. 306(6869):60,1993.Para mayores detalles sobre los mtodos estadsticos para regular las variables des-

    concertantes, vase S. A. Glantz y B. K. Slinker, Primer of Applied Regression and Analysisof Variance, 2 ed., New York: McGraw Hill, 2001, Chapter 12: Regression with a Qualita-tive Dependent Variable.

  • Estudios clnicos aleatorizados

    El estudio clnico aleatorizado es el mtodo de eleccin para evaluartratamientos, puesto que evita los sesgos de seleccin que contaminan alos estudios de observacin. Este tipo de estudio constituye un ejemplode lo que los estadsticos llaman estudio experimental, dado que el in-vestigador manipula en forma activa el tratamiento de inters, lo quepermite deducir conclusiones mucho ms firmes que las inferidas a par-tir de los estudios de observacin en relacin con el efecto teraputico.En las ciencias fsicas y los estudios en animales de las ciencias biolgi-cas casi siempre se emplean estudios experimentales, pero stos son me-nos comunes cuando el estudio incluye a seres humanos.

    La aleatorizacin reduce los sesgos que aparecen en los estudios deobservacin y, puesto que los estudios clnicos son prospectivos, nadiesabe lo que resultar. Este hecho reduce adems la posibilidad de que seproduzcan sesgos. Quiz por estas razones, los estudios clnicos aleato-rizados demuestran con frecuencia que los tratamientos tienen muy pocao ninguna utilidad, aunque los estudios de observacin sugieran que soneficaces.*

    Entonces, por qu no se someten todos los tratamientos a un estu-dio clnico aleatorizado? Una vez que algo forma parte de la prcticamdica aceptada aunque lo hiciera sin demostrar en forma objetiva suutilidad es muy difcil convencer a los pacientes y sus mdicos departicipar en un estudio que los obliga a diferir el tratamiento. En segun-do lugar, los estudios clnicos aleatorizados siempre son prospectivos; elsujeto reclutado para un estudio se debe vigilar durante cierto tiempo, amenudo varios aos. No obstante, las personas se mudan, pierden inte-rs o mueren por razones ajenas al estudio. En un estudio clnico aleato-rizado, seguir el rastro de las personas constituye una tarea muy difcil.

    Adems, con el fin de obtener a suficientes pacientes para que lamuestra sea relevante, muchas veces es necesario recurrir a varios gruposen distintas instituciones participantes. Si bien esto es divertido para laspersonas que encabezan el estudio, es slo una tarea ms para los sujetosque colaboran en las instituciones. Estos factores se combinan para incre-mentar el costo y el grado de dificultad de los estudios clnicos aleatori-

    CMO RESUMIR LOS DATOS 29

    *Para cotejar una descripcin sencilla y consagrada del lugar que ocupan los estu-dios clnicos aleatorizados en los conocimientos clnicos de utilidad, adems de una des-cripcin del fragmento mnimo de la prctica mdica aceptada cuya utilidad no se ha de-mostrado, vase A. K. Cochran, Effectiveness and Efficiency: Random Reflections onHealth Services, Nuffield Provincial Hospitals Trust, London, 1972.

  • zados. Con todo, cuando se llevan a cabo, ofrecen las respuestas ms de-finitivas a las interrogantes sobre la eficacia de las diversas teraputicas.

    CMO CALCULAR LA MEDIA Y LA DESVIACIN ESTNDAR DE UNA MUESTRA

    Una vez que se recoge una muestra aleatoria de la poblacin estudiada,es posible utilizar la informacin de esa muestra con la finalidad de calcu-lar las caractersticas de la poblacin de fondo. El clculo de la media dela poblacin se conoce como media de la muestra y se define de maneraanloga a la media de la poblacin:

    La frmula matemtica equivalente es:

    donde la lnea sobre la X indica que constituye la media de las observa-ciones n de X.

    El clculo de la desviacin estndar de la poblacin se denominadesviacin estndar de la muestra s y se define por:

    Desviacin estndar de la muestra

    5

    o, en forma matemtica:*

    s (X X)2n 1

    suma de (valor de la observacin en lamuestra media de la muestra)2

    nmero de observaciones en la muestra 1

    X Xn

    suma de valores (p. ej., tallas) de cada observacin en la muestra

    Media de la muestra nmero de observaciones en la muestra

    30 CAPTULO 2

    *Las ecuaciones de este libro se presentan de la manera que sea ms sencilla paracomprender los conceptos estadsticos. A menudo se muestra el equivalente matemticoque resulta ms adecuado para la informtica. Estas formas se encuentran tabuladas en elApndice A.

  • (La desviacin estndar tambin se conoce con las siglas SD.) La defini-cin de la desviacin estndar de la muestra, s, difiere de la definicinde la desviacin estndar de la poblacin de dos formas: a) la media dela poblacin m se ha sustituido por el clculo, la media de la muestra X,y b) se calcula la desviacin promedio al cuadrado de una muestra aldividir entre n 1 en lugar de n. La razn por la que se divide entre n 1requiere n argumentos matemticos de consideracin, pero por ahorabasta el siguiente razonamiento: la muestra jams revela la misma varia-bilidad de la poblacin completa y al dividir entre n 1 en lugar de n secompensa la tendencia resultante de la desviacin estndar de la muestraa subestimar la desviacin estndar de la poblacin.

    En conclusin, si se presupone que la muestra se obtuvo a partir deuna distribucin normal, se resumen los datos con una media y una des-viacin estndar de la muestra, que son los mejores clculos de la mediay la desviacin estndar de la poblacin, puesto que estos parmetros de-finen en su totalidad la distribucin normal. No obstante, cuando existeevidencia de que la poblacin estudiada no tiene una distribucin normal,se resumen los datos con la mediana y los percentiles superior e inferior.

    QU TAN VALIOSOS SON ESTOS CLCULOS?

    La media y la desviacin estndar que se infieren con base en una mues-tra aleatoria son clculos de la media y la desviacin estndar de la po-blacin completa a partir de la cual se obtuvo la muestra. La muestraaleatoria especfica usada para calcular estas estadsticas no tiene nadaespecial y las diferentes muestras aleatorias proporcionan clculos dis-tintos de la media verdadera y la desviacin estndar de la poblacin.Para cuantificar la precisin de estas op


Top Related