Download - Initiation à la logique Bayésienne
Initiation à la logique Bayésienne
Département des Maladies Infectieuses et Tropicales
GHU Pierre et Marie Curie
Site Pitié-Salpêtrière
Mercredi 28 mars 2007
Dr. Frédérick Gay
Université Pierre et Marie Curie – Paris 6
Au quotidien…
• Film photographique
• Détecteur de sécurité
• Filet de pêche
• Arme à feu
• Profil de poste
• Définition d’un cas
5- Comprendre le lien entre le théorème de Bayes et
la signification statistique
Objectifs :
1- Comprendre et savoir estimer les paramètres
de validité intrinsèque
2- Comprendre et savoir estimer les paramètres
de validité prédictive
3- Savoir ce que sont les probabilités a priori et a
posteriori et les rapports de vraisemblance
4- Savoir discuter et choisir les meilleures stratégies
en fonction des objectifs recherchés
Vocabulaire et applications
• Validité = Performance = Valeur diagnostique = Evaluation
• Test / Signe / Symptôme / Examen complémentaire / Combinaison de signes / Système d’alerte…
Validité intrinsèque
• Un test réagit-il correctement
à la présence ou à l’absence
d’une maladie ?
Validité “a priori”
• Paramètres intrinsèques :
– Référence / procédé conventionnel /
Test standard (“Gold Standard”)
– Sensibilité
– Spécificité
– Rapport de vraisemblance positif
– Rapport de vraisemblance négatif
Sensibilité :
Définitions de la Sensibilité :
� Capacité du test de donner un résultat positifquand la maladie est présente
� Probabilité conditionnelle que le test soit positiflorsque la maladie est présente
� Estimée par la proportion de résultats positifslorsque le test est appliqué à des malades
� Estimée par la proportion de malades dont le résultat du test est positif
� La sensibilité mesure à quel point le test estcapable d’identifier les malades
Spécificité :
Définitions de la Spécificité :
� Capacité du test de donner un résultat négatifquand la maladie est absente
� Probabilité conditionnelle que le test soit négatiflorsque la maladie est absente
� Estimée par la proportion de résultats négatifslorsque le test est appliqué à des non-malades
� Estimée par la proportion de non malades dont le résultat du test est négatif
� La spécificité mesure à quel point le test estcapable d’exclure les non malades
Sensibilité : Spécificité :
Fusion artificielle de 2 tableaux indépendants :
Double diffusion
Pas d’arc
Absence d’argument
Immunologique en faveur
de maladie du poumon de
fermier
Présence d’arcs
Maladie du poumon
de fermier
SEROLOGIE DE LA MALADIEDU POUMON DE FERMIER
Choix du seuil :
Choix du seuil :
0 50 100
100
50
0
Se
nsib
ilité
(%
)
%age de faux positifs
Courbe ROC :
SEROLOGIE DE LA TRICHINOSE
IF
Absence d’argument immunologique en
faveur d’unetrichinose
Code 0
1er examen
2eme examen
Trichinose immunologique
Code 1Code 200
Code 401
- 200 400 ≥400
Si 1er 400 : Code 402Si 1er <400: Code 403Si 1er >400: Code 404
Indices de synthèse
J = Se + Sp – 1
� Varie de -1 à +1
� J= 0 signifie que le test n’appporte aucune orientation diagnostique
� Indice peu utilisé
Indice de Youden (J) :
Objectifs :
1- Comprendre et savoir estimer les paramètres
de validité intrinsèque
2- Comprendre et savoir estimer les paramètres
de validité prédictive
Validité prédictive
Validité prédictive
• Un test est-il un bon indicateur de la présence ou non de la maladie ?
• Aptitude d’un test à reconnaître les malades et les non-malades
• Le résultat positif (ou négatif) d’un test correspond-il à une probabilité élevéed’être affecté (ou non) par la maladie ?
Validité “a posteriori”
• Paramètres extrinsèques :
– Valeur prédictive positive
– Valeur prédictive négative
– Rôle du taux de prévalence
– Effet de la sensibilité
– Effet de la spécificité
Définitions de la valeur prédictive positive
d’un test positif (VPP) :
� La VPP d’un test positif mesure la probabilitéconditionnelle que la maladie soit présente si le test est positif
� La VPP est estimée par la proportion de maladeschez les positifs au test
Définitions de la valeur prédictive négative
d’un test négatif (VPN) :
� La VPN d’un test négatif mesure la probabilitéconditionnelle que la maladie soit absente sile test est négatif
� La VPN est estimée par la proportion de sujets sains chez les négatifs au test
Etude transversale en population :
Etude transversale en population :
Calcul empirique par simulation :
Formule de Bayes :
Théorème de Bayes :
P(B/A)=P(B) x P(A/B)
P(A)
P(B/A)=P(B) x P(A/B)
[P(B) x P(A/B)] + [P(B)x P(A/B)]
VPP d’un test positif :
VPN d’un test négatif :
VPN =
VPP =
VPP d’un test positif :
VPN d’un test négatif :
VPN =Sp x (1 - Pr)
[Sp x (1 - Pr)] + [(1 - Se)x Pr]
VPP =Se x Pr
(Se x Pr) + [(1 - Sp) x (1 – Pr)]
Exercice :
���� Vos conclusions ?
� Santé publique 10%
� Soins généraux 50%
� Service spécialisé 90%
Tx de Pr VPP VPN
� Sensibilité = 90%
� Spécificité = 80%
33,3% 98,6%
81,2% 88,9%
97,6% 47,1%
0 50 100
100
50
0
Taux de prévalence (%)
%
Va
leu
rs p
réd
ictive
s
Exactitude / Efficience (E) :
VP FP
VNFN
M+ M-
+
-
Test
% de bien classés =
Indices de synthèse
Objectifs :
1- Comprendre et savoir estimer les paramètres
de validité intrinsèque
2- Comprendre et savoir estimer les paramètres
de validité prédictive
3- Savoir ce que sont les probabilités a priori et a
posteriori et les rapports de vraisemblance
Probabilité a priori :
� Probabilité d’existence de la maladie avant le résultat du test
� Fonction du contexte clinique et épidémiologique du sujet
���� Probabilité pré-test
Probabilité a posteriori :
� Représente la situation après le test
� Un test positif augmente la probabilitéd’existence de la maladie, un test négatif la diminue
���� Probabilité post-test
Vraisemblance exprimée en termes de
probabilité ou de cote :
� La probabilité qu’un évènement se réalise est la proportion de fois où l’on s’attend à voir cetévènement se réaliser au cours de plusieursessais ���� [ 0 ; 1 ]
� La cote est définie comme la probabilité quel’évènement se produise divisée par la probabilité
que l’évènement ne se produise pas ���� [ 0 ; ∞ ]
Conversions :
Cote =Probabilité
1- Probabilité
Probabilité =Cote
1+ Cote
Rapport de vraisemblance positif(positive likelihood ratio: LR+)
� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test
� Concernant les sujets pour lesquels le résultat du test est positif
LR+ =Cote post-test
Cote pré-test
Rapport de vraisemblance positif :
Rapport de vraisemblance positif :
VP FP
VNFN
M+ M-
+
-
Test
Rapport de vraisemblance positif
=Se
1 - Sp
Rapport de vraisemblance positif(positive likelihood ratio: LR+)
� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test
� Concernant les sujets pour lesquels le résultat du test est positif
LR+ =Cote post-test
Cote pré-test=
Sensibilité
1 - Spécificité
Rapport de vraisemblance négatif(negative likelihood ratio: LR-)
� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test
� Lorsque le résultat du test est négatif
LR- =Cote post-test
Cote pré-test
Rapport de vraisemblance négatif :
Rapport de vraisemblance négatif :
VP FP
VNFN
M+ M-
+
-
Test
Rapport de vraisemblance négatif
=1 - Se
Sp
Rapport de vraisemblance négatif(negative likelihood ratio: LR-)
� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test
� Lorsque le résultat du test est négatif
LR- =Cote post-test
Cote pré-test=
1 - Sensibilité
Spécificité
Objectifs :
1- Comprendre et savoir estimer les paramètres
de validité intrinsèque
2- Comprendre et savoir estimer les paramètres
de validité prédictive
3- Savoir ce que sont les probabilités a priori et a
posteriori et les rapports de vraisemblance
4- Savoir discuter et choisir les meilleures stratégies
en fonction des objectifs recherchés
Test BTest A
A – & B –A + & B –A - & B +A + & B +
ou
- +- +
Tests en parallèle :
Exercice (2 tests en parallèle) :
Condition d’indépendance entre les tests !
� TA
� TB
� TATB
VPP VPN
� Test A (TA) : Se = 90% ; Sp = 80%
� Test B (TB) : Se = 70% ; Sp = 60%
� Taux de Prévalence (Pr) = 10%
VPP de 2 tests positifs effectués en parallèle :
VPP =
Pr x (SeTA) x (SeTB)
[Pr x (SeTA) x (SeTB)] + [(1-Pr) x (1-SpTA) x (1-SpTB)]
VPN de 2 tests négatifs effectués en parallèle :
VPN =
(1-Pr) x (SpTA) x (SpTB)
[(1-Pr) x (SpTA) x (SpTB)] + [Pr x (1-SeTA) x (1-SeTB)]
Exercice (2 tests en parallèle) :
Condition d’indépendance entre les tests !
� TA 33,3 98,6
� TB 16,3 94,7
� TATB 46,7 99,3
VPP (%) VPN (%)
� Test A (TA) : Se = 90% ; Sp = 80%
� Test B (TB) : Se = 70% ; Sp = 60%
� Taux de Prévalence (Pr) = 10%
Deux tests en parallèle :
� Lorsque les 2 tests sont positifs :
VPP améliorée
� Lorsque les 2 tests sont négatifs :
VPN améliorée
���� Applicable à n tests…
Test B
Test A
Tests en série :
ou
Test B
- +
- +
- +
A + puis
B +
A –puis
B –
A –puis
B +
A + puis
B -
Exercice (2 tests en série) :
� TA
� TB siTA+
� TB siTA-
VPP (%) VPN (%)
� Test A (TA) : Se = 90% ; Sp = 80%
� Test B (TB) : Se = 70% ; Sp = 60%
� Taux de Prévalence (Pr) = 10%
Exercice (2 tests en série) :
Le test A modifie la probabilité pré-test B
� TA 33,3 98,6
� TB siTA+ 47
� TB siTA- 99,3
VPP (%) VPN (%)
� Test A (TA) : Se = 90% ; Sp = 80%
� Test B (TB) : Se = 70% ; Sp = 60%
� Taux de Prévalence (Pr) = 10%
Absence d’argument immunologique en faveur
d’une cysticercose
Taux limite d’anticorps nepermettant pas d’affirmer
une cysticercose
0-10 u > ou = 35 u10 u < Titre < 35 u
Western Blot
Présence d’anticorps enELISA dont la spécificité
n’est pas confirmée
CYSTICERCOSEIMMUNOLOGIQUE
Négatif Positif
ELISA
SEROLOGIE DE LA CYSTICERCOSE
INTERPRETATION
SEROLOGIE DISTOMATOSE
HG ES
IEP≤320 >320
- +
Absence d’argument immunologique en
faveur d’unedistomatose
Code 0Taux moyen
d’anticorps enhémagglutination
non confirmés en ES
Code dh
+ -
Absence d’argument immunologique en
faveur d’unedistomatose
Code 0
Distomatoseimmunologique
Code 1
Absence d’argument
Immunologique en
Faveur de
Larva migrans
SEROLOGIE DE TOXOCAROSE
Résultats sérologiques
en faveur d'une
Larva migrans
viscérale
Anticorps en ELISA
non confirmés en ES et en
WB. Possibilité de Larva migrans
viscérale ancienne ou d'une réaction
croisée avec une autre nématodose.
ELISA ES
>50 ≤50 +-
WB
+ -
IEP
- +
Résultats sérologiques
en faveur d'une
Larva migrans
viscérale
Code wb+
Code 0
Code wb-
SEROLOGIE HYDATIDOSE
ELISA ES
+ (arc 5)-
Hydatidoseimmunologique
<50
HG
≥75
≥640
Absence d’argument immunologique en
faveur d’unehydatidose
Code 0
Hydatidoseimmunologique
Code 1
50≤ <75
HG
≤320 ≥640
Taux d’Ac en ELISAdont la spécificitéhydatique ne peut
Être affirmée.
Code 1Code de
WBDemande du
biologiste si
forte suspicion
Diagnostic versus Dépistage
Diagnostic Dépistage
� Milieu clinique : Pr forte
� Nbre de FP faible
� Pb des FP ++
� ↑ Sp ↓ FP
� Pr faible
� Nbre de FP ++
� donc ↑ spécificité
� Groupes à risque
� Second test
Analyse décisionnelle
1. Validité intrinsèque
2. Validité pédictive
3. “Fréquence” de la maladie
4. Gravité de la maladie
5. Efficacité du traitement
6. Risques du traitement
7. Coûts (humain et financier) du test
8. “Coûts” (humain et financier) du traitement
9. Objectif du test : dépistage ou diagnostic ?
5- Comprendre le lien entre le théorème de Bayes et
la signification statistique
Objectifs :
1- Comprendre et savoir estimer les paramètres
de validité intrinsèque
2- Comprendre et savoir estimer les paramètres
de validité prédictive
3- Savoir ce que sont les probabilités a priori et a
posteriori et les rapports de vraisemblance
4- Savoir discuter et choisir les meilleures stratégies
en fonction des objectifs recherchés
Choix du seuil d’un test diagnostique :
VP FP
VNFN
M+ M-
+
-
Test
Trouver un compromis entre les FP et les FN
Bayes et p-value
Choix du seuil α d’un test statistique :
Pas d’erreurErreur
de type I
≠
S
NS
Test
Trouver un compromis entre α et β
Bayes et p-value
Populations
=
Pas d’erreurErreur de
type II
Bayes et p-value
� Si le test de laboratoire mesure la concentration
d’une substance, celle-ci doit être considérée tellequelle sans se préoccuper des FP et des FN
���� (il n’y pas de résultat négatif ou positif)
� Si la p-value est un moyen de décrire ou de résumer les données, nul besoin de se préoccuper des erreurs de type I et II ���� (le résultat n’est ni significatif ni non-significatif)
Spécificité et risque α
� Test diagnostique : Si le patient n’est pas malade, la probabilité que le test donne un résultat positif
= 1- Sp
� Test statistique : Si les 2 populations ont les
mêmes moyennes (ou %ions), la probabilité quel’étude mette en évidence une différencestatistiquement significative
= α
Sensibilité et risque β
� Test diagnostique : Si le patient est malade, la probabilité que le test donne un résultat positif
= Se
� Test statistique : S’il existe une différence ∆ entre
les moyennes (ou %ions) des 2 populations, la probabilité que l’étude mette en évidence unedifférence statistiquement significative
= 1- β
Question posée :
� Dans quelle proportion de l’ensemble des étudesqui donnent de p-values significativesl’hypothèse nulle est-elle vraie ?
� Si un résultat est statistiquement significatif, quelle est la probabilité que l’hypothèse nullesoit vraie ?
Exemple :
Quelle est la probabilité de chacune de ces possibilités ?
� Un nouveau médicament génère une baisse significativede la moyenne de la PA : 2 possibilités
� Ce médicament est réellement anti-HTA
� Ce médicament n’est pas anti-HTA, le résultat est le fait du hasard
� Etude de médicaments potentiellement anti-HTA
� ∆ = 10 mmHg
� Effectifs offrant une puissance = 80%
� Risque α = 0,05
Médicament A :
���� 64% de chance qu’il soit réellement efficace
� ≠ significative 80 45 125
� ≠ non significative 20 855 875
� Total 100 900 1000
efficace inefficace Total
� Appartient à une famille instable, faible affinité, etc.
� Probabilité a priori = 10%
Médicament B :
���� 98,5% de chance qu’il soit réellement efficace
� ≠ significative 640 10 650
� ≠ non significative 160 190 350
� Total 800 200 1000
efficace inefficace Total
� Bonne affinité, stable, bloque les bons récepteurs
� Probabilité a priori = 80%
Médicament C :
���� 14% de chance qu’il soit réellement efficace
� ≠ significative 8 50 58
� ≠ non significative 2 940 942
� Total 10 990 1000
efficace inefficace Total
� Sélectionné au hasard dans une banque de produits
� Probabilité a priori = 1%
� Résultat
� Objectif
� Erreurs
� Seuil
� Précision
� Interprétation
� Comparaisons
multiples
Test diagnostique Test statistique
+ / - S / NS
M ou ךM H0 ou H1
FN & FP α & β
Compromis entre Compromis entre
% de bien classés Puissance
VPP ou VPN Probabilité
Tests Correction
FN et FP α et β
en série de Bonferoni
que la ≠ soit vraie
Objectifs atteints ? :
1- Comprendre et savoir estimer les paramètres
de validité intrinsèque
1- Comprendre et savoir estimer les paramètres
de validité intrinsèque
2- Comprendre et savoir estimer les paramètres
de validité prédictive
2- Comprendre et savoir estimer les paramètres
de validité prédictive
3- Savoir ce que sont les probabilités a priori et a
posteriori et les rapports de vraisemblance
3- Savoir ce que sont les probabilités a priori et a
posteriori et les rapports de vraisemblance
4- Savoir discuter et choisir les meilleures stratégies
en fonction des objectifs recherchés
4- Savoir discuter et choisir les meilleures stratégies
en fonction des objectifs recherchés
5- Comprendre le lien entre le théorème de Bayes et
la signification statistique
5- Comprendre le lien entre le théorème de Bayes et
la signification statistique