méthodedeconstructiond’entrepôtsde...
TRANSCRIPT
Méthodedeconstructiond’entrepôtsdedonnéestemporaliséesguidéepar les
ontologiesC. KHNAISSER1,2, L. LAVOIE1, H. DIAB1, A. BURGUN2, J. F. ETHIER1,2
1GRIIS, Université de Sherbrooke, Sherbrooke, Canada;
2INSERM, UMRS 1138, CRC, Équipe 22, Université Paris Descartes, Sorbonne Paris Cité, Paris, France;
MISE EN CONTEXTE
Les systèmes informationnels sont désormais au centre des décisions ensanté. Ainsi, les dispositifs médicaux, les dossiers cliniques et sociaux,la recherche, etc. génèrent un très grand volume de données chaquejour associé à des évènements interreliés temporellement. Les étab-lissements de santé désirent réutiliser ces données pour différents typesd’analyse et les partager d’une façon exploitable. L’efficacité des étudescliniques dépend de la quantité et de la qualité des données recueillies.
D’une part, l’extraction des informations d’intérêt à des fins d’études de-meure un grand défi au vu du grand nombre de sources hétérogènes,du grand volume de données, des besoins et des connaissances diver-sifiées, etc. D’autre part, la temporalisation est devenue un enjeu crucialafin de garder les traces de l’évolution des données et d’améliorer la prisede décision clinique.
PROBLÉMATIQUE
L’approche préconisée consiste à construire un entrepôt de données (ED)en se basant sur un modèle de connaissance (ontologie) pour faciliterl’intégration des sources, l’extraction des informations et l’expression desrequêtes en faisant abstraction de la complexité de l’hétérogénéité. Lesméthodes de construction d’un ED temporalisées existantes possèdentdes limites nuisant à l’interopérabilité temporelle [1] et donc à l’exploitationde données (Figure 1).
Sn
…
S1
Hétérogénéité?
Transformation des connaissances
?
IS
CED
IE
MEC IMDIMC
AED
Assertions temporelles
?
Modèles de connaissances
Modèles temporels?
Automatisation?
Évolution?
Figure 1: Problématique de construction d’EDT.
BUT
Le but est d’élaborer une méthode semi-automatisée de constructiond’ED temporalisées sur la base des modèles approuvés par les analystes(ontologie de référence) et en recourant le moins souvent possible à desdécisions ad hoc.
MÉTHODE
La méthode est opérationnalisée par un atelier composé de plusieursmodules coordonnés par différents correspondeurs spécialisés pour as-surer une construction et une exploitation traçable (Figure 2).
Construction et évolution
Exploitation
Consultation
PM
Source1
Sourcen
GD
MC1
MCk
SE
CID
IMC IMDMEC
AI
CED
ED
SI SD
CIE CDE
GE
ED
Source1
Sourcen
PM GD
MC1
MCk
SE
SI SD
CIE CDE AED
ISI IED
CADGE
AI
ED
Source1
Sourcen
PM GD
MC1
MCk
SE
CID
IMC IMDMEC
CED
SI SD
CIE CDE AED
ISI IED
CADGE
ProcessusAED : alimentation de l’entrepôt de donnéesCAD : contrôle d’accès aux donnéesCED : construction de l’entrepôt de donnéesIMC : importation du modèle de connaissancesIMD : importation du modèle de donnéesMED : mise en correspondanceIS(I) : interaction système informationnelIE(D) : interaction entrepôt de données
Personnel médical
Gestinnaire de l’entrepôt
Gestinnaire de données
Analyste informatique
DépôtsCED : correspondeur entrepôt-donnéesCIE : correspondeur information-entrepôtCDE : correspondeur données-entrepôtSI : schéma d’informationSD : schéma de données
Figure 2: Atelier de construction, d’exploitation et de consultation d’un ED temporalisées.
CONCLUSION
Le système permet d’automatiser certaines décisions fondées sur descritères fondamentaux (théorie relationnelle), des critères de conception(normalisation, bitemporalité, etc.), de critères technologiques (choix duSGBDR d’hébergement, des primitives de temporalisation, du dialecteSQL, etc.). Le système assure également la mise en correspondancetraçable entre le modèle relationnel et le modèle ontologique. L’approchesemi-automatisée rendue possible par les ateliers est innovante dans lesens où, jusqu’à présent, les ED du domaine de la santé ont été dévelop-pés manuellement selon des règles ad hoc. Elle l’est également par laprise en compte d’un modèle temporel unifié et par l’intégration des con-traintes du domaine provenant du modèle de connaissances.
RÉFÉRENCES[1] Khnaisser, C., Lavoie, L., Diab, H., and Ethier, J.-F. 2015. Data Warehouse Design Methods Re-
view: Trends, Challenges and Future Directions for the Healthcare Domain. In: T. Morzy, P. Valduriezand L. Bellatreche, eds., New Trends in Databases and Information Systems. Springer InternationalPublishing, 76–87.
Courriel : [email protected]