multi-dimensional service-oriented ontology mapping nuno alexandre pinto da silva
TRANSCRIPT
Multi-Dimensional Service-Oriented Ontology Mapping
Nuno Alexandre Pinto da Silva
2
Análise do problema
• Observações
• Necessidade de automatizar o processo de interoperabilidade
• Diferentes comunidades de informação
• Diferentes conceptualizações de domínios parcialmente sobrepostos
• Interoperabilidade baseada em dados ou informação
Problema
É pouca e pobre a interoperabilidade automática entre
diferentes comunidades de informação
3
Objectivos
Investigação dum processo semi-automático de mapeamento de ontologias que facilite a interoperabilidade baseada em conhecimento
entre entidades heterogéneas.
Desenvolvimento de ferramentas que permitam avaliar a viabilidade e utilidade das ideias resultantes da investigação realizada,
nomeadamente no contexto da Web Semântica.
4
Requisitos identificados
• Áreas analisadas
• Sistemas de informação
• Web semântica
• Organizações virtuais e Negócios electrónicos
• Gestão do conhecimento
• Requisitos
• Identificação, especificação e representação de relações entre conceptualizações
• Transformação da informação das comunidades de acordo com as relações
anteriores
• Negociação das relações anteriores entre comunidades de informação
• Manutenção das relações anteriores
• Integração (mas minimização da participação do) ser humano no processo
• Adopção de tecnologia do âmbito da web semântica
5
Ontologia
• “ontologia é uma especificação explícita duma conceptualização ” (Gruber, 1993)
• “ontologia é uma especificação explícita e formal duma conceptualização
partilhada” (Studer et al., 1998)
• Ontologia vs. Esquema de base de dados
• Ontologia descreve um domínio de conhecimento segundo uma perspectiva
-nome-género
O1:Indivíduo
O1:Familia
-nome-sobrenome-num_casamentos-endereço
O2:Pessoa
O2:Homem
O2:Mulher
esposoEm
-rua-localidade
O1:Endereço
viveEm
6
Ontologia
Conceitos
Hierarquia de conceitos
Propriedades
Propriedades e conceitos
Nível Léxico
Nível semântico
Modelo de Ontologia
2_ ,is a Mulher Pessoa
1 : ,esposoEm Indivíduo Família
2 2 2: " " , , (" ", ,Person Person Pessoa P PL L
2 : , ,Pessoa Mulher HomemC
_is a C C
: , ,esposoEm nome rua1P
: 2 \ 2 \Literal CCP \
: , , , C P C PL L L
,1max_cardinality género
2 2 2 2 2 2: , _ , ,is a O C P L A
-nome-género
O1:Indivíduo
O1:Familia
-nome-sobrenome-num_casamentos-endereço
O2:Pessoa
O2:Homem
O2:Mulher
esposoEm
-rua-localidade
O1:Endereço
viveEm
: , _ , , , ,is a O C P L A
P
C
A
7
Base de Conhecimento
Instâncias de conceitos
Instanciação de conceitos
Instanciação de propriedades
Modelo de Base de Conhecimento
: , , ,inst instKB O I C P
nome = Napoleongénero = Bonapart
i1 : O1:Indivíduo
rua = Versailleslocalidade = Paris
e1 : O1:Endereço
rua = Scholburglocalidade = Wien
e2 : O1:Endereço
f1 : O1:Familia
f2 : O1:Familia
: 2inst IC C
1 1 1 1 1: , , ,inst instKB O I C P
1 : 1, 1, 2, 1, 2," "," ",...i e e f f Versailles ParisI
1 : , 1, 2 , , " "," "inst Pessoa i i Literal Paris VersaillesC
1 : 1, 1 , 1," "inst viveEm i e rua e VersaillesP: 2 2inst C CP P
I
8
Mapeamento de Ontologias
Um processo em duas fases:
1. A nível Intencional• Especificação de relações semânticas entre• Entidades da ontologia de origem (i.e. conceitos, relações, atributos), e
• Entidades da ontologia de destino
2. A nível Extensional• Executar as relações semânticas especificadas,• Transformando instâncias da ontologia de origem em• Instâncias da ontologia de destino
9
Nív
el E
xte
nsi
on
al
nome = Napoleon Bonapartgénero = M
i1 : O1:Indivíduo
nome = Joséphine de Tashergénero = F
i2 : O1:Indivíduo
Nív
el In
tenc
iona
l
-nome-género
O1:Indivíduo -nome-sobrenome-endereço-num_casamentos
O2:Pessoa
Ou seja…
O1:Indivíduo é semanticamenteequivalente a O2:PessoaeO1:Indivíduo.nomeé semanticamente equivalente aO2:Pessoa.nome eO2:Pessoa.sobrenome
Transformação
nome = Napoleonsobrenome = Bonapartendereçonum_casamentos
p1 : O2:Pessoa
nome = Joséphinesobrenome = de Tasherendereçonum_casamentos
p2 : O2:Pessoa
10
Interfacegráfica
Conhecim.&
Restriçõesdo
Domínio
Conhecim.&
Restriçõesdo
Domínio
EspecificaçãoEspecificação
Medição de SemelhançasMedição de Semelhanças
ExecuçãoExecução
MAFRA – MApping FRAmework
„Lift“ & Normalização
Pós-processamento
NegociaçãoEvoluçãoInterfacegráfica
11
Conceptualização
• Tipos de heterogeneidade• Sintáctica
• Modelo
• Semântica
• Dimensões identificadas das relações semânticas:• Tipos de entidades
• Transformação
• Cardinalidade
• Restrições
• Estrutura
-nome-género
O1:Indivíduo
O1:Familia
-nome-sobrenome-num_casamentos-endereço
O2:Pessoa
O2:Homem
O2:Mulher
esposoEm
-rua-localidade
O1:Endereço
viveEm
Conceito-Conceito c/ condição
Conceito-Conceito
Conceito-Atributo
Relação-Atributo
Atributo-Atributos
12
Mapeamento
ConceptBridge (CB)
PropertyBridges (PB)
Serviços
Relação entre CBs e PBs
Hierarquia entre CBs
I2M : ConceptBridge
if género=”F”
e2nC : PropertyBridge
service=CountRelations
I2H : ConceptBridgeif género=”M”
-nome-género
O1:Indivíduo
O1:Familia
-nome-sobrenome-num_casamentos-endereço
O2:Pessoa
O2:Homem
O2:Mulher
esposoEm
-rua-localidade
O1:Endereço
viveEm
Representação – Semantic Bridging Ontology (SBO)
1 1 2 1 1 1 1 1 1 1 1 1: , , , , , , , , , , C P C PC P B B B BM O O T B B A A
I2P : ConceptBridge
n2ns : PropertyBridge
AB : AB-of-ConceptBridge
abstract=true
12 : , , , , , , , , ,s t s tn ns B nome nome sobrenome Split P PQ K B
12 : , , , , ,s tI P B Indivíduo Pessoa C CQ K B
1: " . . ", , , ,s tSplit Service pt mafra Split sourceAttribute arrayOfAttributes T
1: , , ,Mulher Pessoa Homem Pessoa
1 : 2 ,{ 2 , 2 }I P n ns e nC
service=Split
13
Representação - Semantic Bridging Ontology (SBO)
• SBO é uma ontologia acerca do processo de mapeamento entre ontologias
• SBO é uma meta-ontologia
• Instanciação de SBO é um mapeamento entre ontologias
• Trata-se de:• Taxonomia de relações semânticas (pontes semânticas)
• Relações entre pontes semânticas
• Caracterização semântica das pontes semânticas e das suas relações
• Mecanismos de transformação
• Mecanismos de controlo do fluxo de transformação
• Mecanismos de manipulação das entidades das ontologias
• Caracterização semântica das relações entre pontes semânticas e entidades
• Implementada completamente em código Java
• Implementada parcialmente em RDFS e DAML+OIL
14
• Processo em duas fases
• Vantagens:
• Inexistência de ordem de execução entre pontes semânticas
• Especificação e compreensão simples do mapeamento
• Execução determinística
Execução
Execução de
ConceptBridges
BC deorigem
BC dedestino
Execução de
PropertyBridges
15
ID da instância de
origem
ID da instância de
destino ConceptBridge
p1 pX CB1 e1 eY CB2 e2 eZ CB2
Execução – Transformation Information Table (TI2)
-nome
O1:Pessoa-nome-sobrenome
O2:Pessoa
nome
p1 : O1:Pessoa
O1:Endereço O2:Endereço
viveEm viveEm
e1 : O1:Endereço
e2 : O1:Endereço
nomesobrenome
pX : O2:Pessoa
ExecuçãoeY : O2:Endereço
eZ : O2:Endereço
PB1 : PropertyBridge
CopyRelation : Service
CB1 : ConceptBridge
CB2 : ConceptBridge
ID da instância de
origem Pessoa/ viveEm/ Endereço
p1 e1
p2 e2
Interrogação e Filtragem
16
Execução – Especificação extensional
-nome-género
O1:Indivíduo
O1:Familia
-nome-sobrenome-num_casamentos-endereço
O2:Pessoa
esposoEm
-rua-localidade
O1:Endereço
viveEm
nomesobrenomenum_casamentosendereço = Porto
Vila Real
pX : O2:Pessoa nomegénero
p3 : O1:Indivíduo
Execução
CB3 : ConceptBridge
rualocalidade
e3 : O1:Endereçorualocalidade
e4 : O1:Endereço
ID da instância de origem
Especificação extensional ID da
instância de destino
ConceptBridge
pX p3 CB3 pX Pessoa/ endereço/ Literal=”Porto” e3 CB4 pX Pessoa/ endereço/ Literal=”Vila Real” e4 CB4
PB2 : PropertyBridge
ID da instância de origem
Pessoa/ endereço/ Literal
pX “Porto”
pX “Vila Real”
Interrogação e Filtragem
CB4 : ConceptBridge
endereço==endereço
17
Serviços Multi-dimensionais
• Observações
• Capacidade de transformação virtualmente incompleta
• Papel central dos serviços de transformação
• Especificação
• Negociação
• Evolução
• Proposta
• Serviços competentes em diversas fases do processo (multi-dimensionais)
• Serviços independentes das fases do processo de mapeamento
• Serviços auto-caracterizados
• Serviços automaticamente interligáveis com o resto do sistema
18
Arquitectura de sistema
MAFRA Service Interface (API)
Split
Copy
Inst
ance
Copy
Re
latio
n
Copy
Attri
bute
Conca
tenate
Curr
ency
Co
nve
rter
Serv
ice X
Attrib
ute
Table
Tra
nsl
atio
n
EspecificaçãoManual
EspecificaçãoAutomática
Execução Negociação Evolução
Instânciasorigem
Instânciade SBO
Ontologia origem Semantic BridgeOntology
Ontologia destino
Medição deSemelhanças
Esquema origem Esquema destino
Instânciasdestido
DB
Instâncias origem
DB
Instâncias destino
MAFRA Core Engine
“Lift” & Normalização
19
Processo automático de especificação
BC deorigem
BC dedestino
Clustering
CopyInstance
Split
CopyAttribute
CopyRelation
serviços
Currency Converter
Matching
MOMIS like
Resnik like
Type matcher
Hyponymic
Matcher Y
matchers
Semantic Bridging
serviços
SBO
CopyInstance
Split
CopyAttribute
CopyRelation
Currency Converter
Clusters
,Service Matches
Matches
, , , ,SE TE Matcher Value Justifications
20
Implementação – MAFRA Toolkit
21
• Projectos nacionais
• Projectos internacionais
Aplicações
• OntoMapper I&D de soluções de mapeamento entre ontologias
• SANSKII&D de soluções e interoperabilidade baseada em conhecimento na empresa virtual
• Harmonise Interligação entre grandes operadores turísticos
• Artemis Interligação de informação de repositórios de informação médica
• Satine Interligação entre pequenas e médias empresas de turismo
• Harmo-TENfollow up do projecto Harmonise, com vista a desenvolver soluções pré-comerciais
22
Experiências
• Harmonise
Ontologia
Alojamento Eventos
ConceitosPropriedes
ConceitosPropriedades
Atributos Relações Atributos Relações
IMHO 136 340 543 86 174 328
MEK 2 104 1 1 47 0
TIS 26 57 26 38 41 38
WoW - - - 20 40 20
Alojamento
Ontologia origem Ontologia destinoConceptBridge
sPropertyBridge
s
IMHO WoW 12 33
WoW IMHO 26 64
IMHO MEK 1 39
MEK IMHO 28 70
TIS IMHO 23 46
Eventos
Ontologia origem Ontologia destino ConceptBridges
PropertyBridges
MEK IMHO 26 74
IMHO TIS 11 45
23
Comparação
• MAFRA Toolkit vs. OntoMerge
Características OntoMerge MAFRA Toolkit
Estratégia de mapeamentoMapping através de
mergingMapping puro
Representação das pontes semânticas
Axiomas em Web-PDDL Instâncias RDF de SBO
Estratégia de execução Inferência Funcional
Representação de Ontologia Web-PDDL RDFS com ext. léxicas
Representação de BC Web-PDDL RDF
Input Ficheiro RDF na Web Ficheiro RDF
Output Ficheiro RDF na Web Ficheiro RDF
Ambiente de execução Web Java virtual machine
Disponibilidade Privado Público
OntoMerge MAFRA Toolkit
Pentium III 800 MHz Pentium II Pentium 4M
Experiência em 2002
Experiência em 2003 Experiências em 2003
1320 segundos 59 segundos< 120 segundos
< 77 segundos
24
Conclusões (1)
• MAFRA – MApping FRAmework
• Sistematiza e organiza as fases do processo de mapeamento de ontologias
• Propõe e representa um processo de mapeamento
• Processo iterativo e interactivo
• Funciona como uma ferramenta de classificação e caracterização e trabalhos
relacionados
• Semantic Bridging Ontology (SBO)
• Conceptualização do problema de especificação de relações semânticas
• Conceptualização simples e compacta
• Completamente formalizada
• Método declarativo da representação das relações semânticas
• Possibilidade de múltiplas notações e sintaxes
25
Conclusões (2)
• Processo de execução
• Processo genérico baseado em cinco fases: interrogação-filtragem-transformação-
filtragem-instanciação
• Processo funcional suportado por serviços externos
• Restrições de execução sobre ambas as bases de conhecimento
• Formalização completa baseada em álgebra relacional
• Especificação extensional
• Arquitectura baseada em serviços multi-dimensionais
• Serviço é promovido a Serviço Multi-dimensional
• Serviços independentes das fases do processo de mapeamento
• Serviços auto-descritivos e auto-caracterizáveis
• Serviços dinamicamente interligáveis
26
Conclusões (3)
• Processo automático de especificação de pontes semânticas
• Caso de teste da arquitectura baseada em serviços multi-dimensionais
• Serviços parameterizáveis
• Matches são entidades genéricas e independentes do sistema
• Adopta, segue e explora a caracterização semântica proposta na SBO
• Gera um mapeamento válido
• MAFRA Toolkit
• Aplicações e Experiências
• Diversas áreas de aplicação
• Diversos projectos internacionais
27
Trabalho futuro
• Combinação de serviços
• Abstração da representação da especificação extensional
• Processo automático de especificação
• Melhoria da interface gráfica
• Evolução
• Negociação
• Integração em sistemas de terceiros
• Re-engenharia do MAFRA Toolkit
• Standardização
• Experiências
28
Publicações mais relevantes
• “Multi-Dimensional Service-Oriented Ontology Mapping”; Nuno Silva e João Rocha; International Journal of Web Engineering and Technology; Inderscience Publishers; aceite para publicação.
• “Proposal for the combination of ontology assemble and ontology mapping processes”; Nuno Silva, Jorge Santos e João Rocha; ICKEDS’2004; Porto, Portugal; Julho de 2004.
• Semantic Web Complex Ontology Mapping; Nuno Silva e João Rocha; Web Intelligence and Agent Systems Journal; 1(3-4) 235-248; IOS Press; 2003.
• “Ontology Mapping for Interoperability in Semantic Web”; Nuno Silva e João Rocha; ICWI'2003; Algarve, Portugal; Novembro de 2003.
• “Service-Oriented Ontology Mapping System”; Nuno Silva e João Rocha; ISWC’2003 Workshop on Semantic Integration; Sanibel Island (FL), EUA; Outubro de 2003.
• “E-Business Interoperability through Ontology Semantic Mapping”; Nuno Silva, João Rocha e José Cardoso; PRO-VE’2003; Lugano, Suiça; Outubro de 2003.
• “Semantic Web Complex Ontology Mapping”; Nuno Silva e João Rocha; IEEE Web Intelligence 2003 conference; Halifax, Canada; Outubro de 2003.
• “MAFRA – An Ontology MApping FRAmework for the Semantic Web”; Nuno Silva e João Rocha; 6th BIS; Colorado Springs (CO), EUA; Maio de 2003.
• “MAFRA - A Mapping Framework for Distributed Ontologies”; A. Maedche, B. Motik, N. Silva, R. Volz; 13th EKAW, Madrid, Espanha, Setembro de 2002.
• “MAFRA - A Mapping Framework for Distributed Ontologies in the Semantic Web”; A. Maedche, B. Motik, N. Silva, R. Volz; ECAI WS on Knowledge Transformation; Lyon, França, Julho de 2002.
• “Merging Ontologies using a Bottom-up Lexical and Structural Approach”; Nuno Silva e João Rocha; 7th ISKO; Granada, Espanha; Julho de 2002.
Multi-Dimensional Service-Oriented Ontology Mapping
Nuno Alexandre Pinto da Silva