redes semânticas de documentos de cti

20
Redes semânticas de documentos de CTI Brasilia, 23/05/2018 7

Upload: others

Post on 19-Jul-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Redes semânticas de documentos de CTI

Redes semânticas de documentos de CTI

Brasilia,

23/05/2018

7

Page 2: Redes semânticas de documentos de CTI

Slide 2

Principais métodos empregados nos estudos do CGEE

Page 3: Redes semânticas de documentos de CTI

Slide 3

[adj., v. kuh m-pleks, kom-pleks; n. kom-pleks]

–adjective

1.

composed of many interconnected parts; compound; composite: a complex highway system.

2.

characterized by a very complicated or involved arrangement of parts, units, etc.: complex machinery.

3.

so complicated or intricate as to be hard to understand or deal with: a complex problem.

Fonte: Dictionary.com

Sistemas Complexos

Complexity, a scientific theory which asserts that some systems display behavioral phenomena that are completely inexplicable by any conventional analysis of the systems’ constituent parts. These phenomena, commonly referred to as emergent behaviour, seem to occur in many complex systems involving living organisms, such as a stock market or the human brain.

Fonte: John L. Casti, Encyclopædia Britannica

Network Science: Introduction

Page 4: Redes semânticas de documentos de CTI

Slide 4

Hipótese de trabalho:

Inerente a cada sistema complexo existe uma

rede que descreve as relações entre seus

componentes.

Barabási : Network Science: Introduction

O papel das redes

Page 5: Redes semânticas de documentos de CTI

Slide 5

Redes e grafos

Rede = grafo

Um grafo é um conjunto de nós conectados por um

conjunto de arestas

1 12 3

4 45 56 6

2 3

Rede direcionada Rede não-direcionada

Page 6: Redes semânticas de documentos de CTI

Slide 6

Redes complexas reais

• Componente conectado gigante

• Distribuição de arestas do tipo lei de potência (scale-free)

• Small-world

• Existência de comunidades de nós densamente

interconectados

Fonte Albert Barabási6500 pesquisadores de 120 INCTS

Page 7: Redes semânticas de documentos de CTI

Slide 7

O que são as relações?

Duas entidades são conectadas se:

Têm ligações simbólicas ou físicas

Realizam os mesmos tipos de ações

Dividem antecedentes

Possuem características comuns

Ligam-se a entidades comuns

Realizam transações entre si

São referidas como um par

Referem-se a significados comuns

Combinações das alternativas acima

Page 8: Redes semânticas de documentos de CTI

Slide 8

Análise de redes no CGEE

Page 9: Redes semânticas de documentos de CTI

Slide 9

Análise de redes para identificação de

competências (individuais e de grupos de pesquisa)

Fonte: LattesRedes de coautorias

Redes de similaridade semântica

Coautoria

Similaridade

semântica

Coautoria e similaridade

semântica

Nó - pesquisador

Diametro - # de publicações

Capacidade atual – 30 mil currículos por extração

Page 10: Redes semânticas de documentos de CTI

Slide 10

Evolução de grupos/áreas de pesquisa

1982 1990 2000

2010 2014

Page 11: Redes semânticas de documentos de CTI

Slide 11

Análise de centralidade: betweeness

Identificação de atores com potencial de assumir o papel de pontes em redes

Melhor identificador de coordenadores de INCTs

Page 12: Redes semânticas de documentos de CTI

Slide 12

Análise de centralidade: eigenvector

Pesquisadores com produção mais representativa no contexto da rede, mas

há controvérsias

Page 13: Redes semânticas de documentos de CTI

Slide 13

Gestão do

Conhecimento

Mapeamento de competências (área de pesquisa:

redes)

Saúde

Inteligência

Artificial

Física

Ecologia

Desenvolvimento

de Software

Gestão

de Dados

Engenharia

Elétrica

Engenharia

de Redes

Inclui análise de centralidade

Page 14: Redes semânticas de documentos de CTI

Slide 14

Resultados inesperados: polímeros de silicona

Química/Engenharia Química

Odontologia

Page 15: Redes semânticas de documentos de CTI

Slide 15

Redes de pesquisadores agrupados por INCT e por modularidade

O lado esquerdo mostra grupos temáticos identificados (por cores) pelo

algoritmo de modularidade de uma parte da rede completa. No lado direito, cada

cor representa um INCT diferente.

Redes de similaridade semântica (cosseno)

Page 16: Redes semânticas de documentos de CTI

Slide 16

001302

000105

100010

310004

001000

250400

Representação matricial – Matriz de Adjacência

Cossenos tf.idf

35

1

26

4

24

1

3

5

1

1

Page 17: Redes semânticas de documentos de CTI

Slide 17

Cuttoff de similaridade de cosseno

Page 18: Redes semânticas de documentos de CTI

Slide 18

Page 19: Redes semânticas de documentos de CTI

Slide 19

Page 20: Redes semânticas de documentos de CTI

Slide 20

Obrigado

[email protected]