docente: vincenzo aulettalibeccio.di.unisa.it/socialnetworks_2015/slide/web.pdf · equilibrium a...

14
STRUTTURA DEL WEB STRUTTURA DELLE RETI SOCIALI A.A. 2014/15 Docente: Vincenzo Auletta

Upload: others

Post on 23-Aug-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

STRUTTURA DEL WEB

STRUTTURA DELLE RETI SOCIALI A.A. 2014/15

Docente: Vincenzo Auletta

Page 2: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 RETI DI INFORMAZIONI

¢  Fino ad ora ci siamo interessati soprattutto di reti sociali �   I nodi della rete erano entità sociali che interagivano con

altri soggetti e prendevano delle decisioni �   I link della rete rappresentavano opportunità di relazioni

sociali ed economiche tra coppie di entità

¢  Le reti di informazioni sono reti costituite da pezzi di informazione (documenti) collegati tra loro �   Esiste un link tra due documenti se sono collegati

¢  Esempi di reti di informazione �   Web (nostro principale argomento)

1

Page 3: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 RETI SOCIALI E RETI DI INFORMAZIONE

¢  Le reti di informazioni differiscono dalle reti sociali perché �   I nodi non sono soggetti autonomi e non prendono

decisioni �   I collegamenti sono unidirezionali

v   In un documento X si può far riferimento ad un documento Y

v  non è detto che Y faccia riferimento ad X

¢  Le reti di informazioni mostrano numerose caratteristiche comuni con le reti sociali �   Componente gigante �   Un gran numero di percorsi brevi �   Misure di centrality �   Connessioni con i matching markets

2

Page 4: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 IL WORLD WIDE WEB

¢   Il Web è il più grande e popolare esempio di rete di informazioni �   Creato da Tim Barners-Lee tra il 1989-1991 come

strumento per rendere facilmente disponibili e fruibili i risultati dei vari gruppi di ricerca ll’interno del CERN

3

¢   Idee base del progetto di Barners-Lee �   Documenti realizzati in un formato testuale standard (pagine

html) e resi disponibili in una zona del computer pubblicamente accessibile (web server)

�   un’applicazione (browser) specializzata per accedere alle pagine, visualizzarne il contenuto e navigarle

¢   Il Web oggi è un gigantesco sistema informativo costituito da miliardi di pagine �   Le singole pagine sono realizzate da soggetti differenti che

decidono autonomamente di renderle disponibili e le collegano ad altre pagine

Page 5: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 IPERTESTI

¢  Il Web è un’ipertesto �   non deve necessariamente essere letto sequenzialmente �   È possibile spostarsi da una pagina ad un’altra seguendo i

collegamenti v   I collegamenti sono predisposti dall’autore del testo

¢  Gli ipertesti sono stati introdotti a metà del XX secolo per rendere più fruibili i testi

¢  Precursori degli ipertesti �   Reti di Citazioni e cross-reference

v  Differiscono dai link dell’ipertesto perché un documento può citare solo i documenti creati prima di lui

�   Wiki �   Memorie associative �   Reti semantiche

4

Page 6: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014

RETI DI RIFERIMENTI 5

13.2. INFORMATION NETWORKS, HYPERTEXT, AND ASSOCIATIVE MEMORY397

Nash

Equilibrium

A Beautiful

Mind (film)

Apollo 13

(film)

Game

Theory

John Forbes

Nash

Ron Howard

NASA

Conspiracy

Theories

RAND

Figure 13.4: The cross-references among a set of articles in an encyclopedia forms another kind of infor-mation network that can be represented as a directed graph. The figure shows the cross-references among aset of Wikipedia articles on topic in game theory, and their connections to related topics including popularculture and government agencies.

how it’s possible to get from the article on Nash Equilibrium to the article on NASA (the U.S.

National Aeronautics and Space Administration) by passing through articles on John Nash

(the creator of Nash equilibrium), A Beautiful Mind (a film about John Nash’s life), Ron

Howard (the director of A Beautiful Mind), Apollo 13 (another film directed by Ron Howard),

and finally on to the article about NASA (the U.S. government agency that managed the

real Apollo 13 space mission). In short: Nash equilibrium was created by someone whose

life was the subject of a movie by a director who also made a movie about NASA. Nor

is this the only short chain of articles from Nash equilibrium to NASA. Figure 13.4 also

contains a sequence of cross-references based on the fact that John Nash worked for a period

of time at RAND, and RAND is the subject of several conspiracy theories, as is NASA.

These short paths between seemingly distant concepts reflect an analogue, for information

Page 7: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 VANNEVAR BUSH ED IL MEMEX

¢  Gran parte delle caratteristiche attuali del Web sono state predette e descritte con straordinaria precisione nel 1945 da Vannevar Bush �   As we May Think – Atlantic Monthly

6

¢   Bush immaginò che i futuri computer avrebbero sostituito i metodi tradizionali di memorizzazione lineare delle informazioni con meccanismi associativi �   più simili a quelli del nostro cervello

¢  Bush immaginò un prototipo chiamato Memex �   Molto simile al Web attuale �   Conteneva versioni digitalizzate di tutta la conoscenza

umana connesse da collegamenti associativi

Page 8: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 L’EVOLUZIONE DEL WEB

¢  Negli ultimi 25 anni il Web si è evoluto ed è diventato anche una grande piattaforma di calcolo

¢  Ad oggi le pagine web sono di due tipi �   Pagine statiche che forniscono pezzi di informazione �   Pagine dinamiche che presentano l’output di un programma

eseguito sul server

¢  Allo stesso modo i link possono essere �   Llink navigazionali

v   Permettono di navigare tra le pagine statiche e di raggiungere le pagine dinamiche

v   Rappresentano la struttura del Web �   Link transazionali

v   Permettono di lanciare l’esecuzione di un’applicazione

¢   I motori di ricerca prendono in considerazione solo le pagine raggiungibile tramite link navigazionali

7

Page 9: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 IL WEB COME GRAFO DIRETTO

¢  Il Web e le reti di informazioni possono essere rappresentate come grafi diretti �   Consideriamo solo i link navigazionali

¢  Il grafo del Web è �   Diretto �   Sconnesso

¢  Possiamo applicare al Web concetti di path, connettività e componenti connesse

¢  Una componente fortemente connessa S di un grafo diretto è un sottinsieme di nodi tali che �   Ogni nodo di S è collegato a tutti gli altri nodi dell’insieme �   Il sottinsieme S è massimale

8

Page 10: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 ESEMPIO 9

13.3. THE WEB AS A DIRECTED GRAPH 403

I'm a student at Univ. of X

Company Z's home page

Our Founders

Press Releases

Contact Us

Univ. of X

Classes

Networks

Networks class blog

Blog post about college rankings

I teach at Univ. of X

USNews: College

Rankings

USNews: Featured Colleges

Blog post about

Company Z

I'm a applying to college

My song lyrics

Figure 13.6: A directed graph with its strongly connected components identified.

Page 11: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 LA STRUTTURA DEL WEB

¢  Nel 1999 Broder ed altri hanno creato una mappa del Web del tempo �   Basata sui dati immaganizzati nell’indice del motore di

ricerca Altavista

¢  L’esperimento di Broder è stato replicato numerose volte, sia sul Web che su altre reti di informazioni �   Google �   Wikipedia �   Reti di citazioni di articoli scientifici �   Rete di prestiti interbancari

¢  Tutti gli esperimenti hanno mostrato che queste reti hanno strutture simili �   Componente gigante

10

Page 12: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 CLASSIFICAZIONE DELLE COMPONENTI DEL WEB ¢  Il gruppo di Broder ha classificato le componenti

fortemente connesse del Web in tre tipi �   CORE: componente gigante in cui ogni pagina può

raggiungere tutte le altre �   IN: nodi che possono raggiungere il CORE ma non possono

essere raggiunte da questo �   OUT: nodi che possono essere raggiunti dal CORE ma non

lo possono raggiungere �   TENDRILS: nodi che possono essere raggiunti da IN o

raggiungere OUT �   NODI ISOLATI: tutto il resto

¢  Con la creazione di nuovi link pagine in IN e OUT passano in CORE e vengono sostituiti da nuove pagine appena create

11

Page 13: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 LA BOW-TIE STRUCTURE 12

13.4. THE BOW-TIE STRUCTURE OF THE WEB 405

Figure 13.7: A schematic picture of the bow-structure of the Web (image from [81]).

13.4 The Bow-Tie Structure of the Web

In 1999, after the Web had been growing for the better part of a decade, Andrei Broder and

his colleagues set out to build a global map of the Web, using strongly connected components

as the basic building blocks [81]. For their raw data, they used the index of pages and links

from one of the largest commercial search engines at the time, AltaVista. Their influential

study has since been replicated on other, even larger snapshots of the Web, including an

early index of Google’s search engine [57] and large research collections of Web pages [134].

Similar analyses have been carried out for particular well-defined pieces of the Web, including

the links among articles on Wikipedia [84].

A Giant Strongly Connected Component. A “map” of the Web clearly can’t resemble

a map of the physical world in any serious sense, given the scale and complexity of the network

being analyzed. Rather, what Broder et al. [81] wanted was something more conceptual —

Page 14: Docente: Vincenzo Aulettalibeccio.di.unisa.it/SocialNetworks_2015/slide/web.pdf · Equilibrium A Beautiful Mind (film) Apollo 13 (film) Game Theory John Forbes Nash Ron Howard NASA

Arch

itettura

deg

li Ela

bo

rato

ri – Au

tun

no

2014 L’EMERGENZA DEL WEB 2.0

¢   Negli ultimi 10 anni il contenuto informativo del Web si è arricchito enormemente

¢   Le principali trasformazioni sono state �   Diffusione di siti che permettono a più persone di creare e

mantenere contenuti condivisi (Wikipedia) �   Sviluppo di applicazioni sociali che enfatizzano il collegamento tra

le persone e non solo tra i documenti (facebook) �   Trasferimento di moltissime informazioni personali online (google

services, cloud)

¢   Tim ‘O Reilly ha definito queste trasformazioni come l’emergenza del Web 2.0 �   Un’attitudine più che una nuova tecnologia

¢   I protettisti di siti web non possono prescindere dal considerare gli effetti di feedback sociale �   Wisdom of crowds, long tail, cascading behaviours

13