isis jam 3 - di-srv.unisa.itcordasco/seminari/jam3.pdf · vicino di casa, il compagno di scuola, il...

33
ISISJam 3 ISIS ISISJam Jam 3 Gennaro Cordasco GEOGRAPHIC ROUTING IN SOCIAL NETWORKS David Liben-Nowell, Jasmine Novak, Ravi Kumar, Prabhakar Raghavan, Andrew Tomkins Proceedings of the National Academy of Sciences, Vol. 102, No. 33. (2005), pp. 11623-11628.

Upload: lamtu

Post on 18-Feb-2019

219 views

Category:

Documents


0 download

TRANSCRIPT

ISISJam3

ISISISISJamJam33

Gennaro Cordasco

GEOGRAPHIC ROUTING IN SOCIAL NETWORKS

David Liben-Nowell, Jasmine Novak, Ravi Kumar, Prabhakar Raghavan, Andrew Tomkins

Proceedings of the National Academy of Sciences, Vol. 102, No. 33. (2005), pp. 11623-11628.

ISISJam3

OUTLINE

� Background

� Small-World

� Milgram Experiment

� Kleinberg’s Model

� LiveJournal� LiveJournal

� GeoGreedy

� Relazione fra amicizia e distanza

� Comparazione fra il modello di Kleinberg e LJ

� Distribuzione dei nodi in LJ

� Rank Based Friendship

09/06/2009 2ISISJam3: Geographic routing in social networks

ISISJam3

SMALL-WORLD: OBIETTIVO

� Trovare un modello che rispecchi le proprietà delle reti sociali

� Si ma… come sono strutturate le reti sociali?

� Intuizione: La maggior parte degli amici di una persona si trovano vicino (in senso geografico o per gusti, affinità ecc.) Esempi sono il vicino di casa, il compagno di scuola, il collega di lavoro.

Dunque le reti sociali sono più o meno 'grid-like':� Dunque le reti sociali sono più o meno 'grid-like':

Da questa osservazione

sembrerebbe che il diametro di

una rete sociale è O(√n)…. ma

non è così

09/06/2009 3ISISJam3: Geographic routing in social networks

ISISJam3

THE MILGRAM'S EXPERIMENT

� Le reti sociali funzionano e funzionano bene. Perché?

� Stanley Milgram (sociologo) condusse il seguente esperimento al fine di intuire il meccanismo alla base del funzionamento delle reti sociali:

� Milgram chiese and alcune persone scelte in maniera casuale in Kansas e Nebraska di inviare una lettera ad una persona (agente di Kansas e Nebraska di inviare una lettera ad una persona (agente di cambio) a Boston.

� Le uniche informazioni date a queste persone erano nome cognome e professione del destinatario.

� L‘unica operazione possibile per consegnare la lettera era di inoltrare la lettera ad una persona conosciuta.

09/06/2009 4ISISJam3: Geographic routing in social networks

ISISJam3

THE MILGRAM'S EXPERIMENT

� Le lettere che raggiunsero il target lo raggiunsero in media in 5.5 < 6 passi.

� Così venne coniato il termine "6 degrees of separation"

� Questo valore era di gran lunga inferiore a quello che ci si attendeva dalla assunzione che le reti sociali hanno una struttura 'grid-like'!

Ma il risultato di Milgram è importante perché non solo dimostra � Ma il risultato di Milgram è importante perché non solo dimostra che le reti sociali hanno un diametro atteso molto piccolo. Esso dimostra inoltre che esiste un algoritmo di routing (diverso dal flooding) semplice (lo conoscevano tutti) che permette di scoprire queste path corte.

Target raggiunto solo da 64 lettere su 296

09/06/2009 5ISISJam3: Geographic routing in social networks

ISISJam3

MODELLI TRADIZIONALI

� Random Graph� Gli archi sono creati in maniera casuale � Bassa average path length (≤ log n/log k) ☺� Basso coefficiente di Clustering C(G) ≈ k/n �

� Regular Networkk è il grado medio

Nessuno di questimodelli è in gradodi simulare le reti

reali

� Regular Network� Gli archi seguono una struttura� Alto average path length �

� Alto coefficiente di Clustering ☺

k è il grado mediodei nodi

09/06/2009 6ISISJam3: Geographic routing in social networks

ISISJam3

SMALL-WORLD NETWORKS

� Secondo Watts and Strogatz [WS98] una rete si dice Small world se rispetta le seguenti caratteristiche:� Ha un numero elevato di nodi (n >> 1)� Il grado dei nodi è basso (grado medio k << n)

� Ha un coefficiente di Clustering elevato (molto più grande di quello dei grafi casuali)

� Ha un coefficiente di Clustering elevato (molto più grande di quello dei grafi casuali)

� Ha una APL bassa (≈ log n, simile a quella di un grafo casuale)

09/06/2009 7ISISJam3: Geographic routing in social networks

ISISJam3

Coefficiente di Clustering vs Average Path length

WATTS AND STROGATZ MODEL

� Il diagramma mostra l‘evoluzione del coefficiente di Clustering e dell‘average pathlength in funzione di p.

� Risultati: Per piccoli valori di p

p (log scale)

Small World

� Risultati: Per piccoli valori di p il coefficiente di Clusteringrimane alto mentre l‘averagepath length decresce molto velocemente.

Le reti Small World networks combinano un alto

coefficiente di clustering con una bassa average path

length.

ISISJam3

IL MODELLO DI KLEINBERG

� Un aspetto fondamentale dell‘esperimento di Milgram è che le persone sono capaci di trovare le path ottimali (o quasi):� Da notare che ogni persona ‘vede‘ solo una piccola parte della

rete, vale a dire solo i propri vicini, ed usa quindi un algoritmo di routing decentralizzato.di routing decentralizzato.

� Il modello di Kleinberg può essere sintetizzato in questo modo:� Consideriamo un nodo v in una matrice d-dimensionale: v = (v1, v2, …, vd). vi è la posizione di v nella dimensione i.

� Ogni nodo conosce la proprio posizione, la posizione del target e la posizione dei propri vicini.

� Ogni nodo inoltra il messaggio al vicino u che si trova più vicino al target. La distanza fra due nodi d(v,t) è data dalla somma delle differenze delle posizioni (in valore assoluto) su ogni dimensione d(v,t) =Σdi=1|vi-ti| (Manhattan Distance).

09/06/2009 9ISISJam3: Geographic routing in social networks

ISISJam3

IL MODELLO DI KLEINBERG

� Consideriamo n nodi su una matrice a d dimensioni, ogni nodo ha

� (2d) vicini sulla griglia� k contatti (detti long-range) (ogni nodo v stabilisce k link

indipendentemente utilizzando una distribuzione di probabilità p(d(u,v)))

ISISJam3: Geographic routing in social networks

Di solito p(d(u,v)) è proporzionale a d(u,v)-α

coefficiente di normalizzazione

λ = ∑v d(u,v)-α

09/06/2009 10

ISISJam3

IL MODELLO DI KLEINBERG

� Teorema: L‘algoritmo di routing greedy è capace di trovare delle path brevi, vale a dire, path di lunghezza O(log2 n), da ogni sorgente a ogni destinazione se α = d.

p(d(u,v))= d(u,v)-α/λ

λ = ∑v d(u,v)-α

p(d(u,v))= d(u,v)-d /λ

λ = ∑v d(u,v)-d

ISISJam3

OUTLINE

� Background

� Small-World

� Milgram Experiment

� Kleinberg’s Model

� LiveJournal� LiveJournal

� GeoGreedy

� Relazione fra amicizia e distanza

� Comparazione fra il modello di Kleinberg e LJ

� Distribuzione dei nodi in LJ

� Rank Based Friendship

09/06/2009 12ISISJam3: Geographic routing in social networks

ISISJam3

LIVEJOURNAL

� LiveJournal (LJ) è il nome di un provider di weblog che permette agli utenti Internet di mantenere un blog online.

� Il software lato Server è open source. Fornisce anche delle API che permettono di scoprire le relazioni fra gli utenti.che permettono di scoprire le relazioni fra gli utenti.

� Feb, 2004:

� 1,312,454 bloggers

� 495,836 hanno fornito la loro posizione geografica nel loro profilo e si trovano negli USA.

� 384,507 (77.6%) costituiscono un grafo connesso

� 3,959,440 link (8 link in media per nodo)

09/06/2009 13ISISJam3: Geographic routing in social networks

ISISJam3

DEGREE DISTRIBUTION

� Distribuzione di tipo log-normal (invece che powerlaw)

09/06/2009 14ISISJam3: Geographic routing in social networks

ISISJam3

OBIETTIVI

� Effettuare un esperimento simile a quello di Milgram sul grafo ottenuto da LJ:

� Non è necessaria la collaborazione “volontaria” degli utenti (ci aspettiamo un percentuale di successo maggiore).

� E’ possibile implementare diversi algoritmi e testare le loro � E’ possibile implementare diversi algoritmi e testare le loro performance sullo stesso grafo.

09/06/2009 15ISISJam3: Geographic routing in social networks

ISISJam3

GEOGREEDY

� Partendo da un nodo sorgente ed un nodo destinazione scelti a caso.

� Ad ogni passo il nodo corrente contatta il vicino più vicino al nodo destinazione.

� Ci fermiamo quando raggiungiamo la città del target.

� GeoGreedy può fallire!!! (nessuno dei vicini permette di ridurre la distanza dal target).

09/06/2009 16ISISJam3: Geographic routing in social networks

ISISJam3

GEOGREEDY

� 500.000 tentativi

� 13% successo, media 4.12, deviazione standard 2.54

09/06/2009 17ISISJam3: Geographic routing in social networks

ISISJam3

GEOGREEDYMOD

� GeoGreedyMod: se il messaggio non può avanzare scegli a caso uno dei nodi nella tua stessa città e riparti da li:

� 80% successi

� Media 16.74

09/06/2009 18ISISJam3: Geographic routing in social networks

ISISJam3

RELAZIONI FRA AMICIZIA E DISTANZA

� Esiste “in qualche maniera” una relazione fra la distanza geometrica fra due nodi u e v e la probabilità che questi nodi siano amici

� Per ogni distanza δ, sia P(δ) il numero di link (u,v) tali che d(u,v)= δ

� Come previsto nel modello di Kleinberg al crescere di δ, P(δ) decresce

La tecnologia

09/06/2009 19ISISJam3: Geographic routing in social networks

La tecnologiapermette di

ridurre le distanzema non le annulla

ISISJam3

RELAZIONI FRA AMICIZIA E DISTANZA

� Analizzando nel dettaglio la figura si intuisce che per valori grandi di δ, la distanza non incide sulla probabilità che ci sia un link

� Ipotesi: P(δ)= ε + f(δ), ε viene calcolato campionando P(δ) per δgrande (più di 1000 km)

� ε=5.0x10-6 (la parte di P(δ) che non dipende dalla distanza)

Considerando che ogni nodo ha in media 8 link e che di questi 2.5 in media � Considerando che ogni nodo ha in media 8 link e che di questi 2.5 in media dipendono solo da ε, si può affermare che il 70% dei link è dipendente dalla distanza fra i nodi.

20

ISISJam3

RELAZIONI FRA AMICIZIA E DISTANZA

� P(δ)= ε + f(δ),

� Consideriamo adesso f(δ),

� Secondo il modello teorico definito da Kleinberg f(δ) dovrebbe essere circa 1/δ2

(considerando la superficie terrestre come una superficie piana bidimensionale)

� Inoltre se f(δ) = 1/δα con α ≠ 2, allora GEOGreedy non dovrebbe funzionare.

� Ma f(δ) = 1/δ1.2 quindi ci troviamo a una contraddizione!!!!

21

P(δ)= ε + f(δ),

ISISJam3

OUTLINE

� Background

� Small-World

� Milgram Experiment

� Kleinberg’s Model

� LiveJournal� LiveJournal

� GeoGreedy

� Relazione fra amicizia e distanza

� Comparazione fra il modello di Kleinberg e LJ

� Distribuzione dei nodi in LJ

� Rank Based Friendship

09/06/2009 22ISISJam3: Geographic routing in social networks

ISISJam3

DISTRIBUZIONE DEI NODI

Distribuzione deinodi non uniforme

09/06/2009 23ISISJam3: Geographic routing in social networks

ISISJam3

RANK BASED FRIENDSHIP (RBF) MODEL

� Idea: La distanza assoluta fra i nodi non è sufficiente a modellare i legami, è necessario prendere in considerazione anche la densità della popolazione:

� Formalmente, il rango di v rispetto ad u è definito come

� Nel modello RBF, la probabilità che ci sia un link da u a v

� Il modello RBF comprende il modello di Kleinberg (quando il numero di dimensioni è costante).� In una griglia a s=O(1) dimensioni, ranku(v) ≈ O(δs) (dove δ=d(u,v) sulla

griglia)

09/06/2009 24ISISJam3: Geographic routing in social networks

ISISJam3

RANK BASED FRIENDSHIP (RBF) MODEL

� La dimensione frazionale (fractional dimension) di una rete è definita come l’esponente α tale che ranku(v) ≈ c × d(u,v)α

� Nel caso di LJ α=0.8

� Teorema

Sia N una griglia a k dimensioni e sia P una popolazione di di n persone, distribuita in maniera arbitraria su N, che utilizza una rankbased friendship. Utilizzando l’algoritmo GEOGREEDY, la distanza attesa di una path fra due persone s e t ∈ P è c × log3 n

(c è indipendente da n,N,P, ma dipende da k).

09/06/2009 25ISISJam3: Geographic routing in social networks

ISISJam3

RANK BASED FRIENDSHIP (RBF) MODEL

Teorema

Sia N una griglia a k dimensioni e sia P una popolazione di di n persone, distribuita in maniera arbitraria su N, che utilizza una rank based friendship. Utilizzando l’algoritmo GEOGREEDY, la distanza attesa di una path fra due persone s e t ∈ P è c × log3 n

(c è indipendente da n,N,P, ma dipende da k).

Prova

Scegliamo s e t in maniera casuale

09/06/2009 26ISISJam3: Geographic routing in social networks

s

t

d(s,t)<2i

2i-1<d(s,t)<2i

Diametro 2i-1

Pr[sfera blu]=(c log2 n)-1

ISISJam3

RANK BASED FRIENDSHIP (RBF) MODEL

� Teorema

Sia N una griglia a k dimensioni e sia P una popolazione di di n persone, distribuita in maniera arbitraria su N, che utilizza una rankbased friendship. Utilizzando l’algoritmo GEOGREEDY, la distanza attesa di una path fra due persone s e t ∈ P è c × log3 n

(c è indipendente da n,N,P, ma dipende da k).(c è indipendente da n,N,P, ma dipende da k).

� Differenze rispetto al modello di Kleinberg

� O(log3 n) vs O(log2 n)

� Expected APL vs Expected diameter

� dipende da k (# dimensioni) vs non dipende da k.

09/06/2009 27ISISJam3: Geographic routing in social networks

ISISJam3

RBF AND LJ

09/06/2009 28ISISJam3: Geographic routing in social networks

ISISJam3

RBF AND LJ

� Dimensione della griglia = N1/2 × N1/2

� Ogni posizione (x,y) è caratterizzata da una popolazione p(x,y) che corrisponde al

numero di nodi all’interno della cella (∑(x,y) p(x,y) = n)

� Si assume p(x,y)>0

Ogni nodo ha 4 connessioni N S W E,

scegliendo un nodo a caso fra le celle vicine

09/06/2009 29ISISJam3: Geographic routing in social networks

scegliendo un nodo a caso fra le celle vicine

Una ulteriore connessione è scelta usando il rank

Non ci sono dati sufficienti per calcolare il rango corretto di tutti. (Si usa un rango medio)

Dimensione media delle celle 1,300.

ISISJam3

RBF AND LJ

09/06/2009 30ISISJam3: Geographic routing in social networks

ISISJam3

RBF AND LJ

09/06/2009 31ISISJam3: Geographic routing in social networks

ISISJam3

CONSIDERAZIONI

� Ancora non esiste un modello universalmente riconosciuto per descrivere le reti sociali

� Il risultato principale di questo lavoro è che il modello di Kleinberg ha dei limiti.

� RBF è un passo avanti, ma non basta!!!� RBF è un passo avanti, ma non basta!!!

09/06/2009 32ISISJam3: Geographic routing in social networks

ISISJam3

NELLA PROSSIMA MARMELLATA…

Exploring the Multiple-GPU Design SpaceDana Schaa and David Kaeli

Department of Electrical and Computer Engineering

Northeastern University

Best Paper IPDPS 200933