sebastien schnettler a structure overview of 50 years of small-world research social networks,...
TRANSCRIPT
Sebastien SchnettlerA Structure Overview of 50 years of small-world researchSocial Networks, 31:165-178, 2009
Samuel THIRIOT (IRIT-UT1)
Séminaire réseaux, 08/01/2010
2
Introduction Sebastian Schnettler
– Center for Research on Inequality and the Life Course (CIQLE)
– Yale University But du papier: donner
un aperçu synthétique des recherches sur le « small-world »
Article dense, nombreuses références
Plan:
– Historique– Taxinomie & review– Quelques réflexions
3
Histoire
Milgram: The small-world Problem
1998: Watts & Strogatz
1998 – nos jours : modèles formels
4
Histoire
1902: Guglielmo Marconi (physicien Italien, prix Nobel 1902): combien de stations radio sont nécessaire pour couvrir le monde ?
1929: Nouvelle du Hongrois Frigyes Karinthy: Chaînes (« Lánceszemek »), 1929
1949 (1979): De Sola Pool & Kochen: Contacts and Influence
Milgram: The small-world Problem
1989-1998: le point
1998: Watts & Strogatz
1998 – nos jours : modèles formels
5
1900: Premières traces non académiques
Guglielmo Marconi (physicien Italien, prix Nobel 1902): combien de stations radio sont nécessaire pour couvrir le monde ?
Fin de la Ière guerre mondiale. On cherche à optimiser les cités, le trafic, etc.
Nouvelle du Hongrois Frigyes Karinthy: Chaînes (« Lánceszemek »), 1929
« Un jeu fascinant naquit de cette discussion. L'un de nous suggéra de préparer l'expérience suivante afin de prouver que la population de la planète est plus proche ensemble maintenant qu'elle ne l'a jamais été dans le passé. Nous devrions sélectionner n'importe quelle personne des 1,5 milliards d'habitants de la planète, n'importe qui, n'importe où. Il paria que, utilisant pas plus de cinq individus, l'un d'entre eux étant une connaissance personnelle, il pourrait contacter les individus choisis utilisant rien d'autre que le réseau des connaissances personnelles. »
6
Premières traces académiques
Ithiel de Sola Pool & Manfred Kochen rédigent en 1958 un document de travail sur les réseaux, “Contacts and Influence”, qui circulera pendant 20 ans parmi les chercheurs.
Définition intuitive du phénomène small-world: “My, it’s a small world !”
« il est pratiquement certain que deux individus au hasard peuvent se contacter au moyen d'au moins deux intermédiaires. Dans une population structurée socialement cela est moins possible mais reste encore probable. Et peut-être pour la population mondiale entière, on aura besoin probablement seulement d'un seul individu de plus. »
Contacts and Influence sera finalement publié dans le tout premier numéro de Social NEtworks (1978)
Milgram travaille avec de Sola Pool & Kochen à Paris
7
Expérience de Milgram
Milgram crée une expérience pour vérifier l’effet small-world, par l’envoi de lettres
Le réseau étudié est celui des accointances: il faut connaître le prochain destinataire par son prénom
Résultat: 30% des chaines à destination, ~6.4 steps => folklore des 6 degrés de séparation
Papier dans Nature, puis plus détaillé dans Sociometrics Réplications dans d’autres contextes (Erickson & Kringas, 1975) Dont réplications dans des catégories sociales différentes:
– Blancs vs. noirs (Korte & Milgram 1970, Lin et al 1977)– Juifs Ashkenaz vs. Orientaux (Weimann, 1983)– Femmes vs hommes (Lin et al. 1977)
Des organisations différentes:– Bureaucratisation (Lundberg 1975)– Graduated vs. Undergraduated (Stevenson et al., 1997)
Ou avec des supports différents:– Téléphone (Guiot 1976)– Email (Dodds et al. 2003 a,b)
8
1989-1998: take stock
1989: The Small World, Kochen
Bouquin disparate, focalisé sur l’aspect structurel du phénomène small-world
La définition du phénomène small-world demeure qualitative: « The phenomenon of two strangers meeting in a place and discovering that they have a common acquaintance […]. It is related to the equally counter-intuitive fact that a chain of at most seven intermediaries, and more commonly 2 or 3 intermediaries, are sufficient to link most pairs of people in the world. This is the small-world phenomenon » (Kochen, 1989)
Recherches:
– Modèles formels, dont des modèles regressifs (Doreian 1989)– Estimations du nombre d’accointances– Impact de la structure sociale sur la diffusion (ex: Burt and Uchiyama,
1989)– Peu d’activité… concept quasi délaissé en 1990.
9
Conceptualisation de Schnettler
Diffusion (~passif) Search (~actif)
Social Processes Diffusion and contagion Search and social access possibilities
Social Structure Structural small-world (chains) Algorithmic small world (findable chains)
Psychological Surprise effect Finding paths of connection
Différenciation passif/actif (Watts 1999)
Comme toute grille d’analyse… discutable
10
1998: début des modèles formels
1998, modèle de Watts & Strogatz
Travail fondateur:
– nouvelle vague de recherche : the « new » science of networks– « complex networks » : grands réseaux – Intervention de physiciens: (ex Crossley 2005)supprot technique– de plus en plus de datasets disponibles (et ça va continuer (Bainbridge,
2007) )
Recherches axées sur:
– Les propriétés des réseaux– La dynamique sur ces réseaux (assez limité et partiel)– Cherchabilité des réseaux
définition small-world
– Newman: « the fact that most pairs of vertices in most networks seem to be connected by a short path through the network » (Newman 2003, p181)
– Watts Strogatz: high clustering & short average path length (Watts & Strogatz, 2002)
– Barabasi-Albert: high clustering & short average path length & scale-free distribution
11
Structurel&passif: théorique & empirique small-world
Empirique:
– Mis en évidence (démontré ?) par Milgram, dans une structure inconnue– Distance sous-estimée ? (faible participation – Sur estimée ? Problèmes de mémorisation, de recherche du contact
– Mesuré sur des ensemble de données (fie sharing, acteurs, open source, boards, german firms, MSN…)
– Mise en évidence d’individus “pont” & de rencontres aléatoires (Urry 2004)
Théorique:
– court chemin géodésique: théoriquement, oui, même en random pur– court chemin & clustering: il suffit de quelques liens aléatoires pour
créer l'effet petit monde (WS) Attention, les processus lui-même n'est pas réaliste (on ne part pas de l'ordre), pas plus que paramètres sans écho dans la réalité (Watts 2006):
– Court chemin, clustering & scale-free: Barabasi Albert. Ici, ce sont les huibs qui créent l'effet petit monde
– Attention, power law peut apparaître à cause d'autres mécanismes (Keller, 2005)
– Modèles: Peut être utilisé pour décrire une structure qui n'est pas totalement connue
– => Conditions d’apparition du petit monde = minimale
12
Structurel&Actif: Algorithmic small-world
L’expérience de Milgram montre qu’il existe des courts chemins, mais aussi qu’ils sont cherchables sur des informations locales
Watts-Strogatz: réseau non cherchable (pas de différenciation entre les liens locaux et distants)
Kleinberg: autre notion de distance. Ajout de poids au liens, qui influencent la proba de reconnection. Faible proba: cherchable, forte proba: pas cherchable
Watts: connaissance des groupes sociaux: info locale permet de chercher dans tout le réseau
Adamic: dans des réseaux scale-free, passer par des hubs
13
Process&Passif: Diffusion & co
Empirique: efficacité de la diffusion:
– exemple de l'information sur un désastre local (Erickson, 78&79). En une heure, 80% des interviewés ont entendu parler du pb – 8.1% direct, 89.2% indirect, 2.7% médias
– Diffusion d'innovations (Coleman 1957): plus long ! … mais parfois avec une structure très différente:
– diffusion d'une pétition traçable électroniquement (Liben-Nowell and Kleinberg 2008): chaines de pls centaines
Conceptualisation:
– Centola & Macy: diffusion simple ou complexe– Pondération des liens (Van der Leij and Goyal, 2006)
=> les processus de diffusion ne sont pas assez généraux, il faut spécialiser les études sur les réseaux pour chaque phénomène
14
Process&Actif: Search process
Différence entre structure & possibilité de chercher– (Milgram 1977, p294): Si tout le monde est à 5.5 personnes du président,
cela ne veut pas dire que ces gens sont vraiment proches. Mathématiquement, c'est petit. Psychologiquement, c'est une distance énorme. Ils ne sont pas à 5 personnes de distance, mais à 5 cercles relationnels, ou 5 structures.
– S’oppose aux tenants du capital social qui pensent qu’il augmente de façon exponentielle (Lin 2001).
Usage réel des chaînes ?– Erickson & Kringas: chaines qui permettent aux résidents d'ottawa de
contacter leurs représentants: 16/250 chaines réussissent (2 steps). Plusieurs notent qu'ils utiliseraient pas ces chaines pour agir
– Granovetter: job, présenté comme un succès: direct ou 1 intermédiaire: 84%, 2 inter: 12.5%, 3 inters: 3.1%, pas plus de 4 !
– => Les chaînes courtes ont-elle une signification pour le comportement réel ?
Résultat inverse: (Lee 1969): recherche pour avortement illégal: 12% chaine de 9 ou plus !, ~5, succès 70/114 (mais plusieurs recherches)
Pistes: – Peu de recherches dans cet axe (Granovetter…)– notion d'incentives pour la recherche (Magnani 2005, Heckathorn 1997)
15
Psychological: finding pathes
3 axes:
– représentation cognitive de la structure
– Surprise: les individus sont-ils conscients de la structure dans laquelle ils sont ?
– Quelles stratégies de recherche ? récupération en mémoire des liens très imparfaite
(Bell et al. 2007, Killworth & Bernard 1976)
=> même si les individus sont rationnels, résultat biaisé
Mécanismes de recherche des liens mal connus
Une seule étude (Killworth et al., 2006) sur l'efficacité de cette recherche en connaissant toute la structure; 50% plus long que l'optimal
16
Résumé
L’effet small-world a été identifié dans de nombreux jeux de données; ses conditions d’apparition sont minimales.
On trouve des chaînes moyenne de même taille (~5.5) sur de nombreuses études empiriques et par des modèles théoriques
On n’en sait pas tant que cela… (expériences contradictoire, facteurs explicatifs inconnus)
La tendance est à l’usage de données électroniques; mais un retour à de l’expérimental (sciences humaine) sera peut-être nécessaire pour répondre à plusieurs questions.
17
Questions ouvertes sur le search
La plupart des études sur le search portent sur le cas artificiel de l’expérience de Milgram. Qu’en est-il pour d’autres types de search ?
– Compliqué ! Un but, plusieurs buts, pas de but ? Mieux identifier chaque cas…
– Différentes stratégies: être introduit auprès du maillon suivant, ou pas
– => pas d’heuristique généralisable, il faut explorer chaque aspect
Facteurs expliquant le succès ou l'échec: confiance, incentives, tie strength, bridges… une nouvelle expérience de Milgram comparative ?
Retour à l’individu: quels individus ont accès aux ressources ? Lesquels savent rechercher ? (affiliations ?) Quel est exactement le rôle des hubs ?
Efficacité de la recherche d’information comparé à autre chose ? (Web, presse...)
18
Questions ouvertes
social networks are special (hyper complexity)
différents processus sociaux: ressources, power, communication...
définition de la structure pas claire: amitié, accointances, fraternité. Dépend de ce qui nous intéresse
– => multiplicité & interférences: quels liens entre différents types de relations ? Par exemple, hiérarchie / amitié, etc. Blockmodelling, mais encore ?
– => implications réelle du type de lien sur ce qui y passe. Accointance: très inclusif. On peut être lié à tout le monde par 5 étapes; ce n'est pas pour autant que le SRAS va se diffuser partout ! Le monde est-il un réseau unique ?
Les caractéristiques « small-world » ou « scale-free » ne définissent pas complètement le réseau. Ne peut-on pas se baser sur les processus de formation des réseaux pour créer des choses plus réalistes ?