sporcarsi le mani
DESCRIPTION
Ovvero, perché devo passare ore ad impazzire sui dati prima di poterli visualizzareTRANSCRIPT
Sporcarsi le mani Ovvero, perché devo passare ore ad impazzire sui dati prima di poterli visualizzare
Michele Mauri DensityDesign Research Lab
Dati
Visualizzazione
Pochi dati o
dati semplici
Country CO2e emissions in megatonnes
Brazil 2854
Canada 810
China 7225
Germany 1005
India 1875
Indonesia 2038
Japan 1390
Russian Federation 2012
United Kingdom 684
United States of America 6933
molti dati o
dati complessi
(schermata excel twitter)
Dati
Visualizzazione
Esplorazione
conteggi, filtri,
aggregazione
conteggi, filtri,
aggregazione, conversione,
…
1987: La visualizzazione dell’informazione diventa scienza
Edward Tufte
Visualizzare dati significa offrire una
prospettiva privilegiata su un fenomeno
quali sono i passaggi per creare una
visualizzazione?
Misurazione Cosa misuro? Con quali strumenti? Con quale precisione?
Analisi Quali dati considero utili? Quali scarto considerandoli errori? Quali
aggrego considerandoli parti dello stesso elemento?
Visualizzazione Quali relazioni metto in evidenza? Quali sono le variabili principali?
Quali sono i vincoli fisici, di supporto, che devo rispettare?
There are three kind of lies.
1. Lies
2. Damn lies
3. Statistics
1. I dati non sono oggettivi, ma possono essere utilizzati per sostenere la propria posizione
2. Lo stesso può essere fatto con la visualizzazione
3. La scelta della visualizzazione dipende da ciò che si vuole raccontare
Cosa possiamo fare: -convertire (rimappare)
- aggregare -espandere
-unire -classificare
-ordinare
Non sempre i dati sono nella forma più adatta alla
visualizzazione
“Ciò che è immediatamente presente alla conoscenza, prima di ogni forma
di elaborazione”
∼Vocabolario Treccani
“Il dato, come concetto astratto, può essere visto come il livello minimo di
astrazione da cui derivano informazione e conoscenza.”
en.wikipedia.org, 2/7/12
15
hello
[255,255,0]
La scala degli “elementi minimi” varia a seconda del fenomeno osservato
dato
quantitativo
qualitativo
Continuo (peso: 73,857…)
Discreto (numero iscritti: 6)
Nominale (provincia)
Ordinale (buono, mediocre,
pessimo)
Il dato ha valore se messo in relazione
confronto = informazione
Monte Everest 8848 m
Monte Everest 8848 m
Monte Bianco 4810 m
>
Le relazioni vengono codificate con le strutture dato
Dati strutturati vs.
dati non strutturati
Dati strutturati
Monte Stato Altezza Prima salita
Monte Bianco Italia 4810 1786
Everest Cina 8848 1953
Dati strutturati:
collezione di dati, tra loro coerenti, codificati in una struttura
che ne esplicita le relazioni
Dati non strutturati
“La montagna più alta della Cina è l'Everest, con 8848 metri di altezza. La prima ascensione è stata compiuta nel 1858 da Edmund Hillary. In Italia è il Monte Bianco, alto 4810 metri, salito per la prima volta nel 1786.”
Dati non strutturati:
Forme espressive (testi, immagini) che possono contenere dati, la cui
struttura è mutevole e non coerente.
Esempio 1. Visualizzare dati strutturati
11. Visualizzare dati non strutturati
111. Strutturare dati non strutturati
(e poi visualizzarli)
Strutture dati: le tabelle
Monte Stato Altezza Prima salita
Monte Bianco Italia 4810 1786
Everest Cina 8848 1953
Monte Stato Altezza Prima salita
Monte Bianco Italia 4810 1786
Everest Cina 8848 1953
Monte Stato Altezza Prima salita
Monte Bianco Italia 4810 1786
Everest Cina 8848 1953
Tipi di tabelle: matrici
lombardia piemonte
Italia dei valori 4162 913
Partito Democratico 45231 7177
Per il Terzo Polo (ApI-FLI) 7667 2702
Popolo della Libertà 55975 8668
Tipi di tabelle: dataset (liste)
Partito Regione Politici (comuni)
Italia dei valori lombardia 4162
Partito Democratico lombardia 45231
Per il Terzo Polo (ApI-FLI) lombardia 7667
Popolo della Libertà lombardia 55975
Italia dei valori piemonte 913
Partito Democratico piemonte 7177
Per il Terzo Polo (ApI-FLI) piemonte 2702
Popolo della Libertà piemonte 8668
Formati dati per tabelle
Plain Text .CSV (carachter separated values) .TSV (tabulation separated values) .DAT (generic data) Spreadsheet .XLS (Excel) .XLSX (Office Open XML) .numbers (Apple Numbers) .ODF (OpenOffice Spreadsheet)
Dove trovare dati in formato tabulare
Altre strutture dati
XML Extensible Markup Language
<tag>contenuto</tag>
JSON JavaScript Object Notation
Oggetti { }
Proprietà
nomeProprietà : valore
Liste [ elemento1, elemento2, …]
Ottenere dati XML/JSON: le API
Application programming interface
Dati non strutturati: il web