python advanced 01-numpypandas
TRANSCRIPT
Built -in
Mappa sinottica: Strutture dati
Classe Costruttore
list [ ]
dict { }
Modulo numpyClasse Costruttore
ndarray arrayndarray
matrixlib.defmatrix.matrix
matrix
Modulo pandasClasse Costruttore
Index Index
Multindex Multindex
Series Series
DataFrame DataFrame
Panel4D Panel4D
Panel Panel
list
Confronto tra list, array, Index
- NO
array
+ somma
Index
somma+ concatena
- sottraz.
+Stringhe
Numeri
unione
* concatena * moltiplica
sottraz.-
Stringhe
Numeri
esclus.
moltiplica* Numeri
divide/ Numeri/ divide/ NO
list
Confronto tra list, array, Index
array
numpy.append( A1, A2)
Index
.append() (in-place) .append(..) (out-of-place)
.sort() (in-place) numpy.sort( A1).sort (in-place)
.remove(..) (in-place) numpy.delete(A1, ..) .delete(...) (out-of-place)
= (nuova var; stesso obj.) (nuova var; stesso obj.)= = (nuovo oggetto)
Metodi per l’analisi statistica (ad esempio, mean())
Metodi per l’analisi statistica (ad esempio, mean())
Metodi per raggruppamenti e per trasformazioni
Series e Dataframe
SeriesUna Series è una classe pandas che può essere vista come un dizionario, in cui la chiave è data dall’indice della serie
{ 1: 100, 2: 120, 3: 132, 4: 131, 5 127 }
Una volta istanziato esiste una relazione fissa tra indice (chiave) e valore. Diversamente da quanto avviene per una lista (array, Index), se si estrae una slice non viene modificata la relazione tra indice e valore
DataFrameUn DataFrame è una classe pandas che può essere vista come un dizionario di Liste/Series, in cui la chiave identifica una Lista/Series.
{ ‘V1’: [ 100, 120, 132, 131, 127], ‘V2’: [ 132, 176, 232, 243, 457]}
Ogni colonna di una DataFrame è identificata da una variabile. La lista di queste variabili forma l’attributo .columnsOgni riga di un DataFrame è identificata da un indice, assegnato all’attributo index. Questo indice è un oggetto della classe Index del modulo pandas.
Liste [ , , , ]
Dizionari { : , : , }
Tuple ( , , , )
Set { , , , }
Mappa sinottica Strutture Dati
array e ndarray(statistica)
matrix(matrici)
Index(array+set)
MultiIndex(Index+tuple)
Series(1 Index/M.+ 1 array)
Dataframe(1 Index/M +
1 (dict + n array))
Panel(1 Index/M +n Dataframe)
built-in
numpy pandas
Struttura dati: DataFrame
20152016201720182019 …...2025202620272028
IndexLAB1 LAB2 LAB3 LABn. . . . . . . .
2276364462
42167649
6536664460
65867684
2276364462
42187650
4436864462
32167649
array
. .. .YEAR
12345 …...30313233
Struttura dati: DataFrame
20152016201720182019 …...2025202620272028
Index LAB1 LAB2 LAB3 LABn. . . . . . . .2276364462
42167649
6536664460
65867684
2276364462
42187650
4436864462
32167649
array