python advanced 01-numpypandas

11
Corso Data Journalist gen-mar 2017 PYTHON ADVANCED Dalle liste ai dataframe

Upload: studiabo

Post on 12-Apr-2017

20 views

Category:

Software


2 download

TRANSCRIPT

Corso Data Journalist gen-mar 2017

PYTHON ADVANCED

Dalle liste ai dataframe

Built -in

Mappa sinottica: Strutture dati

Classe Costruttore

list [ ]

dict { }

Modulo numpyClasse Costruttore

ndarray arrayndarray

matrixlib.defmatrix.matrix

matrix

Modulo pandasClasse Costruttore

Index Index

Multindex Multindex

Series Series

DataFrame DataFrame

Panel4D Panel4D

Panel Panel

list

Confronto tra list, array, Index

- NO

array

+ somma

Index

somma+ concatena

- sottraz.

+Stringhe

Numeri

unione

* concatena * moltiplica

sottraz.-

Stringhe

Numeri

esclus.

moltiplica* Numeri

divide/ Numeri/ divide/ NO

list

Confronto tra list, array, Index

array

numpy.append( A1, A2)

Index

.append() (in-place) .append(..) (out-of-place)

.sort() (in-place) numpy.sort( A1).sort (in-place)

.remove(..) (in-place) numpy.delete(A1, ..) .delete(...) (out-of-place)

= (nuova var; stesso obj.) (nuova var; stesso obj.)= = (nuovo oggetto)

Metodi per l’analisi statistica (ad esempio, mean())

Metodi per l’analisi statistica (ad esempio, mean())

Metodi per raggruppamenti e per trasformazioni

LEZIONE 1..www.fordatascientist.org

E00-PyDataE02-Numpy.ipynb

Series e Dataframe

SeriesUna Series è una classe pandas che può essere vista come un dizionario, in cui la chiave è data dall’indice della serie

{ 1: 100, 2: 120, 3: 132, 4: 131, 5 127 }

Una volta istanziato esiste una relazione fissa tra indice (chiave) e valore. Diversamente da quanto avviene per una lista (array, Index), se si estrae una slice non viene modificata la relazione tra indice e valore

DataFrameUn DataFrame è una classe pandas che può essere vista come un dizionario di Liste/Series, in cui la chiave identifica una Lista/Series.

{ ‘V1’: [ 100, 120, 132, 131, 127], ‘V2’: [ 132, 176, 232, 243, 457]}

Ogni colonna di una DataFrame è identificata da una variabile. La lista di queste variabili forma l’attributo .columnsOgni riga di un DataFrame è identificata da un indice, assegnato all’attributo index. Questo indice è un oggetto della classe Index del modulo pandas.

Liste [ , , , ]

Dizionari { : , : , }

Tuple ( , , , )

Set { , , , }

Mappa sinottica Strutture Dati

array e ndarray(statistica)

matrix(matrici)

Index(array+set)

MultiIndex(Index+tuple)

Series(1 Index/M.+ 1 array)

Dataframe(1 Index/M +

1 (dict + n array))

Panel(1 Index/M +n Dataframe)

built-in

numpy pandas

Struttura dati: DataFrame

20152016201720182019 …...2025202620272028

IndexLAB1 LAB2 LAB3 LABn. . . . . . . .

2276364462

42167649

6536664460

65867684

2276364462

42187650

4436864462

32167649

array

. .. .YEAR

12345 …...30313233

Struttura dati: DataFrame

20152016201720182019 …...2025202620272028

Index LAB1 LAB2 LAB3 LABn. . . . . . . .2276364462

42167649

6536664460

65867684

2276364462

42187650

4436864462

32167649

array

LEZIONE 1..www.fordatascientist.org

E00-PyDataE04-Pandas-DataStructures.ipynb

CONTATTI TELEFONO

051 22 35 20

EMAIL [email protected]