big data projekte - best practices aus der praxis

21
Big data-Projekte: Best practices aus der Praxis Dr. Kathrin Spreyer Big Data Engineer JAX / Big data days Mainz, 14.05.2014

Upload: inovex-gmbh

Post on 20-Aug-2015

210 views

Category:

Technology


2 download

TRANSCRIPT

Page 1: Big Data Projekte - Best Practices aus der Praxis

Big data-Projekte:Best practices aus der Praxis

Dr. Kathrin SpreyerBig Data Engineer

JAX / Big data daysMainz, 14.05.2014

Page 2: Big Data Projekte - Best Practices aus der Praxis

Agenda

1. Projekte

2. Big

3. Datenimport

4. Datenschutz

5. Testen

6. Tooling

7. Agilität

2

Page 3: Big Data Projekte - Best Practices aus der Praxis

Agenda

1. Projekte

2. Big

3. Datenimport

4. Datenschutz

5. Testen

6. Tooling

7. Agilität

2

Page 4: Big Data Projekte - Best Practices aus der Praxis

Zwei Projekte

• 1&1

• 2009-2013

• Web-Analytics

• ProsiebenSat.1 Digital (PSD)

• 2013-heute

• Integration von Reichweiten-, Vermarktungserlös- und Transaktionsdaten

3

Page 5: Big Data Projekte - Best Practices aus der Praxis

Architektur 1&1

4

Page 6: Big Data Projekte - Best Practices aus der Praxis

Architektur PSD

5

| 20. März 2013 | ProSiebenSat.1 Digital GmbH | Business Intelligence | Jürgen Popp Page 18

Lösungsansatz Hybrides System aus relationaler Datenbank und Hadoop Cluster

Page 7: Big Data Projekte - Best Practices aus der Praxis

Was heißt “Big?”

6

3V

Page 8: Big Data Projekte - Best Practices aus der Praxis

Was heißt “Big?”

6

3V

Parallelisierung

Skalierbarkeit

Page 9: Big Data Projekte - Best Practices aus der Praxis

Datenimport

7

Koordination m. Quellsystemen

Zwischenspeicherung

Skalierbarer Transport

(N)RT

Page 10: Big Data Projekte - Best Practices aus der Praxis

Datenschutz

8

Computersicherheit

Multi-Tenancy

Page 11: Big Data Projekte - Best Practices aus der Praxis

Datenschutz

8

Computersicherheit

Multi-Tenancy

PII

Anonymisierung

Nutzen vs. Anonymität

Page 12: Big Data Projekte - Best Practices aus der Praxis

Testen

9

KorrektheitRobustheitPerformanz

Page 13: Big Data Projekte - Best Practices aus der Praxis

Testen

9

KorrektheitRobustheitPerformanz

Regressions-/Akzeptanztests

Page 14: Big Data Projekte - Best Practices aus der Praxis

Testen

9

Datenmenge

KorrektheitRobustheitPerformanz

Testdauer

Regressions-/Akzeptanztests

Wartbarkeit (Fachseite)

Page 15: Big Data Projekte - Best Practices aus der Praxis

Tooling

10

Page 16: Big Data Projekte - Best Practices aus der Praxis

Tooling

10

Reifegrad

Downstream-AnforderungenDatenmodellierungRT?Nutzerakzeptanz

Page 17: Big Data Projekte - Best Practices aus der Praxis

Agilität

11

REfactoring mit neuen Technologien

Iterativinkrementell

Page 18: Big Data Projekte - Best Practices aus der Praxis

Agilität

11

Daten-Exploration

REfactoring mit neuen Technologien

Iterativinkrementell

Anforderungen erwachsen aus Daten

Page 19: Big Data Projekte - Best Practices aus der Praxis

Und jetzt?

12

Luecken

Junge Technologien

Page 20: Big Data Projekte - Best Practices aus der Praxis

inovex Academy

1. U.a. Hadoop-Entwickler-Training

2. 1-3 Tage

3. Inhouse oder offen

4. Offene Hadoop-Trainings 2014:

18.-20. März (Köln)24.-26. Juni (München)18.-20. November (Karlsruhe)

www.inovex.de/trainings/offene-trainings/

13

Page 21: Big Data Projekte - Best Practices aus der Praxis

14

Fragen?Meinungen?