Email Archival and Discovery
Michael PribSeminar StuPro cims
14.07.2009
cims
Email Archival and Discovery 14.07.2009 2cims
Agenda
• Einleitung• Email Archival and Discovery• EAD-Prototyp• Zusammenfassung• Demonstration
Email Archival and Discovery 14.07.2009 3cims
Einleitung
Email Archival and Discovery 14.07.2009 4cims
Einleitung
• Softwaregestützte Datenverwaltung- Gründe:
• riesige Datenmengen• enormer Aufwand
- Lösung: Enterprise-Content-Management (ECM)
• Anpassungsfähigkeit• Durchsatz• Sicherheit
Email Archival and Discovery 14.07.2009 5cims
Email Archival and Discovery (EAD)
Email Archival and Discovery 14.07.2009 6cims
• Mailbox-Kapazität Beschränkungen
• Information in der E-Mail
• Rechtliche Voraussetzungen
• Gerichtsbeschlüsse
Warum braucht man EAD-Systeme?
Email Archival and Discovery 14.07.2009 7cims
Eingliederung ein E-Mail System
Abbildung 1: E-Mail-System [2]
Email Archival and Discovery 14.07.2009 8cims
• Einfügen der E-Mail
• Compliance und Discovery
• Suche und Retrieval
• Löschen der E-Mails
Funktionale Anforderungen an ein EAD-System
Email Archival and Discovery 14.07.2009 9cims
• Zuverläsigkeit, Rechstgültigkeit, Sicherheit
• Hohe Leistung und besonders hoher Durchsatz (sehr große Datenmengen)
• Finanzielle Tragbarkeit und Rentabilität (kleine und mittlere Unternehmen)
Nicht-funktionale Anforderungen an ein EAD-System
Email Archival and Discovery 14.07.2009 10cims
Das EAD-Prototyp
Email Archival and Discovery 14.07.2009 11cims
• Entwickelt im Rahmen des CMaaS-Projekts (Content Management as a Service) in Zusammenarbeit von Uni-Stuttgart, Uni-Hamburg und IBM Deutschland Research and Development GmbH
• Serviceorientierter Ansatz
Das EAD-Prototyp
Email Archival and Discovery 14.07.2009 12cims
Schichtenbasierte Architektur
Abbildug 2: Prototyp-Architektur [2]
Email Archival and Discovery 14.07.2009 13cims
Infrastructure SoftwareHier weden die E-Mails
abgespeichert
Unveräderliche Metadaten
veränderliche Daten
Abbildung 2: Infrastructure-Software-Schicht [2]
Email Archival and Discovery 14.07.2009 14cims
• Indexiertes Inhalt der E-Mail (unveränderlich)– Voll-Text-Index
• Status der E-Mail (veränderlich)– Metadaten DB
• Benutzer- und Zugriffskontrolle für eine E-Mail (veränderlich)
Im Katalog abgelegte Daten
Email Archival and Discovery 14.07.2009 15cims
Applikationsschicht
SOAP SOAP
Eifüge-Prozess
Suche und Retrieval
Abbildung 4: Applikationsschicht [2]
Email Archival and Discovery 14.07.2009 16cims
• Vertikal- Vorteil: geringer
Administrations-aufwand
- Nachteil: begrenzte Skalierbarkeit (CPU Anzahl)
Horizontal- Vorteil: praktisch
unbegrenzte Skalierbarkeit
- Nachteil: großer Administrations-aufwand
Skalierarkeit
Email Archival and Discovery 14.07.2009 17cims
Horizontale Skalierung im Prototyp
Abbildung 6: DHT als Koordinationsschicht
Email Archival and Discovery 14.07.2009 18cims
Einfüge-Prozess
Abbildung 7: Einfüge-Prozess [6]
Email Archival and Discovery 14.07.2009 19cims
Messung
Abbildung 8: Einfüge-Prozess-Messung [6]
Email Archival and Discovery 14.07.2009 20cims
Verteilte Suche
Abbildung 9: Verteilte Suche
Email Archival and Discovery 14.07.2009 21cims
• Enterprise-Content-Management• Email Archiv and Discovery
- Sicherheit- Skalierbarkeit- Hoher Durchsatz
• Prototyp- DHT(horizontale Skalierung)- Hybrides Katalog
Zusammenfassung
Email Archival and Discovery 14.07.2009 22cims
Demo
Email Archival and Discovery 14.07.2009 23cims
• [1] Cataldo Mega, Kathleen Krebs, Frank Wagner, Norbert Ritter und Bernhard Mitschang: Content-Management-Systeme der nächsten Generation, IBM Deutschland Research & Development Universität Hamburg und Universität Stuttgart.
• [2] Frank Wagner, Kathleen Krebs, Cataldo Mega, Bernhard Mitschang, und Norbert Ritter: Email Archiving and Discovery as a Service, IBM Deutschland Research & Development Universität Hamburg und Universität Stuttgart.
• [3] Martin Russold: Erweiterung des Datenmodells für ein System zur Email Archivierung und Discovery, Abteilung Anwendersoftware, Universität Stuttgart
• [4] Alexander Moosbrugger: Evaluation of Scale-Out Characteristics of an ECM System using Overlay-Techniques to Support Dynamic Topologies , Abteilung Anwendersoftware Universität Stuttgart
Quellen (1)
Email Archival and Discovery 14.07.2009 24cims
• [5] IBM Deutschland Research and Development GmbH: Monitoring the EADM prototype
• [6] David Lebutsch, Alexander Moosbrugger, Frank Wagner: Enhancing Enterprise Content Management Systems for Dynamic Provisioning and Scale-out, Universität Stuttgart
• [7] Ian Sommerville: Software Engineering, Pearson Studium
Quellen (2)
Email Archival and Discovery 14.07.2009 25cims
Fragen?
?