ibm spss text analytics juli 2010 friedel jonker

69
IBM SPSS Text Analytics (TA) Einführung und Einsatzbeispiele Friedel Jonker, Manager Business Development Analytics & Performance Management Juli 2010

Upload: friedel-jonker

Post on 20-Jun-2015

122 views

Category:

Documents


0 download

DESCRIPTION

IBM Text Analytics and Text Mining mit SPSS

TRANSCRIPT

Page 1: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

IBM SPSS Text Analytics (TA)

Einführung und EinsatzbeispieleFriedel Jonker, Manager Business DevelopmentAnalytics & Performance Management

Juli 2010

Page 2: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Important Disclaimer (1/2)

� THE INFORMATION CONTAINED IN THIS PRESENTATION IS P ROVIDED FOR INFORMATIONAL PURPOSES ONLY.

� WHILE EFFORTS WERE MADE TO VERIFY THE COMPLETENESS AND ACCURACY OF THE INFORMATION CONTAINED IN THIS PRESE NTATION, IT IS PROVIDED “AS IS”, WITHOUT WARRANTY OF ANY KIND, EXP RESS OR IMPLIED.

� IN ADDITION, THIS INFORMATION IS BASED ON IBM’S CUR RENT PRODUCT PLANS AND STRATEGY, WHICH ARE SUBJECT TO CHANGE BY IBM WITHOUT NOTICE.

� IBM SHALL NOT BE RESPONSIBLE FOR ANY DAMAGES ARISIN G OUT OF THE USE OF, OR OTHERWISE RELATED TO, THIS PRESENTAT ION OR ANY OTHER DOCUMENTATION.

� NOTHING CONTAINED IN THIS PRESENTATION IS INTENDED TO, OR SHALL HAVE THE EFFECT OF:

– CREATING ANY WARRANTY OR REPRESENTATION FROM IBM (OR ITS AFFILIATES OR ITS OR THEIR SUPPLIERS AND/OR LICENSORS); OR

– ALTERING THE TERMS AND CONDITIONS OF THE APPLICABLE LICENSE AGREEMENT GOVERNING THE USE OF IBM SOFTWARE.

Page 3: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

© IBM Corporation 2010. All Rights Reserved.

The webinars, sessions and materials have been prep ared by IBM or the session speakers and reflect the ir own views. They are provided for informational purposes only, and are neither intended to, nor sha ll have the effect of being, legal or other guidanc e or advice to any participant. While efforts were made to verify the completeness and accuracy of the info rmation contained in this presentation, it is provi ded AS IS without warranty of any kind, express or implied. IBM shall not be responsible for any damag es arising out of the use of, or otherwise related to, this presentation or any other materials. Nothi ng contained in this presentation is intended to, nor shall have the effect of, creating any warranties o r representations from IBM or its suppliers or licen sors, or altering the terms and conditions of the applica ble license agreement governing the use of IBM soft ware.

References in this presentation to IBM products, pr ograms, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities reference d in this presentation may change at any time at IB M’s sole discretion based on market opportunities o r other factors, and are not intended to be a commitm ent to future product or feature availability in any way. Nothing contained in these materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you w ill result in any specific sales, revenue growth or other results.

Performance is based on measurements and projection s using standard IBM benchmarks in a controlled env ironment. The actual throughput or performance that any user will experience will vary depending upon many factors, including considerati ons such as the amount of multiprogramming in the user's job stream, the I/O configuration, the s torage configuration, and the workload processed. Therefore, no assurance can be given that an individual user will achieve results similar to tho se stated here.

All customer examples described are presented as il lustrations of how those customers have used IBM pr oducts and the results they may have achieved. Actual environmental costs and performance characte ristics may vary by customer.

The following are trademarks of the International B usiness Machines Corporation in the United States a nd/or other countries: ibm.com/legal/copytrade.shtmlAIX, CICS, CICSPlex, D ataPower, DB2, DB2 Universal Database, i5/OS, IBM, the IBM logo, IMS/ESA, Power Systems, Lotus, OMEGAMON, OS/390, Parallel Sysplex, pureXML, Ration al, Redbooks, Sametime, SMART SOA, System z , Tivol i, WebSphere, and z/OS.

A current list of IBM trademarks is available on th e Web at “Copyright and trademark information” at ib m.com/legal/copytrade.shtml.

Adobe, the Adobe logo, PostScript, and the PostScri pt logo are either registered trademarks or tradema rks of Adobe Systems Incorporated in the United States, and/or other countries.IT Infrastructure Library is a registered trademark of the Central Computer and Telecommunications Age ncy which is now part of the Office of Government CommerceJava and all Java-based trademarks are trademarks o f Sun Microsystems, Inc. in the United States, other countries, or both.Microsoft and Windows are trademarks of Microsoft C orporation in the United States, other countries, or both.ITIL is a registered trademark, and a registered co mmunity trademark of the Office of Government Comme rce, and is registered in the U.S. Patent and Trademark OfficeIntel and Pentium are trademarks or registered trad emarks of Intel Corporation or its subsidiaries in the United States and other countries.UNIX is a registered trademark of The Open Group in the United States and other countries.Linux is a registered trademark of Linus Torvalds in the United States, other countries, or both.

Important Disclaimer (2/2)

Page 4: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

IBM Software Group, Information ManagementFriedel Jonker, Manager Business Development Analytics & PM

Career History and Education

Selected projects

� Global Pharma Information Company: German Business Value Concept to improve Sales Force Effectiveness based on eBusiness Assessment, Pain Point Analysis, Definition of Requirements and Portfolio Prioritization.

Contribution: Lead the German Business Value Concept to improve Sales Force Effectiveness.

� Global German Automotive Company: Global Concept and implementation coordination together with the Boston Consulting Group to set up IT/Data Governance and Data Modelling/Re-Engineering of an As/is Landscape with the objective to reduce costs in development and maintenance and increase and secure the Quality of Data as a base for high quality use of CRM, BI/LI for Sales & Risk Performance Management (SRPM).

Contribution: Lead the IT/Data Governance and acted as the SME for all IT/Data Governance related issues at the company.

� Global German Bank: Definition of a Business Driven Traffic Light Test Management Concept to successfully implement an Oracle/Siebel CRM & BI solution.

Contribution: Lead the Testmangement and acted as the SME for all CRM & BI related Testmanagement matters. The Testmanagement Concept is now used as a global handbook for Testmanagement.

� German, English (fluent).

� CRM, BI/LI Strategy Leader IBM GBS Germany.

� Winner of the Sales Excellence Award 2005 from the University of St. Gallen and Handelsblatt.

� Broad experience in Planning and Implementing value based CRM & BI/LI Strategy, Processes, Architecture and Systems.

� Member of the MIT, Member of the Sales Executive Councile and member of Marketing Alumni, University of Münster, Germany

Languages and Profile

University of Münster , Master of Business Management in Marketing & Statistics

19881982-

Infas , Germany, LOCAL-Direct Project manager for SRPM with Location Intelligence (LI)

19891988-

Ogilvy & Mather Dataconsult , Germany, Consultant Database Marketing

19901989-

Citicorp-Citibank AG , Germany, European Manager Marketing Database VISA

19941990-

Deutsche Leasing AG, S-Finance Group , Germany, CRM & BI Business and ProgramDirector

20081994-

IBM, Germany, Manager Business Development Analytics & PM, ManagingConsultant CRM & BI

today2008-

Page 5: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

� Neue Informationsqualität für das VISA Kartenmanage ment der Citicorp, in: Oracle Finanzwelt, 1994

� Leadership durch Informations- und Lernsysteme, in: Know How, 7/1996, Schumann Unternehmensberatung

� Database Marketing bei der Deutschen Leasing AG, in: Jahrbuch 2000, Deutscher Direktmarketing Verband e.V.

� Von Database Marketing zum CRM, in: Computerwoche, 19/2001

� Customer Relationship Management, Bericht über das Deutsche Leasing CRM-Projekt, in: GoAhead 9/2001, CSC- Ploenzke

� CRM – die nächste Generation, Interview mit Friedel Jonker, in: Computerwoche, 33/2002

� Mit intelligentem Database Marketing und CRM zu übe rdurchschnittlichem Markterfolg, in: Cognos- Kundenmagazin

� Case Study Präsentation C3M-Eagle, marcusevans, FoCus Gipfel CRM, Montreux, 19.-21. Januar 2003

� Erfolgreiches Customer Relationship Management bei de r Deutschen Leasing AG , Nordakademie, Elmshorn, e-think-tank, Febraur 2003

� Konflikte zwischen Vertrieb und Vertrag lösen, in: Praxismagazin für Marktkommunikation der Sparkassen-Finanzgruppe, 2004, 11. Jahrgang, Nr. 5, S 38 ff

� CRM und Sales -2 Seiten einer erfolgreichen Verbind ung , im Beratungsbrief von http://www.vertriebs-experts.de , 23.03.2005

� Deutsche Leasing Gruppe: Mit Siebel/Oracle CRM-Syste m das Neugeschäft jährlich um durchschnittlich 12 Proz entgesteigert, in: Oracle Customer Snapshot Juli 2006

� CRM als strategisches Element der wertorientierte U nternehmensführung der Deutschen Leasing AG -7P Pro gramm für erfolgreiche CRM-Programme –Position_Path_Portfolio_ Program_People_Progress_Performance, marcusevans, FoCus Gipfel CRM, Montreux, 14.-16. Februar 2007

� Case Study CRM bei der DL, in Kundenmanagement –Grundlagen-Strategien-Beispiele von Manfred Krafft, März 2007

� Vom Callcenter zum Intelligent Multichannel Custom er Management Center , IBM Callcenter Circle, Hamburg HASPA, Mai 2008

� Neue Technologien schaffen eine Demokratisierung de r Information, Initiative Mittelstand http://www.imittelstand.de/themen/topthema_100288.html , 16.11.2009

� Integrierte Echtzeit Unternehmenssteuerung (IEU), IBM Partner Channel Kick Off-Berlin-Januar 2010, Salesforce.comCloudforce2-Frankfurt-März 2010, Teradata Enterprise Intelligence Summit-Berlin-April 2010, IBM Partner University-Frankfurt-April2010

� Integrated Realtime Corporate Management (IRCM), IBM Europe & Asia IT Architects University-Stuttgart-April 2010

References

References –Literature and Presentations

Page 6: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Agenda

1. Einführung� Das Unternehmen SPSS� Predictive Analytics und Predictive Enterprise

2. Bedarfsanalyse / Anforderungen

3. Vorstellung der Lösung

4. Zusammenfassung

Page 7: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Agenda

1. Einführung� Das Unternehmen SPSS� Predictive Analytics und Predictive Enterprise

2. Bedarfsanalyse / Anforderungen

3. Vorstellung der Lösung

4. Zusammenfassung

Page 8: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Wer ist IBM SPSS ?

� Seit 1968 fokussiert auf Predictive Analytics

� Weltweit führender Anbieter in den Bereichen Statistik, Analyse, Marktforschung und Data Mining

� Mehr als 250.000 Kunden mit ca. 3 Mio. Anwendern weltweit

� 80% der Fortune 500, 70% der Marktforschungs-unternehmen

� Über 1.200 Mitarbeiter weltweit

020406080

100120140160180200220240

1997 1999 2001 2003 20XX

40 Jahre Erfahrung in Statistik, Analyse, Marktforschung und Data Mining

Page 9: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

IBM SPSS –The ROI Leader in Analytics

� 94% of customers achieved a positive ROI

� payback period of 10.7 months.

� 81% of projects were deployed on time

� 75% on or under budget.

“This is one of the highest ROI scores Nucleus has ever seen in its Real ROI series of research reports”

� Best marketing automation solution

� Best customer-centric solution

� Best CRQI score (Customer Think Relationship Quality Index)� Project success� Customer loyalty

� Beat E.piphany, SAS and Unica

Page 10: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

10

Der Predictive Analytics Ansatz

Interaktionen Einstellungen

Demografie Verhalten

Kundenkontakt(in allen Kanälen)

Kumulativer ROI

Kunde

Page 11: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Predictive Analytics ist ein Prozess11

Capture

DataCollection

Act

DeploymentTechnologies

Predict

…Plattform

StatisticsText

MiningData

Mining

Page 12: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Vier Produktlinien für Mehrwert mit Predictive Analytics

12

StatisticsIBM SPSS Statistics

Data CollectionIBM SPSS Data Collection

ModelingIBM SPSS ModelerIBM SPSS Text Analytics

DeploymentIBM SPSS Collaboration & Deployment ServicesIBM SPSS Decision Management

Page 13: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Agenda

1. Einführung� Das Unternehmen SPSS� Predictive Analytics und Predictive Enterprise

2. Bedarfsanalyse / Anforderungen

3. Vorstellung der Lösung

4. Zusammenfassung

Page 14: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Die meisten Unternehmen haben einen Top-Down Ansatz für den Blick auf die vorhandenen Daten und analysieren diese. Häufig fehlt jedoch die Fähigkeit gewonnene Kenntnisse und Resultate der Analyse effektiv umzusetzen.

Gareth Herschel, Gartner Inc.

The Knowledge and Execution Gap

Page 15: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Gartner Group:Die “Prediktive (d.h. vorausschauende) Analyse”generiert aus Daten operative Aktionen, indem verlässliche Schlüsse zur aktuellen Situation und zukünftigen Ereignissen erkannt bzw. prognostiziert werden.

Die Sicht der Analysten zurPrediktiven Analyse

Page 16: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Operative

Systeme

Operative

Systeme

ERPERP

ERMERM

WebWeb

CRMCRM

BASISBASISBASISBASISBASISBASISBASISBASIS�� Interaktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit KundenInteraktion mit Kunden�� WarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaftWarenwirtschaft�� Supply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain ManagementSupply Chain Management�� QualitQualitQualitQualitQualitQualitQualitQualitäääääääätstststststststs--------KontrolleKontrolleKontrolleKontrolleKontrolleKontrolleKontrolleKontrolle�� FIBUFIBUFIBUFIBUFIBUFIBUFIBUFIBU

WebWeb

Business

Intelligence

Business

Intelligence

OLAPOLAPOLAPOLAPOLAPOLAPOLAPOLAP

ETLETLETLETLETLETLETLETL

DatenqualitDatenqualitDatenqualitDatenqualitäääättttDatenqualitDatenqualitDatenqualitDatenqualitäääättttQueryQueryQueryQuery/

ReportingReportingReportingReportingQueryQueryQueryQuery/

ReportingReportingReportingReporting DataDataDataDataWarehouseWarehouseWarehouseWarehouse

DataDataDataDataWarehouseWarehouseWarehouseWarehouse

STANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTINGSTANDARD REPORTING-- VergangenheitVergangenheitVergangenheitVergangenheitVergangenheitVergangenheitVergangenheitVergangenheit-- VorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiertVorstrukturiert-- Sehen was warSehen was warSehen was warSehen was warSehen was warSehen was warSehen was warSehen was war……………………

Analyse und

Vorhersage

Analyse und

VorhersageEmpfehlungenEmpfehlungen

ScoringScoringScoringScoringScoringScoringScoringScoring

DataDataDataDataMiningMiningMiningMiningDataDataDataDataMiningMiningMiningMining

OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:OPTIMIERT pro aktiv:Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und Warum ist es passiert und wie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifenwie kann ich eingreifen�� KundenbindungKundenbindungKundenbindungKundenbindungKundenbindungKundenbindungKundenbindungKundenbindung�� ProduktmixProduktmixProduktmixProduktmixProduktmixProduktmixProduktmixProduktmix�� DirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketingDirektmarketing�� QualitQualitQualitQualitQualitQualitQualitQualitäääääääätsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserungtsverbesserung�� PersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindungPersonalbindung

Der Analysekreislauf und IBM´s Software

Page 17: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

081500004711

13Kennedystr.Hamburg2258JBerg31Kennedystr.Hamburg22587BergPetra

Kennedy 13Hamburg22587BerkPeter

Verstehen

Kardinalität, Frequenz, Abhängigkeiten (Cross)

Parallel Verbindung Metadaten Admin Deployment

Analysieren der Quelldaten

Analysieren, Verstehen und Reports

Quellen-übergreifend

?

Liefern4711 4 925 528-01.07.2010

Transparenter Zugriff

Echtzeit-Daten

4711 13Kennedystr.Hamburg22587BergPetra320 985

Aktuellste Daten

Echtzeitzugriff durch Föderation

Konsistente Daten durch Replikation

4711 13Kennedystr.Hamburg22587BergPeter

Verbesserung der Qualität

Fehlende Informationsstandards

Fehlende Daten / DuplikateDuplikate, Referenz

Match, SelektionBereinigen

Verstehen LiefernPlattform

Bereinigen Transformieren

Transformieren

Joins, Aggregation,

Geschäfts-Regeln

4711 13Kennedystr.Hamburg22587BergPetra5 246 486

Extraktion, Transformation, LadenDaten GeschäftsinformationenVordefiniert, wiederverwendbar

0815

4711

5 228 76915.09.2007

13 34213.01.20084711 4 37521.12.2007

IBM InfoSphere Information ServerDatenfluss von Kundendaten

Page 18: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Operative Prozesse

Verhaltensdaten- Aufträge / Käufe- Transaktionen- Zahlungsverhalten- Nutzungsverhalten

Beschreibende Daten- Attribute- Charakteristik- selbsterklärende Informationen- (Geo)demographisch

Daten zur Einstellung- Meinungen- Präferenzen- Bedürfnisse- Wünsche

Interaktionsdaten- Angebote- Anrufe- Bemerkungen- Click streams- Anfragen

Prediktives Unternehmen:Kundeninformationen im Fokus

Daten-quellen des Unterneh-mens

Page 19: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Unternehmensplattform fürdie Prediktive Analyse

Operative Abläufe

Datenquellen des Unternehmens

Produkt& Markt

Finanzen &Risiko

Tätigkeiten

CRM

Kunden-dienst

Unternehmensplattform für d. Prediktive Analyse

Web-daten

Produkt-daten

Transakt-ionsdaten

Marketing-daten

Kunden-daten

VerstehenEinblick in die aktuelle Unternehmensleistung anbieten

� Was ist in der Vergangenheitgeschehen?

� Was geschieht momentan?

1

VorhersagenVerhalten in der Vergangenheit analysieren, um zukünftige Events vorherzusagen

� Was wird passieren?

2

AgierenOperative Prozesse überwachen und Maßnahmen vorschlagen

� Welche Maßnahme bietet dasbeste Ergebnis?

3

Page 20: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

“Einblick in die Effektivität von Marketingkampagnen”

“Management Cockpit:Indikatoren für die Schlüsselleistung”

“Visualisierung von komplexen Beziehungen”

Verstehen

Page 21: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Vorhersagen

“Entdecken neuer Risikoprofile”

“Modellierung des Kampagnenresponses und Auswahl der affinsten Segmente”

“Automatische Erkennung neuer Zielgruppen und Vorhersage ihres potenziellen Wertes”

“Einsatz von Clusterverfahren zur Kundensegmentierung und zur Erstellung von speziellen Angeboten für wenig loyale Kundengruppen”

Page 22: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Echtzeitempfehlungenüber Call Center

Kampagnenübergreifende Planung und Optimierung

Agieren

Optimierung der

Entscheidung

Optimierung des Direct Marketing, um die Resonanz und den Profit zu maximieren

Real-time Identifikation von suspekten Transaktionen

Risiko-Scoring, um Fälle für die Recherche zu bestimmen

Bewertung der Risiken zum Zeitpunkt der Dateneingabe

PersonalisierteAngebote via Website

Page 23: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Spektrum der Lösungen von SPSS

Befragungen

Echtzeit-Empfehlungen

Text AnalyticsData Mining

Web Mining VorhersagenKampagnen-

Optimierungen

Datengewinnung Optimierung der Abläufe

Page 24: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

SPSS Enterprise-Plattform für die Prediktive Analyse

SPSS BaseStatistik Server

SPSS Text Analytics – Inf. Mining PlattformText Analytics – Web Mining

SPSSDimensions

Befragungs-lösung

-EnterpriseFeedback

Management

Customer Touch Points

SPSS Unternehmensplattform für die Prediktive Analyse

DataWarehouse

OLAP, BI

Markt-forschungs-

daten

MarketingDatenbank

Interaktions-daten

Web-daten

Call CenterDatenbank

MonitoringReporting

SPSS Predictive Enterprise Services – Modellverwaltung, Security, Automatisierung

CustomApplications

IndividuelleUmsetzung

SPSSEvent Builder

ÜbergreifendeKampagnenoptimierung

SPSSInteraction Builder

Echtzeit Scoring fürWeb und Call Center

SPSSRisc Control BuilderEchtzeit Betrugserkennung

für Versicherungen

SPSSSHOWCASE(i5 – AS/400)

Partner(NT, Unix)

Page 25: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Agenda

1. Einführung� Predictive Analytics und Predictive Enterprise � Das Unternehmen SPSS

2. Bedarfsanalyse / Anforderungen

3. Vorstellung der Lösung

4. Zusammenfassung

Page 26: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

USP‘s „in a Nutshell“

� Zugriff auf alle Textformate

� Text Analytics� � enge Integration mit klassischem Data Mining� � Clementine-/Predictive Analytics – Deployment

(Echtzeit)

� Text Analytics: Schnell, standardisiert, flexibel anpassbar

� Intuitive grafische Bedienung und Darstellung, z.B. Web-Diagramme, Overlay-Diagramme, Tabellen

Page 27: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Was ist Text Analytics?

� Über 80% aller Daten, mit denen Unternehmen und Organisationen täglich zu tun haben, sind unstrukturierte Textdaten:� E-mails, � Call Center logs,� Reports, Fachartikel� Webseiten, Blogs, uvm.

� Text Analytics bedeutet, effizient strategisch nutzbares Wissen aus unstrukturierten Daten zu generieren � Identifikation zentraler Themen und Konzepte� Verfolgen von Diskussionen und Trends

Page 28: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Eine kurze Geschichte des linguistisch basierten Text Analytics

1970 1980 1990

« Bag of Words »-Extraktion

cstmrcustomer

Yellowinc

happynot

SwitchCell

phone

Extraktion von zusammenhängenden

Ausdrücken (Expressions

extraction)

cstmrcustomerYellow inc

switchCell phoneNot happy

Extraktion von « typisierten »

Begriffen(« Named Entities

extraction »)

customer -> CRM termCstmr?

Yellow inc -> Telco Company (not the color)Cell Phone -> Telco term

Not Happy switch

Nov 18th-> Date

Extraktion von Zusammenhängen

(« Events/SentimentExtraction »)

Nov 18thCustomer (cstmr) -> cell phone -> unhappy (Negative)

Switch to (Negative Predicate) -> yellow inc(Competition)

Kombinationmit strukturierten

Daten

Decision makingChurner

-> special offer

Freitext-Protokoll eines Kundenanrufs: “Customer not h appy with his cell phone, customer wants to switch to Yellow inc”

JETZT!!

Page 29: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Warum wird Text Analytics immer wichtiger

� “…Text mining will revolutionize customer service strategies within customer relationship management by 2008…”

� “…Text categorization software will not succeed as a stand-alone offering but will instead be embedded in portals, larger applications (email response) and data mining suites .”

Gartner Group

Page 30: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Text Analytics in the Predictive Enterprise� Text Analytics is a key component to capture any

kind of unstructured data to leverage Customer Insight and Predictive Applications

Behavioral data- Orders- Transactions- Payment history- Usage history

Descriptive data- Attributes- Characteristics- Self-declared info- (Geo)demographics

Attitudinal data- Opinions- Preferences- Needs- Desires

Interaction data- Offers- Results- Context- Click streams- Notes

Web data10 – 20%

improvement

Web data10 – 20%

improvement

Text data20 – 40%

improvement

Text data20 – 40%

improvement

Attitudes10 – 30%

improvement

Attitudes10 – 30%

improvement

Page 31: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Wer setzt Text Analytics ein?

TelcoTelco /ISP/ISP FBIFBI AutomotiveAutomotive

RetailRetail

Page 32: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Wer setzt Text Analytics ein?

MediaMedia Pharma./Life SciencesPharma./Life Sciences Public/Public/ GovernmentGovernment AgenciesAgencies

Page 33: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Einsatzbereiche

� Customer Relationship Management� “Voice of the customer”:

Wie äußern sich die Kunden?� Analyse von Einstellungen,

Wünschen, Meinungen zur besseren Betreuung

� Marktforschung und Befragungen� Analyse offener Fragen� Effizientes Auswerten von

Interviews

� Market Intelligence / Wettbewerberanalyse� Trends antizipieren� Wettbewerberverhalten

antizipieren

� Qualitätsmanagement� Frühzeitiges Erkennen von Fehlerquellen� Optimieren von Prozessketten

� Sicherheitsbehörden und Verwaltung� Bedrohungen schneller erkennen� Analyse von Einstellungen zu Behörden� Optimierung der Bürger-/

Klienteninteraktion

� Betrugserkennung� Auffälliges Verhalten schneller entdecken� Präziser Motive und mögliche

Betrugsindikatoren entdecken

� Wissenschaft� Genomforschung� Medikamentenentwicklung� Medizinische Forschung und

Patentrecherche

Page 34: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Customer Relationship Management

Page 35: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Telekommunikations-BrancheCustomer Retention Kampagne

Hintergrund

� Mobilfunkanbieter� 43,8 Mio. Kunden

Geschäftsziel

� Senken der Abwanderungsrate profitabler Kunden

� Motive der Kunden verstehen� Markttrends antizipieren

Lösung

� Kombination aus Text Analytics und Data Mining

� Bessere Prognose- und Klassifikationsmodelle

Ergebnis

� Prognosen um 15% verbessert

� Verbesserte Früherkennung von abwanderungswilligen Kunden

� Einsparungen von mehreren hunderttausend Dollar pro Jahr durch zielgerichtete Ansprache der richtigen Kunden zum richtigen Zeitpunkt mit den richtigen Angeboten

Page 36: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Die Verbesserung der Vorhersagen durch Text Analytics – wie geht das?

Strukturierte Kundenmerkmale und Transaktionsdaten: welche Kunden kündigen

Unstrukturierte Daten (Freitexte): warum kündigt ein Kunde?

&

Page 37: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Zugriffsmöglichkeiten mit Text Analytics

� SPSS Text Analytics versetzt Sie in die Lage, Texte aller Art aus� Internet� Dateiverzeichnissen� Befragungen� Datenbanken� .csv / Tabellenkalkulation uvm.

� speziell auf Ihre Bedürfnisse abgestimmt auszuwerten

� mit anderen (z.B. strukturierten) Daten zu verbinden

� => 3600-Sicht!

Page 38: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Zentrale Aufgabe: Verbinden der Informationen

Freitextkommentare

Linguistisch basiertes Text Analytics:

1. Sprache und Strukturen bestimmen

2. Konzepte identifizieren3. Konzepttyp, Häufigkeiten

und Muster analysieren

Integrierte Analyse strukturierter und unstrukturierter Daten

Leichtes Ergänzen und Verwalten von Synonymen, Schreibvarianten und Abkürzungen

Beispiel zum Anreichern von Kundendaten: hat sich ein Kunde entsprechend geäußert – oder nicht!

Page 39: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

CHURNTechnical Support

New Phone ASAP

New Phone

Nearest Store Location

Minute Charges Manager ASAP

Help Learning

Handset

Customer Care

Change Rate

Welche Themen hängen mit bestimmtenKategorien zusammen?

Stärkere Linien = Stärkere Assoziationen

Page 40: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Het is voor U voordeliger om een sms voorraad 50 aan te slui ten.

JohnsonChurchilllaan 221022 AMAmsterdam53463788

0622147763

0622147763

Cross-Selling Vorschlag

Kündigungsrisiko

Kundenwertindikator

Vodafone -Mehrumsatz durch optimierte Echtzeit Handlungsempfehlungen am Point of Sale

Page 41: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Merck Sharpe & DohmeÄrztekommentare und Patienten-Feedback

Hintergrund

� Deutsches Pharmaunternehmen, gegründet1891; 22,9 Mill. USD Umsatz (2004)

� Schwerpunkte der Anwendungen: AIDS, Asthma, CNS (ZentralesNervensysstem), Osteoporose und Herzmittel

Geschäftsziel

� Effektivere Marketingkampagnen durchgezielte Ansprache von Ärzten

Lösung

� Clementine und Text Analytics für Clementine ermöglichen ein besseres Verständnis und leichte Integration verschiedenerInformationskanäle (Umfragen, Datenbankenim Bereich Vorsorge uvm.)

� Ärzte und Personal können u.a. anhand ihresFeedbacks noch präziser bestimmten Profilenzugeordnet werden

Resultat

� Bestimmung typischer Sprachmuster, die in Zusammenhang mit Verordnungsverhalten bestehen

� Präzisere Kundenprofil-bildung und Segmentierung

� Verbesserung derKommunikation und des Informationsaustauschs imwissenschaftlichen Bereich

Page 42: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Text Analytics in derMarktforschung

Page 43: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

ArsoaMarktanforderungen besser verstehen

Hintergrund

� Hersteller von Naturkosmetik und Health Food

� Gegründet 1972, ca. 800.000 Kunden in Japan

� Vertrieb über 28.000 B-to-B Sales Representatives

Geschäftsziel

� Unterstützung der Produktentwicklung� Entwicklung eines Loyalty-Programms

Lösung

� Text Analytics zur Analyse projektüber-greifender Studienergebnisse, Experten-Interviews, Produkttests, Erfolg von Testprodukten, Kundendatenbanken uvm.

Ergebnisse

� Identifikation von Unterschieden zwischen neuen und existierenden Kunden, Entwicklung eines Loyalty-Programms

� Nutzen des Feedbacks von Produkttestern, um Produktentwicklung und Gestaltung von Labels und Beipackzetteln zu verbessern

� Gesteigerte Marktpräsenz

Page 44: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Marktforschung: Die wichtige Rolle offener Fragen

� Direkte „Voice of the Customer“

� Wichtige Antwortalternativen erfassen

� Vermeiden von Bias und verzerrtenErgebnissen

� Validitätskontrolle, u.a.:� Verstehen die Befragten die Zusammenhänge

richtig?� Gibt es weitere wichtige Aspekte?

Page 45: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Offene Antworten: Die Herausforderung des Kodierens

Reduktionvon Komplexität

Einschränkungdurch vordefinierte Code-

Schemata

Kostet Zeit und Geld

Der semi-manuelle Kodierungsprozess:

Schnelle , NLP-gestützte

Erfassung zentraler Themen

Flexible und dabei leicht standardi-

sierbare Kategorie-Schemata

Interkodierer-Reliabilität durch

konsistente Extraktionsraster

Leicht auf neue und verwandte Projekte

übertragbar

Text Analytics ermöglicht:

Page 46: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Text Analytics for Market Intelligence

Analyse externer Informationsquellen:Nutzen des Web 2.0 (Internetforen, Newsgroups uvm.)

Page 47: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Auswirkungen negativer Statements

Page 48: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Auswirkungen positiver Statements

Page 49: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

News Watch / Supervision von Webforen

� Tausende von Informationen, die täglich von Newsfeeds, Blog, Internetforen geliefert werden

� Darin « manuell » strategisch wichtige Themen zu entdeckenist sehr zeitaufwändig und erfordert viel geschulteRessourcen

� SPSS bietet Ihnen hierfür die « Finde-Maschine » um schnel lzu erkennen, welche Themen für Sie interessant sind� Welche Fragen werden gerade diskutiert?� Lassen sich Trends erkennen?� Wie kommunizieren die relevanten Akteure miteinander? � Gibt es Schlüsselfiguren und Meinungsbildner – wer sind

diese?� Dadurch erhalten Sie die Möglichkeit, rechtzeitig auf

Gerüchte, Stimmungen, Trends zu reagieren!

Page 50: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Blog- und Foren-Analyse Beispiel: Anderson Analytics

Eine Hotelkette ließ untersuchen, welche Ausstattungs-merkmale besonders häufig bei zufriedenen Kunden gelobt wurden – und welche von unzufriedenen Kunden kritisiert wurden!

Page 51: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Blog- und Foren-AnalyseAnderson Analytics

So ließ sich zeigen, dass über Probleme mit der Schließanlage berichtet wurde.

Diese wiederum wurden verursacht durch System-Wartung gegen Ende des Monats.

=> Ansatzpunkt für Gegenmaßnahmen!

Page 52: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Blog- und Foren-AnalyseAnderson Analytics

Verbesserte Kundensegmentierung:

• Loyale Kunden betonen positive Aspekte

• Wechselfreudige Kunden diskutieren verstärkt Sonderangebote

Page 53: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Beispiel zur Web Foren-Analyse (1)

� Führender Bekleidungs-hersteller analysiert Web-Foren für Jugendliche

� Vorteil von Text Analytics: es kann leicht durch den Anwender bezüglichspezieller Jargons undFachsprachen trainiertwerden

� « Nick names », Umschreibungen u.ä. können unter offiziellenBrandnames und eigenenstrategischen Kategorienzusammengefasst werden

Page 54: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Beispiel zur Web Foren-Analyse (2)

� “Gothic Style” alsHauptthema

� zwei signifikanteAusschläge imMai und September

Page 55: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

GerGerüüchte und Trends in Newsgroups chte und Trends in Newsgroups und Internetforen frund Internetforen fr üühzeitig erkennenhzeitig erkennen

Page 56: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Identification of patent infringements by mining newsfeeds

Page 57: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Agenda

1. Einführung� Predictive Analytics und Predictive Enterprise � Das Unternehmen SPSS

2. Bedarfsanalyse / Anforderungen

3. Vorstellung der Lösung

� Zusammenfassung

Page 58: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Der Mehrwert von SPSS Text Analytics-Lösungen� Designed für alle Arten von Text

� Meinungsforschung (Surveys), Webseiten, Newsgroups und Blogs, Manuals, technische Dokumentationen, Patente; Wettbewerberanalyse

� Informationen aller Art, die in Textform vorliegt!

� Skalierbar vom Einzelplatz zum unternehmensweiten Einsatz

� Viele Sprachen� Englisch, Französisch, Japanisch, Spanisch, Deutsch, Holländisch, Italiensisch, Portugiesisch; � Direkte Schnittstelle zu Language Weaver für u.a. Arabisch, Chinesisch, Persisch

� Teil der SPSS Plattform� Direkte Schnittstellen zur Integration weiterer Datenquellen� Schnittstellen und Exportmöglichkeiten für den variablen Einsatz in vielen Bereichen� Erfolgreicher Einsatz in weltweit über 1300 Unternehmen und Organisationen

� Interessen des Fachanwenders im Vordergrund� Training der Extraktions- und Suchfunktionen nach eigenen Interessen und Vorgaben (z.B. Orte,

Namen, Produkte, Themen)� Analyseraster nach eigenen Schwerpunkten bestimmen und leicht modifizieren können� Keine Linguisten und wenig IT nötig!

� Besser und schneller als „nur Lesen“!� Computer haben keine selektive Wahrnehmung, er arbeitet schnell und streng nach den vorgebenen

Rastern und Strategien,� und wird niemals müde!

Page 59: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

SPSS Predictive Text Analytics:Beispiele für Benefits

� 3600-Sicht auf die Kundenbeziehung� Schnelle Analyse von Kommentaren, Meinungsdaten uvm.� Leichte Verbindung mit Stammdaten und Transaktionsdaten

� Was wird im Internet diskutiert? Welche Themen sind in Online-Communities gerade wichtig?

� Was spielt sich auf den Webseiten anderer Unternehmen, Organisationen und Wettbewerber ab?

� SPSS Textanalyse:� Sofort sehen, was steckt in Newsgroups, offenen Antworten und

sonstigen Texten aller Art!„What (and who) is „hot“ – and what‘s not!

Page 60: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Einige zufriedene Nutzer von SPSS Text Analytics-Lösungen

“The combination of the Computer Forensics Architecture together with Textmining has significant advantages:

• Finding missed conclusions• Speeding up cases

Cases grow bigger and bigger, so better and faster insights in seized data isessential“ Jochen van der Wal

Dutch National Police Agency

“We know, thanks to SPSS text mining, which properties of and information about our drugs are particularly well understood in conversations with the doctors, and in which instances the terms used for our marketing campaigns still need to be refined”

Werner Kreiter, Data Mining SpecialistMerck Sharp & Dohme

“…We selected this solution because of its cost, the openness of the software, itsease of use and implementation, and the responsiveness of the vendor”

Pierre-Yves Thomas, ManagerDe Boeck/DBIT

Page 61: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Search

NA

*

NABPM

NACollaboration

NANABusiness Applications

NAPortal

NAApplication Server

Content Analytics

NABAM

Modeling/Metadata/MDM

NAContent Management

Database/Data Warehouse

Data Integration

NAPackaged Analytic Apps

NACPM Suites

BI Platform

*Predictive AnalyticsPredictive Analytics

= Strong Negative

= Caution

= OK or Promising

= Positive

= Strong Positive

Source: Gartner Mega Vendor Comparison, Feb 2009 + IBM Analysis

IBM SPSS –Der Leader in Analytics

* Relies on 3 rd party; OEM SPSS components

Page 62: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Auswahl internationaler Kunden

Page 63: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

IBM SPSS Customer Success Stories

Grow and Retain

“The power and ease of use of PASW Statistics enables the AMR Consumer Research department to perform more research than ever before and deliver timely reports while maintaining a small, dedicated staff.”

Grow

“With SPSS, HSBC Bank USA effectively mines an ever-growing file of customer data, creating predictive models to uncover cross-selling and “roll over”sales opportunities.”

Attract, Grow and Retain

“SPSS solutions add intelligence to our business ensuring efficiencies in pricing, marketing and reporting –something no company can afford to ignore in today’s business environment”Hong Juan Liu, R&D AnalystPremierline Direct

Page 64: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

“...Blend the Cognos portfolio with IBM's data integration, data quality, data warehouse,

content management, text mining & other offerings, & there's no more extensive information

management portfolio available, period…”

2008 Editor’s Choice AwardsIntelligent Enterprise Magazine

Leading Capabilities…

Page 65: IBM SPSS Text Analytics Juli 2010 Friedel Jonker
Page 66: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

© Copyright IBM Corporation 2010 All rights reserve d. The information contained in these materials is provided for informational purposes only, and is provided AS IS without warrantyof any kind, express or implied. IBM shall not be responsible for any damages arising out of the use of, or otherwise related to, these materials. Nothing contained in these materials is intended to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of the applicable license agreement governing the use of IBM software. References in these materials to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities referenced in these materials may change at any time at IBM’s sole discretion based on market opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. IBM, the IBM logo, Cognos, the Cognos logo, and other IBM products and services are trademarks of the International Business Machines Corporation, in the United States, other countries or both. Other company, product, or service names may be trademarks or service marks of others.

Page 67: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Questions?

??

?

Page 68: IBM SPSS Text Analytics Juli 2010 Friedel Jonker

Contact Details

Friedel JonkerDipl.-KaufmannManager Business Dev. Analytics & PMIBM Software GroupInformation Management

Wilhelm-Fay-Strasse 30-34D-65936 Frankfurt

Phone (+49)-69-6645-1227Fax (+49)-69-6645-5640Mobile (+49)[email protected]

More information from IBM and me. Look at Xing, Linkedin, Youtube, Twitter, Scribd, Slideshare and Lotus Greenhouse.

Join my Networks as Thomas H. Davenport, J. Ross (MIT),Daniel Pink, Charles Savage, David Croslin and other leadingThinkers and Practitioners have already done it !

Page 69: IBM SPSS Text Analytics Juli 2010 Friedel Jonker