|
Geleitwort: Den Menschen im Fokus – Datenschutz als Erfolgsfaktor für Big Data Technologien |
5 |
|
|
Vorwort |
7 |
|
|
Grußwort |
9 |
|
|
Grußwort: Data Science – Weiterbildung für die Zukunft |
10 |
|
|
Data Science – Entwicklungslinien und Trends |
11 |
|
|
Inhaltsverzeichnis |
15 |
|
|
Herausgeber- und Autorenverzeichnis |
23 |
|
|
Abbildungsverzeichnis |
37 |
|
|
Tabellenverzeichnis |
41 |
|
|
Teil I Data Strategist Digitalisierung von Geschäftsmodellen – Big Data Technologien erfolgreich implementieren |
42 |
|
|
1 Big Data |
43 |
|
|
Zusammenfassung |
43 |
|
|
1.1 Grundlagen |
43 |
|
|
1.2 Architektur und Bausteine |
46 |
|
|
1.3 Datengetriebene Geschäftsmodelle |
55 |
|
|
1.4 Exemplarische Einsatzmöglichkeiten |
57 |
|
|
Literatur |
64 |
|
|
2 Data Literacy als ein essenzieller Skill für das 21. Jahrhundert |
66 |
|
|
Zusammenfassung |
66 |
|
|
2.1 Notwendigkeit von Data Literacy |
67 |
|
|
2.2 Data Literacy als Begriff |
69 |
|
|
2.3 Data Literacy Skills im Detail |
71 |
|
|
2.4 Konzepte zur Implementation von Data Literacy in Lehre und Praxis |
73 |
|
|
2.5 Fazit |
77 |
|
|
Literatur |
78 |
|
|
3 Management von Big Data Projekten |
80 |
|
|
Zusammenfassung |
80 |
|
|
3.1 Konzeptioneller Rahmen des Informationsmanagements |
80 |
|
|
3.1.1 Überblick |
81 |
|
|
3.1.2 Aufgabenorientiertes Ebenenmodell |
81 |
|
|
3.1.3 Integriertes Informationsmanagement |
83 |
|
|
3.1.4 Einordnung von Big Data |
84 |
|
|
3.2 Digitalisierung von Geschäftsmodellen mit Big Data |
85 |
|
|
3.2.1 IT-Governance und Digitalisierung |
85 |
|
|
3.2.2 Von der IT-Strategie zur Business Digitalstrategie |
88 |
|
|
3.2.3 Management von Big Data |
92 |
|
|
3.2.4 Vorgehensmodelle zur Einführung von Big Data |
93 |
|
|
3.2.5 Messung des Reifegrades von Organisationen |
96 |
|
|
3.2.6 Auswirkungen von Big Data auf die Organisation |
98 |
|
|
Literatur |
99 |
|
|
4 Digital Leadership |
102 |
|
|
Zusammenfassung |
102 |
|
|
4.1 Führung im Digitalzeitalter |
102 |
|
|
4.2 New Work |
103 |
|
|
4.2.1 Mobile Arbeitsplätze |
104 |
|
|
4.2.2 Flexible Arbeitszeiten |
104 |
|
|
4.2.3 Veränderte Arbeitsinhalte |
105 |
|
|
4.2.4 Neue Arbeitsorganisation |
106 |
|
|
4.3 New Workforce |
107 |
|
|
4.3.1 Beschäftigungseffekte der Digitalisierung |
107 |
|
|
4.3.2 Rekrutierung von Generation Z |
107 |
|
|
4.4 Digital Leader |
110 |
|
|
4.4.1 Persönlichkeitsmerkmale |
110 |
|
|
4.4.2 Führungskompetenzen |
111 |
|
|
4.4.3 Virtuelle Führung |
111 |
|
|
4.5 Konzepte und Methoden für Digital Leadership |
112 |
|
|
4.5.1 SCRUM |
112 |
|
|
4.5.2 Design Thinking |
115 |
|
|
4.5.3 Servant Leadership |
116 |
|
|
4.5.4 VOPA?+?Modell |
116 |
|
|
4.6 Fazit |
118 |
|
|
Literatur |
119 |
|
|
Teil II Data Architect: Informationsarchitekturen gestalten – Daten effizient verwalten |
121 |
|
|
5 Data Engineering |
122 |
|
|
Zusammenfassung |
122 |
|
|
5.1 Aufgaben des Data Engineering |
123 |
|
|
5.2 Architekturen zum Daten-Management |
124 |
|
|
5.3 Datenmodellierung und Metadaten-Management |
128 |
|
|
5.4 Datenaufbereitung und Datenintegration |
130 |
|
|
5.5 Datenbank-Management-Systeme: SQL, NoSQL und Big Data |
136 |
|
|
5.6 Fazit |
139 |
|
|
Literatur |
140 |
|
|
6 Data Governance |
142 |
|
|
Zusammenfassung |
142 |
|
|
6.1 Einführung |
142 |
|
|
6.1.1 Begriffliche Einordnung |
142 |
|
|
6.1.2 Datenstrategie |
144 |
|
|
6.2 Data Governance Framework |
146 |
|
|
6.2.1 Strategie |
146 |
|
|
6.2.2 Aufbauorganisation |
148 |
|
|
6.2.3 Richtlinien, Prozesse und Standards |
149 |
|
|
6.2.4 Messen und Beobachten |
150 |
|
|
6.2.5 Technologie |
151 |
|
|
6.2.6 Kommunikation |
153 |
|
|
6.3 Data Quality Management (DQM) |
154 |
|
|
6.4 Fazit |
155 |
|
|
Literatur |
155 |
|
|
7 Einsatz von In-Memory Technologien |
157 |
|
|
Zusammenfassung |
157 |
|
|
7.1 Einleitung |
157 |
|
|
7.2 Definition und Abgrenzung In-Memory Technologien |
159 |
|
|
7.3 Anforderungen an den Einsatz einer In-Memory-Technologie |
163 |
|
|
7.4 Bewertung |
165 |
|
|
7.5 Fazit |
167 |
|
|
Literatur |
167 |
|
|
8 Big-Data-Technologien |
168 |
|
|
Zusammenfassung |
168 |
|
|
8.1 Einleitung |
168 |
|
|
8.2 Skalierbarkeit und Fehlertoleranz |
169 |
|
|
8.3 Volume – Management von großen Datenmengen |
172 |
|
|
8.4 Velocity – Kontinuierliche Verarbeitung von Datenströmen |
177 |
|
|
8.5 Variety – Unterstützung für die Zusammenführung von heterogenen Daten |
180 |
|
|
8.6 Fazit |
183 |
|
|
Literatur |
183 |
|
|
9 Information Data Models: Das Fundament einer guten Information Strategy |
184 |
|
|
Zusammenfassung |
184 |
|
|
9.1 Drei Thesen aus Sicht eines Praktikers |
185 |
|
|
9.2 It`s all about the information |
187 |
|
|
9.3 Das Heute und seine Hürden |
187 |
|
|
9.4 Wie es dazu gekommen ist |
188 |
|
|
9.5 Die Enterprise Architektur |
189 |
|
|
9.6 Drei Formen der Informations-Architektur und deren Auswirkungen |
190 |
|
|
9.6.1 Das Gestern und leider noch das Heute. Der anwendungszentrierte Ansatz (The Application Centric Approach) |
190 |
|
|
9.6.2 Das Heute und die Morgendämmerung, der datengesteuerte Ansatz (The Data Driven Approach) |
191 |
|
|
9.6.3 Das überfällige Übermorgen, die datenzentrische Architektur (The Data Centric Architecture) |
194 |
|
|
Literatur |
197 |
|
|
Teil III Data Analyst: Auswerten, Präsentieren, Entscheiden – Systematische Datenanalyse im Unternehmen |
199 |
|
|
10 Reporting multidimensionaler Daten und Kennzahlen |
200 |
|
|
Zusammenfassung |
200 |
|
|
10.1 Betriebswirtschaftliche Motivation |
200 |
|
|
10.1.1 Kennzahlen und ihre Anwendung |
201 |
|
|
10.1.2 Auswahl von Kennzahlen |
202 |
|
|
10.2 Daten und Business Intelligence |
203 |
|
|
10.2.1 Datenmodellierung |
204 |
|
|
10.2.2 Datensicherung |
205 |
|
|
10.2.3 Harmonisierung |
206 |
|
|
10.2.4 Daten-/Informationsqualität |
206 |
|
|
10.2.5 Datenbereitstellung |
207 |
|
|
10.3 Reporting/Berichtswesen |
207 |
|
|
10.3.1 Berichtsgrundformen |
209 |
|
|
10.3.2 Anforderungen an Berichte |
210 |
|
|
Literatur |
210 |
|
|
11 Fundamentale Analyse- und Visualisierungstechniken |
212 |
|
|
Zusammenfassung |
212 |
|
|
11.1 Einleitung und Begriffswelt |
212 |
|
|
11.2 Lineare Regression |
215 |
|
|
11.2.1 Basisidee und Begrifflichkeiten |
215 |
|
|
11.2.2 Beispiel und Ergebnisinterpretation |
216 |
|
|
11.2.3 Prüfen der Voraussetzungen und Variablentransformation |
218 |
|
|
11.3 Einfache Klassifikationsverfahren |
219 |
|
|
11.3.1 k-Nearest-Neighbors |
219 |
|
|
11.3.2 Naive Bayes |
220 |
|
|
11.3.3 Entscheidungsbäume |
221 |
|
|
11.4 Clustering-Verfahren |
222 |
|
|
11.4.1 Hierarchische Verfahren |
222 |
|
|
11.4.2 Partitionierende Verfahren |
224 |
|
|
11.5 Assoziationsanalyse |
224 |
|
|
11.6 Ergänzende Überlegungen, Software und Tools |
225 |
|
|
Literatur |
226 |
|
|
12 Fortgeschrittene Verfahren zur Analyse und Datenexploration, Advanced Analytics und Text Mining |
227 |
|
|
Zusammenfassung |
227 |
|
|
12.1 Einleitung |
227 |
|
|
12.2 Datenexploration und -darstellung |
228 |
|
|
12.3 Principal Component Analysis |
229 |
|
|
12.4 Random Forests |
232 |
|
|
12.5 Logistische Regression |
232 |
|
|
12.6 Entscheidungsbewertung |
233 |
|
|
12.7 Zeitreihenanalyse |
234 |
|
|
12.8 Text Mining |
237 |
|
|
12.9 Weitere Analysemöglichkeiten |
239 |
|
|
Literatur |
240 |
|
|
13 Datenbasierte Algorithmen zur Unterstützung von Entscheidungen mittels künstlicher neuronaler Netze |
241 |
|
|
Zusammenfassung |
241 |
|
|
13.1 Datenbasierte Algorithmen und maschinelles Lernen |
241 |
|
|
13.1.1 Maschinelles Lernen |
242 |
|
|
13.1.2 Lernverfahren |
243 |
|
|
13.2 Künstliche neuronale Netze |
244 |
|
|
13.2.1 Netzarchitekturen |
244 |
|
|
13.2.2 Grenzen künstlicher neuronaler Netze |
245 |
|
|
13.3 Beispielhafte Anwendungsfelder |
246 |
|
|
13.4 Entwicklungsprozess |
248 |
|
|
13.5 Entwicklungsplattformen und Werkzeuge |
249 |
|
|
13.5.1 TensorFlow und PyTorch |
250 |
|
|
13.5.2 Ausführungsmodi |
251 |
|
|
13.5.3 Deployment und Betrieb |
252 |
|
|
13.6 Fazit und Ausblick |
254 |
|
|
Literatur |
255 |
|
|
14 Künstliche Neuronale Netze – Aufbau, Funktion und Nutzen |
257 |
|
|
Zusammenfassung |
257 |
|
|
14.1 Einleitung |
258 |
|
|
14.2 Aufbau |
259 |
|
|
14.2.1 Künstliches Neuron |
259 |
|
|
14.2.2 Künstliche neuronale Netze |
261 |
|
|
14.3 Lernen künstlicher neuronaler Netze |
265 |
|
|
14.3.1 Überwachtes Lernen – Lernen mittels Backpropagation |
266 |
|
|
14.3.2 Unüberwachtes Lernen – Lernen mittels Wettbewerbslernen |
267 |
|
|
14.4 Nutzenpotenziale und Herausforderungen |
268 |
|
|
14.5 Fazit |
270 |
|
|
Literatur |
270 |
|
|
15 Bayesian Thinking in Machine Learning |
272 |
|
|
Zusammenfassung |
272 |
|
|
15.1 Bayesian Thinking |
273 |
|
|
15.2 Bayes in Machine Learning |
276 |
|
|
15.2.1 Bayes in Regressionsverfahren |
276 |
|
|
15.2.2 Bayes in Klassifikationsverfahren |
280 |
|
|
15.3 Naive Bayes Classifier |
282 |
|
|
15.3.1 Grundlagen |
282 |
|
|
15.3.2 Methodik |
283 |
|
|
15.4 Fazit |
285 |
|
|
Literatur |
285 |
|
|
Teil IV Anwendungsorientierte Data Science |
287 |
|
|
16 Text Mining: Durchführung einer Sentiment Analysis mit SAP HANA |
288 |
|
|
Zusammenfassung |
288 |
|
|
16.1 Einleitung |
288 |
|
|
16.2 Grundlagen |
289 |
|
|
16.3 Umsetzung |
290 |
|
|
16.3.1 Vorgehensmodell |
290 |
|
|
16.3.2 Implementierung |
292 |
|
|
16.3.2.1 Datenakquise |
293 |
|
|
16.3.2.2 Datenverarbeitung |
295 |
|
|
16.3.2.3 Datenanalyse |
300 |
|
|
16.4 Fazit |
302 |
|
|
Literatur |
303 |
|
|
17 Weiterbildung in Data Science |
305 |
|
|
Zusammenfassung |
305 |
|
|
17.1 Kompetenz-Rahmenwerke für Data Science |
306 |
|
|
17.2 Studiengänge zu Data Science |
308 |
|
|
17.3 Berufliche Weiterbildung zu Data Science |
311 |
|
|
17.3.1 Zertifikatsprogramm der Fraunhofer Gesellschaft zu Data Science |
312 |
|
|
17.3.2 Zertifikatsstudien der Hochschule Niederrhein |
313 |
|
|
17.3.3 Zertifikatslehrgang zum Data Scientist der Bitkom Akademie |
315 |
|
|
17.4 Fazit |
316 |
|
|
Literatur |
317 |
|
|
18 Plattformökonomie für Data Plattformen |
318 |
|
|
Zusammenfassung |
318 |
|
|
18.1 Motivation |
318 |
|
|
18.2 Begriffshaushalt |
319 |
|
|
18.2.1 Plattformen und Plattformökonomie |
319 |
|
|
18.2.2 Data Plattform |
321 |
|
|
18.3 Design-Prinzipien für Data Plattformen |
323 |
|
|
18.3.1 Netzwerkeffekte durch gemeinsam genutzte Datenobjekte |
323 |
|
|
18.3.2 Strategien für die Aktivierung von Plattformteilnehmern |
324 |
|
|
18.3.3 Einfacher Zugang durch Self-Service |
325 |
|
|
18.3.4 Effektives Matching durch Metadaten |
326 |
|
|
18.4 Monetarisierung |
326 |
|
|
18.5 Zusammenfassung und Fazit |
327 |
|
|
Literatur |
329 |
|
|
19 Akzeptanz und Nutzung von maschinellem Lernen und Analytics im Rechnungswesen und Controlling |
331 |
|
|
Zusammenfassung |
331 |
|
|
19.1 Eine Herausforderung für die Finanzfunktion |
332 |
|
|
19.2 Nutzerakzeptanzforschung zu maschinellem Lernen |
333 |
|
|
19.3 Befragung von Führungskräften |
334 |
|
|
19.3.1 Strukturgleichungsmodell |
334 |
|
|
19.3.2 Umfrage |
334 |
|
|
19.4 Aktuelle Nutzung und Treiber |
336 |
|
|
19.4.1 Ergebnisse der Befragung |
336 |
|
|
19.4.2 Treibermodell zur Nutzung und Akzeptanz |
341 |
|
|
19.5 Handlungsempfehlungen und Ausblick |
343 |
|
|
Literatur |
344 |
|
|
20 Durch Daten zu neuen Geschäftsmodellen und Prozessoptimierungen – im Kontext von Car-Sharing |
346 |
|
|
Zusammenfassung |
346 |
|
|
20.1 Kurze Einführung |
346 |
|
|
20.2 Durch Daten zu neuen Ideen und Optimierungen |
347 |
|
|
20.3 Umdenken im Unternehmen |
350 |
|
|
20.4 Durch ständige Überwachung zur stetigen Anpassung |
353 |
|
|
20.5 Mit ‚Lessons Learned‘ zur Optimierung von Geschäftsmodellen und -prozessen |
356 |
|
|
20.6 Fazit |
360 |
|
|
Literatur |
360 |
|
|
21 Einsatz von Logit- und Probit-Modellen in der Finanzindustrie |
361 |
|
|
Zusammenfassung |
361 |
|
|
21.1 Einleitung |
361 |
|
|
21.2 Logit- und Probit-Modelle |
362 |
|
|
21.3 Datengrundlage |
364 |
|
|
21.4 Modellierung |
367 |
|
|
21.5 Überprüfung der Modellannahmen |
371 |
|
|
21.6 Vorstellung der Ergebnisse |
372 |
|
|
21.7 Vergleichende Beurteilung |
375 |
|
|
Literatur |
378 |
|
|
Stichwortverzeichnis |
381 |
|