Big Data
Daten - das Gold und die Währung des 21. Jahrhunderts?
Nie zuvor stellten scheinbar triviale Informationen über eine beliebige Person ein so hohes Geschäfts- und Diskussionspotenzial dar.
Daten sammeln, Daten analysieren, mit Daten handeln, mit Daten Geld verdienen und (Kauf-)entscheidungen beeinflussen.
Unsere Datenbestände wachsen exponentiell. Berechnungen zufolge verdoppelt sich das weltweite erzeugte Datenvolumen alle 2 Jahre.
Daten sind zu einem Machtinstrument geworden, die einerseits in Forschung und Medizin zu wichtigen Durchbrüchen führen.
Andereseits sehen einige, wie die Wirtschaftswissenschaftlerin Shoshana Zuboff, in der Sammlung von personenbezogenen Daten durch Internetkonzerne, wie Google und Facebook, die Gefahr eines Überwachungskapitalismus.
In diesem Beitrag erfahren, wofür der Begriff Big Data steht und welchen Chancen und Risiken er birgt.
Big Data - erklärt in 3 Minuten
Urheber: "youknow“
Big data - Definition
Unter "Big Data" versteht man riesige Datenmengen.
Gesammelt werden sie u.a. aus dem Internet, dem Mobilfunk, Finanzindustrie, Energiewirtschaft, Gesundheitswesen und Verkehr und aus Quellen wie intelligenten Agenten, sozialen Medien, Kredit- und Kundenkarten, Smart-Metering-Systemen, Assistenzgeräten, Überwachungskameras sowie Flug- und Fahrzeugen.
Anschließend können sie mit speziellen Lösungen gespeichert, verarbeitet und ausgewertet werden.
„Big Data“ versteht man auch als Sammelbegriff für digitale Technologien (die zum Sammeln und Auswerten dieser Datenmengen verwendet werden).
Grundsätzlich ist der Begriff „Big Data“ von einem kontinuierlichen Wandel geprägt.
Big data - Dimensionen
Die gewonnenen Datenbestände sind von solch beträchtlichem Ausmaß, Schnelllebigkeit und Komplexität geprägt, dass sich die Verarbeitung mit herkömmlichen Methoden gar nicht oder nur schwer bewerkstelligen ließ.
Man konnte die Datenbestände zwar speichern und darauf zugreifen.
Aber erst in den frühen 2000er Jahren gewann Big Data an Bedeutung, als der Branchenanalytiker Doug Laney den Begriff in seinem 3-V-Modell definierte:
Volume (Masse)
= der Umfang und das eigentliche Datenvolumen
Unternehmen sammeln Daten aus verschiedenen Quellen, z. B.
- smart devices (IoT)
- geschäftliche Transaktionen
- Social Media
Vor nicht allzu langer Zeit wäre die Datenspeicherung in diesem Ausmaß nicht möglich gewesen.
Heute ist es dank kostengünstigerer Speicherplattformen (Data Lakes, Hadoop) kein Problem mehr.
Velocity (Geschwindigkeit)
= Geschwindigkeit, mit der die Datenmengen generiert und transferiert werden
Vor allem seit der Ausbreitung & des Erfolgs des Internet of Things (IoT) landen enorme Datenmengen innerhalb kürzester Zeit in Unternehmen ein und können unverzüglich verarbeitet & analysiert werden.
Dank Sensoren, RFID-Tags, Smart Metering etc. lassen sich riesige Datenmengen nahezu in Echtzeit bewältigen.
Variety (Vielfalt)
= Bandbreite der Datenquellen und -typen
Daten werden in verschiedenen Formaten gewonnen, z. B.
- strukturiert
- unstrukturiert (Textdokumente, E-Mails, Videos, Audioquellen, Finanztransaktionsdaten)
- numerisch (aus herkömmlichen Datenbanken)
Immer öfter ergänzt man die Definition um folgende Begriffe (die sich auf den unternehmerischen Mehrwert beziehen, der durch diese Daten generiert wird sowie die Datenqualität und Ihre Richtigkeit):
- Variability (Variabilität)
- Veracity / Validity (Datenqualität, Echtheit von Daten)
Warum ist Big Data so wichtig?
Grundsätzlich ist Big Data vor allem für die Business Intelligence
(kurz BI = Verfahren und Prozesse zur systematischen Analyse des eigenen Unternehmens) von Bedeutung.
Massendaten sind im Einzelnen recht unwesentlich. Entscheidend ist, was man mit der Fülle der Daten macht.
Durch gezielte Analysen können wichtige Erkenntnisse (z. B. in der Forschung, medizinischen Diagnostik und im Marketing) gewonnen werden.
Diese Grundlage bietet wiederum den Nährboden für effiziente & strategische Entscheidungen und Wettbewerbsvorteile.
Mithilfe von Datenanalysen & -auswertungen spart man nicht nur Kosten und Zeit und optimiert seine Produkte.
Inzwischen können Fehlfunktionen, Probleme und Defekte nahezu in Echtzeit festgestellt, Kaufgewohnheiten bestimmt, Risiken berechnet, Betrugsfälle schneller aufgeklärt bzw. verhindert und Prognosen und zukünftige Trends ermittelt werden.
Kritik & Gefahren von Big Data
Da man bei der Datenerfassung auch in die Privatsphäre der Nutzer eindringt, kommt es zu einer Herausforderung für den Datenschutz und den Persönlichkeitsrecht des Einzelnen.
Daher muss auf eine strikte Anonymisierung der Daten geachtet werden ... theoretisch. In der Realität liegt oft kein Einverständnis jedes Betroffenen für die Verwendung der Daten vor.
Big Data als Big Brother
"Die Verknüpfung von an sich unproblematischen Informationen kann zu problematischen Erkenntnissen führen", sodass man plötzlich zum Kreis der Verdächtigen gehört, und die Statistik kann einen als kreditunwürdig und risikobehaftet erscheinen lassen, weil man im falschen Stadtviertel wohnt, bestimmte Fortbewegungsmittel benutzt und gewisse Bücher liest."
(Gabler Wirtschaftslexikon)
Beispiele für Big Data
- Bonitätsprüfung (Big-Data-Kreditscoring)
- Direktmarketing: direkte, persönliche Ansprache von z. B. Kunden oder Wählern zur Beeinflussung von Kauf- bzw. Wahlentscheidungen oder mit dem Ziel sonstiger Meinungs- oder Verhaltensbeeinflussung
-> Online-Manipulation der Wähler?
Bei der Präsidentschaftswahl in den Vereinigten Staaten 2016 wurde das Unternehmen Cambridge Analytica engagiert, die sich mit der Erhebung, Auswertung und mit dem Verkauf (hauptsächlich im Internet gewonnener) persönlicher Daten beschäftigt und Methoden der Psychometrik anwendet, einem Ableger der Psychologie.
- Entdeckung von Unregelmäßigkeiten bei Finanztransaktionen (Fraud-Detection)
- Einführung und Optimierung einer intelligenten Energieverbrauchssteuerung (Smart Metering)
- Erkennen von Zusammenhängen in der medizinischen Diagnostik
- Erstellung von Bewegungs-, Kauf-, Persönlichkeitsprofilen (Big Five, Psychologie)
- Echtzeit-Cross- und Upselling im E-Commerce und stationären Vertrieb
- Fabriksteuerung, Produktionsplanung und vorausschauende Wartungsmaßnahmen im Kontext von Industrie 4.0
- Geheimdienstliches Erstellen von Bewegungsprofilen mit Programmen
- IT Operations Analytics: Das Anwenden der „Big Data“-Prozesse auf IT-Systeme, um effizientes und innovatives IT-Management zu betreiben
- Nutzbarmachung von großen Datenmengen in der Landwirtschaft (im Zuge von Smart Farming)
- Risikobewertung und Anpassung von Versicherungsbeiträgen in Abhängigkeit vom Verhaltensmuster (Beitragsgestaltung PKW je nach Fahrweise, für die Krankenversicherung je nach gesundheitsbezogenem Verhalten)
- Vorhersage von Epidemien
- Verbesserungen der Arbeitsbedingungen für Mitarbeiter, etwa die Reduzierung von Burnout Raten, durch datenbasierte Change Projekte
- Verarbeitung von Daten aus Wettersatelliten und anderen naturwissenschaftlich eingesetzten Sensoren
Quellen
https://wirtschaftslexikon.gabler.de/definition/big-data-54101
https://www.sas.com/de_de/insights/big-data/what-is-big-data.html
https://weissenberg-group.de/einfach-erklaert-was-ist-big-data/
https://de.wikipedia.org/wiki/Big_Data