Big Data vs. Small Data

Big Data ist eines der beliebtesten 'Buzzwords' unserer Zeit. Doch ab wann ist denn 'big' überhaupt 'big'?

Im Zentrum steht die Fülle an Daten, die täglich – in jeder Minute – erzeugt und erfasst werden. Den Wenigsten von uns ist das quantitative Ausmaß dieser Daten tatsächlich bewusst.

Big Data in Zahlen


Jeden Tag werden weltweit 2,5 Trillionen Byte Daten generiert.
Anders ausgedrückt sind das 2.500.000.000.000.000.000 Byte. – Das erscheint in erster Linie vor allem überwältigend und erschließt sich erst bei näherer Betrachtung.
Ein überwiegender Anteil der Weltbevölkerung verfügt über einen Internetzugang. Bedenkt man, dass durchschnittlich jeden Tag etwa 300 Milliarden E-Mails gesendet werden oder 55 Milliarden WhatsApp-Nachrichten das Smartphone verlassen, lässt sich im Ansatz erkennen, wie solch eine Datenmenge zustande kommen kann.
Bei etwa 90 Prozent dieser Informationen handelt es sich um unstrukturierte Daten – das sind also Fotos, Sprachdaten etc. Um diese Daten zu verwerten und Erkenntnisse daraus ziehen zu können, müssen sie also erst entsprechend strukturiert werden.

Groß gegen Klein 


Big Data wird meist mithilfe der drei V’s Volume (Menge), Velocity (Geschwindigkeit) & Variety (Vielfalt)charakterisiert. 
Doch abgesehen davon, unterscheidet sich Big Data von Small Data in wesentlichen praktischen Merkmalen: 


#1 Ort


Ist die Rede von Small Data, handelt es sich in den meisten Fällen um Daten, die an einem physischen Ort (zB Festplatte) gebündelt sind. Big Data bekäme hier schlichtweg ein Platzproblem. Große Datenmengen verteilen sich auf viele verschiedene Server, nicht selten auch auf unterschiedliche Länder.

#2 Datenstruktur

Klassische Excel-Sheets und andere Tabellen sind typische Formate kleinerer Datensätze. Durch die feste Form sind diese in der Regel auch bereits strukturiert. Big Data hingegen umfasst alle generierten Daten und somit unterschiedlichste Quellen und Formate.

#3 Messung

Während Small Data innerhalb einer bestimmten Zeitspanne in einheitlichen Maßen (Bsp. einer Währung) gesammelt werden, müssen große Datenmengen diverser Quellen erst aufwändig übertragen werden.

#4 Reproduzierbarkeit

Die Chance bei einem Verlust oder technischen Fehler kleine Datenmengen wiederherzustellen, ist (mit etwas Mühe) sehr viel größer als bei Big Data. Je nach Ausmaß des Problems, kann eine vollständige Rekonstruktion unmöglich werden.

#5 Analyse

Die Analyse von Small Data wird häufig in einem festgelegten Zeitraum von einigen beteiligten Personen durchgeführt. Bei Big Data funktioniert eine Analyse viel mehr wie ein Puzzle, dass in unterschiedliche Teile zerlegt, analysiert und wieder zusammengeführt wird.


#6 Introspektion

Kleine Datenmengen können sich selbst beschreiben, das bedeutet es wird eine Art Kern-Objekt festgelegt und mit entsprechenden Informationen angereichert. Diese Überschaubarkeit kann bei Big Data nicht mehr gewährleistet werden, viel mehr dominieren hier unzählige wechselseitige Zusammenhänge.

Auch wenn 'Big Data' in aller Munde ist: die 'kleinen' Datensätze sind die weniger oft zitierten Helden, die uns Zusammenhänge und Trends in Echtzeit liefern können. Das sind Daten, die uns - entsprechend aufbereitet - zu Analysen und Erkenntnissen verhelfen, um unser Unternehmen und unsere Organisation erfolgreich durch den Alltag zu steuern.

Magazin

Andere Beiträge

This is the thumbnail of the other blogpost.
Augmented Analytics: Unterstützung am Weg zur Data-Driven Culture

Was waren die umsatzstärksten Tage der letzten zwei Jahre? Wieviele Produktivstunden leisten meine Mitarbeiter? Welches Projekt ist aktuell wirtschaftlich am effektivsten?

Read more
This is the thumbnail of the other blogpost.
Data Literacy – der Weg zur Information

Wollen wir gewinnbringende Erkenntnisse aus Daten generieren, ist eine data-driven Culture notwendig. Doch auf dem Weg dahin, hemmt häufig ein unsicheres Gefühl im Umgang mit "Daten" den Fortschritt.

Read more