Wovon sprechen wir hier eigentlich?
Gemeint ist in erster Linie eines: eine enorm große Menge strukturierter und unstrukturierter Daten. Unternehmen unterschiedlichster Branchen - ob aus Wirtschaft, Gesundheitswesen oder Energieindustrie - generieren alle täglich Daten.
Aber woher kommen diese Daten und wofür brauchen wir sie?
Produziert werden die Daten von uns, der Bevölkerung, im Grunde von jedem.
Ein Online-Einkauf, der Besuch im Fitness-Studio, jeder neue Social-Media Freund, die Routenplanung mit dem Navi, jedes Telefonat, die monatliche Überweisung und so weiter –alles was wir tun, abseits von analoger Kommunikation, generiert neue Daten.
Neben den strukturierten Daten - damit sind Zahlen oder andere Informationsträgern in tabellarischer Form gemeint - stellen besonders unstrukturierte Daten eine große Herausforderung dar. Diese sind die Fülle an digitalen Informationen, die nicht direkt in eine Software übertragbar und somit verwertbar sind. Texte in natürlicher Sprache, Bilder oder menschliche Tonaufnahmen müssen daher zur Verarbeitung transformiert, in ein Schema gebracht und sortiert werden.
Bedenkt man, dass die Hälfte der Weltbevölkerung, also etwa 3,8 Milliarden Menschen das Internet nutzen wird schnell klar, dass die Dimension der vorhandenen Daten enorm ist.
Big Data in Zahlen: Schätzungen zufolge entstehen die Daten, die die Menschheit seit ihrem Entstehen bis zum Jahr 2002 gesammelt hat, in aktuell etwa zehn Minuten.
Die bloße Menge der Daten ist also der eine Teil von Big Data.
Eine Basisdefinition von Big Data stammt aus dem Beratungsunternehmen McKinsey und konzentriert sich auf die drei Vs: Volume, Variety und Velocity.
Die riesige Menge der umherschwirrenden Daten erklärt also bereits den ersten Aspekt des Volumens. Begreift man deren Vielfalt (Variety), dringt man schon wesentlich tiefer ein. Zum einem sind damit die unterschiedlichsten Quellen aus denen wir Daten gewinnen gemeint - sozusagen die digitalen Alltagshandlungen, auch abseits von Siri, Alexa & Co.
Zum anderen wird mit der Vielfalt das Format der Daten beschrieben - ob sie als Video, Text, Audiodateien oder numerischer Irrgarten vorliegen.
Velocity bezieht sich auf die hohe Geschwindigkeit mit der Daten entstehen und verarbeitet werden müssen.
Die Massen an Daten die permanent entstehen sind mit herkömmlicher Soft- und Hardware nicht mehr zu bewältigen. Und die Daten wachsen weiter. Aus diesem Grund gibt es spezielle Lösungen, um die Anforderungen effizient zu handeln. Mit Hilfe von Business Intelligence Tools können die Informationen geordnet und visualisiert werden.
Die Daten wollen verwertet, also analysiert und genutzt werden, um Zusammenhänge und Strukturen zu erkennen und reagieren zu können.
Als Nutzer im Sinne von Kunden und Dienstleistungsempfängern profitieren wir häufig von diesen Daten - ob personalisierte Musikvorschläge, Buchempfehlungen, Sportangebote oder Rezept-Tipps. Was längst Einzug in den Alltag gefunden hat ist nicht die beachtliche Intuition des Internets, sondern das Ergebnis präzisen Datenmanagements. Und es ist längst nicht mehr nur der allen bekannte Online-Versandriese, der passende Produkte vorschlägt und zeigt was andere Käufer noch interessant fanden.
Mechanismen wie diese sind datengestützte Handlungsempfehlungen und basieren auf der Echtzeitungauswertung von Millionen von Kaufdaten anderer Kunden.
Gewissermaßen leben die meisten von uns eine Art „data-driven Lifestyle“.
Es werden also in rasanter Geschwindigkeit und großer Menge Daten produziert.
Lernt man im Unternehmen damit umzugehen, birgt das die Möglichkeit darauf reagieren zu können und das lohnt sich.
Der Nutzen der Datenanalyse ist für Unternehmen einerseits immer da besonders groß, wo es seinen Kunden nahe kommt. Zum anderen ist sie auch unternehmensintern ein effektives Mittel für strategische und wirtschaftliche Entscheidungsfindungen.
Die wichtigste Ressource ist nicht länger Öl, sondern Daten. Economist 12/6/17
#BigData #DataDrivenLifestyle
‚IoT‘ boomt, aber warum eigentlich? Stellen Sie sich vor, Sie sparen bares Geld, weil Sie Strom effizient nutzen und teure Verbrauchsspitzen vermeiden, wissen welche Arbeitsplätze ...
Read moreWenn es um die 'Demokratisierung von Daten' geht, so gibt es dabei unterschiedliche Ebenen. Die eine ist das öffentliche zur Verfügung stellen von Daten, wie man es zB von Open Data Portalen kennt.
Read more