Gibt es ein erforderliches Datenvolumen für Big Data?

Gibt es ein erforderliches Datenvolumen für Big Data?

Mein Unternehmen hat nur 100 Gigabyte Daten, kann ich damit „Big Data“ betreiben?

Das Datenvolumen, auf das Sie zugreifen können, hängt stark von Ihrer eigenen Aktivität ab. 10 GB an Videoaufnahmen entsprechen nicht im Entferntesten 10 GB an Text: die über 5 Millionen Yelp-Benutzerbewertungen von 174.000 verschiedene Unternehmen passen auf einen einfachen 4 GB–USB-Stick… Und doch reichen diese Daten aus, um korrekt entwickelte Lern- und Prognosealgorithmen durchzuführen.

Der Begriff „Big Data“ ist vage und das wahrscheinlich sogar mit Absicht. Er steht gleichzeitig für eine Datenmenge, für eine Reihe von Technologien und Techniken zur Verwaltung und Analyse großer Datenmengen, für bestimmte Arten von Daten und stellt darüber hinaus ein neues Modell für die Arbeitsweise eines Unternehmens dar.

Infolgedessen wird Big Data (wie auch „Künstliche Intelligenz“ oder „Deep Learning“) als etwas Beeindruckendes, vielleicht sogar Beängstigendes oder Mysteriöses wahrgenommen, was genau zwei Reaktionen bei digitalen Akteuren hervorruft:

Für Erstere glauben wir, dass es ein wesentlicher Bestandteil von Unternehmen ist, aufkommende Trends zu nutzen, um das Geschäfts voranzutreiben. Und genau diese Einstellung ist es, die die Nutzung von Big-Data-Tools mittelfristig wirklich voranbringen kann.

Letzteren möchten wir ans Herz legen, dass sie den Wert ihrer Daten wahrscheinlich unterschätzen…und dass die Datenmenge nicht zwangsläufig „big“ sein muss, um von Nutzen zu sein.

Wenn Sie herausfinden wollen, ob Ihr Unternehmen bereit für Big Data ist, dann haben Sie sich wahrscheinlich schon mit den BDMM-Modellen (für Big Data Maturity Models) auseinandergesetzt. Diese wurden genau dazu entwickelt, Ihren Reifegrad in Sachen Daten zu ermitteln, bevor Sie den ersten Schritt in Richtung Big Data machen.

Aber seien Sie mal ehrlich: wenn Sie mit etwas starten wollen – freuen Sie sich dann, wenn jemand Ihnen sagt, Sie seien noch nicht reif? Nein. Niemandem gefällt das.

Genauso verhält es sich mit Big Data. Sie sind vielleicht noch nicht bereit oder ausgerüstet dafür; aber reif? Ja, das sind Sie. Und das, sobald Sie in einem Unternehmen arbeiten, dessen Rohstoff Daten sind und eventuell bereits erste Überlegungen zu Ihren Verfahrensweisen und zukünftigen Strategien unternommen haben.

BDMM-Modelle sind nur eine von vielen Möglichkeiten (und daher immer eine gute Wahl), aber sie können Sie auch davon abhalten, Ihre Entwicklung in Richtung Big Data zu beginnen.

Wir sind überzeugt davon, dass Sie bereit für Big Data sind sobald Sie:

Was ist mit dem Datenvolumen?

Diese Frage taucht an dieser Stelle immer wieder auf, diesmal aber in Bezug auf den Einsatz von Machine/Deep Learning-Algorithmen: Je nach Tätigkeit können schon einige hundert MB Daten ausreichen, um die Leistungsfähigkeit und Stärke des maschinellen Lernens zu nutzen. In erster Linie geht es um die Qualität Ihrer Daten. Aber machen wir uns nichts vor: Wenn Sie nur eine Excel-Datei mit 12 Zeilen und 8 Spalten haben, greifen Sie einfach zu Papier und Stift.

Im extremen Kontrast dazu steht das Phänomen der Infobesessenheit – die Besessenheit von Datenerfassung oder ungebremster Datengenerierung. Diese kann sich schnell in einen Fluch verwandeln, wenn Sie nicht die richtigen Werkzeuge zur Hand haben, um die ungeheuren Datenmengen zu verwalten, und dadurch auch nicht mehr dazu in der Lage sind, zu verstehen, was in den Daten steckt. Daher ist es besser, lieber wenige Daten zu haben, die dafür aber übersichtlich und von guter Qualität sind, als ein riesiges Rechenzentrum, das mit Daten gefüllt ist, die vielleicht nicht relevant – oder sogar fehlerhaft – sind und Sie dann zu völlig falschen Entscheidungen führen.

Darüber hinaus ermöglicht der wachsende und immer einfachere Zugang zu externen Datenbanken eine erhebliche Bereicherung der Ihnen zur Verfügung stehenden Daten. Diese externen Daten (Wetter, Bilder, Töne, Texte, Kartografie usw.) stellen einen wichtigen Nutzen für Sie dar, indem sie eine breite und solide Informationsbasis bieten, die die vorhandenen Daten ergänzt, die für Ihr Unternehmen spezifisch sind und die es einzigartig machen.

Sicher ist, dass die schrittweise Implementierung von Big Data Tools in Ihrem Unternehmen in jedem Fall eine lohnenswerte Investition für die Zukunft darstellt, da sie Sie dazu anleitet, die Qualität und Verarbeitung Ihrer Daten zu verbessern und neue Formen in der Verwaltung dieser zu wählen.  

Genauso wie Sie ein Dolby Surround 5.1 System dazu bringt, Filme in 4K statt 480p schauen zu wollen, so bringen Sie diverse Big Data Solutions dazu, neue Wege mit Ihren Daten gehen zu wollen.


1https://www.kaggle.com/yelp-dataset/yelp-dataset