Noch vor einigen Jahrzehnten wurden alle Daten vom Menschen selbst erstellt, wodurch die Datenmenge noch vergleichsweise begrenzt war. Mit der digitalen Revolution entstanden Daten, die nicht nur von Menschen, sondern auch von Algorithmen oder künstlicher Intelligenz produziert wurden. Mit jedem Post auf jedem Social Media Kanal oder jedem Versenden einer WhatsApp werden täglich tausende von Daten erstellt.
Schenkt man den Prognosen Glauben, so werden wir 2025 auf unseren Servern ganze 163 Zetabyte an Daten haben, also eine 163 mit 21 Nullen. Ist von Big Data die Rede, dann sind damit gigantische Datenmengen gemeint, die mit einer hohen Geschwindigkeit anfallen. So einfach dies erst einmal klingen mag, so komplex ist das Modell des Big Data. Zudem kann es bei der Verarbeitung solch immenser Datenmengen zu gewissen Sicherheitsrisiken kommen.
Durch die Digitalisierung und das Internet der Dinge gewinnt Big Data eine immer wichtigere Rolle. Im Folgenden stellen wir die wesentlichen Merkmale des Big Data, auch bekannt als die 5 V’s vor.
Volume
Volume bezeichnet die eben erwähnte immense Datenmenge, die heute vorhanden ist und aufgrund ihrer Größe nur mit Hilfe neuer Technologien erfasst und verarbeitet werden kann. Das Volumen kann im einfachsten Fall die Datenmenge an sich sein, im weiteren Sinne aber auch die Anforderungen von Algorithmen an Hardware und Software.
Velocity
Neben der wachsenden Datenmenge nimmt auch die Geschwindigkeit, mit der Daten übertragen und verarbeitet werden, exponentiell zu. Technologien wie RFID (Radio Frequency Identification), GPS und Sensorsysteme verarbeiten Daten nahezu in Echtzeit und erfassen kontinuierlich neue Informationen. Es ist daher wenig überraschend, dass Hard- und Software ständig weiterentwickelt werden müssen, um mit der hohen Geschwindigkeit von Big Data Schritt zu halten.
Variety
Variety bezieht sich auf die Vielfalt der aktuellen Datentypen. Es gibt zahlreiche Arten von Daten, wie etwa simple Textdateien, Fotos, Videos, Nutzerdaten, Finanzdaten, Standortinformationen, medizinische Daten und viele mehr. Dank Big Data können diese unterschiedlichen Datentypen sortiert, strukturiert, verknüpft und analysiert werden. Schätzungen zufolge existieren rund 80 Prozent aller globalen Daten in einer weitgehend unstrukturierten Form.
Veracity
Neben den drei ersten Merkmalen für Big Data kamen in den vergangenen Jahren noch zwei weitere hinzu. Spricht man von Veracity, so steht vor allem die Glaubwürdigkeit, Gültigkeit und Zuverlässigkeit der Daten im Mittelpunkt – also die Datenqualität. Auch wenn eine große Menge an Daten zur Lösung eines Problems vorhanden ist, wird die Aussagekraft dieser Daten erheblich eingeschränkt, wenn ihre Verifizierung nicht ausreichend gewährleistet ist.
Value
Das fünfte Merkmal ist das Big Data Value. Dabei geht es um den Mehrwert, den die Daten für Unternehmen generieren. Dieser Mehrwert ist entscheidend, um Big Data-Projekte innerhalb eines Unternehmens zu begründen. Wenn beispielsweise Daten gesammelt werden, um ein Produkt gezielt auf eine spezifische Zielgruppe auszurichten, lässt sich der wirtschaftliche Nutzen dieser Daten klar belegen.