Pro Tag speichert Google etwa 20 Petabyte an Daten. Das ist eine Zwei mit 16 Nullen! Im ersten Moment hört sich das beeindruckend an. Andererseits: Eine durchschnittliche Ejakulation enthält immerhin schon fünf Petabyte an Datenmaterial. Und der Download geht meistens deutlich schneller.
Allerdings muss man der Fairness halber erwähnen, dass in der männlichen Datensuppe auch eine große Menge Dubletten enthalten sind. Außerdem haben 90 Prozent des gesamten Erbmaterials nach heutigem Kenntnisstand keine eindeutige Funktion. Ein Großteil der übertragenen DNA ist also möglicherweise kompletter Datenmüll. Warum sollte es dann bei Google und Co. grundsätzlich anders sein?
Rauschen im Daten-Dschungel
Meine Vermutung: Google sammelt wie bekloppt Daten, nicht weil die Jungs im Silicon Valley eine Vision oder einen Masterplan haben, sondern schlicht und einfach, weil sie es können. Dadurch wächst die Datenmenge unglaublich an, nicht aber die Informationsmenge. Gute Informationen sind im Gros der Daten sogar immer schwieriger zu bekommen.
Jeder Statistiker weiß: Je größer die Datenmenge, desto stärker wächst auch das Rauschen und überstrahlt das eigentliche Signal. Könnte es also sein, dass die Versprechungen, Visionen und Befürchtungen von Big Data vollkommen überschätzt sind?
Ein kleines Beispiel: Da ich exzessiver Buchbesteller bin, hat Amazon im Laufe der vergangenen Jahre von mir eine unglaubliche Anzahl von Daten gesammelt. Doch die Kaufvorschläge, die mir Jeff Bezos regelmäßig macht, sind an Fantasielosigkeit nicht zu überbieten. Vor einem Jahr habe ich ein Geburtstagsgeschenk für einen Freund gekauft. Ein Buch über Zierfische (ich weiß, ich habe einen seltsamen Freundeskreis). Seitdem werde ich von Amazon Woche für Woche mit absurden Angeboten über Fischfutter, Aquarien und Angelbedarf bombardiert.
So schlau wie die Küchenschabe
2012 entwickelte Google einen sensationellen Algorithmus, der – nachdem er zehn Millionen Youtube-Videos gescannt hat – mit einer Wahrscheinlichkeit von 75 Prozent eine Katze identifizieren konnte. Wow! Der zweijährige Sohn meiner Nachbarin kommt auf nahezu 100 Prozent.
Im Grunde sind Computer heute noch genauso „dumm“ wie sie vor 50 Jahren auch schon waren. Ultraschnelle Rechenmaschinen auf dem intellektuellen Stand einer Küchenschabe. Bis zum heutigen Tag „versteht“ kein Computer eine einfache Kindergeschichte, die man ihm vorliest. Prozessoren wissen nicht, dass man nach dem Tod nicht mehr zurückkommt, dass man einem Bindfaden ziehen, aber nicht schieben kann und dass die Zeit nicht rückwärts läuft.
Eine simple Fruchtfliege hat 250 000 Neuronen. Das ist ein Bruchteil der Rechnerkapazität eines iPhones. Aber sie können problemlos in drei Dimensionen navigieren, Loopingmanöver durchführen und unseren Hausmüll in einen Swingerclub verwandeln. Okay, dafür können sie nicht telefonieren.
Neulich erzählte mir ein IT-Spezialist einen internen Witz unter Datenschützern: In Wahrheit sei Edward Snowden kein Whistleblower, sondern ein Agent, der von der US-Regierung angeheuert wurde, um der gesamten Welt vorzugaukeln, wie klug, mächtig und gefährlich die NSA angeblich sei.