Goldgräber im Datenberg

Hightech-Strategie Goldgräber im Datenberg

Aus der Analyse großer Datensätze (Big Data) lassen sich wirtschaftlich wertvolle Erkenntnisse gewinnen. Die Anforderungen an hierfür qualifizierte Spezialisten sind so hoch, dass sich die Hightech-Strategie im Rahmen der Zukunftsaufgabe "Digitale Wirtschaft und Gesellschaft" mit "Big Data" befasst.

3 Min. Lesedauer

Ein STRATO Mitarbeiter hebt einen Server zurück in ein Rack.

Wartungsarbeiten im STRATO Rechenzentrum erfolgreich beendet: Ein STRATO Mitarbeiter hebt einen Server zurück in ein Rack.

Foto: STRATO

Daten sind das Gold unserer Zeit. Daher versuchen Anbieter im Internet oder von Apps auf Smartphones Daten von uns zu bekommen. Meist geben wir sie bereitwillig, denn der Gegenwert sind Informationen oder Dienstleistungen, die wir mit unseren Daten bezahlen. Diese Daten nutzen Firmen nun, um uns passgenau mit Werbung zu bombardieren. Manch einen stört das nicht. Er behauptet, dass er die Werbung nicht beachtet oder als nützlich empfindet.

Unternehmen können aber noch sehr viel mehr mit umfangreichen Datensätzen anfangen –und dies sogar mit anonymisierten Daten. Die Herausforderung besteht darin, in diesen großen Datensätzen – den Big Data – Strukturen zu erkennen und diese zu nutzen.

Jeder Autor schafft Datenberge

Ein Beispiel: Die Texte eines Schriftstellers, sein Stil, seine Wortwahl, typische Wortfolgen stellen einen gewaltigen Datensatz dar. Wenn ich diesen Datensatz analysiere, werde ich Strukturen erkennen, die typisch für diesen und nur für diesen Schriftsteller sind. Jetzt kann ich einen Text unbekannter Herkunft darauf untersuchen, ob er vom betreffenden Autor stammt.

Binärcode auf einem Computerbildschirm

Strukturen in Daten erkennen

Foto: picture alliance/dpa/Berg

Jilles Vreeken, Forscher an der Universität Saarbrücken, nennt weitere Beispiele. Bei Menschen mit seltenen Krankheiten ist es durchaus möglich, dass diese genetisch bedingt sind. Gendaten eines einzelnen Menschen stellen schon allein einen gewaltigen Datensatz dar. Der Abgleich der Daten mehrerer Menschen mit der gleichen Krankheit mit Personen, die nicht an dieser Krankheit leiden, sind ein typisches Big-Data-Problem. Gelänge es, typische Gensequenzen zu identifizieren, ergäben sich Ansatzpunkte zur Bekämpfung der Krankheit.

Große Datenmengen fallen übrigens auch in Maschinen an. In der Gasturbine eines Kraftwerks beispielsweise messen Hunderte von Sensoren jede Sekunde Temperaturen, Drücke, Strömungsverläufe und Gaszusammensetzungen. Wer diese Daten fachgerecht analysiert, kann Kraftwerksbetreiber wertvolle Hinweise geben, wie er seine Anlage effizienter und umweltfreundlicher einstellen kann.

Nutzen für die Wirtschaft

Besonders attraktiv sind Big-Data-Analysen jedoch für die Wirtschaft. Einkaufsdaten von Millionen Kunden fallen an und können nach unterschiedlichen Kriterien analysiert werden. Was kaufen viele Kunden typischer Weise gemeinsam? Stellt man fest, dass häufig frischer Salat gemeinsam mit Balsamico-Essig gekauft wird, liegt es nahe, den Essig nahe des Frischgemüses zu platzieren. Auch könnte man für die Kunden, die den Essig vielleicht vergessen hätten, auf diesen mit geeigneter Werbung aufmerksam machen.

Wo aber liegt nun die Aufgabe der Forschung? Professor Volker Markl von der Technischen Universität Berlin zeigt auf, wie vielseitig die Anforderungen sind. Genau deshalb gründet und finanziert das Bundesforschungsministerium zwei Big-Data-Kompetenzzentren in Berlin und Dresden-Leipzig.

...

Spezialisten für derartige Analysen müssen die äußerst komplizierten und vielfältigen statistischen und mathematischen Analyseverfahren verstehen und anwenden können. Sie müssen geeignete Programme schreiben können. Darüber hinaus geht es aber auch um Fachkenntnisse des jeweiligen Anwendungsgebietes. Wenn ich nichts von Genetik verstehe, bin ich für Analysen entsprechender Datensätze nicht geeignet.

Es wird also darum gehen, derartige Spezialisten zu qualifizieren. Merkl zitiert eine Studie, nach der allein in den USA 190.000 Arbeitskräfte auf diesem Gebiet fehlen werden. Wichtig ist aber darüber hinaus, dass die Forschung Analyseprogramme entwickelt, die auch von Fachleuten mit weniger fundierten Statistik- und Programmierkenntnissen verwendet werden können.

Chancen für kleine innovative Unternehmen

Solche Programme würden es kleineren und mittleren Unternehmen ermöglichen, Big-Data-Analysen durchzuführen und auf dieser Grundlage neue Geschäftsideen zu entwickeln. Als Beispiel kann die Idee eines jungen Unternehmens dienen, das Facebook-Daten auswertet.

Facebook-Netzwerke sind äußerst komplexe Datensätze. Wer ist mit wem verknüpft, wer verabredet sich mit wem. Das junge Unternehmen will die öffentlich ins Netz gestellten Verabredungen zu Partys auswerten. Die anonymisierten Daten lassen abschätzen, wo sich am heutigen Abend viele Menschen aufhalten werden. Schätzt man dann noch ab, wann diese nach Hause wollen, hat man wertvolle Informationen für Taxiunternehmen. Diese ließen sich dies sicher etwas kosten.

Problem Datenschutz?

Markl befürchtet allerdings, dass die in Deutschland so zentrale Datenschutzdiskussion manche Idee verhindern wird. Vertraut man Unternehmen, dass sie die keineswegs anonymen Facebookdaten wirklich nur verwenden, um Strukturen in den Daten aufzuzeigen? Werden Positionsdaten wirklich nur verwendet, um festzustellen, wo sich viele Menschen gerade aufhalten, nicht aber wo ich persönlich gerade bin?

Streng genommen erlaubt jeder Facebook-Nutzer und Smartphone-Besitzer die Auswertung der Daten. Zumindest sollte er sich bewusst sein, dass preisgegebene Daten - so die heutige Verabredung zur Party - nicht schützbar sind. Andererseits: Wie durch Wunderhand sind Taxis verfügbar, die man in der Gegend, in der die Party stattfand, um diese Zeit nicht erwartet hätte. Ein ausreichender Gegenwert?