Exklusiv-Interview
Den Daten-Tsunami bändigen und gewinnbringend nutzen

Von Jürgen Schreier 17 min Lesedauer

Im Jahr 2019 gingen in Deutschland rund 18 Millionen Maschinen, Sensoren und Autos zusätzlich ins Netz. Die Datenflut, die sie produzieren, ist gigantisch und schwillt ständig an. Doch wie generiert man aus diesen vielen Daten Mehrwerte? Darüber sprachen wir mit dem Münchner Data Scientist Andreas Hübner.

Das Datenaufkommen im IIoT nimmt rapide zu. Diese Datenflut gilt es zu speichern, aufzubreiten und zu analysieren, sollen daraus Mehrwerte entstehen. (Bild:  gemeinfrei / Unsplash)
Das Datenaufkommen im IIoT nimmt rapide zu. Diese Datenflut gilt es zu speichern, aufzubreiten und zu analysieren, sollen daraus Mehrwerte entstehen.
(Bild: gemeinfrei / Unsplash)

Allein in Deutschland gingen 2019 rund 18 Millionen Maschinen, Sensoren und Autos zusätzlich ins Netz. Weltweit sollen aktuell mehr als 20 Milliarden IoT-Geräte online sein. All diese Devices produzieren Daten – oft unstrukturierte. Diese wollen gespeichert und letztlich genutzt werden. Wie geht man unter „rein“ technologischen Gesichtspunkten mit einer solchen Datenflut im Unternehmen um?

Hübner: Die meisten Daten weisen eine Struktur auf – vielleicht abgesehen von Freitexten. Selbst Bilder haben eine Datenstruktur, mit der man sehr gut arbeiten kann. Was Sensorik angeht: Dabei wird durch die Abtastrate regelmäßig ein Signal produziert, das ebenfalls strukturiert ist. Die Herausforderung besteht in der Masse an Daten, die zunächst irgendwo anlanden. Man muss die Möglichkeit geben, eine Landing Zone zu haben, wenn sie nicht verloren gehen sollen. Ein weiterer technologischer Aspekt ist das Katalogisieren der Daten. Der Begriff „Data Catalog“ ist bereits recht verbreitet. Metadaten, also die datenbeschreibenden Informationen, müssen festgehalten werden. Die Werkzeuge hierfür sind in den vergangenen Jahren gereift. Dadurch können Daten in Empfang genommen, beschrieben und katalogisiert werden. Von da an geht es dann im nächsten Schritt weiter zur Verfeinerung der Daten.