Machine Learning

Sensible Unternehmensdaten helfen beim maschinellen Lernen

< zurück

Seite: 2/2

Föderales Lernen schützt fremde Daten, die man dringend braucht

Im Rahmen des föderalen Lernens bleiben die Daten zum Training des Modells, wie bereits erwähnt, an ihrem lokalen Speicherort und müssen nicht weitergegeben werden. So können auch sensible Unternehmensdaten für das maschinelle Lernen genutzt werden, ohne ihre Schutzwürdigkeit zu gefährden, machen die Forscher klar. Das Team konzentriere sich dabei auf die Themen Datenintegration und natürliche Sprachverarbeitung (auf Englisch: Natural Language Processing, abgekürzt NLP).

Unter Datenintegration verstehen Fachleute das Zusammenführen verschiedener Datenansammlungen in eine einheitliche Struktur. Der Prozess erfordere aber nach wie vor oft einen hohen manuellen Aufwand, der aber durch den Einsatz von KI drastisch reduziert werden kann. Dabei sind Unternehmen jedoch in der Zwickmühle. Denn für das Training der KI werden in der Regel mehr Daten benötigt, als ein Unternehmen alleine bereitstellen könnte. Deshalb müssten mehrere Organisationen ihre Daten austauschen, was aber aufgrund der Datensensibilität in der Praxis oft nicht möglich ist. Das Oldenburger Team untersucht deshalb, wie das föderale Lernen diesen Spagat zu meistern hilft. Die Forscher wollen dazu zunächst ein Modell konzipieren und anschließend einen Prototyp entwickeln und evaluieren.

Computer erzeugen und interpretieren menschliche Sprache

Das zweite Thema des Projekts ist der Einsatz natürlicher Sprachverarbeitung innerhalb von Unternehmen. Diese Technik erlaubt es Computern, menschliche Sprache zu interpretieren und zu erzeugen, wie die Oldenburger erklären. Sie bildet etwa die Grundlage für Chat-Bots wie das derzeit vieldiskutierte Programm Chat GPT. Die für das Training solcher Bots benötigten Textdaten seien aber meist nur eingeschränkt zugänglich. Und schon innerhalb eines Unternehmens könnten Textdaten wie E-Mails, interne Berichte oder Lieferscheine nicht ohne Weiteres zwischen unterschiedlichen Abteilungen oder Zweigstellen ausgetauscht werden. Auch hier will das Forschungsteam das föderale Lernen erproben, was mit dem Ziel geschieht, dem Sprachmodell etwa alle lokal verwendeten Vokabeln, Satzstrukturen oder Zusammenhänge beizubringen. Anschließend wollen die Forscher den Erfolg ihrer Methode in einem globalen Modell evaluieren.

(ID:49324462)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung