Federated Learning (Föderales Lernen)

Was ist Federated Learning?

Beim federated learning werden Modelle gleichzeitig auf mehreren Geräten trainiert. Dies erfolgt dezentral und ist dabei ohne jegliche Herausgabe oder Austausch von sensiblen Informationen. So verbleiben die entsprechenden Daten zu jeder Zeit bei den jeweiligen Besitzern. Das zentrale Analysemodell bekommt lediglich die Lernergebnisse sowie die Parameter von den einzelnen Modellen.

Federated learning ermöglicht, die Modellgüte bei maschinellem Lernen deutlich zu verbessern und dabei die Datenschutzbestimmungen einzuhalten. So wird aus einer Fülle von einzelnen Analysemodellen von unterschiedlichen Teilnehmern ein ganz zentrales Modell gebildet.

Der große Vorteil besteht darin, dass der entstehende Lerneffekt durch die Einbeziehung von Informationen von verschiedenen Trainingsdaten massiv bestärkt wird. Es wird auf mehreren Geräten parallel trainiert und somit steigt die Genauigkeit des Modells.

Föderales Lernen kann Unternehmen im Bereich Machine Learning die Möglichkeit eröffnen, eine Entwicklung von datengetriebenen Prozessen und Services auch bei begrenzter Datenbasis zu erhalten. Föderales Lernen besitzt das Potenzial, Kosten einzusparen und einen hohen Mehrwert zu generieren.

Wie funktioniert Federated Learning of Cohorts (FLoC)?

Federated learning of cohorts, kurz FLoC, ist ein Teil der Google-Privacy-Sandbox-Initiative. Es handelt sich dabei um eine Art von Web-Tracking. Das Nutzungsverhalten aller Nutzer kann durch den Browser selbst direkt ausgewertet werden und die Nutzer werden in bestimmte Kategorien gruppiert. Die Anwender erhalten daraufhin interessenbasierte Werbung.

Die Funktionsweise geht über Hashing, indem innerhalb des Browsers Kohorten-IDs generiert werden. Dies erfolgt mithilfe von SimHash-Algorithmen. Der Browser-Verlauf kann mittels Hash-Werten verschlüsselt werden. Die Privatsphäre wird dabei geschützt, denn FLoC ersetzt Third-Party-Cookies und auch Fingerprinting.

Trotzdem ist zielgerichtete Werbung für die Anwender möglich. Nutzer werden nach den entsprechenden Werten gruppiert und können daraufhin gezielt mit Werbung angesprochen werden. Über eine API kann man auf die Kohorten-ID zugreifen. Diese werden in jeder Woche neu erstellt. Entwickler erhalten zum Beispiel durch TensorFlow ein Federated-Learning-Framework, das Berechnungen für dezentrale Daten ermöglicht und daraus eigene Nutzertypen für Werbetreibende abzuleiten.

Mit welchem Framework wird Föderales Lernen aufgesetzt?

Eine Möglichkeit ist das bekannte Machine-Learning-Framework „Flower“. Dieses Framework wurde im Jahre 2020 entwickelt und ist durch seine weite Verbreitung und hohe Skalierbarkeit besonders vorteilhaft. Die Infrastruktur hat sich dabei als sehr bewährt herausgestellt, besonders durch die hohe Nutzerfreundlichkeit von Flower.

Data Navigator Newsletter