Arbeitslosigkeit kann sehr unterschiedliche Auswirkungen auf Betroffene haben und ihr Verlauf verändert sich im Takt der ökonomischen Entwicklung. Neuen Biografien und Lebensentwürfen steht zudem ein statisches und in die Jahre gekommenes System der sozialen Sicherheit gegenüber. Beim Bundesamt für Statistik (BFS) wollte man sich über die komplexe Situation und Tendenzen ein Bild verschaffen.
Darum wurde 2022 das Projekt "Machine Learning Soziale Sicherheit" gestartet, das zeigen soll, wie "typische Bezugsverläufe" aussehen. Das Ziel war eine bessere statistische Erfassung dank Machine Learning. Dafür wurden 126'000 Verläufe im Sozialstaat in 3000 Cluster eingeteilt, wie dem Abschlussbericht zu entnehmen ist. Mittels algorithmischer Verfahren wurden diese auf 10 Verlaufsmuster heruntergebrochen.
Datennutzung für personenbezogene Zwecke ist verboten
Anfang Jahr hatten wir beim Bundesamt für Statistik nachgefragt, ob der Bund beabsichtigt, ein Werkzeug zur Automatischen Entscheidungsfindung (ADM) zu entwickeln. Das sei nicht Aufgabe des BFS, erklärte das Amt damals und ergänzte: "Eine Weiterverwendung oder Weitergabe der Daten zum Beispiel für personenbezogene Zwecke ist ausdrücklich untersagt und war auch nie Gegenstand des Projektes."
Eigentlich hätte im Projekt die Zugehörigkeit zu einem bestimmten Verlaufsmuster für die Mitglieder einer neuen Kohorte geschätzt werden sollen, für welche die Daten nicht vollständig vorlagen. Diese Vorhersage wurde aber nicht mehr weiterverfolgt, weil sich diese nicht stabil genug entwickelten, wie dem Bericht zu entnehmen ist. Dort steht zudem: Eine Zuordnung der Clusterzugehörigkeit allein aufgrund der soziodemografischen Angaben zum Zeitpunkt des Systemeintritts ist nicht erfolgversprechend.
Technische Grenzen haben das Projekt limitiert
Dennoch lieferte das Projekt einige Erkenntnisse, vor allem zur Infrastruktur. Das BFS stiess mit dem Vorhaben an die Grenzen der vorhandenen Technik, selbst die besonders performante Analyseumgebung für die BFS-Dateninnovation habe für manche Schritte nicht ausgereicht, schreiben die Projektinvolvierten. Sie haben Anforderungen für deren Weiterentwicklung formuliert, schreiben aber auch: Man solle sich nicht auf die Skalierung der Infrastruktur verlassen, sondern Überlegungen zu den Algorithmen anstellen.