Das Kernziel meiner Forschung ist die Entwicklung anwendungsorientierter Verfahren zur (teil-)automatisierten Klassifizierung von Beiträgen (beispielsweise Vorschläge oder Kommentare) in Bürger*innenbeteiligungsverfahren , um die Auswertung dieser Prozesse in Wissenschaft und Praxis zu unterstützen.
Die Forschung konzentriert sich auf die Entwicklung von Strategien zur automatischen Strukturierung von Beteiligungsdaten durch eine Gliederung nach inhaltlichen und formalen Aspekten. Dazu werden Techniken des Natural Language Processing sowie des maschinellen Lernens genutzt.
Die inhaltliche Strukturierung kann mit zwei verschiedenen Ansätzen umgesetzt werden. Zum einen kann überwachtes Lernen genutzt werden, falls ein Kategorisierungsschema und ein anhand dieser inhaltlichen Kategorien kodierter Datensatz verfügbar sind. In diesem Anwendungsfall können geeignete Klassifikationsalgorithmen entwickelt werden, um ungelabelte und unbekannte Beiträge automatisiert zu kategorisieren. In der Praxis ist nicht immer ein Kategorisierungsschema gegeben. Für diese Fälle werden in einem zweiten Ansatz unüberwachte Verfahren zur Gruppierung von Themen (Topic Modeling) eingesetzt. Die entstehende Struktur kann weiterführend erneut als Kategorisierungsschema aufgegriffen werden und auf weitere Daten angewendet werden. Da Beteiligungsverfahren sich inhaltlich stark unterscheiden können und eine thematische Gliederung auch subjektiv unterschiedlich ausfallen kann, ist die Anwendung von interaktiven Verfahren, in denen Experten in den Topic Modeling-Prozess miteinbezogen werden, sinnvoll.
Um die Auswertung von Beteiligungsprozessen zu erleichtern, kann nicht nur die inhaltliche, sondern auch die formale Strukturierung der Daten hilfreich sein. Zu diesen formalen Aspekten gehören unter anderem Lesbarkeit, Zivilität, Konstruktivität oder Neuheit eines Vorschlags sein. Durch den Projektfokus unserer Forschungsgruppe auf nachhaltige Mobilität sollen insbesondere Eigenschaften, die hier einen Mehrwert liefern können, untersucht werden.
Beide Ansätze sind umfangreiche Forschungsaufgaben. Um sicherzustellen, dass die Tiefe der Untersuchung nicht leidet, werde ich in meiner Promotion den Fokus auf die Klassifikation legen. Es ist geplant, Topic Modeling-Verfahren im Kontext von Partizipationsverfahren im Anschluss zu untersuchen.
Um die erarbeiteten Verfahren den Praxispartnern und Interessierten zur Verfügung zu stellen, wird eine Software entwickelt, welche sowohl anwenderfreundlich als auch einfach zu bedienen sein soll.
Besondere Anforderungen an mein Forschungsvorhaben ergeben sich durch die speziellen Charakteristiken der deutschen Sprache, den teilweise informalen Sprachgebrauch in (Online-) Beteiligungsverfahren, die aus Machine Learning-Gesichtspunkten kleine Anzahl von Datenpunkten, sowie die Defizite bekannter Topic Modeling-Verfahren im Umgang mit kurzen Beitragstexte und der Trennung von ähnlichen Themen, was eine häufige Eigenschaft von Bürger*innenbeteiligungsverfahren zu konkreten Anliegen ist.