Lernbasiertes Clustering gestreamter Daten zur effizienten Modellierung und Vorhersage von Prozesscharakteristiken der Fräsbearbeitung durch Integration von Domänenwissen
Das Forschungsvorhaben „Lernbasiertes Clustering gestreamter Daten zur effizienten Modellierung und Vorhersage von Prozesscharakteristiken der Fräsbearbeitung durch Integration von Domänenwissen“ (ClusterSim) ist ein Kooperationsprojekt zwischen dem Institut für Spanende Fertigung der Fakultät Machinenbau und der Arbeitsgruppe Virtual Machining der Fakultät für Informatik und untersucht die Entwicklung und Erprobung eines neuartigen Ansatzes zur clusterbasierten Modellierung und Vorhersage von Charakteristiken spanender Fertigungsprozesse durch die Anwendung von Methoden des machinellen Lernens (ML). Diese sollen allerdings nicht als „Black-Box“-Anwendung durchgeführt werden. Vielmehr wird Expertenwissen als qualitäts- und effizienzsteigernde Ressource einbezogen. Hierfür stellen Prozessmodelle und das Wissen über die darin formalisierten Zusammenhänge in Kombination mit technologischer Expertise eine zentrale „Enabling-Technology“ dar. Zeitreihendaten aus experimentellen Fertigungsprozessen sowie aus geometrisch-physikalischen Prozesssimulationen sollen mittels Anwendung von ML-Methoden bei gleichzeitiger Integration von produktionstechnologischem Expertenwissen analysiert, evaluiert und für die Vorhersage von Charakteristiken anderer Prozesskonfigurationen bereitgestellt werden. Expertenwissen zu technologischen Randbedingungen und Zusammenhängen wird genutzt, um die Analyse- und ML-Methoden möglichst anwendungsspezifisch und somit effizient auslegen zu können. Somit soll eine Grundlage zur Beschreibung, Bewertung und Vorhersage von spanenden Bearbeitungsprozessen geschaffen werden.
Die zentrale Grundlage zur Realisierung der projektspezifischen Ziele stellt exploratives data mining dar, mit dessen Hilfe Fräsoperationen anhand von Merkmalen für jede hochaufgelöste Abtastung der Prozessdaten durch die Anwendung von Clusteringmethoden in Klassen gruppiert werden sollen. Das Ergebnis des Clusterings stellt eine Zuordnung jedes Merkmalsvektors der Zeitreihen zu einer Klasse dar. Für jede Klasse werden wiederum ML-Regressionsmodelle gelernt. Diese werden verwendet, um Prozesscharakteristiken für Merkmale für jede korrespondierende Klasse vorherzusagen. Um diesen Zusammenhang abbilden zu können, werden für jeden Merkmalsvektor messtechnisch ermittelte oder simulierte Prozesscharakteristiken und -zustände akquiriert. Im Rahmen der Projektinitiative soll der Fokus zunächst vor allem auf prozessdynamische Charakteristiken und deren Auswirkungen auf die Bauteilqualität gelegt werden.
Darüber hinaus soll projektbegleitend eine geeignete Strategie zum transparenten und nachhaltigen Forschungsdatenmanagement vereinbart werden. In diesem Kontext spielen insbesondere die Datenspeicherung, -struktur, -formatierung und -benennung eine Rolle. Daten sind im Kontext von ML-Methoden stets von zentraler Bedeutung. Sie werden benötigt, um neue Methoden und Ansätze entwickeln, lernen, testen, nachvollziehen, bewerten und weiterentwickeln zu können. So hemmt die mangelnde Verfügbarkeit anwendungsspezifischer Daten häufig Neu- und Weiterentwicklungen von Methoden. Um diesem Umstand gerecht zu werden und einen Beitrag zur Steigerung der Verfügbarkeit anwendungsspezifischer Datensätze zu liefern, sollen alle Prozess- und Forschungsdaten, welche im Projekt generiert und genutzt werden, anderen Forschenden frei zugänglich bereitgestellt werden.