Effective and transparent multivariate time series classification

verfasst von
Raneen Younis
betreut von
Wolfgang Nejdl
Abstract

Heutzutage haben wir Zugang zu einer enormen Menge an Daten, darunter Bilder, Töne, Texte und Sensorinformationen. Zeitreihendaten gewinnen in einer Vielzahl von Branchen an Bedeutung, darunter im Finanzwesen, im Gesundheitswesen, in der Klimawissenschaft und im Internet der Dinge (Internet of Things, IoT). Mit mehr vernetzten Geräten und fortschrittlichen Überwachungstechnologien erwarten wir eine erhebliche Zunahme der Menge und Komplexität multivariater Zeitreihendaten (Multivariate Time Series, MTS). So liefern beispielsweise tragbare Geräte kontinuierlich Daten über die Vitalparameter, die bei der Entwicklung einer personalisierten Medizin und der Früherkennung von Krankheiten helfen. Infolge dieses exponentiellen Wachstums sind fortschrittliche MTS-Analysetechniken erforderlich, um Daten in einem solch großen Umfang zu analysieren. Techniken des Deep Learning haben vielversprechende Ergebnisse bei der Klassifizierung von MTS-Daten gezeigt und bieten eine Abkehr von der traditionellen Merkmalstechnik hin zu einem durchgängigen Klassifizierungsmodell. Durch die Verwendung von Architekturen wie Convolutional Neural Networks und Recurrent Neural Networks können diese Modelle geschickt mit großen Merkmalsräumen umgehen, indem sie niedrigdimensionale Merkmalsrepräsentationen lernen. Diese Anpassungsfähigkeit für verschiedene Zeitreihenanwendungen minimiert die Notwendigkeit von domänenspezifischem Wissen und unterstreicht die Vielseitigkeit von Deep Learning. Der Mangel an Transparenz bei tiefen neuronalen Netzen, die oft als "Black-Box"-Modelle bezeichnet werden, stellt jedoch eine große Herausforderung dar, insbesondere in Bereichen, in denen die Transparenz von Entscheidungen von größter Bedeutung ist, wie z. B. in der Medizin und im Recht. Das Streben nach der Interpretierbarkeit von Modellen hat zu umfangreichen Forschungsanstrengungen geführt, insbesondere bei MTS-Daten, die von Natur aus komplex sind und sich weniger gut visuell interpretieren lassen. Darüber hinaus haben die Bedenken hinsichtlich des Datenschutzes in sensiblen Anwendungen, wie z. B. im medizinischen Bereich, die Notwendigkeit unterstrichen, Klassifikatoren zu entwickeln, bei denen die Benutzerdaten geschützt sind. Um diese Herausforderungen zu bewältigen, werden in dieser Arbeit mehrere Frameworks zur Verbesserung der Klassifizierung von MTS-Daten unter Berücksichtigung von Transparenz- und Datenschutzaspekten vorgestellt. Zu den wichtigsten Beiträgen gehören Multi-VISION, ein Post-hoc-Modell zur Verbesserung der CNN-Interpretierbarkeit für MTS-Daten; MTS2Graph, das die Interpretierbarkeit mit Verbesserungen der Klassifizierung verbindet; FLAMES2Graph und D-FLAMES2Graph, föderierte Lernansätze, die dem Datenschutz Priorität einräumen, ohne die Interpretierbarkeit zu beeinträchtigen; und HyperTime, ein Hypergraph-basierter Klassifikator zur Steigerung der Effektivität. Um die Effektivität unserer Frameworks zu zeigen, führen wir umfangreiche Experimente sowohl mit populären Archiven als auch mit realen Daten durch.

Organisationseinheit(en)
Forschungszentrum L3S
Typ
Dissertation
Anzahl der Seiten
147
Publikationsdatum
06.02.2025
Publikationsstatus
Veröffentlicht
Ziele für nachhaltige Entwicklung
SDG 3 – Gute Gesundheit und Wohlergehen, SDG 13 – Klimaschutzmaßnahmen
Elektronische Version(en)
https://doi.org/10.15488/18495 (Zugang: Offen)