Towards semantic completeness of knowledge graphs from the property perspective
- verfasst von
- Emetis Niazmand
- betreut von
- Sören Auer
- Abstract
Wissensgraphen (KGs) sind heterogene Graphenstrukturen, die durch menschliche Beiträge Fakten in einem maschinenlesbaren Format darstellen. Trotz der koordinierten Bemühungen der beitragenden Gemeinschaften können gemeinschaftsbasierte Wissensgraphen unvollständig sein, und vergleichbare Entitäten und Eigenschaften können unter verschiedenen Namen existieren. Das Problem der Heterogenität bei der Benennung von Prädikaten kann durch die Erkennung semantisch ähnlicher Prädikate, die andere Prädikate ergänzen, gelöst werden, was zur Vervollständigung der Wissensgraphen führt. Die Vervollständigung von Wissensgraphen spielt eine entscheidende Rolle bei der Interoperabilität und verbessert deren Effektivität bei nachgelagerten Aufgaben. In dieser Arbeit untersuchen wir Methoden und Techniken zur Vervollständigung der Wissensgraphen aus der Perspektive der Eigenschaften. Zunächst schlagen wir eine wissensgraphen-agnostische Methode, SAP-KG, vor, um Beziehungen zwischen Prädikaten durch Wissensgrapheneinbettungsmodelle (KGE) zu identifizieren. Diese Forschung zielt darauf ab, die Existenz von Beziehungen zwischen Prädikaten aufzuzeigen, was bei der Vervollständigung von Prädikaten helfen und auch nachgelagerte Aufgaben wie die Vollständigkeit von Abfrageantworten verbessern kann. Wir schlagen einen zweifachen Ansatz vor, SYRUP, der eine Metrik namens Complementary Score verwendet und Ausrichtungsregeln nutzt, um die Konjunktionen von Prädikaten als alternative Repräsentationen zu erkennen, die komplementär sind. Wir wandeln das Problem der Vervollständigung von Prädikaten in das Minimum Set Cover Problem um, um die minimale Menge alternativer Repräsentationen von Prädikaten zu finden, die komplementär sind, um unbekannte Fakten aufzudecken. Unser Ziel ist es, die Vollständigkeit von Wissensgraphen zu erhöhen, indem wir diese alternativen Repräsentationen nutzbar machen. Zudem stellen wir Methoden zur Wissensgraph-Zusammenfassung vor, um die Größe von Wissensgraphen zu reduzieren, indem wir komplementäre Prädikate verwenden, um die Aufgabe der Vollständigkeit von Anfrageantworten zu verbessern. Die empirischen Studien zeigen, dass bei der verlustfreien Zusammenfassung des Wissensgraphen die wichtigsten Informationen erhalten bleiben. Schließlich schlagen wir die Techniken für reale Szenarien in der biomedizinischen Domäne vor, um die Auswirkungen der familiären Krebsvorgeschichte auf Lungenkrebspatienten mithilfe des Wissensgraphen zu analysieren. Bei der Erstellung des Wissensgraphen für Lungenkrebs haben wir uns an die Konsistenz der Prädikatsbenennung gehalten. Mit der vorgestellten Arbeit tragen wir hauptsächlich zur Vervollständigung von Wissensgraphen bei, indem wir Prädikate verwenden, die dieselben semantischen Beziehungen kapseln, aber komplementäre Instanzen bereitstellen, was zu einer Verbesserung der Aufgabe der Vollständigkeit von Abfrageantworten führt. Die Ergebnisse dieser Forschung bieten neue Wege zur Untersuchung und zeigen den Weg zu einer effektiveren Vervollständigung von Wissensgraphen.
- Organisationseinheit(en)
-
Fachgebiet Data Science and Digital Libraries
- Typ
- Dissertation
- Anzahl der Seiten
- 159
- Publikationsdatum
- 05.05.2025
- Publikationsstatus
- Veröffentlicht
- Ziele für nachhaltige Entwicklung
- SDG 3 – Gute Gesundheit und Wohlergehen
- Elektronische Version(en)
-
https://doi.org/10.15488/19000 (Zugang:
Offen)