Vor etwa zwei Wochen haben wir erfahren, dass unser Grant-Proposal akzeptiert wurde. Ein Professor, ein Student der Philosophie und ich werden an einem Projekt arbeiten, dass sich um die Stanford Encyclopedia of Philosophy dreht. Wir werden eine Ontologie vom Text der Dokumente in der Encyclopedia und mit Hilfe von Feedback von Spezialisten (d.h. Autoren der Artikel), denen wir spezielle automatisch generierte Fragen stellen, erstellen.
Eine Ontologie ist ein Graph-aehnliche Struktur, die im Bereich der Wissensrepresentation zur Anwendung kommt. Maschinen (d.h. Computer etc.) koennen bisher nur Nutzen von der Dokumentenstruktur (siehe z.B. XML) beziehen, aber nicht wirklich die Semantik die dahinter steht “verstehen”. Eine Ontologie hilft verschiedene “Dinge” in Relation zueinander zu bringen und ihnen damit Bedeutung zu geben. Ein Computer weiss z.B. per se nicht, was ein Student ist. Wenn es allerdings eine Ontologie gibt, die Studenten als Menschen definiert, die an einer Universitaet arbeiten und sich fortbilden, unterrichtet von Professoren etc., dann definiert das die Semantik des Begriffes “Student”. Philosophisch gesprochen, und das geht auf Kant (”das Ding an sich”) zurueck, koennen Menschen oder andere “intelligente” Agenten ein Objekt in ihrer Umgebung nicht wirklich wahrnehmen, als das was es ist. Es ist immer eine Frage der individuellen Erfahrung und des Wissensstandes des einzelnen, der das Wahrgenommene in Verbindung bringt mit Dingen, die er kennt, die wiederum in Verbindung zu anderen Dingen stehen. Die Bedeutung eines Dings ist also nicht das, was es wirklich “ist” (was auch immer das sein mag), sondern wie es eingeordnet wird, in das Wissensnetzwerk, das schon gespannt wurde. (Passt es da nicht, dass unser Gehirn ein neuronales Netz ist?!?). Ziel der Forschung im Bereich der Ontologien und spezifisch des “Semantischen Netzes” ist es, solche Netzwerke fuer alle moeglichen Wissensbereiche aufzubauen, um es Maschinen zu ermoeglichen, Begriffen Sinn (Semantik) zu geben, sie verstehen und einordnen zu koennen.
Hier sind einige Folien, die ich fuer eine Presentation benutzt habe, um das Projekt meiner Arbeitsgruppe vorzustellen: Ontology Learning and Population from Text