mind the gap

Locations of visitors to this page
Obama '08

mat'log

m y b l o g


Wir haben den Grant!

Filed under: Studium — Mathias at 4:07 am (CET) on Saturday, February 25, 2006

Vor etwa zwei Wochen haben wir erfahren, dass unser Grant-Proposal akzeptiert wurde. Ein Professor, ein Student der Philosophie und ich werden an einem Projekt arbeiten, dass sich um die Stanford Encyclopedia of Philosophy dreht. Wir werden eine Ontologie vom Text der Dokumente in der Encyclopedia und mit Hilfe von Feedback von Spezialisten (d.h. Autoren der Artikel), denen wir spezielle automatisch generierte Fragen stellen, erstellen.

Eine Ontologie ist ein Graph-aehnliche Struktur, die im Bereich der Wissensrepresentation zur Anwendung kommt. Maschinen (d.h. Computer etc.) koennen bisher nur Nutzen von der Dokumentenstruktur (siehe z.B. XML) beziehen, aber nicht wirklich die Semantik die dahinter steht “verstehen”. Eine Ontologie hilft verschiedene “Dinge” in Relation zueinander zu bringen und ihnen damit Bedeutung zu geben. Ein Computer weiss z.B. per se nicht, was ein Student ist. Wenn es allerdings eine Ontologie gibt, die Studenten als Menschen definiert, die an einer Universitaet arbeiten und sich fortbilden, unterrichtet von Professoren etc., dann definiert das die Semantik des Begriffes “Student”. Philosophisch gesprochen, und das geht auf Kant (”das Ding an sich”) zurueck, koennen Menschen oder andere “intelligente” Agenten ein Objekt in ihrer Umgebung nicht wirklich wahrnehmen, als das was es ist. Es ist immer eine Frage der individuellen Erfahrung und des Wissensstandes des einzelnen, der das Wahrgenommene in Verbindung bringt mit Dingen, die er kennt, die wiederum in Verbindung zu anderen Dingen stehen. Die Bedeutung eines Dings ist also nicht das, was es wirklich “ist” (was auch immer das sein mag), sondern wie es eingeordnet wird, in das Wissensnetzwerk, das schon gespannt wurde. (Passt es da nicht, dass unser Gehirn ein neuronales Netz ist?!?). Ziel der Forschung im Bereich der Ontologien und spezifisch des “Semantischen Netzes” ist es, solche Netzwerke fuer alle moeglichen Wissensbereiche aufzubauen, um es Maschinen zu ermoeglichen, Begriffen Sinn (Semantik) zu geben, sie verstehen und einordnen zu koennen.

Hier sind einige Folien, die ich fuer eine Presentation benutzt habe, um das Projekt meiner Arbeitsgruppe vorzustellen: Ontology Learning and Population from Text

4 Comments »

18

Comment by raccoon

March 5, 2006 @ 2:59 pm

Congratulations :)

Dann geht der “Stress” ja jetzt erst richtig los ;) . Ich hatte sowas schon mal gesehen, wusste allerdings nicht, dass man das als “Onthologie” bezeichnet. Bei der Suche nach einem Buch bin ich auf eine Liechtensteiner Webseite gestoßen, die sowas für ihre Bestandsbibliothek im Netz haben:

http://beat.doebe.li/bibliothek/b01412.html

Da der Graph vermutlich dynamisch zur Laufzeit generiert wird, dauert das mitunter etwas, bis sich das Bild weiter unten aufbaut.

Zu Deinem PDF: Für mich bitte ein Stück von dem Baumstammkuchen rechts außen ;) .

135

Comment by raccoon

March 29, 2006 @ 2:30 pm

Gerade eben stoße ich auf einen Artikel auf Deutschlands bekanntester Weiterbildungs-Webseite www.weiterbildungsblog.de :

Ontology is Overrated: Categories, Links, and Tags

Quelle: http://www.weiterbildungsblog.de/archives/001127.html

Ob ich nächstes Jahr auch wieder zur LearnTEC nach Karlsruhe fahre, kann ich noch nicht sagen. Dieses Jahr war es wieder relativ teuer für 50% gute und 50% uninteressante oder unvorbereitet gehaltene Fachvorträge. Gerade der Vortrag für Web 2.0, worüber im oben genannten Artikel auch die Rede ist, war sehr improvisiert aus dem Stegreif gehalten (nicht mal eine nervige PowerPoint-Präsentation gab’s ;) .

P. S.: Wenn man beim Absenden diesen teils unleserlichen Code (ist es ein b oder eine 6) falsch eintippt, geht der Artikel verloren und bleibt nicht im Cache. Dieses Mal hab ich ihn vorausschauend separat abgespeichert.

P. P. S.: Und nach zweimalig falschem Eintippen erscheint eine weiße Seite - zumindest bei mir eben…

P. P. P. S.: Waren diese Abfragen schon immer wie bei Passwörtern standardmäßig case-sensitive?

136

Comment by Mathias

March 29, 2006 @ 4:35 pm

Ich habe mir mal den eigentlichen, unten im Blog verlinkten Artikel durchgelesen und moechte es mal ueberspitzt formulieren: Der Autor meint, weil es nicht ein ganz genau passendes Gesetz fuer jeden individuellen Fall geben kann, wir braeuchten keine Gesetze, sondern einfach nur eine Abstimmung unter allen Buergern, die entscheidet, was gut ist und was schlecht — denn, die wissen eh viel besser was richtig und was falsch ist fuer sie.

Ich behaupte, dass Ontologien, Gesetze und Terminologien immer dann entwickelt werden (und sich automatisch entwickeln), wenn es darum geht, Menschen zusammen leben, arbeiten, kommunizieren zu lassen, dass man sich auf eine Struktur einigen muss, auch wenn diese nicht vollkommen ist.
Und der Autor hat recht, wenn er schreibt, dass Ontologien, Periodensysteme, Gesetze nie perfekt sein koennen. Aber was waere die Chemie ohne das Periodensystem heute? Wie wuerden Naturwissenschaftler Wissen austauschen, wenn es keine zu Grunde liegende einheitliche Terminologie, Ontologie gaebe? Ich spreche hier oft mit Biologen und Bioinformatikern. Die versuchen haenderingend Ontologien zu generieren und extrahieren, um zumindest ein wenig Ordnung in das genetische Chaos ihrer Enzyme zu bringen. Wie wuerden wir ohne Ontologien nach einem Buch in der Bibliothek suchen? Nur nach dem Titel und dem Namen des Autors?

Richtig ist, das “search”, so wie es von Google betrieben wird, eine fantastische Sache ist. Aber sie ist ebenso wenig perfekt wie eine Ontologie. Manchmal gibt eine Suche etwas zurueck was man nicht wissen wollte. Das gleiche Wort kann in verschiedenen Bereichen verschiedene Bedeutung haben. Eine Ontologie kann hier helfen, den Benutzer in die richtige Richtung zu bringen. Was wir in unserem Projekt versuchen, ist eine Kombination beider Techniken.

Im uebrigen vergisst der Autor, dass eine Ontologie nicht nur eine einfache Taxonomie ist (so wie z.B. die bei Yahoo). Es koennen auch nicht-taxonomische Beziehungen zwischen Konzepten bestehen. Und die sind nichts anderes als semantisch kategorisierte Links. Information zu ziehen aus dem Wust von Informationen die heute verfuegbar sind, ist das Ziel aller Bestrebungen in diesem Bereich. Linkanalyse, Suche, social Bookmarking sind, da hat der Autor recht, sehr wichtige Werkzeuge hierfuer. Aber ohne eine zugrunde liegende “Ordnung”, die eine moeglicherweise dynamische (!) Beziehung zwischen den Elementen herstellt und die es erst moeglich macht, dass Menschen wissen, dass und wie sie sich ueber etwas in einem speziellen (Fach-)bereich austauschen, geht es nicht.

RSS feed for comments on this post.

Leave a comment

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

 
 

This is a captcha-picture. It is used to prevent mass-access by robots. (see: www.captcha.net)

Bitte gebe die 5 Zahlen und Buchstaben (0..9 und A..F) ein, die Du im Bild sehen kannst, bevor Du den Kommentar abschickst.

  

Ich kann das Kauderwelsch nicht lesen. Erstelle mir ein neues ID-Bild!

mind the gap