Bad Soden, Deutschland,
26
November
2013
|
13:00
Europe/Amsterdam

Adolf-Messer-Preis für Sprachtechnologen Chris Biemann

Wie lehrt man Computer, natürliche Sprache zu verstehen, um so auch große Textmengen zu strukturieren und erschließbar zu machen? Diesem Problem hat sich an der TU Darmstadt Professor Dr. Chris Biemann mit seiner Forschergruppe am Fachbereich Informatik verschrieben. Für seine Arbeit wurde er am Dienstag, den 25. November 2013, mit dem Adolf Messer Preis ausgezeichnet, der mit 50.000 Euro dotiert ist.

Computer haben ihre eigene Sprache, die nach klaren, logischen Regeln funktioniert und stets eindeutig ist. „Die menschliche Sprache ist dagegen gewachsen und nicht immer logisch und eindeutig“, erklärt Chris Biemann. Soll ein Computer einen von Menschen geschriebenen Text „verstehen“, also interpretieren, muss man ihm beibringen, Wörter nicht nur als Ansammlung von Buchstaben zu sehen. Ein Rechner muss auch erschließen können, welches Konzept hinter einem Wort steht. Chris Biemann erklärt das Problem, vor dem Computer dabei stehen, am Beispielsatz „Sie ging zur Bank und hob Geld ab“. Hinter dem Wort „Bank“ könnten zwei verschiedene theoretische Konzepte stehen: eine Sitzgelegenheit oder ein Geldinstitut.

Menschen erschließen sich die jeweilige Bedeutung des Wortes „Bank“ aus dem Zusammenhang. Computer können das bislang kaum und wenn nur in kleinem Rahmen. „Diese Zuordnung automatisch zu bewerkstelligen und so Computern Wissen über unsere Welt beizubringen ist nicht trivial“, sagt Biemann. Gemeinsam mit seiner Forschungsgruppe arbeitet er daran, große Datenmengen algorithmisch zu analysieren. Vereinfacht gesagt: Computerprogramme durchforsten riesige Textmengen, zum Beispiel 20 Jahrgänge Tageszeitungen, und entdecken dabei, dass manche Wörter typischerweise ähnlich verwendet werden. Nach und nach entstehen so zu allen Wörtern Listen mit ähnlich verwendeten Wörtern. Die Methode, zu einem schlichten Text einen „zweidimensionalen Text“ generieren zu lassen, ist eine Entwicklung der Forscher an der TU Darmstadt.

Der Darmstädter Forschungsansatz lässt Computer eigenständig lernen. In der Praxis werden die an der TU Darmstadt entwickelten Methoden bereits eingesetzt, und zwar immer dann, wenn es ums Wissensmanagement geht. Suchanfragen in Internet-Suchmaschinen sind ein Beispiel. Da nicht genau absehbar ist, welche Formulierung und welche Suchbegriffe der Suchende wählen wird, muss die Suchmaschine in der Lage sein, mit einer Anfrage „intelligent“ umzugehen und sie zu interpretieren. „Immer, wenn ein Thema noch nicht gut erschlossen ist, hilft zweidimensionaler Text weiter“, sagt Chris Biemann.

Für seine Arbeit wird Chris Biemann in diesem Jahr mit dem Adolf-Messer-Preis ausgezeichnet. Das Preisgeld fließt zurück in die Forschung: Verschiedene weiterführende Teilprojekte, teils geleitet von renommierten Gastwissenschaftlern, werden ebenso finanziert wie ein neuer Rechner, der von seiner Architektur her darauf ausgelegt ist, große Datenmengen zu verarbeiten und damit die Forschung voranzutreiben.

Chris Biemann studierte Diplominformatik an der Universität Leipzig, wo er von 2003 bis 2007 auch promovierte. In seiner Dissertation brach er mit den Traditionen von Computerlinguistik und Sprachtechnologie, indem er zeigte, dass Maschinen computerlinguistische Aufgaben lösen können, ohne auf explizit gegebenes Wissen zurückzugreifen. Die Maschine lernt „von selbst“. Nach der Promotion arbeitete Biemann in San Francisco bei der semantischen Suchmaschine Powerset und später bei Microsoft Bing. 2011 folgte er dem Ruf auf die Juniorprofessur am Fachbereich Informatik der TU Darmstadt. Er leitet die Fachgruppe Sprachtechnologie. In den vergangenen beiden Jahren entstanden hier zahlreiche Publikationen sowie eine Reihe von Forschungsprojekten und Kooperationen.

Der mit 50.000 Euro dotierte Preis der Adolf Messer Stiftung wird jährlich verliehen. Er fördert die Forschung und Lehre von Nachwuchswissenschaftlerinnen und -wissenschaftlern an der TU Darmstadt. Gewürdigt werden herausragende Leistungen in den Naturwissenschaften, Ingenieurwissenschaften sowie Wirtschafts-, Sozial- und Geisteswissenschaften.