Am Institut für Informatik der Humboldt-Universität zu Berlin (HU) hat Prof. Dr. Alan Akbik mit seinem Team eine Zitatsuchmaschine entwickelt (via hu-berlin.de):
“Diese Zitatsuchmaschine geht über das hinaus, was herkömmliche Suchmaschinen zu bieten haben. Denn die Webcrawler durchforsten fortlaufend den Website-Content von deutschsprachigen journalistischen Medien und extrahieren Zitate, die dann quasi in Echtzeit verschlagwortet nach Themen und Personen auf der Website zu finden sind. Durch den vollautomatisierten Prozess auf Basis von KI-Modellen, die das Team um Akbik in den letzten vier Jahren entwickelt haben, ist eine riesige Datenbank entstanden: Zwei Millionen Zitate von 240 Tausend Sprecher*innen aus rund 50 verschiedenen journalistischen Quellen. Jeden Tag kommen mehr als 10.000 weitere Zitate hinzu.
Für Alan Akbik, der den Lehrstuhl für Maschinelles Lernen innehat, ist die Zitatsuchmaschine ein Nebenprodukt seiner Forschung. Er und sein Team beschäftigten sich mit Sprachmodellen und der Frage, wie Computer lernen, menschliche Sprache zu verarbeiten (Natural Language Processing, NLP). Dafür wollen die Informatiker*innen möglichst daten- und ressourceneffiziente Methoden entwickeln.”
Pingback: KI sucht automatisiert Zitate aus der Presse – Archivalia