Der Schockwellenreiter Rotating Header Image

Posts Tagged ‘Computerlinguistik’

Idee

Ausprobieren, ob Nodebox 2 als Grundlage für eine digital workbench für philologische und historische Arbeiten geeignet ist. (Das steht hier nur für mich, damit ich es nicht vergesse …)

Bibliotheca Polyglotta

Ein Beweis dafür, daß das Web nicht nur englisch spricht und ein Beispiel, wie man mit einfachsten Mitteln Sprachttechniken im Web einsetzen kann, ist die Bibliotheca Polyglotta der Osloer Universität. Das Projekt wurde heute bei uns am Institut vorgestellt und ich muß sagen, ich bin beeindruckt.

NLTK Kurzvortrag

http://www.youtube.com/watch?v=keXW_5-llD0

Morgen nachmittag gebe ich am Institut eine kurze Einführung in das Natural Language Toolkit, eine (Open Source) Sammlung von Python-Modulen für die Verarbeitung natürlicher Sprachen. Sie wird sicher nicht so lang wie der über einstündige Vortrag im obigen Video — aber die Folien stehen schon einmal online (ein Klick auf das Flipchart-Symbol oben startet …

Natural Language Toolkit

Das Natural Language Toolkit (NLTK) ist eine Sammlung von (Open Source) Python-Modulen für die Verarbeitung natürlicher Sprachen. Da es sehr gut auch mit großen Text-Corpora umgehen kann, ist es vielleicht eine Lösung einiger Probleme, die wir am Institut mit diesen haben.

Die Installation verlief jedenfalls Mac-typisch einfach. Lediglich mit der Erkennung »meines« Pythons hatte der …