Wer braucht Computerlinguistik?
Esther Seyffarth
@ojahnn
23. Juni 2016, Webworker Ruhr
Was tut Computerlinguistik?
Screenshot von der ELIZA-Implementierung auf
http://www.masswerk.at/elizabot/
1. Aufgabe:
Input verarbeiten und "verstehen"
Rechtschreibkorrektur
Falsch geschriebene Inputwörter können nicht weiterverarbeitet werden
Tokenisierung: Zerlegen des Inputs
Jeder einzelne Satz muss separat interpretiert werden. Jedes einzelne Wort muss separat verarbeitet werden.
Lemmatisierung: Zusammenführen von Wortformen
Ein Wort kann nur dann verstanden werden, wenn klar ist, zu welchem Wortstamm es gehört.
Parsen: Grammatische Struktur der Eingabe ermitteln
Ist die grammatische Struktur bekannt, kann die Eingabe vom Computer "verstanden" werden.
Screenshot von
http://demo.ark.cs.cmu.edu/parse
Interne semantische Repräsentation: Verständnis vortäuschen
I think my mother and I are too close.
$$\exists e \exists c [think(e, SPEAKER, c) \wedge $$ $$ be\_too\_close(c, SPEAKER, SPEAKERS\_MOTHER)]$$
Die Bedeutung von Sätzen setzt sich nach bestimmten Regeln aus den Bedeutungen der Einzelelemente zusammen.
2. Aufgabe:
Antwort generieren
Ungelöst und unlösbar (?)
Folie von Dan Jurafsky, 2012
http://spark-public.s3.amazonaws.com/nlp/slides/intro.pdf
Bots
Bots als Brücke zwischen Frontend und Backend
Plattform zur Weiterentwicklung bzw. Präsentation computerlinguistischer Tools und Algorithmen
Bots als "Apps mit geringerer Hemmschwelle"
Bots als Programmierprojekte für Einsteiger/innen
Bots als Kunstform:
#botALLY
Bots als bessere Menschen?
Let's Talk About Bots! \o/
Unkonferenz am 09.07. im Unperfekthaus, Essen
Kommt alle!