Blockseminar Twitterbots und Textgenerierung (WS 2015/16), Heinrich-Heine-Universität Düsseldorf
In diesem Seminar werde ich eine Einführung in einige Anwendungsbereiche der Sprachgenerierung geben. Im praktischen Teil des Seminars werden die Teilnehmenden ihre eigenen Twitterbots programmieren und so erste Erfahrungen im Bereich Textgenerierung sammeln.
Voraussetzung zur Teilnahme sind (Grund-)Kenntnisse in Python (2.x oder 3.x). Die Leistung für den BN besteht aus dem Programmieren eines funktionierenden Twitterbots, einem Kurzreferat über das eigene Projekt am letzten Seminartag sowie einer 2- bis 5-seitigen schriftlichen Ausarbeitung.
Eine Anmeldung über das HISLSF ist nicht nötig. Ich werde an alle einen BN ausstellen, die zum Schluss ein fertiges Projekt vorstellen. Es gibt keine Anwesenheitspflicht.
Zeitplan
Die Foliensätze und sonstige Materialien zu den jeweiligen Terminen werden im Laufe der Seminarwoche ergänzt.
Montag, 29.02.2016
- Beginn: 10:00, Raum 23.21.04.87
- Themen: Vorstellung, Organisatorisches, Theorie der Textgenerierung
Folien
Literaturempfehlungen (Jahreszahlen beachten!)
- Reiter, E., & Dale, R. (1997). Building applied natural language generation systems. Natural Language Engineering, 3(01), 57-87. [PDF]
- Martin, J. H., & Jurafsky, D. (2000). Speech and language processing. International Edition [Table of Contents]
- Reiter, E., Sripada, S., Hunter, J., Yu, J., & Davy, I. (2005). Choosing words in computer-generated weather forecasts. Artificial Intelligence, 167(1), 137-169. [PDF]
- Dale, R., Geldof, S., & Prost, J. P. (2005). Using natural language generation in automatic route. Journal of Research and practice in Information Technology, 37(1), 89. [PDF]
- Zhang, Y., & Clark, S. (2015). Discriminative syntax-based word ordering for text generation. Computational Linguistics, 41(3), 503-538.
- Garoufi, K., & Koller, A. (2014). Generation of effective referring expressions in situated context. Language, Cognition and Neuroscience, 29(8), 986-1001.
- Mairesse, F., & Young, S. (2014). Stochastic language generation in dialogue using factored language models. Computational Linguistics.
Dienstag, 01.03.2016
- Beginn: 10:00, Raum 23.21.04.87
- Themen: Existierende Twitterbots, technische Grundlagen (Python, OAuth), Erste Ideensammlung (Projektvorschläge von mir)
Folien
Mittwoch, 02.03.2016
- Beginn: 10:00, Raum 23.21.04.87
- Themen: Bot Ethics, Nützliche Datensätze, APIs, Korpora, Umsetzung der Projekte
Folien
Donnerstag, 03.03.2016
- Voraussichtlich kein Präsenztermin: Fertigstellung der Projekte, Vorbereitung der Präsentation
Freitag, 04.03.2016
- Beginn: 10:00, Raum 23.21.04.87
- Themen: Vorstellung der fertigen Projekte, Diskussion
Sonntag, 13.03.2016
- Spätester Termin für die Abgabe der schriftlichen Ausarbeitung (per Mail an esther.seyffarth@hhu.de)
Technisches
Die Computer in unserem Raum sind sehr langsam und nicht auf dem allerneuesten Stand. Wer in der Lage dazu ist, wird sehr vom Mitbringen eines eigenen Laptops profitieren.
Zu installieren:
- Python (idealerweise Python 3, wir können aber notfalls auch mit Python 2 arbeiten)
- Das Python-Paket tweepy
- Das Python-Paket nltk
- PyCharm Community Edition (optional)