Kompetenz für die Zukunft der Textarbeit: eWW-Gesellschafter schließt NLP-Promotion ab
Die natürliche Sprachverarbeitung (Natural Language Processing, NLP) ist die maschinelle Verarbeitung menschlicher Sprache. Im Gegensatz zu den Formalsprachen wie die Mathematik oder Programmiersprachen, stellt die menschliche Sprache durch ihre historische Entwicklung und Mehrdeutigkeit eine große Herausforderung für Formalsysteme (bspw. Computer) dar (Biemann et al., 2022, S. 24). Als Verständnis der künstlichen Intelligenz (KI) wird folglich u.a. die Fähigkeit verstanden, menschliche Sprache zu verstehen, zu verarbeiten und zu produzieren (Jurafsky & Martin 2008, S. 54). Die NLP ist eine Teildisziplin der KI und nutzt sprachstatistische Verfahren, sowie heutzutage vornehmlich das Deep Learning (Russel & Norvig 2016, S. 860 ff.).
Dr. Dirk Johannßen durfte sich im November 2022 nach rund fünfjähriger der Forschung und Lehre mit einem Gesamtresultat „magna cum laude“ (sehr gut) den Doktorhut aufsetzen. In seinem Thema „Computer-aided Psychometrics with Natural Language Processing“ (zu dt. Computergestützte Psychometrie mit natürlicher Sprachverarbeitung) nutzte er NLP-Methoden und konstruierte Machine- und Deep Learning Modelle (LSTM (Hochreiter & Schmidhuber, 1997), eine Art von Neuronaler-Netz-Architektur), um psychologisch-diagnostische Textdaten zu verarbeiten und die resultierenden Modelle für behavioristische Vorhersagen zu nutzen und zu validieren (Johannßen 2022). Solche behavioristischen Vorhersagen umfassen u.a., Aussagen dazu, wie sich eine Person mit identifiziertem Persönlichkeitsprofil in einem bestimmten Stellenprofil entwickelt oder welche Team-Zusammensetzungen harmonieren (McClelland & Boyatzis, 1982).
Der genutzte Datensatz wurde von der IMPART GmbH kollektiviert und von Forscher:innen der Universität Trier unter Leitung der Professorin Nicola Baumann aufbereitet und untersucht. Er beinhaltet 219.000 textuelle Antworten auf einen Projektivtest und ist unter der CC BY-SA 4.o-Lizenz frei verfügbar für nicht-kommerzielle Zwecke (Johannßen et al., 2020a).
Wie auch bei der effective WEBWORK GmbH stand das Promotionsvorhaben unter dem Credo der Daten- und Quelloffenheit. Um die Daten frei zugänglich zu machen und das Forschungsinteresse zu wecken, wurde im Jahr 2020 eine sog. Shared Task veranstaltet, bei der Forschende Daten beziehen und sich an der Erstellung der besten Systeme für eine definierte Problembeschreibung versuchen können (ebd.). Auch die ethischen und gesellschaftlichen Implikationen wurden untersucht und im offenen Podium diskutiert (Johannßen et al. 2020b). Die Forschung wurde ebenfalls frei zugänglich publiziert. Derzeit wird bei der eWW daran gearbeitet, auch die Modelle durch eine benutzbare und quelloffene Software unter der CC-Lizenz zur Verfügung zu stellen. Nach Vorbild des psychometrischen Textanalyse-Tools Linguistic Inquiry & Word Count (LIWC, Pennebaker et al, 2007) soll ein solches Tool Forschende dazu befähigen, die neuronalen Modelle für Textanalysen und zur Persönlichkeitsprofilanalyse zu nutzen.
Dieser Tage ist der von der US-Firma OpenAI entwickelte Chatbot ChatGPT, basierend auf dem Sprachmodell GTP-3.5 (Brown et al. 2005, Ouyang et al. 2022), in aller Munde. Die disruptive Technologie, Large-Scale Sprachmodelle (Language Models) für die Verarbeitung von Queries und Erzeugung von textuellen Antworten zu nutzen, wird die Art, mit Texten zu arbeiten, fundamental ändern (Patel & Lam, 2023). In Wissenschaft, Bildungs- und Bibliothekswesen wird die NLP nach aktuellen Einschätzungen disruptiven Charakter haben und die Mensch-Maschine-Interaktion grundlegend verändern.
Das bedeutet auch, dass sich auch der Dokumentationsprozess von Wissenschaft verändern wird (King, 2022). Künftig könnten etwa Sprachmodelle mit zielgerichteten Fragen und Aufforderungen gespeist und deren Ergebnisse von den Forschenden in den eigenen Wissenschaftskontext gebettet werden, anstatt jede Ausformulierung langwierig und arbeitsintensiv selbst zu gestaltet (Hutson, 2022). Aktuell weisen Sprachmodelle noch zu viele und teils gravierende Fehler auf, als dass sie ohne tiefe Expertise genutzt werden könnten. Auch künftig wird die Fachkundschaft von Expert:innen vonnöten sein, um die generierten Texte auf Korrektheit zu prüfen und für die eigenen Zwecke heranzuziehen. Auch neue Ideen lassen sich mit Large-Scale Sprachmodellen nicht erzeugen. Nichtsdestotrotz wird die disruptive Technologie – richtig eingesetzt – auch den wissenschaftlichen Schaffungsprozess beschleunigen und müßige, repetitive und unkreative Fleißaufgaben erleichtern. (Salvagno et al., 2023)
Mit Dr. Johannßen besitzt die eWW die Kompetenz und das Wissen im Hause, die neuartigen Technologien zu verstehen, im Umgang damit zu beraten und eigene (wenn auch bei weitem nicht so große) Lösungen zu erarbeiten, um die Textarbeit der Zukunft mitzugestalten. Nach seiner Promotion bemüht sich Dr. Johannßen derweil um Professuren, um, neben der Software-Entwicklung und Gesellschafter-Tätigkeit bei der eWW, die Lehre und Forschung weiter auszugestalten.
Literatur
Biemann, C., Heyer, G., & Quasthoff, U. (2022). Wissensrohstoff Text: Eine Einführung in das Text Mining. Wiesbaden: Springer Vieweg, 2nd ed. 2022 ed.
Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., Neelakantan, A., Shyam, P., Sastry, G., Askell, A., Agarwal, S., Herbert-Voss, A., Krueger, G., Henighan, T., Child, R., Ramesh, A., Ziegler, D. M., Wu, J., Winter, C., Hesse, C., Chen, M., Sigler, E., Litwin, M., Gray, S., Chess, B., Clark, J., Berner, C., McCandlish, S., Radford, A., Sutskever, I., & Amodei, D. (2020). Language Models are Few-Shot Learners. arXiv:2005.14165 [cs].
Hochreiter, S., & Schmidhuber, J. (1997). Long Short-term Memory. Neural computation, 9, 1735–1780.
Hutson M. Could AI help you to write your next paper? Nature Nature Research. 2022;611:192–3.
Johannßen, D. (2022): Computer-aided Psychometrics with Natural Language Processing. Doctoral Dissertation, U Hamburg.
Johannßen, D., Biemann, C., Remus S., Baumann T., and Scheffer, D. (2020a): GermEval 2020 Task 1 on the Classification and Regression of Cognitive and Motivational style from Text. In Proceedings of the 5th SwissText & 16th KONVENS Joint Conference 2020, pages 1–10, Zurich, Switzerland (online).
Johannßen, D., Biemann C., and Scheffer, D. (2020b): Ethical considerations of the GermEval20 Task 1. IQ assessment with natural language processing: Forbidden research or gain of knowledge? In Proceedings of the GermEval 2020 Task 1 Workshop in conjunction with the 5th SwissText & 16th KONVENS Joint Conference 2020, pages 30–44, Zurich, Switzerland (online).
Jurafsky, D., & Martin, J. H. (2008). Jurafsky, D: Speech and Language Processing: International Edition. Upper Saddle River, NJ: Prentice Hall, 2 ed.
King, M.R. The Future of AI in Medicine: A Perspective from a Chatbot. Ann Biomed Eng 51, 291–295 (2023).
Patel S. B., Lam K. ChatGPT: the future of discharge summaries? Lancet
Digit Health. 2023. https:// doi. org/ 10. 1016/ S2589- 7500(23) 00021-3.
Pennebaker, J., Chung, C., Ireland, M., Gonzales, A., & Booth, R. (2007). The Development and Psychometric Properties of LIWC2007. Software manual. http://liwc.wpengine.com.
McClelland, D. C. and Boyatzis, R. 1982. Leadership Motive Pattern and Long-Term Success in Management. Journal of Applied Psychology, 67:737–743.
Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C.L., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., Schulman, J., Hilton, J., Kelton, F., Miller, L., Simens, M., Askell, A., Welinder, P., Christiano, P., Leike, J., Lowe, R., 2022. Training language models to follow instructions with human feedback. https://doi.org/10.48550/arXiv.2203.02155
Russell, S., & Norvig, P. (2016). Artificial Intelligence: A Modern Approach, Global Edition. Boston Columbus Indianapolis New York San Francisco Upper Saddle River Amsterdam, Cape Town Dubai London Madrid Milan Munich Paris Montreal Toronto Delhi Mexico City Sao Paulo Sydney Hong Kong Seoul Singapore Taipei Tokyo: Addison Wesley, 3. edition ed.
Salvagno, M., ChatGPT, Taccone, F., Gerli, A.G., 2023. Can artificial intelligence help for scientific writing? Critical care (London, England) 27, 75.