Maschinelles Lachen
Verstehen ChatGPT und Co. Humor?
Sprachmodelle wie ChatGPT kennen Millionen von Witzen. Doch verstehen sie auch, warum diese lustig sind, oder tun sie nur so? Malte Elson befasst sich mit der Psychologie der Digitalisierung und kennt die Antwort.
«Witze kann man nur dann aus dem Ärmel schütteln, wenn man sie vorher hineingesteckt hat», sagte einst der niederländische Showmaster Rudi Carrell. Wer, wie Carrell zu Lebzeiten selbst, scheinbar mühelos Witze erzählt, hat ein inneres Archiv unzähliger Wendungen und Wortspiele. Aus diesem Archiv schöpft der Moment, und die pointierte Darbietung ist mühevoll trainiert.
In den Ärmeln heutiger Sprachmodelle (Large Language Models) wie ChatGPT stecken mehr Humorschnipsel als in den gesamten Kleiderschränken menschlicher Comedians: Millionen Punchlines und Kalauer sowie unzählige Varianten klassischer Witzstrukturen, vom Slapstick bis zum Antiwitz. Wenn Carrells Bonmot also stimmt, wieso wirkt Sprachmodellkomik dann mitunter, als sei sie weniger aus einem Ärmel geschüttelt als vielmehr einem Unterhemd entglitten?
Warum sind Witze witzig?
Unter Berücksichtigung der enormen individuellen Unterschiede, worüber Menschen lachen (und worüber nicht), gibt es in der Psychologie drei klassische (und rivalisierende) Humortheorien dazu, warum Menschen lachen:
Die Inkongruenztheorie sieht Humor als Folge der Kollision von Erwartungen und Realität: unerwartete Widersprüche oder Wendungen. Ein berühmtes Beispiel ist der Witz des britischen Komikers Bob Monkhouse: «Ich möchte friedlich im Schlaf sterben wie mein Grossvater, nicht schreiend wie seine Passagiere.»
Die Entlastungstheorie betrachtet Humor als Ventil für aufgebaute Spannung oder Nervosität. In einer Kommissionssitzung sagte eine Kollegin kürzlich: «Solange ChatGPT keinen Kaffee kochen kann, ist mein Job hier zum Glück sicher.» Diese Form des Galgenhumors lässt sich überall beobachten, wo Personen hohem Stress ausgesetzt sind, und hilft dabei, emotionale Distanz zu gewinnen, aber auch, um Kollegialität unter Leidtragenden zu stiften.
Laut der Überlegenheitstheorie steckt in jedem Scherz ein Opfer. Wir lachen, wenn wir uns, wenigstens für einen Moment, anderen überlegen fühlen – dem Ungeschickten, der Naiven, dem Blamierten oder unserem früheren Ich.
Oftmals besteht humorvolle Kommunikation aus kognitiven, sozialen und affektiven Komponenten, die zu allen drei Theorien passen.
As a large language model, I can’t understand humour
Sprachmodelle können mit Erwartungen spielen, Tabus brechen oder mit Klischees provozieren. Nutzen sie also diese Humortheorien, um für Menschen besonders komischen Output zu generieren? Nein! Oder besser gesagt: Nur insoweit diese Theorien in sprachlichen Spuren von Humor enkodiert sind. Sprachmodelle wenden keine expliziten Modelle von Inkongruenz, Überlegenheit oder Entlastung im psychologischen Sinne an, sondern rekonstruieren empirische Regularitäten.
Statt Humortheorien verwenden Sprachmodelle statistische Abkürzungen. Sie optimieren für Humor nicht durch Einsicht, sondern, wo ausreichend Daten vorhanden sind, durch Wahrscheinlichkeiten: Wenn genügend Menschen ein bestimmtes sprachliches Muster lustig finden, lernt das Modell, diese semantischen, syntaktischen und pragmatischen Strukturen zu reproduzieren. Auch Menschen lernen natürlich durch Mustererkennung, was lustig ist, ohne notwendigerweise verstehen zu müssen, warum (etwa bei regelhaften Formaten wie Memes).
Das führt einerseits zu einer paradoxen Einsicht über Sprachmodelle: Sie setzen die psychologischen Theorien von Humor besser um, als sie sie verstehen. Eigentlich verstehen Sprachmodelle gar nichts von dem, was sie so den lieben langen Tag produzieren. Andererseits führt das aber auch zu einer Wahrheit über uns: Wenn wir über einen modellgenerierten Witz lachen, dann nicht, weil das Modell Humor versteht, sondern weil wir im Witz unseren eigenen Humor wiedererkennen wollen.
Vom Parameter zur Pointe
Humor ist für Sprachmodelle ein Prüfstein: Er entsteht manchmal nicht nur durch das, was gesagt wird, sondern auch durch das, was gemeint ist (was wiederum genau das sein kann, was nicht gesagt wird). Auch das Timing ist entscheidend, etwa Pausen, Blickkontakte, die präzise Abstimmung zwischen Erwartung und Auflösung, aber ebenso Tonfall und Intonation. Humor ist ausserdem stark (sub)kulturell geprägt und bedient sich an impliziten Normen oder Referenzen. All das schafft Bedeutung, die nicht immer in reinen Textdaten kodiert ist. Dass Humor natürlich auch für Menschen schwer zu erkennen sein kann, weiss man spätestens in dem Moment, wenn nur das eigene Lachen die unangenehme Stille nach einem missglückten Witz durchbricht.
«Humor ist für Sprachmodelle ein Prüfstein, denn er entsteht nicht nur durch das Gesagte, sondern oft auch durch das Ungesagte.»
Malte Elson
In der Forschung zu Humor von künstlicher Intelligenz unterscheidet man zwischen drei komplementären Fähigkeiten: Erkennung, Verstehen und Generierung.
Humor-Erkennung ist zunächst ein Klassifikationsproblem: Ein System muss beispielsweise anhand lexikalischer oder semantischer Merkmale bestimmen, ob ein Satz, ein Bild oder eine Szene komisch ist. Insbesondere für klar umgrenzte Domänen und stark regelhaften Humor (beispielsweise «Klopf, Klopf»-Witze) ist die Erkennungsleistung bereits relativ gut. Neben impliziten, kulturell enkodierten Besonderheiten und emotionaler Ambiguität sind vor allem Zielgruppenreferenzen (für wen und über wen wird ein Witz gemacht) die Hauptursachen für Fehlklassifikationen.
Insgesamt hängt Humor-Erkennung noch immer stark von kuratierten Datensätzen ab. Der Grund liegt weniger in der technischen Leistungsfähigkeit der Modelle als in der Natur des Humors selbst: Humor ist Verhandlungssache. Ob eine Äusserung witzig ist, hängt von kulturellem Kontext, sozialer Beziehung, Intention und situativer Angemessenheit ab – all das lässt sich nicht ohne Weiteres aus rohen Textdaten «herauslernen».
Humor als Königsdisziplin
Zu erkennen, was lustig ist, ist etwas anderes als erklären zu können, warum etwas lustig ist (etwa so, wie es allen Menschen bei Filmen von Yorgos Lanthimos geht). Das Verständnis von Humor umfasst Semantik (etwa warum eine Erwartung erst entsteht, um dann gebrochen zu werden), die Einschätzung sozialer Rollen und soziokultureller Kontexte (wann und für wen ist ein Witz witzig oder angemessen) sowie das Nachvollziehen von ironischen Wendungen und Übertreibungen (wann ist das Gegenteil vom Gesagten gemeint).
uniAKTUELL-Newsletter abonnieren
Entdecken Sie Geschichten rund um die Forschung an der Universität Bern und die Menschen dahinter.
Simple Wortwitze können moderne Modelle in der Regel plausibel erklären. Sobald aber Weltwissen oder Mehrdeutigkeit ins Spiel kommt, versagen sie regelmässig oder begründen hilfreich, dass etwas lustig ist, weil es witzig ist. Das Verstehen von Sarkasmus und Ironie ist dann besonders schwierig, wenn die Kenntnis von Tonfall, Mimik oder vom situativen Kontext fehlt. Dennoch zeigen Modelle mittlerweile teils überraschende Fähigkeiten im Kontextverständnis und können oft richtig reagieren, wenn Nutzende scherzen («LOL»).
Die Generierung von Humor gilt als Königsdisziplin. Lange Zeit beschränkten sich Algorithmen auf Witzvorlagen oder Grammatikregeln (beispielsweise der Pun-Generator JAPE). Mit Sprachmodellen begann sich das Bild zu wandeln. In Studien, in denen Menschen die Qualität von Witzen bewerten, liegen Sprachmodelle etwa gleichauf mit menschlichen Autoren. Witscript, ein speziell auf klassische Witzstrukturen trainiertes Modell des Gag-Autors Joe Toplyn, generiert hochqualitative «One-Liner» («Was ist ein gutes Geburtstagsgeschenk für jemanden, der gerne strickt? Ein Schaf.»). Häufig sind KI-Witze aber immer noch klischeehaft oder vorhersehbar. Gepaart mit menschlichen Kuratorinnen können sie allerdings auch anspruchsvollere Humoraufgaben bewältigen (siehe dazu das sehr zu empfehlende Buch «Meine Witze sind alle nur gecloud», eine Koproduktion des Satirikers Cornelius W. M. Oettle und der mit ChatGPT erdachten Figur Quippy).
Humor ist, wenn man trotz Sprachmodell lacht
Künstliche Intelligenz hat den Sprung von der einfachen Erkennung humoristischer Muster zur kreativen Produktion und situativen Anwendung geschafft. Aber wird sie jemals verstehen, warum Menschen über ihren Output lachen? In meinen Augen ist diese Frage nicht zielführend. Künstliche Intelligenz wird so oder so in den nächsten Jahren zweifellos eine grössere Rolle dabei spielen, wie Humor entsteht, verbreitet und bewertet wird. Schon jetzt schreiben Sprachmodelle Witze auf Zuruf, entwerfen Sketch-Ideen oder helfen, Pointen zu testen. Mehr denn je gilt in Zukunft die Warnung des Komikers Danny Kaye: «Es ist gefährlich, über einen Witz zu lachen. Man bekommt ihn dann immer wieder zu hören.»
Zur Person
Malte Elson
ist seit 2023 Professor für Psychologie der Digitalisierung. Seine Schwerpunkte sind das Qualitätsmanagement in der Wissenschaft, insbesondere das Erkennen und Vermeiden von Fehlern, sowie die Privacy und Security von (Forschungs-)Daten. Je nachdem, wen man fragt, ist seine Forschung ein Witz.
Was bringt Sie persönlich zum Lachen?
«1. Meine Frau, 2. Furzkissen, am liebsten beides zusammen.»