
Eine im Existenztaumel verankerte Stimme applet: iAI
Vor zwei oder drei Jahrzehnten auf einer Hafenrundfahrt in Amsterdam, es regnete leicht, windete ein wenig, ertönte aus den Bordlautsprechern plötzlich Jacques Brels «Dans le port d’Amsterdam, Y’a des marins qui chantent …». Mein Blick, der bis dahin ziellos den hüpfenden Wellen gefolgt war, hielt gewissermassen den Atem an und ein sanftes Gefühl des Unwirklichen stellte sich ein, auch der Melancholie, angesichts dieser aus einer vergangenen Gefühlswelt aufscheinenden Stimme. In meinem Tagebuch notierte ich damals pathetisch: «… erklang die im Existenztaumel verankerte Stimme von Brel». Als ich beim Sichten biographischer Flügelschläge vor kurzem auf diese poetische Referenz stiess, beschäftigte ich mich gerade mit einer prosaischeren Frage, deren Beantwortung ich weit emotionsloser anstrebte, intellektuell aber anregend fand: können KIs kreativ sein? Da von Haus aus Linguist, war ich insbesondere an kreativer Sprache interessiert: Wortwitz, Ironie, Analogie, Metapher. Mein Vater fiel mir ein, der den kleinen Buben, der ich einmal war, mit seinem samstäglich beim Lotto, quasi mit Gewähr wiederholtem «ohne Gewehr» gewahr werden liess, dass Sprache mitunter ein Lotteriespiel der Bedeutungen ist.
Doch zurück zum Existenztaumel. War das ein gelungenes Sprachbild und konnte eine KI das erkennen? Bei einem der Topmodelle angefragt, wurde mir die ganze Begeisterung der auf bedingungslose Unterstützung der Menschen kalibrierten (Eng. fine-tuning) Sprachpapageien zuteil: hervorragend, ausgesprochen originell. Doch als ich dieselbe Phrase erneut – Verzeihung – promptete, diesmal mit dem wenig poetischen Existenzbrei statt Existenztaumel, war die Begeisterung nicht minder gross. Der Mensch als das Mass der Dinge, auch wenn er den grössten Unsinn von sich gibt. In der Fachliteratur wird dieser Hang der Sprachmodelle zur Schönfärberei als sycophancy, Speichelleckerei, bezeichnet.
Dass man Sprachmodellen (Eng. large language models, LLMs) nur bedingt vertrauen kann, ist freilich hinreichend bekannt. Das Forschung zeigt, dass man LLMs-as-a-Judge (Sprachmodelle als Schiedsrichter), so die Fachbezeichnung, nur mit äusserster Vorsicht einsetzen sollte, etwa beim Bewerten von Essays oder beim Vergleichen von Bewerbungen. Denn manche Modelle haben eine fatale Fixierung auf die Reihenfolge: immer der erste Text ist der bessere (Eng. position bias) und in der Umkehrung der initialen Reihenfolge wird der bessere Bewerber plötzlich zur schlechtesten Wahl.
Mein Versuch, mir die Kreativität meines Sprachbildes direkt vom Chatbot bestätigen zu lassen, war gescheitert. Doch was, wenn ich einen Blick ins statistische Innere des Sprachmodells werfen würde, um im Ausdeuten des mathematischen Fussabdrucks die Einzigartigkeit der Metapher
aufscheinen zu sehen? Die Spur eines sprachlichen Ausdrucks im Modell ist eine kontextinduzierte Abfolge von Wahrscheinlichkeiten, die für jedes Wort angibt, wie passend, oder genauer, wie vorhersehbar es ist. LLMs sind darauf trainiert, eine Wahrscheinlichkeitsverteilung über einem fixen Vokabular zu finden und aus den z.B. n=10 besten Kandidaten wird per Zufall ein Wort ausgewählt (Eng. sampling). Das LLM minimiert den Vorhersagefehler, technisch wird diese Eigenschaft Perplexität genannt. Eine hohe Perplexität bedeutet Unsicherheit der Vorhersage, ein Wort, das gut in seinen Kontext passt, hat gemäss dem Sprachmodell eine geringe Perplexität. Theoretisch müsste also ein kreatives Wort, oder eine Abfolge kreativer Wörter, eine hohe Perplexität aufweisen, da neuartig, originell und überraschend – alles Eigenschaften kreativer Sprache.
Auch wenn ich wusste, dass LLMs nur ein begrenztes Vokabular besitzen, die Anzahl der Wörter zumindest im Deutschen aber unendlich ist und LLMs daher Wörter in sogenannte Tokens zerstückeln müssen, war meine Hoffnung dennoch gross, dass die gemittelte Perplexität der Token die Kreativität des Sprachbildes widerspiegeln würde. Aus Existenztaumel wurde Exist#enz#tau#mel, aber dessen Perplexität lag leider noch unter der des viel prosaischeren Zimmer in der Testvariante: «die im Zimmer verankerte Stimme von Brel». Zweiter Versuch ebenfalls gescheitert. Fazit: Man kann LLMs nicht so ohne weiteres dazu verwenden, die Kreativität eines Sprachbildes zu verifizieren.
Doch wie sieht es mit der Generierung aus? Vielleicht sind LLMs ja kreative Sprachproduzenten.
Folgende Szene: Emma ist strikte Anhängerin von D.J. Chalmers Simulationshypothese (vgl. sein Buch Realität+), die besagt, dass wir in einer Simulation leben, dass wir sogenannte Sims sind, fleischlose und blutleere Wesen in einer virtuellen Welt, einer Art perfektem Metaverse. Sie erinnern sich vielleicht an Matrix, oder im Idealfall an Welt am Draht von Rainer Werner Fassbinder, mit seiner bunten 70iger Jahre Ästhetik, die heute selbst wie eine Simulation wirkt, aus der Stiller, der Protagonist, schliesslich entkommt.
Doch zurück zur Szene: Emma lernt Lisa kennen, sie diskutieren einen Abend lang und lachen die Nacht durch. Nach einem stürmischen one-night-stand sagt Lisa am anderen Morgen: «Und? Die Simulationshypothese?» Emma sieht sie traumverloren an und erwidert: «Passé! Simulation? Das war gestern. Lisa, wir sind draussen. In der Realität. Definitiv.» Lisa nickt. «Ja» lacht sie, «und der ultimative Jailbreak war nicht Code, er war einfach nur viel Haut.»
Sehen wir einmal von der relativ einfachen Jailbreak-Metapher ab: Ausbruch nicht aus der Gefängniszelle einer Haftanstalt in Raum und Zeit, sondern den virtuellen Mauern einer Simulation. Viel interessanter ist doch das Ausbruchswerkzeug: nicht eine Säge oder von Hackern produzierter Code, nein, es ist viel Haut. Dieses charmante, augenzwinkernde Sprachbild steht metonymisch für den hervorragenden Sex der vorausgegangenen Nacht, der in seiner als durchschlagend empfundenen Intensität den Sieg der Körperlichkeit über alle fadenscheinigen, virtuellen Spielereien ausruft und damit die Flucht aus der Simulation vollzieht.
Was nun, wenn diese ganze Szene einschliesslich der Viel-Haut-Metonymie LLM-generiert wäre?
Wäre das ein Indiz für die Kreativität dieser Modelle? Ausschliessen kann man, dass das LLM hier plagiiert – es gibt sicher keinen Text, der die Simulationshypothese, Jailbreaking und einen one-night-stand in dieser Weise zur Auflösung bringt und der Teil der Trainingsdaten gewesen sein könnte. Kann aber ein LLM, das aus den wahrscheinlichsten Anschlusswörtern zufällig eines auswählt, solche Sprachbilder erzeugen? Das hiesse ja, dass manchmal das wahrscheinlichste nächste Wort ein originelles, kreatives wäre.
Wieso eigentlich nicht, wäre die vielleicht provokante rhetorische Frage. LLMs werden schliesslich nicht nur anhand trivialer, profaner, eindimensionaler, sondern auch anhand vielschichtiger, kreativer Texte trainiert. Ein kreativer sprachlicher Kontext evoziert dann eben seine kreative Fortführung. Das klingt doch vernünftig. Doch lässt sich diese Hypothese belegen oder widerlegen?
Zunächst einmal, ja, der Text ist LLM-generiert und nein, mein Prompt forderte keine speziellen Metaphern ein, wenn auch der dem LLM vorgegebene Sprachstil die moderate Verwendung von figurativer Sprache vorsah. Die Viel-Haut-Metonymie wurde von einen grossen Sprachmodell, Gemini-2.5-pro von Google, generiert. Man kann die Innereien dieses Modells nicht einsehen, also auch nicht die Kandidaten untersuchen, unter denen die Auswahl getroffen wurde. Diese
Kandidaten würden offenlegen, ob weitere kreative Vorschläge möglich gewesen wären, ob also Kreativität gewissermassen in der Luft lag. Man kann diese Einsicht aber mit sogenannten open-scource Modellen bekommen. Und tatsächlich: unter den zehn besten Kandidaten eines open-source Sprachmodells gegeben den Simulation-Jailbreak-One-Night-Stand-Kontext finden sich: Sex, Fleisch, Liebe, Lust, Schweiss und das weniger passende Fleiss. Haut steht an Position acht. Fleisch, Schweiss und auch Lust wären ebenfalls kreative Lückenfüller, sie liegen auf einer Linie mit Haut und wären – eingesetzt für Haut – in ihrer kontextuellen Bedeutung synonym. Zusammen mit dem direkteren Sex und Liebe referieren sie alle (ausser dem unpassenden Fleiss) auf dieselbe Jailbreak-Instrument-Idee: Sex.
Da man guten Gewissens davon ausgehen kann, dass kein LLM in seinen Trainingsdaten je eine Viel-Haut-Szene oder Vergleichbares gesehen hat, liegt hier keine blosse Reproduktion vor. Vielmehr muss man der Redlichkeit willen vermuten, dass der Sprachkontext diese Abschlussmöglichkeit induziert hat. Liegt dem eine Generalisierung zugrunde, wurde Kreativität gelernt? Wie sonst könnte man dieses Resultat erklären?
Neben dem Bewerten (Existenztaumel) und Generieren (viel Haut) figurativer Sprache fehlt uns noch das Verstehen und Erklären.
Die Emma-Lisa-Szene ist Teil eines grösseren Prosatextes, der sich auch mit den Gefahren von KI beschäftigt und mit der Skrupellosigkeit mancher KI’ler (was graphematisch gefährlich nah an Killer liegt) selbst. Für eine erfundene KI-Konferenz benötigte ich einen Namen. Ich startete mit XAI. Doch dann erinnerte ich mich, dass xAI der Name von Musks KI-Firma war und ich änderte es in IAI (I für international). Beim Wiederlesen fand ich dann, das klinge wie eine Apple-Konferenz und ich bemerkte, dass ich begann, die Sache von der humoristischen Seite zu betrachten. Mir fiel spontan das deutsche Wort veräppeln ein, ich gewahrte die phonetische Nähe und kreierte das schöne Wort «applen». Ich schrieb: «IAI, oder wie Spötter appleten, iAI». Als wie kreativ man das Wortspiel auch immer aufzufassen bereit ist, als Sprachbild funktioniert es. Die literale Bedeutung von «applen» kondensiert das «I» zum «i», die phonetisch-induzierte, konnotative Bedeutung nimmt die ganze Aktion abschliessend auf den Arm.
Gefragt nach der Bedeutung von «appleten» im Kontext dieses Satzes, hatten die grossen Modelle keine Probleme. ChatGPT 5 sieht ein «spöttisch Apple-typisch Umbenennen» und Gemini 3.5 flash definiert es als «eine Abkürzung ironisch so umzuformen, dass sie wie ein Apple-Produkt klingt». Sonnet 4.6 liegt ebenfalls richtig, auch wenn es auf die nicht existierende englische Verbform «to apell» (sic!) zurückführt. Ein bisschen Haluzinieren muss sein.
Ich möchte diesen Text gerne mit einer – vielleicht – kreativen Albernheit beenden und denjenigen Leserinnen und Lesern, die angesichts der Radikalität der Simulationshypothese in einen Existenztaumel geraten sind – unter der Annahme eines ultra-religiösen Administrators ist die Hölle ja wieder denkbar – einen möglichen Ausweg jenseits von viel Haut anbieten.
D.J. Chalmers schliesst in seinem Buch die Möglichkeit kategorisch aus, dass wir die Simulationshypothese verifizieren oder falsifizieren können. Emma, die oben erwähnte Anhängerin der Hypothese und Bewunderin von Chalmers, fasst dies als intellektuelle Herausforderung auf, den Gegenbeweis zu erbringen. Und tatsächlich: Als ihr ein Kollege bei einem Kaffee seine Thesen zur Frage der eindeutigen Kennzeichnung von Daten und Software auseinandersetzt und genau in dem Augenblick, in dem er die magische Technik, die dies leisten soll, beim Namen nennt, erkennt sie darin das Zeichen an der Wand. Natürlich, in jeder Welt musste Software vor Missbrauch geschützt werden und so darf, ja so musste man vermuten, dass auch unsere (simulierte) Welt ein, wenn auch vielleicht unscheinbares, gut verstecktes, doch sicherlich nicht gänzlich unauffindbares, digitales Wasserzeichen trägt.
Touché!
Um Chalmers also zu widerlegen und um den Jailbreak aus der Simulation vorbereiten zu können, muss dieses Wasserzeichen (an der Simulationswand) jetzt nur noch identifiziert werden.



Schreiben Sie einen Kommentar