Output / Forschungstagebuch

Intelligenz und ihre entscheidenden Schwächen

von Nicklas Berild Lundblad
22. Sep 2025

Notiz 7 aus dem Forschungstagebuch von Nicklas Lundblad: Bei der Entwicklung künstlicher Agenten (oder Stellvertreter) besteht eine der interessanten Herausforderungen darin, Mechanismen zu finden, die sicherstellen, dass der Agent unter bestimmten Umständen nicht handelt.

Notiz 7.

Genauso wie wir uns im Idealfall künstliche Intelligenzen wünschen würden, die klar sagen können, wenn sie sich nicht sicher sind oder etwas nicht wissen, brauchen wir Akteure, die entscheiden können, nicht zu handeln oder auf verschiedene Weise vom Handeln abzusehen.

In einer aktuellen Veröffentlichung gehen die Autoren auf diese entscheidende Lücke in KI-Systemen ein, die personalisierte Entscheidungen treffen (wie medizinische Behandlungen oder gezielte Werbung). Aktuelle Algorithmen erzwingen immer eine Entscheidung zwischen zwei Optionen, selbst wenn die Beweislage schwach oder ungewiss ist. In Situationen mit hohem Risiko wie im Gesundheitswesen kann dies gefährlich sein – manchmal ist es die beste Wahl, sich an einen menschlichen Experten zu wenden oder bei einer sicheren Standardoption zu bleiben, anstatt eine potenziell schädliche Vermutung anzustellen. Oder gar nichts zu tun!

Die Forscher stellen ein Rahmenwerk vor, in dem KI-Strategien eine dritte Option ausgeben können: „Enthaltung“. Wenn sich der Algorithmus der Stimme enthält, erhält er einen kleinen Belohnungsbonus zusätzlich zu dem, was er durch eine zufällige Wahl zwischen den beiden Behandlungsmethoden erhalten würde. Der wesentliche technische Beitrag ist ein zweistufiger Algorithmus: Zunächst identifiziert er aus Beobachtungsdaten eine Reihe von nahezu optimalen Strategien; anschließend erstellt er eine „Enthaltungs-Klasse“, indem er die Richtlinien genau dort abstimmen lässt, wo sie miteinander in Konflikt stehen (was Unsicherheit signalisiert). Die Autoren belegen, dass dieser Ansatz schnelle Lernraten erzielt, ohne die starken Annahmen zu erfordern, die frühere Methoden benötigten.

Über das zentrale Abstraktionsgerüst hinaus zeigt die Arbeit, dass dieser Ansatz mehrere weitere wichtige Probleme löst. Er ermöglicht das Erlernen guter Strategien, selbst wenn der Behandlungseffekt nicht eindeutig von Null abweicht (wodurch gängige „Margin“-Annahmen gelockert werden). Er bietet einen natürlichen Weg, um Basisstrategien sicher zu verbessern – indem man sich in unsicheren Bereichen zurückhält und sich an die Basisstrategie hält, kann man sicherstellen, dass man die Situation nicht verschlimmert.

Man kann – mit anderen Worten – zögern.

Diese Fähigkeit, Zögern-Mechanismen zu entwickeln, stellt nur einen kleinen Teil ähnlicher Anpassungen dar, die wir herausfinden müssen, während wir KI mit Handlungsfähigkeit entwickeln. Was auf den ersten Blick als Schwächen der menschlichen Entscheidungsfindung erscheinen mag – dass wir zögern, an uns selbst zweifeln, Dinge aufschieben und unsere eigenen Entscheidungen sowie die anderer hinterfragen – sind alles Verhaltensweisen, die zu einem bestimmten Zeitpunkt in der Evolution selektiert wurden oder zumindest nicht gegen sie selektiert wurden (manche Verhaltensweisen können natürlich das Ergebnis von Drift sein).

Dass wir nun versuchen, diese Funktionen in der künstlichen Intelligenz zu entwickeln, könnte durchaus ein Zeichen dafür sein, dass wir etwas Interessantes über Intelligenz entdecken – und es könnte sogar ein Zeichen dafür sein, dass das Intelligenzmodell, das wir mit großen Sprachmodellen erstellen konnten, vielleicht gar nicht menschlich ist. Wir haben etwas geschaffen, das sich oberflächlich betrachtet auf eine Weise verhält, die menschlich wirkt, aber wenn wir uns all die „kleinen“ Verhaltensweisen ansehen, die wir als Menschen zeigen, nun, dann fehlen diese oft.

Vielleicht sind wir hier in eine Falle getappt – wir haben uns auf den Hauptfall konzentriert (in dem Intelligenz ein Problem lösen kann) und nicht darauf geachtet, wie Intelligenz versagt, zögert, zweifelt, wartet – all die kleinen Verhaltensweisen, die man so leicht als Fehler abtun kann. Doch unsere Intelligenz hängt von diesen Fehlern ab und wird dadurch gestärkt – und die Tatsache, dass wir sie nun in verschiedenen Lösungen und Korrekturen einbauen – dass wir sie als Notlösungen hinzufügen –, könnte ein erster Hinweis darauf sein, dass der Unterschied zwischen den aktuellen Intelligenzmodellen und unserer eigenen Intelligenz vielleicht größer ist, als wir gedacht haben.

Nehmen wir Prokrastination (eine Schwäche, zu der dieser Mensch neigt!): Ist das nur eine Schwäche, oder hat es einen Sinn, sich etwas mehr Zeit zu nehmen, abzuwarten, bis ein Gedanke vollständig ausgereift ist, sich treiben zu lassen und den Gedanken freien Lauf zu lassen? Vielleicht ist die Zeit, in der wir Dinge aufschieben, die Zeit, in der wir unbewusst verschiedene Aspekte eines Problems verarbeiten und erforschen? Okay, sicher, das mag Selbsttäuschung in ihrer schlimmsten Form sein – schließlich gibt es auch maladaptive menschliche Verhaltensweisen –, aber es lohnt sich, die Schwächen unserer Intelligenz zu betrachten und neu zu prüfen, ob es sich überhaupt um Schwächen handelt.

Und hier lässt sich ein interessantes Forschungsprojekt ins Auge fassen: Was würde es bedeuten, eine Intelligenz zu entwickeln, die ganz natürlich – ohne zusätzliche Behelfslösungen – zögert, zweifelt und wartet, bevor sie entscheidet? Wie sieht die Architektur aus, die es ermöglicht, dass all diese Verhaltensweisen auf natürliche Weise entstehen?

Meine Vermutung ist, dass die menschliche Intelligenz ein Flickenteppich aus evolutionär begünstigten Funktionen ist, die über einen langen Zeitraum sorgfältig ausbalanciert wurden, während die KI, die wir derzeit entwickeln, ein Konstrukt ist, das nicht von denselben evolutionären Kräften geprägt wurde. Manche lehnen diese Unterscheidung ab und sagen, dass Intelligenz Intelligenz ist, egal wie sie zustande gekommen ist – aber mir scheint es logisch konsistent, das Gegenteil zu argumentieren: dass die Referenzklasse für KI nicht die menschliche Intelligenz und andere evolutionär entstandene Funktionen ist, sondern die Klasse der gebauten, zerbrechlichen Dinge, die wir als Werkzeuge konstruiert haben.

Ich bin mir nicht sicher, ob ich das glaube, und ich halte es durchaus für möglich, dass wir in die Falle tappen, die Evolution dazu zu nutzen, den menschlichen Geist zu mystifizieren – doch indem wir Agenten entwickeln, die zögern und zweifeln, erhaschen wir meiner Meinung nach zumindest einen flüchtigen Einblick in etwas Wichtiges: einen Unterschied, der möglicherweise viel markanter ist, als bisher angenommen.

Alle Ausgaben des Forschungstagebuchs hier

Research Journal

Autor

Nicklas Berild Lundblad

fellow of practice

Projekte

Integrating experienced practitioners into the work of the TUM Think Tank

Fellowship

Nicklas Berild Lundblad joins the TUM Think Tank as a Senior Fellow of Practice to develop a novel interdisciplinary framework for understanding how artificial agency transforms institutions, shapes human identity, and increases social complexity.

Fellowship