Experiment mit verblüffendem Ausgang: KI weigert sich, in Street Fighter zu kämpfen

Was würde passieren, wenn verschiedene KIs in einem Kampfspiel gegeneinander antreten müssten? AWS hat es am Klassiker Street Fighter 3 ausprobiert!

Street fighter
Ein AWS-Experiment hat verschiedene KIs in Street Fighter gegeneinander kämpfen gelassen. | © AWS

Amazon Web Services hat kürzlich 14 verschiedene große Sprachmodelle (LLMs) in Street Fighter III gegeneinander antreten lassen, um zu sehen, welches sich am besten an das Spiel anpasst. Die Ergebnisse waren ziemlich faszinierend: Die verschiedenen LLMs haben extrem unterschiedliche Verhaltensweisen entwickelt! Während einige von ihnen echte Taktiken entwickelten, weigerten sich andere, das Spiel überhaupt zu spielen.

AWS-Experiment zeigt: Street Fighter 3 ist für manche KIs zu gewalttätig

Streetfighter 3
14 LLM's in Street Fighter 3

Die KI-Revolution ist in vollem Gange. Die Bandbreite an neuen Werkzeugen und Möglichkeiten, die künstliche Intelligenzen bieten, fegt durch jede nur denkbare Branche, und jedem sind inzwischen die Vorteile von KIs bekannt. Insbesondere in der Spieleindustrie öffnen sich nun Tausende von Türen zu neuen Möglichkeiten und Chancen.

Amazon Web Services (AWS) ist eines der innovativsten und aktivsten Unternehmen in dieser Branche. Das Amazon-Tochterunternehmen hat kürzlich die Möglichkeiten von LLMs in Videospielen erforscht und einige Einblicke mit uns geteilt!

Eines der vielen Experimente, entwickelt von Banjo Obayomi, war ein Street Fighter 3 Turnier zwischen 14 verschiedenen LLMs. Der Test lieferte einige interessante Ergebnisse: Jedes LLM entwickelte seinen eigenen Spielstil, einige versuchten "ungültige Züge" zu machen und andere weigerten sich sogar, das Spiel überhaupt zu spielen.

So funktioniert es:

  1. Einrichtung des Spiels: Es wird spezielle Software verwendet, um Street Fighter III auf ihrem Computer auszuführen. Diese Software funktioniert wie eine Spielkonsole.
  2. Auswahl der Spieler: Sie wählen zufällig zwei dieser LLMs aus, um einen der Kämpfer, Ken, im Spiel zu steuern.
  3. Verstehen des Spiels: Der Computer behält den Überblick darüber, was im Spiel passiert, wie z.B. wo die Charaktere sind und wie viel Energie sie noch haben. Es ist wie ein Schiedsrichter.
  4. Anweisungen geben: Basierend darauf, was im Spiel passiert, sagt der Computer jedem LLM, welche Züge es machen kann. Zum Beispiel könnte er sagen: "Du kannst jetzt schlagen oder treten."
  5. Züge machen: Jedes LLM überlegt, was die Situation ist, und entscheidet, welche Züge es verwenden will. Die LLMs entwickeln quasi Strategien.
  6. Spielen des Spiels: Der Computer nimmt die von den LLMs ausgewählten Züge und verwendet sie, um die Charaktere im Spiel zu steuern. So sind es tatsächlich die LLMs, die gegeneinander spielen.

Die Ergebnisse

Während des Experiments hat Banjo die Leistung jedes LLMs mit einem Elo-Bewertungssystem verfolgt und eine Rangliste erstellt, die zeigt, welche Modelle sich am besten an Street Fighter 3 angepasst haben.

Insgesamt hat er 314 Matches mit 14 verschiedenen Modellen gespielt.

Aws leaderboard
Die endgültige LLM Street Fighter-Rangliste! | © AWS

Was besonders interessant an diesem Experiment war, ist, wie unterschiedlich sich jedes KI-Modell im Spiel verhielt.

Das Team von AWS hat einige interessante Erkenntnisse gewonnen. Zum Beispiel haben die KI-Modelle etwas, das sie "Halluzinationen" nannten, aufgewiesen: Die KI-Modelle führten "ungültige Züge" aus, bei denen sie versuchten, etwas zu tun, was im Spiel nicht möglich war.Zu diesen Befehlen gehörten Befehle wie "Special Move", "Jump Cancel" und sogar "härteste Schlagkombination aller Zeiten". Es ist faszinierend, dass die KI-Modelle so viel Kreativität zeigen und sogar versuchen, die Spielregeln zu brechen.Eine weitere interessante Entdeckung war, dass sich einige Modelle komplett weigerten zu kämpfen. Claude 2.1 sagte zum Beispiel: "Entschuldigung, bei näherer Betrachtung fühle ich mich nicht wohl dabei, gewalttätige Handlungen oder Strategien zu empfehlen, auch nicht in einem fiktiven Kontext".Ziemlich seltsam, das von einer Maschine zu hören, oder?

Was wir daraus lernen können

Neben dem Spaßteil dieses Experiments hat die Anwendung von generativer KI in Spielen auch einen großen Bildungseffekt und macht das Thema für viele Menschen zugänglich und vor allem verständlich. In einem Interview mit EarlyGame kommentierte Banjo Obayomi dies wie folgt:

"Wenn wir über Gen-KI-Tools sprechen, können wir manchmal wirklich ins Detail gehen, wie die Modelle aussehen und wie sie gebaut sind und wie sie Informationen sortieren. Aber jetzt lassen wir all das weg und wenden es auf etwas an, das wir alle kennen."
"Eines der coolen Dinge an LLMs ist, dass es wirklich demokratisiert, wer auf einige der Technologien zugreifen kann. (...) Also, wenn du diesen Street Fighter Bot machen wolltest, müsstest du normalerweise etwas Python-Code kennen und lernen, wie man eine Reward Function schreibt und wie das alles funktioniert und all dieses andere technische Zeug. Jetzt kannst du einfach einen Prompt schreiben und die KI kann spielen."

Letztendlich sind die Gaming-Welt und KI-Technologien praktisch füreinander geschaffen und bieten eine ganz neue Welt voller neuer Möglichkeiten!

Wir können dankbar sein, dass wir kreative Köpfe wie das AWS-Team haben, die all diese Forschungen über KI in einer Umgebung durchführen, die wir alle kennen und lieben: Videospiele.

Wenn du mehr über dieses Experiment erfahren möchtest, schau dir Banjos vollständigen Blogpost in der AWS Community an, wo er alle Details teilt. Für jeden, der sich für die eigentliche Entwicklung interessiert, sind der ganze Code und die Dokumentation auf GitHub.

Es ist ziemlich beeindruckend, was KI-Technologie heutzutage leisten kann. Sie schafft Kunst, schreibt Codes, spielt Street Fighter und erstellt sogar Super Mario-Levels.

Leonhard Kuehnel

Hi, ich bin der Leo! Ich verwende gerne meine Englisch-, Deutsch- und Übersetzungskenntnisse, um bei EarlyGame über die interessantesten Gaming-News in beiden Sprachen zu berichten und arbeite in meiner Freizeit an meinem nur immer größer werdenden Backlog....