Zum Inhalt springen

OpenAI erklärt den Goblin-Bug: Was GPT-5.5 über versteckte Trainingsanreize verrät

OpenAI hat offengelegt, warum GPT-5.5 und frühere Modelle plötzlich auffällig oft von Goblins, Gremlins und ähnlichen Kreaturen sprachen. Das klingt erst einmal wie ein kurioser Detailfehler, zeigt aber ein deutlich größeres Problem: Schon kleine Trainingsanreize können Stilmerkmale in ein Modell hineinverstärken und später ungewollt im gesamten System verteilen.… weiterlesen