Archiv 11. Juni 2026

OpenAI zeigt Codex im Schwarzen-Loch-Labor: Warum Coding-Agenten gerade in echte Forschungsworkflows rutschen

OpenAI hat mit einer neuen Fallstudie auf den ersten Blick nur eine schöne Wissenschaftsgeschichte veröffentlicht: Ein Astrophysiker nutzt Codex, um Algorithmen für Simulationen rund um schwarze Löcher zu verbessern. Das klingt erst einmal nach PR mit viel Kosmos und wenig Relevanz für den Alltag.

Ich halte die Meldung trotzdem für interessanter, als sie zunächst wirkt. Denn hier zeigt sich ziemlich konkret, wie ein Coding-Agent in prüfbare wissenschaftliche Arbeit hineinwächst — nicht als Zauberkiste, sondern als Werkzeug für numerische Verfahren, Testläufe und nachvollziehbare Modellierung.

Worum es konkret geht

OpenAI beschreibt die Arbeit von Chi-kwan Chan von der University of Arizona und dem Steward Observatory. Chan arbeitet im Umfeld des Event Horizon Telescope, also jener internationalen Kollaboration, die 2019 das erste Bild eines schwarzen Lochs veröffentlicht hat. Jetzt geht es um den nächsten Schritt: aus Beobachtungen und Großrechnungen realistischere Simulationen abzuleiten — perspektivisch sogar in Richtung Video statt statischem Bild.

Das Problem liegt dabei nicht nur in der schieren Rechenleistung. In den heißen, dünnen Plasmaregionen nahe supermassereicher schwarzer Löcher stoßen Elektronen und Ionen oft kaum miteinander zusammen. Stattdessen schrauben sie sich entlang magnetischer Feldlinien. Wer dieses Verhalten sauber simulieren will, muss normalerweise unzählige winzige Partikelbewegungen über extrem kleine Zeitschritte verfolgen. Genau das frisst Supercomputer-Zeit.

Chan nutzt Codex laut OpenAI deshalb nicht bloß zum Formulieren von Ideen, sondern um numerische Schemata abzuleiten, Varianten zu implementieren und gegen bekannte Lösungen zu testen. Nicht jeder Vorschlag funktioniert. Aber genau das ist der Punkt: Die Kandidaten lassen sich prüfen, verwerfen oder weiterentwickeln.

Warum das mehr ist als eine nette Forscher-Story

Die eigentliche Nachricht ist für mich nicht „KI hilft bei schwarzen Löchern“. Die eigentliche Nachricht ist, dass Codex hier in einem Workflow auftaucht, in dem Fehler nicht einfach wegerzählt werden können. Wissenschaftliche Simulation verlangt nachvollziehbare Verfahren, Vergleich mit bekannten Referenzen und physikalische Interpretierbarkeit.

Genau deshalb ist der Fall interessant für menzel.works. Wir sehen hier kein Marketing um reine Kreativassistenz, sondern eine Form agentischer Arbeit, bei der Vorschläge direkt in Code, Testbarkeit und Fachprüfung übersetzt werden. Das ist sehr nah an dem, was auch in anderen technischen Domänen gerade wichtiger wird: KI soll nicht nur Text erzeugen, sondern belastbare Arbeitsartefakte.

OpenAI betont außerdem einen Punkt, den ich wichtig finde: Chan nutzt Codex nicht als Orakel. Das Modell produziert mögliche Verfahren, die anschließend inspiziert, implementiert und physikalisch verstanden werden. Damit bleibt der Agent im Rahmen einer verifizierbaren Forschungsoberfläche, nicht einer unprüfbaren Blackbox.

Was das für Coding- und Agenten-Workflows signalisiert

Die Entwicklung passt erstaunlich gut zu anderen Codex-Signalen der letzten Tage. Ich hatte gerade erst eingeordnet, wie OpenAI Codex zur Arbeitsoberfläche für Teams ausbaut und wie der Zugriff über Oracle-Cloud-Verpflichtungen organisatorisch anschlussfähiger wird. Die Black-Hole-Story ergänzt nun eine dritte Ebene: Codex rutscht tiefer in anspruchsvolle Facharbeit hinein.

Das ist wichtig, weil viele Diskussionen über Coding-Agenten noch zu eng geführt werden. Oft dreht sich alles um App-Prototypen, Bugfixes oder die Frage, welcher Assistent den besseren Pull Request schreibt. Diese Fälle bleiben relevant, aber sie greifen zu kurz. Spannend wird es dort, wo ein Agent in lange, iterative und fachlich dichte Problemlösungen eingebunden wird.

In der Astrophysik heißt das: mathematische Umformungen vorschlagen, numerische Verfahren testen, Implementierungen anpassen, bekannte Lösungen als Kontrollpunkt nutzen. In anderen Feldern kann dieselbe Logik bei Materialsimulation, Optimierung, Finance-Modellierung, Bioinformatik oder Produktionsplanung auftauchen.

Warum Wissenschaft hier ein besonders gutes Testfeld ist

Ich finde Chans Argument plausibel, dass Forschung zu den sinnvolleren Einsatzfeldern heutiger KI gehört — gerade weil sich vieles streng testen lässt. Eine Idee zählt nicht, weil sie hübsch klingt oder von einer bekannten Quelle kommt. Sie zählt erst, wenn sie wiederholt standhält.

Das unterscheidet diesen Einsatz von vielen weicheren Wissensarbeits-Szenarien. In wissenschaftlichen und technischen Umgebungen kann ein Modell nützlich sein, obwohl es oft falsch liegt — solange es schneller interessante Kandidaten erzeugt, die dann hart geprüft werden. Genau an dieser Stelle werden Agenten praktisch wertvoller: nicht als letzte Instanz, sondern als Beschleuniger für such- und testintensive Arbeit.

Wo man vorsichtig bleiben sollte

Trotzdem wäre es falsch, daraus gleich autonome Wissenschaft abzuleiten. Die Quelle ist eine OpenAI-Fallstudie, keine unabhängige wissenschaftliche Auswertung der gesamten Methode. Außerdem beschreibt OpenAI einen sehr kontrollierten Anwendungsfall mit einem fachlich starken Nutzer, klaren Testmöglichkeiten und engem Problemraum.

Das heißt: Die Meldung beweist nicht, dass Coding-Agenten plötzlich allgemein verlässliche Forschungsmaschinen sind. Sie zeigt aber, wo ihr realistischer Nutzen heute glaubhaft wächst: bei anspruchsvollen Fach-Workflows, in denen Modelle Ideen liefern, Code bauen und Varianten durchprobieren dürfen — solange Menschen die Ergebnisse hart gegen Physik, Mathematik oder Betriebsrealität halten.

Mein Fazit

Die Black-Hole-Story ist interessanter als viele lautere Produktmeldungen. Nicht weil schwarze Löcher als Thema spektakulär sind, sondern weil OpenAI hier einen glaubhaften Blick darauf gibt, wie Coding-Agenten in echte Forschungs- und Simulationsarbeit hineinrutschen.

Wenn sich solche Muster verbreiten, wird die spannendere Frage nicht mehr nur sein, welcher Agent am schnellsten Code produziert. Wichtiger wird, welcher Agent in prüfbaren Fach-Workflows belastbare Zwischenstufen liefert: Algorithmen, Tests, numerische Varianten, nachvollziehbare Artefakte.

Genau dort kippt KI langsam von produktiver Assistenz zu echter Arbeitsinfrastruktur — auch weit außerhalb klassischer Softwareteams.

Quellen

OpenAI: How an astrophysicist uses Codex to help simulate black holes (11.06.2026)
Event Horizon Telescope: Astronomers Capture First Image of a Black Hole (10.04.2019)

Hinweis: Dieser Beitrag wurde mit Unterstützung von KI erstellt und redaktionell bearbeitet.

Frage zu diesem Inhalt?

Kurz schreiben.

Kontakt