Zum Inhalt springen
Archiv 25. Juni 2026

OpenAI misst den Agenten-Alltag: Warum Codex gerade vom Coding-Tool zur Arbeitsoberfläche für ganze Teams wird

OpenAI hat heute ein neues Economic-Research-Stück veröffentlicht, das ich deutlich spannender finde, als der eher nüchterne Titel vermuten lässt. Die eigentliche Nachricht ist nicht bloß, dass Codex wächst, sondern dass OpenAI hier sichtbar macht, wie sich Wissensarbeit von Chat-Interaktionen zu delegierter Agentenarbeit verschiebt.

Die Zahlen sind dafür ziemlich klar: Innerhalb von OpenAI ist Codex inzwischen laut eigener Darstellung für jede Abteilung das primäre KI-Werkzeug. Und noch wichtiger: Die Nutzung springt längst aus der Entwickler-Ecke heraus. Legal, Finance und Recruiting nutzen Codex inzwischen ebenfalls als Hauptwerkzeug – nicht nur für Text, sondern auch für Automatisierung, Datenarbeit, Debugging und technische Ausführung neben dem eigentlichen Kernjob.

Was OpenAI konkret zeigt

OpenAI beschreibt vier Trends, die zusammen ein erstaunlich klares Bild ergeben:

  • Codex verschiebt sich auf längere Aufgabenhorizonte: Bis Mai 2026 haben 80,6 Prozent der betrachteten Individualnutzer mindestens eine Codex-Anfrage gestellt, die laut Modellschätzung mehr als 30 Minuten menschlicher Arbeit entspräche. 70,2 Prozent lagen über einer Stunde, 25,6 Prozent sogar über acht Stunden.
  • Codex ist bei OpenAI intern zur Standardoberfläche geworden: Für den durchschnittlichen OpenAI-Mitarbeiter stammen inzwischen mehr als 85 Prozent der Output-Tokens aus Codex; insgesamt entfallen laut OpenAI sogar 99,8 Prozent der wöchentlichen Output-Tokens im Unternehmen auf Codex.
  • Nicht-Entwickler wachsen schneller als Entwickler: Seit August 2025 stieg die Zahl der nicht-technischen Codex-Nutzer laut OpenAI um das 137-Fache bei Individualnutzern, um das 189-Fache bei Organisationsnutzern und intern um das 12-Fache.
  • Agenten ziehen Menschen in benachbarte Tätigkeiten hinein: Bei Business-Funktionen sei mehr als ein Viertel der mit Codex erzeugten Arbeit Engineering oder Coding gewesen.

Das ist für mich die eigentlich starke Stelle der Veröffentlichung. OpenAI behauptet hier nicht nur, dass Agenten produktiver machen. OpenAI zeigt, dass sich der Zuschnitt von Arbeit selbst verschiebt.

Warum das für den Arbeitsalltag wichtiger ist als das nächste Modell-Release

Viele KI-Meldungen reden immer noch so, als würde man einfach bessere Antworten in denselben alten Interface-Rahmen schieben. Genau das greift hier zu kurz. Agentische Systeme ändern die Einheit der Arbeit: weg von einzelnen Prompts, hin zu delegierten, länger laufenden Aufgaben mit Werkzeugnutzung, Parallelität und Zwischenkontrolle.

OpenAI formuliert das selbst ziemlich deutlich: Der Wechsel geht von „single interactions“ zu „delegated, long-horizon tasks“. Das passt sehr gut zu dem, was man gerade auch außerhalb von OpenAI sieht: Coding-Agenten und Arbeitsagenten werden nicht interessanter, weil sie nett formulieren, sondern weil sie über längere Zeit in einer Aufgabe bleiben, Werkzeuge koordinieren und Teilstücke selbständig abarbeiten.

Genau deshalb lese ich diese Veröffentlichung auch als Betriebssignal. Sobald ein Unternehmen nicht mehr nur ein paar Power-User hat, sondern Legal, Recruiting, Finance und Support in Richtung Agenten kippen, verändert sich nicht nur die Tool-Landschaft. Dann verändern sich Freigaben, Kontrollpunkte, Verantwortlichkeiten, Skill-Profile und die Taktung von Wissensarbeit.

Codex wird hier als Arbeitsoberfläche neu positioniert

Interessant ist auch, wie sehr sich das Bild von Codex verschoben hat. Vor nicht allzu langer Zeit war Codex vor allem als Coding-Werkzeug lesbar. Jetzt zeigt OpenAI mit den eigenen Nutzungsdaten etwas anderes: Codex wird zur Arbeitsoberfläche für agentische Ausführung – zuerst für Entwickler, dann für alle anderen.

Das ist eine andere Kategorie als klassischer Copilot-Einsatz. Ein Copilot hilft bei Einzelschritten. Ein Agentensystem übernimmt zusammenhängende Arbeitspakete, springt zwischen Tools, läuft länger und produziert mehr operative Zwischenschichten. Dass OpenAI intern am 99. Perzentil inzwischen von mehr als 60 Stunden Codex-Agentenlaufzeit pro Tag über mehrere parallele Agenten spricht, zeigt ziemlich gut, wohin die Reise geht: nicht ein Chatfenster, sondern orchestrierte Arbeitslast.

Damit schließt die Meldung direkt an frühere menzel.works-Themen an – etwa an Codex-Maxxing als Langstreckenmodus oder an Samsungs Rollout von ChatGPT und Codex. Der neue Punkt ist jetzt: OpenAI liefert erstmals eine eigene ökonomische und organisatorische Innenansicht, wie schnell sich dieser Wechsel tatsächlich vollzieht.

Wo ich trotzdem vorsichtig bleiben würde

Natürlich bleibt das kein neutraler Arbeitsmarktreport. Es sind Daten aus OpenAIs eigenem Ökosystem und teils aus modellgestützten Schätzungen. Auch die Einordnung von Aufgabenhorizonten basiert auf einem „LLM-as-judge“-Ansatz und ist laut OpenAI eher als Richtungssignal denn als exakte Messung zu lesen.

Trotzdem würde ich die Veröffentlichung nicht als bloße PR abtun. Gerade weil die Zahlen aus dem eigenen Betrieb kommen, sind sie für die Praxis interessant. Sie zeigen, welche Organisationsformen entstehen, wenn agentische Tools breit, günstig und ohne große Reibung verfügbar werden.

Mein Fazit

OpenAI misst hier nicht einfach Codex-Nutzung. OpenAI misst den Übergang von Chat-Arbeit zu Agenten-Arbeit. Genau das macht die Veröffentlichung relevant.

Wenn nicht-technische Teams plötzlich mit denselben agentischen Werkzeugen arbeiten wie Entwickler, dann wird KI nicht mehr nur Assistenzsoftware. Sie wird zur operativen Arbeitsoberfläche für ganze Abteilungen. Und das ist für Unternehmen wahrscheinlich die wichtigere Geschichte als das nächste Benchmark-Diagramm.

Quellen

Hinweis: Dieser Beitrag wurde mit Unterstützung von KI erstellt und redaktionell bearbeitet.

Frage zu diesem Inhalt?
Kurz schreiben.
Kontakt