07. Mai 2026 5 min

SubQ: Echt oder nur KI-Hype? Meine Einordnung zu Subquadratic und dem 12-Millionen-Token-Versprechen

Ist SubQ echt oder fake? Meine kurze Antwort: eher echt als fake – aber noch nicht bewiesen genug, um den Hype voll mitzugehen.

Subquadratic ist keine offensichtliche Luftnummer. Es gibt eine echte Website, ein klar benanntes Team, eine Seed-Finanzierung über 29 Millionen Dollar, Berichte in mehreren Tech-Medien und ein konsistentes technisches Narrativ rund um subquadratische Sparse Attention. Das Problem, das die Firma angreift, ist außerdem absolut real: Lange Kontexte werden bei heutigen Transformern schnell absurd teuer.

Genau deshalb ist SubQ interessant. Aber genau deshalb muss man auch streng bleiben. Denn zwischen „technisch plausibel“ und „im Markt bewiesen“ liegt im KI-Bereich gerade ein ziemlich breiter Friedhof aus großen Ankündigungen.

Was SubQ konkret verspricht

Subquadratic behauptet, mit SSA, also Subquadratic Sparse Attention, den quadratischen Kostenanstieg klassischer Transformer aufzubrechen. Die Kernversprechen sind groß: bis zu 12 Millionen Tokens Kontext, deutlich schnellere Inferenz, stark reduzierte Rechenkosten und ein Modell, das gerade bei langen Codebasen, Dokumentenbergen und persistentem Agenten-Zustand seine Stärke ausspielen soll.

Das klingt deshalb so attraktiv, weil viele heutige KI-Workflows nur deshalb so kompliziert sind, weil Modelle nicht einfach den vollen Kontext zuverlässig und bezahlbar halten können. RAG, Chunking, Retrieval-Pipelines, Kompaktierungen und Orchestrierung sind oft nicht das Ziel, sondern nur Reparaturbetrieb rund um Modellgrenzen.

Wenn SubQ diesen Engpass wirklich sauber knackt, wäre das keine kleine Produktverbesserung, sondern eine relevante Architekturmeldung.

Warum ich es nicht für einen simplen Fake halte

Mehrere Signale sprechen dafür, dass hier mehr als nur Marketingtheater läuft.

Die Firma ist öffentlich sichtbar und tritt mit namentlich benannten Gründern und Team-Hintergründen auf.
Die Seed-Finanzierung über 29 Millionen Dollar wird konsistent in mehreren Medien genannt.
Die technische Story ist nicht völlig beliebig, sondern dockt an ein echtes, seit Jahren bekanntes Problem an: Attention skaliert bei Transformern schlecht mit wachsendem Kontext.
Subquadratic veröffentlicht nicht nur Marketing-Slogans, sondern zumindest eine technische Erklärung des eigenen Ansatzes und konkrete Benchmark-Behauptungen.

Das heißt nicht, dass alles stimmt. Aber es heißt: Das hier wirkt eher wie ein reales, ambitioniertes Lab mit sehr aggressiver Außendarstellung – nicht wie ein offensichtlicher Scam.

Warum ich den Hype trotzdem noch nicht unterschreiben würde

Der entscheidende Haken ist simpel: Die stärksten Behauptungen sind öffentlich noch nicht stark genug belegt.

Zum Start gibt es vor allem die Aussagen des Unternehmens selbst, ausgewählte Benchmarks und den Hinweis auf teilweise dritte Validierung. Gleichzeitig fehlt noch genau das, was man bei so einer Ankündigung sehen möchte: ein vollständiger technischer Report, ein belastbarer Model Card, breite unabhängige Reproduktionen und Praxisberichte von externen Teams.

Besonders wichtig: Die Firma spricht groß über 12 Millionen Tokens, aber öffentlich greifbar ist vor allem ein SubQ 1M-Preview. Das ist nicht nichts – aber es ist eben auch nicht dasselbe wie ein sauber belegter Nachweis, dass das Gesamtversprechen im Alltag stabil trägt.

Genau hier trennt sich in KI-News gerade ständig Signal von Lärm. Viele Dinge sind nicht direkt gelogen, aber im Launch-Moment trotzdem deutlich größer erzählt als das, was externe Nutzer schon verlässlich nachprüfen können.

Ist das für den Markt wichtig? Ja. Ist es schon bewiesen? Nein.

Ich halte SubQ deshalb für ein Thema, das man ernst nehmen sollte – aber nicht für eines, das man schon feiern sollte, als wäre der Fall entschieden.

Die relevante Frage ist aus meiner Sicht nicht: „Ist das unmöglich?“ Die relevante Frage ist: „Liefert Subquadratic außerhalb der eigenen Benchmark-Bühne wirklich das, was hier versprochen wird?“

Wenn ja, hätte das echte Folgen. Dann würden sich einige heute übliche Krücken in KI-Systemen plötzlich anders rechnen: weniger aggressive Vorselektion, weniger fragiles Retrieval, weniger Kontextverlust zwischen Agenten-Schritten und deutlich stärkere Repo- oder Dokumentarbeit in einem Durchlauf.

Das passt direkt zu dem, was ich auf menzel.works zuletzt schon öfter beschrieben habe: Nicht der nächste Modellname allein ist spannend, sondern was Modelle in echten Arbeitsumgebungen robuster macht. Bei OpenAI Symphony ging es um den Wechsel von Agenten aus dem Chat in operative Systeme. Bei Geminis Webhooks ging es um betriebsfähigere Langläufer. SubQ wäre die viel tiefere Version derselben Geschichte: weniger Workflow-Kosmetik, mehr Architekturhebel.

Mein Urteil: Echt genug, um hinzuschauen. Nicht bewiesen genug, um den Hype zu kaufen.

Wenn ich es hart und fair formuliere, lautet mein Urteil so:

SubQ ist vermutlich kein Fake. Dafür gibt es zu viele reale Signale. Aber SubQ ist aktuell vor allem ein sehr großer Anspruch mit noch zu wenig öffentlicher Absicherung.

Oder noch direkter: Das ist kein „ignore it“, aber auch kein „game over für alle anderen“.

Der Hype ist also teilweise verdient – wegen der Richtung, wegen der möglichen Tragweite und weil das Grundproblem real ist. Voll verdient ist er erst dann, wenn unabhängige Tests zeigen, dass SubQ nicht nur in Launch-Materialien gut aussieht, sondern unter echter Last mit echtem Datenchaos und echten Nutzerfragen stabil liefert.

Bis dahin ist die saubere Haltung nicht Euphorie und auch nicht Zynismus, sondern aufmerksame Skepsis.

Was man als Leser praktisch daraus mitnehmen sollte

Wer mit Agent-Workflows, großen Repositories, langen Dokumentstrecken oder komplexer Wissensarbeit arbeitet, sollte SubQ beobachten. Nicht, weil es schon bewiesen hat, dass es den Markt kippt – sondern weil genau an dieser Stelle gerade einer der wichtigsten Engpässe moderner KI sitzt.

Wenn Subquadratic liefert, wäre das relevant. Wenn nicht, bleibt trotzdem eine wichtige Erkenntnis: Der Markt wird sich in den nächsten Phasen nicht nur über bessere Antworten entscheiden, sondern über bessere Kontextökonomie.

Weiterführende Beiträge auf menzel.works

Frage zu „SubQ: Echt oder nur KI-Hype? Meine Einordnung zu Subquadratic und dem 12-Millionen-Token-Versprechen"?

// du redest mit dem, der commitet

Termin buchen →