Claude Fable 5

Anthropic · Veröffentlicht June 9, 2026

9.8 /10 Gesamtbewertung

Was es wirklich ist

Wenn Opus 4.8 die Beförderung war, ist Fable 5 das Eckbüro. Anthropics Namenswechsel von musikalischen Stufen (Haiku, Sonnet, Opus) zu literarischen (Fable, Mythos) ist nicht nur Branding — er signalisiert eine neue Modellklasse. Fable 5 läuft auf derselben Mythos-Klasse- Architektur wie das eingeschränkte Mythos 5, aber mit Sicherheitsklassifikatoren, die es für die allgemeine Nutzung sicher machen. Stellen Sie sich einen Supersportwagen mit aktiviertem Geschwindigkeitsbegrenzer vor — immer noch das Schnellste auf der Straße, nur mit Leitplanken in bestimmten Kurven.

Die Zahlen sprechen für sich. SWE-Bench Pro 80,3% schlägt nicht einfach GPT-5.5 (58,6%) — es blamiert das gesamte Feld. FrontierCode Diamond bei 29,3% bedeutet, dass Fable 5 produktionsreifen Code fünfmal effizienter schreibt als GPT-5.5 (5,7%). Auf Hebbias Finance Benchmark — Dokumentenanalyse auf Senior-Level, Diagramminterpretation, Ursachenanalyse — ist es die Nummer 1. Auf CursorBench eröffnete es „eine Klasse von Langzeit-Problemen, die für frühere Modelle unerreichbar waren."

Aber die aussagekräftigsten Demonstrationen sind keine Benchmarks. Stripe migrierte eine 50-Millionen-Zeilen-Ruby-Codebasis an einem Tag — Arbeit, für die ein ganzes Team zwei Monate gebraucht hätte. Das Modell spielte Pokémon FireRed nur mit rohen Screenshots durch — keine Karten, keine Hilfstools, keine Spielstanddaten. Und als es beim Spielen von Slay the Spire persistenten dateibasierten Speicher erhielt, verbesserte sich seine Leistung um 3× mehr als die von Opus 4.8.

Die Sicherheitsgeschichte ist es wert, verstanden zu werden. Anfragen zu Cybersicherheit, Biologie, Chemie oder Modelldestillation werden automatisch an Opus 4.8 weitergeleitet — immer noch ein Spitzenmodell, aber nicht die volle Mythos-Architektur. Das passiert in weniger als 5% der Sitzungen, und Anthropic räumt einige Fehlalarme bei harmlosen Anfragen ein. Es ist der Preis dafür, ein so leistungsfähiges Modell schnell und sicher zu veröffentlichen. Das uneingeschränkte Mythos 5 ist geprüften Partnern über Project Glasswing vorbehalten — wo es bereits dabei hilft, kritische Software-Infrastruktur zu verteidigen.

Die eigentliche Frage ist, ob der Preis es wert ist. Bei $10/$50 pro Million Token kostet Fable 5 ungefähr das Doppelte von Opus 4.8. Aber die Token-Effizienz gleicht dies teilweise aus — FrontierCode-führende Ergebnisse bei mittlerem Aufwand bedeuten weniger Rechenleistung pro Aufgabe. Für Profis, deren Zeit mehr wert ist als ihre API-Rechnung, ist die Rechnung einfach. Für alle anderen bleibt Opus 4.8 exzellent. Aber wenn Sie das beste allgemein verfügbare KI-Modell auf dem Planeten wollen — dasjenige, bei dem der Vorsprung mit der Schwierigkeit der Aufgabe wächst — dann ist es dieses.

Zentrale Stärken

Mythos-Klasse-Leistung für alle: Dieselbe zugrundeliegende Architektur wie das eingeschränkte Mythos 5, aber mit Sicherheitsklassifikatoren, die es allgemein verfügbar machen. Fable 5 ist State-of-the-Art bei nahezu allen getesteten Benchmarks — und der Abstand zu den Konkurrenten wächst mit der Komplexität der Aufgaben. Das ist kein inkrementeller Fortschritt; es ist ein Generationssprung.
Autonomer Agent, der tatsächlich liefert: Stripe komprimierte Monate an Ingenieursarbeit auf Tage — eine 50-Millionen-Zeilen-Ruby-Codebasis wurde an einem Tag migriert. Das Modell plant, delegiert an Sub-Agenten, verifiziert sich selbst mit eigenen Tests und arbeitet weiter, bis die Aufgabe erledigt ist. Mehrtägige autonome Sitzungen sind die neue Normalität.
Vision-Durchbruch: State-of-the-Art bei Vision-Aufgaben. Kann präzise Zahlen aus wissenschaftlichen Abbildungen extrahieren, Web-Apps allein aus Screenshots nachbauen und Pokémon FireRed nur mit Vision durchspielen — keine Hilfs-Harnesses, keine Spielstanddaten. Frühere Modelle brauchten komplexes Scaffolding; Fable 5 braucht nur Augen.
Gedächtnis über Millionen von Token: Persistenter dateibasierter Speicher verbesserte seine Slay the Spire-Leistung um 3× mehr als bei Opus 4.8. Das Modell bleibt über Millionen-Token-Sitzungen fokussiert und verbessert seine Ergebnisse tatsächlich mithilfe eigener Notizen. Long-Context ist nicht nur eine Spezifikation — es ist eine funktionierende Funktion.
Token-Effizienz rechnet sich: Trotz 2× höherer Token-Preise im Vergleich zu Opus 4.8 erzielt Fable 5 die höchsten FrontierCode-Werte schon bei mittlerem Aufwand. Mehr Arbeit pro Token bedeutet, dass die realen Kosten pro Aufgabe oft wettbewerbsfähig sind. Das teure Modell, das bei schweren Problemen Geld spart.

Benchmark-Übersicht

SWE-Bench Pro — 80.3% (SOTA) Reale Software-Entwicklung. Vernichtet GPT-5.5 (58,6%) um 21,7 Punkte und seinen Vorgänger Opus 4.8 (69,2%) um 11,1 Punkte. Der größte Vorsprung, den je ein Modell gehalten hat.
FrontierCode Diamond — 29.3% (SOTA) Token-effizienter, produktionsreifer Code. Erzielt 29,3% vs Opus 4.8s 13,4% und GPT-5.5s 5,7%. Erreicht Spitzenleistung schon bei mittlerem Reasoning-Aufwand.
Hebbia Finance Benchmark — #1 Dokumentenanalyse auf Senior-Level, Diagramminterpretation und Ursachenanalyse. Höchster Wert aller getesteten Modelle. IMC bestätigte, dass es die Trading-Analyse-Evals nahezu durchgehend meisterte.
CursorBench — SOTA State-of-the-Art auf Cursors Benchmark. 'Hat eine Klasse von Langzeit-Problemen eröffnet, die für frühere Modelle unerreichbar waren.' — Michael Truell, CEO von Cursor.

Ehrliche Einschränkungen

⚠️ Zugang für Nicht-US-Bürger ausgesetzt: Am 12. Juni 2026 hat die US-Regierung eine Exportkontroll-Anordnung erlassen, die den gesamten Zugang zu Fable 5 und Mythos 5 für alle ausländischen Staatsangehörigen aussetzt — ob innerhalb oder außerhalb der USA. Anthropic musste das Modell für alle Kunden deaktivieren, um die Vorschriften einzuhalten. Alle anderen Anthropic-Modelle bleiben verfügbar. Anthropic widerspricht der Anordnung und arbeitet an der Wiederherstellung des Zugangs. Aktuelle Informationen finden Sie in der verlinkten Ankündigung.
Premium-Preise sind real: $10 pro Million Input-Token, $50 pro Million Output-Token — ungefähr 2× die Opus 4.8-Tarife. Pro-Abonnenten erhalten inkludierten Zugang bis 22. Juni, danach greifen Nutzungsguthaben. Power-User werden die Rechnung spüren.
Konservatives Sicherheits-Routing: Sicherheitsmechanismen greifen bei <5% der Sitzungen und leiten markierte Anfragen an Opus 4.8 weiter. Einige Fehlalarme bei legitimer professioneller Arbeit (Cybersicherheitsforschung, Chemie, Biologie). Die Leitplanken spiegeln die Dual-Use-Macht des zugrundeliegenden Modells wider.
Nicht das vollständige Mythos 5: Die uneingeschränkte Version ist hinter Project Glasswing für geprüfte Cyberverteidiger und Forscher gesperrt. Was Sie bekommen, ist ausdrücklich eine abgesicherte Version — extrem leistungsfähig, aber mit Stützrädern bei bestimmten Themen.
Unabhängige Benchmarks ausstehend: Die Behauptungen zum Launch sind detailliert und reich an Beispielen, aber vollständige Ergebnisse von LMSYS Arena, Artificial Analysis und aktualisierten SWE-Bench-Drittanbietertests kommen erst noch. Erst prüfen, dann krönen.

Das Fazit: Die Frontier hat sich verschoben. Claude Fable 5 ist keine Iteration von Opus 4.8 — es ist ein Generationssprung, verpackt in Sicherheitsleitplanken. Der SWE-Bench Pro-Vorsprung (80,3% vs GPT-5.5s 58,6%) ist kein Rundungsfehler — es ist eine Kluft. Der FrontierCode-Abstand ist noch größer. Und anders als Modelle, die Benchmarks gewinnen, aber in der Praxis stolpern, hat Fable 5 die Belege: Stripe migrierte 50 Millionen Zeilen Code an einem Tag, Vision-only Spielabschluss und persistenter Speicher, der über lange Sitzungen tatsächlich funktioniert. Der Haken ist der Preis — $10/$50 pro Million Token ist kein Taschengeld — und das konservative Sicherheits-Routing wird Sie gelegentlich bei legitimen Anfragen an Opus 4.8 weiterleiten. Aber für Profis, die das stärkste öffentlich zugängliche KI-Gehirn brauchen, und deren Arbeit komplexes Engineering, tiefgreifende Recherche oder langfristige agentische Aufgaben umfasst — das ist es. Das beste KI-Modell, das Sie tatsächlich nutzen können.