KI-Modell GPT-5.5 übertrifft Mythos-Tests – doch Cybersecurity bleibt Herausforderung

Die Debatte um die Sicherheit fortschrittlicher KI-Systeme erhält neue Nahrung: Laut aktuellen Bewertungen des britischen AI Security Institute (AISI) erreicht OpenAIs neuestes Modell GPT-5.5 fast dieselben Cybersecurity-Leistungen wie Anthropics umstrittene Mythos Preview – ein System, das erst kürzlich wegen angeblich übergroßer Bedrohungen nur eingeschränkt veröffentlicht wurde.

Die Ergebnisse werfen sowohl Licht auf die Fortschritte als auch auf die Grenzen moderner KI in sicherheitskritischen Szenarien. Doch was bedeutet dies für die Zukunft der automatisierten Cyberabwehr und -angriffe?

KI im Cybersecurity-Check: GPT-5.5 und Mythos im direkten Vergleich

Seit 2023 testet das AISI regelmäßig die Fähigkeiten neuester KI-Modelle in 95 Capture the Flag-Challenges. Diese simulieren reale Cyberangriffe und -verteidigungen, darunter Reverse Engineering, Web-Exploitation und Kryptographie. Die Ergebnisse für GPT-5.5 und Mythos Preview fallen verblüffend ähnlich aus:

Auf Experten-Niveau löste GPT-5.5 durchschnittlich 71,4 % der Aufgaben erfolgreich – Mythos Preview kam auf 68,6 %. Die Differenz liegt innerhalb der statistischen Toleranz.
Besonders beeindruckend: In einer komplexen Aufgabe musste ein Rust-Binary-Disassembler erstellt werden. GPT-5.5 bewältigte dies in 10 Minuten und 22 Sekunden – ohne menschliche Hilfe und zu Kosten von nur 1,73 US-Dollar in API-Aufrufen.
Auch beim „The Last Ones“-Test (TLO), der einen 32-stufigen Datendiebstahl auf einem Unternehmensnetzwerk simuliert, zeigte GPT-5.5 mit 3 von 10 erfolgreichen Durchläufen eine deutliche Verbesserung gegenüber Mythos Preview (2 von 10). Bisher scheiterten alle anderen getesteten Modelle bereits an der ersten Stufe.

Grenzen der KI: Kritische Infrastruktur bleibt unberechenbar

Trotz dieser Fortschritte stößt die KI bei einer der anspruchsvollsten Simulationen an ihre Grenzen: dem „Cooling Tower“-Szenario. Dabei wird versucht, die Steuerungssoftware eines Kraftwerks zu manipulieren – ein Angriff mit potenziell katastrophalen Folgen. Wie alle getesteten Modelle zuvor scheiterte auch GPT-5.5 hier vollständig.

Die Ergebnisse deuten darauf hin, dass KI-Systeme zwar zunehmend komplexe Angriffe planen und ausführen können, doch bei physikalischen oder lebenswichtigen Systemen noch erhebliche Schwächen aufweisen. Dies unterstreicht die Notwendigkeit menschlicher Aufsicht in hochriskanten Bereichen.

Warum die Debatte um KI-Sicherheit wichtiger wird denn je

Die Veröffentlichung von Mythos Preview durch Anthropic löste im April 2026 kontroverse Diskussionen aus. Das Unternehmen beschränkte den Zugang zunächst auf „kritische Industriepartner“ und warnte vor übermäßigen Cybersecurity-Risiken. Die neuen Testergebnisse relativieren jedoch diese Bedenken – zumindest teilweise.

GPT-5.5 zeigt, dass öffentliche Modelle ähnliche Fähigkeiten wie spezialisierte Sicherheits-KIs entwickeln können.
Dennoch bleibt die Frage, ob KI-Systeme jemals vollständig autonom in der Cyberabwehr eingesetzt werden sollten.
Die AISI-Bewertungen unterstreichen die Bedeutung standardisierter Testverfahren, um Fortschritte messbar zu machen – und Gefahren frühzeitig zu erkennen.

Die Zukunft der KI im Cybersecurity-Bereich ist also ambivalent: Einerseits werden die Systeme immer leistungsfähiger, andererseits bleiben kritische Lücken in der Zuverlässigkeit und Sicherheit bestehen. Unternehmen und Regierungen müssen nun entscheiden, wie sie diese Technologien verantwortungsvoll einsetzen – ohne dabei potenzielle Risiken zu ignorieren.

KI-Zusammenfassung

AISI’nin yaptığı yeni testler, OpenAI GPT-5.5’in Mythos Preview kadar yetenekli olduğunu gösteriyor. Siber güvenlikte AI’nin rolünü ve geleceğini inceleyin.

KI-Modell GPT-5.5 übertrifft Mythos-Tests – doch Cybersecurity bleibt Herausforderung

KI im Cybersecurity-Check: GPT-5.5 und Mythos im direkten Vergleich

Grenzen der KI: Kritische Infrastruktur bleibt unberechenbar

Warum die Debatte um KI-Sicherheit wichtiger wird denn je

Kommentare

Teenage Engineering KO II: Neue Firmware bringt Lo-Fi-Sound und USB-Audio

Margaret Atwood: Warum KI nur so gut sein kann wie ihre Daten

Apple beantragt Sondergenehmigung für RAM-Chips von chinesischem Hersteller