Cohere veröffentlicht Command A+ als Apache-2.0-Modell mit Quantisierung und Agenten-Fähigkeiten

Das kanadische KI-Unternehmen Cohere hat mit Command A+ einen bedeutenden Schritt in Richtung offener, effizienter und gleichzeitig leistungsstarker Sprachmodelle gemacht. Erstmals stellt das Unternehmen ein Modell dieser Größe unter der Apache-2.0-Lizenz frei zur Verfügung, was Entwicklern weltweit neue Möglichkeiten für autonome Agenten-Workflows und multimodale Dokumentenverarbeitung eröffnet.

Ein Meilenstein für offene KI-Architekturen

Command A+ basiert auf einer sparsen Mixture-of-Experts-Architektur (MoE) und nutzt dabei nur einen Bruchteil der insgesamt 218 Milliarden Parameter aktiv. Während herkömmliche Modelle wie OpenAIs GPT-5.5 oder Anthropics Claude Opus 4.7 auf geschätzte Billionen Parameter setzen, aktiviert Command A+ gezielt nur etwa 25 Milliarden Parameter pro Anfrage. Diese Strategie reduziert den Rechenaufwand deutlich und ermöglicht den Betrieb auf einer einzelnen NVIDIA Blackwell B200 GPU oder sogar zwei älteren H100-GPUs.

Die Effizienz des Modells wird zusätzlich durch fortschrittliche Quantisierungstechniken gesteigert. Cohere bietet Command A+ in drei Präzisionsstufen an: 16-Bit (BF16), 8-Bit (FP8) und 4-Bit (W4A4). Besonders die 4-Bit-Quantisierung markiert einen Durchbruch. Üblicherweise führt eine zu starke Komprimierung zu deutlichen Leistungseinbußen bei komplexen Aufgaben. Doch Cohere umgeht dieses Problem, indem es nur die MoE-Experten quantisiert, während die kritischen Aufmerksamkeitsschichten mit voller Präzision erhalten bleiben. Ein zusätzlicher Ansatz namens Quantization-Aware Distillation sorgt dafür, dass die Komprimierung nahezu verlustfrei bleibt.

Die Performance-Daten sprechen für sich: Bei geringer Auslastung erreicht das Modell eine Ausgabegeschwindigkeit von 375 Tokens pro Sekunde mit einer Verzögerung bis zum ersten Token (TTFT) von nur 113 Millisekunden. Gegenüber dem Vorgängermodell Command A Reasoning bedeutet das eine Steigerung der Geschwindigkeit um 63 % und eine Reduzierung der Latenz um 17 %.

Globale Sprachunterstützung und Kosteneffizienz

Ein weiterer Schwerpunkt lag auf der Optimierung des Tokenizers – der Komponente, die Text in verarbeitbare Fragmente zerlegt. Der neue Tokenizer unterstützt 48 Sprachen und verbessert die Effizienz für nicht-europäische Sprachen deutlich. Für Arabisch reduziert sich die Tokenanzahl um 20 %, für Japanisch um 18 % und für Koreanisch um 16 %. Da die Kosten für die Inferenz pro Token berechnet werden, führt diese Optimierung zu erheblichen Einsparungen bei globalen oder mehrsprachigen Anwendungen.

Stärken in Agenten-Workflows und Spezialgebieten

Command A+ wurde speziell für agentische Workflows entwickelt – also für Szenarien, in denen die KI autonom oder semi-autonom agiert, externe Tools nutzt, Datenbanken abfragt und Informationen über mehrere Schritte hinweg verknüpft. Die Benchmark-Ergebnisse belegen die Überlegenheit gegenüber dem Vorgängermodell:

Auf dem 𝜏²-Bench Telecom für komplexe Reasoning-Aufgaben stieg die Leistung von 37 % auf 85 %.
Beim Terminal-Bench Hard für agentische Code-Tests verbesserte sich die Leistung von 3 % auf 25 %.
In komplexen Mathematikaufgaben erreichte das Modell 90 % auf AIME 25, während der Vorgänger noch bei 57 % lag.

Obwohl Command A+ mit nur 25 Milliarden aktiven Parametern operiert, übertrifft es damit deutlich größere Modelle wie DeepSeek V4 Pro in mathematischen Benchmarks. Lediglich bei sehr tiefgreifenden agentischen Code-Aufgaben und allgemeiner breit angelegter Intelligenz hinkt es noch hinter den neuesten chinesischen Open-Source-Modellen wie DeepSeek oder Z.ai (GLM) her.

Zukunftsperspektiven für souveräne KI

Mit der Veröffentlichung von Command A+ unter Apache 2.0 unterstreicht Cohere seine Vision einer „souveränen KI“, die Unternehmen und Regierungen die Kontrolle über hochperformante Modelle ermöglicht – ohne Abhängigkeit von proprietären Cloud-Lösungen. Die Kombination aus Effizienz, offener Lizenz und agentischen Fähigkeiten positioniert das Modell als starke Alternative zu den geschlossenen Systemen der US-amerikanischen Tech-Giganten.

Für Entwickler und Unternehmen bedeutet dies nicht nur eine Kostensenkung, sondern auch die Möglichkeit, KI-Lösungen vollständig in eigenen, sicheren Umgebungen zu betreiben. Die kommenden Monate werden zeigen, wie sich die Community das Modell zunutze macht und welche neuen Anwendungsfälle entstehen.

KI-Zusammenfassung

Cohere’in yeni Command A+ modeli, Apache 2.0 lisansıyla sunulan ilk açık kaynaklı dev yapay zeka aracı. 218 milyar parametreye rağmen 25 milyar aktif parametreyle çalışan model, kayıpsız 4-bit sıkıştırma ve çok dilli destek sunuyor.

Cohere veröffentlicht Command A+ als Apache-2.0-Modell mit Quantisierung und Agenten-Fähigkeiten

Ein Meilenstein für offene KI-Architekturen

Globale Sprachunterstützung und Kosteneffizienz

Stärken in Agenten-Workflows und Spezialgebieten

Zukunftsperspektiven für souveräne KI

Kommentare

Googles Managed Agents API: Schnellere KI-Agenten mit weniger Infrastrukturaufwand

Cerebras zeigt: Chips bewältigen Billionen-Parameter-KI-Modelle fast 7x schneller als GPUs

Warum Enterprise-KI-Agenten scheitern – und wie Entscheidungsgraphen Abhilfe schaffen