iToverDose/Startups· 21 MAI 2026 · 00:02

Cohere veröffentlicht Command A+ als Apache-2.0-Modell mit Quantisierung und Agenten-Fähigkeiten

Das kanadische KI-Labor Cohere stellt mit Command A+ ein neues Open-Source-Sprachmodell vor, das mit nur 218 Milliarden Parametern die Effizienz von Giganten wie OpenAI oder Anthropic übertrifft. Durch Quantisierung und eine sparse Architektur lässt sich das Modell auf einer einzigen GPU betreiben – und bietet dabei native Zitierfähigkeiten für komplexe Reasoning-Aufgaben.

VentureBeat3 min0 Kommentare

Das kanadische KI-Unternehmen Cohere hat mit Command A+ einen bedeutenden Schritt in Richtung offener, effizienter und gleichzeitig leistungsstarker Sprachmodelle gemacht. Erstmals stellt das Unternehmen ein Modell dieser Größe unter der Apache-2.0-Lizenz frei zur Verfügung, was Entwicklern weltweit neue Möglichkeiten für autonome Agenten-Workflows und multimodale Dokumentenverarbeitung eröffnet.

Ein Meilenstein für offene KI-Architekturen

Command A+ basiert auf einer sparsen Mixture-of-Experts-Architektur (MoE) und nutzt dabei nur einen Bruchteil der insgesamt 218 Milliarden Parameter aktiv. Während herkömmliche Modelle wie OpenAIs GPT-5.5 oder Anthropics Claude Opus 4.7 auf geschätzte Billionen Parameter setzen, aktiviert Command A+ gezielt nur etwa 25 Milliarden Parameter pro Anfrage. Diese Strategie reduziert den Rechenaufwand deutlich und ermöglicht den Betrieb auf einer einzelnen NVIDIA Blackwell B200 GPU oder sogar zwei älteren H100-GPUs.

Die Effizienz des Modells wird zusätzlich durch fortschrittliche Quantisierungstechniken gesteigert. Cohere bietet Command A+ in drei Präzisionsstufen an: 16-Bit (BF16), 8-Bit (FP8) und 4-Bit (W4A4). Besonders die 4-Bit-Quantisierung markiert einen Durchbruch. Üblicherweise führt eine zu starke Komprimierung zu deutlichen Leistungseinbußen bei komplexen Aufgaben. Doch Cohere umgeht dieses Problem, indem es nur die MoE-Experten quantisiert, während die kritischen Aufmerksamkeitsschichten mit voller Präzision erhalten bleiben. Ein zusätzlicher Ansatz namens Quantization-Aware Distillation sorgt dafür, dass die Komprimierung nahezu verlustfrei bleibt.

Die Performance-Daten sprechen für sich: Bei geringer Auslastung erreicht das Modell eine Ausgabegeschwindigkeit von 375 Tokens pro Sekunde mit einer Verzögerung bis zum ersten Token (TTFT) von nur 113 Millisekunden. Gegenüber dem Vorgängermodell Command A Reasoning bedeutet das eine Steigerung der Geschwindigkeit um 63 % und eine Reduzierung der Latenz um 17 %.

Globale Sprachunterstützung und Kosteneffizienz

Ein weiterer Schwerpunkt lag auf der Optimierung des Tokenizers – der Komponente, die Text in verarbeitbare Fragmente zerlegt. Der neue Tokenizer unterstützt 48 Sprachen und verbessert die Effizienz für nicht-europäische Sprachen deutlich. Für Arabisch reduziert sich die Tokenanzahl um 20 %, für Japanisch um 18 % und für Koreanisch um 16 %. Da die Kosten für die Inferenz pro Token berechnet werden, führt diese Optimierung zu erheblichen Einsparungen bei globalen oder mehrsprachigen Anwendungen.

Stärken in Agenten-Workflows und Spezialgebieten

Command A+ wurde speziell für agentische Workflows entwickelt – also für Szenarien, in denen die KI autonom oder semi-autonom agiert, externe Tools nutzt, Datenbanken abfragt und Informationen über mehrere Schritte hinweg verknüpft. Die Benchmark-Ergebnisse belegen die Überlegenheit gegenüber dem Vorgängermodell:

  • Auf dem 𝜏²-Bench Telecom für komplexe Reasoning-Aufgaben stieg die Leistung von 37 % auf 85 %.
  • Beim Terminal-Bench Hard für agentische Code-Tests verbesserte sich die Leistung von 3 % auf 25 %.
  • In komplexen Mathematikaufgaben erreichte das Modell 90 % auf AIME 25, während der Vorgänger noch bei 57 % lag.

Obwohl Command A+ mit nur 25 Milliarden aktiven Parametern operiert, übertrifft es damit deutlich größere Modelle wie DeepSeek V4 Pro in mathematischen Benchmarks. Lediglich bei sehr tiefgreifenden agentischen Code-Aufgaben und allgemeiner breit angelegter Intelligenz hinkt es noch hinter den neuesten chinesischen Open-Source-Modellen wie DeepSeek oder Z.ai (GLM) her.

Zukunftsperspektiven für souveräne KI

Mit der Veröffentlichung von Command A+ unter Apache 2.0 unterstreicht Cohere seine Vision einer „souveränen KI“, die Unternehmen und Regierungen die Kontrolle über hochperformante Modelle ermöglicht – ohne Abhängigkeit von proprietären Cloud-Lösungen. Die Kombination aus Effizienz, offener Lizenz und agentischen Fähigkeiten positioniert das Modell als starke Alternative zu den geschlossenen Systemen der US-amerikanischen Tech-Giganten.

Für Entwickler und Unternehmen bedeutet dies nicht nur eine Kostensenkung, sondern auch die Möglichkeit, KI-Lösungen vollständig in eigenen, sicheren Umgebungen zu betreiben. Die kommenden Monate werden zeigen, wie sich die Community das Modell zunutze macht und welche neuen Anwendungsfälle entstehen.

KI-Zusammenfassung

Cohere’in yeni Command A+ modeli, Apache 2.0 lisansıyla sunulan ilk açık kaynaklı dev yapay zeka aracı. 218 milyar parametreye rağmen 25 milyar aktif parametreyle çalışan model, kayıpsız 4-bit sıkıştırma ve çok dilli destek sunuyor.

Kommentare

00
KOMMENTAR SCHREIBEN
ID #MXIBFF

0 / 1200 ZEICHEN

Menschen-Check

4 + 6 = ?

Erscheint nach redaktioneller Prüfung

Moderation · Spam-Schutz aktiv

Noch keine Kommentare. Sei der erste.