Liquid AI, ein von ehemaligen MIT-Wissenschaftlern gegründetes Startup, hat mit LFM2.5-230M das bisher kleinste KI-Modell der Marke vorgestellt – und unterstreicht damit einen wachsenden Trend hin zu kompakter, aber leistungsstarker KI für lokale Anwendungen.
Das Modell mit nur 230 Millionen Parametern ist speziell für agentenbasierte Arbeitsabläufe auf dem Endgerät konzipiert. Wie das Unternehmen in seinem offiziellen Blog mitteilt, lässt es sich nahezu überall ausführen – von Smartphones über Laptops bis hin zu Robotern. Dabei übertrifft es laut eigenen Angaben Modelle, die mehr als viermal so groß sind, bei der Datenextraktion. Besonders hervorzuheben sind die besseren Benchmark-Ergebnisse im Vergleich zu Alibabas Qwen3.5-0.8B (Instruct) mit 800 Millionen Parametern und Googles Gemma 3 1B (1 Milliarde Parameter).
Zielgruppe sind Entwickler und Ingenieure, die leichtgewichtige Datenverarbeitungspipelines oder autonome Edge-Systeme aufbauen. Die Nutzung des Modells unterliegt einer Doppelnutzungslizenz: Für Privatpersonen und Unternehmen mit einem Jahresumsatz unter 10 Millionen US-Dollar ist die Nutzung kostenlos. Größere Unternehmen benötigen hingegen eine kostenpflichtige Enterprise-Lizenz.
Wie LFM2.5-230M Architektur und Effizienz revolutioniert
Während Tech-Giganten wie Anthropic, OpenAI, Google und Meta ihre Modelle auf Hunderte von Milliarden oder gar Billionen von Parametern aufblähen, setzt Liquid AI auf eine vollständig andere Strategie: architektonische Effizienz statt reiner Skalierung. Das Modell nutzt die LFM2-Architektur, die als Hybrid-System gated Kurzstrecken-Konvolutionen mit gruppierter Abfrage-Attention kombiniert.
Diese Herangehensweise ermöglicht es, 19 Billionen Tokens an Trainingsdaten in einem Modell mit nur 230 Millionen Parametern unterzubringen – ohne die typischen Speicherengpässe herkömmlicher Transformer-Modelle. Mit einem Kontextfenster von 32.000 Tokens können selbst umfangreiche Dokumente oder kontinuierliche Datenströme von Robotern verarbeitet werden.
Die Performance-Zahlen sprechen für sich:
- Speicherbedarf unter 400 MB – deutlich weniger als vergleichbare Modelle wie Gemma 3 1B IT oder Granite 4.0-H-350M.
- Prefill- und Dekodierungsgeschwindigkeiten, die selbst größere Modelle übertreffen.
- Auf einem Samsung Galaxy S25 Ultra (mit Qualcomm Snapdragon Gen4) erreicht das Modell 213 Tokens pro Sekunde bei der Dekodierung.
- Selbst auf einem Raspberry Pi 5 (knapp bemessene Hardware) liegt die Rate bei 42 Tokens pro Sekunde.
- Niedrigere Latenzzeiten bei GPU-Inferenz im Vergleich zu Konkurrenzmodellen – unabhängig von der Auslastung.
# Beispiel-Pseudocode für die Integration von LFM2.5-230M in eine lokale Pipeline
from liquid_ai import LFModel25
# Modell laden (230M Parameter)
model = LFModel25("lfm2.5-230m")
# PDF-Datei parsen und strukturierte Daten extrahieren
data = model.extract_data(
file_path="rechnung.pdf",
output_format="json",
context_window=32000
)
print(data) # Ausgabe: {'Rechnungsnummer': '12345', 'Datum': '01.01.2025', ...}Warum kompakte KI-Modelle für Unternehmen unverzichtbar werden
Für viele Unternehmen bedeutet Datenverarbeitung bisher einen starren, regelbasierten Prozess – etwa mit klassischen ETL-Skripten (Extract, Transform, Load), die bei Änderungen in Dokumentstrukturen oder Schemata schnell versagen. Solche Systeme sind fehleranfällig und erfordern manuelle Anpassungen, was zu hohen Wartungskosten führt.
Die Lösung liegt im „AI ETL“, bei dem KI-Modelle selbstständig Daten aus unstrukturierten Quellen wie PDFs, E-Mails oder Webformularen extrahieren und in strukturierte Formate wie JSON umwandeln – ohne starre Regeln. Doch der Einsatz großer Modelle wie Claude Opus 4.6 (Kosten: 5 US-Dollar pro Million Tokens) für Routineaufgaben wie Rechnungsverarbeitung oder Adressformatierung ist wirtschaftlich unsinnig.
Genau hier setzt LFM2.5-230M an:
- Kostensenkung: Lokale Ausführung spart teure Cloud-API-Aufrufe.
- Geringere Latenz: Daten werden in Echtzeit verarbeitet – ohne Abhängigkeit von Netzwerkverbindungen.
- Flexibilität: Das Modell passt sich automatisch an neue Datenstrukturen an, was die Wartung vereinfacht.
- Datenschutz: Sensible Informationen bleiben auf dem Endgerät – ideal für Unternehmen mit strengen Compliance-Vorgaben.
Kampf der „kleinen“ KI-Modelle: Wer übertrifft wen?
Der KI-Markt erlebt derzeit eine Renaissance der kleineren Modelle, doch die Definition von „klein“ ist relativ. So sorgte kürzlich Weibo mit VibeThinker-3B für Aufsehen: Das 3-Milliarden-Parameter-Modell erreichte auf dem AIME 2026-Mathematik-Benchmark einen Wert von 94,3 – und damit Leistungen, die sonst nur Modelle mit 600 Milliarden Parametern erzielen. Ermöglicht wurde dies durch spezielle Datenaufbereitung und Verstärkungslernen.
Auch Google setzt mit der Gemma 4-Familie (über 200 Millionen Downloads) auf Edge-KI – darunter das Gemma 4 E2B mit 2 Milliarden Parametern, das speziell für mobile und IoT-Geräte optimiert ist.
Doch LFM2.5-230M bewegt sich in einer völlig anderen Liga:
- Größe: Nur 230 Millionen Parameter – etwa ein Zehntel der Größe von VibeThinker-3B oder Gemma 4 E2B.
- Zweck: Kein Wettbewerb bei komplexen Aufgaben wie Programmierung oder kreativem Schreiben, sondern optimiert für Datenextraktion und Tool-Calls.
- Benchmark-Ergebnisse: Übertrifft Modelle mit 4-mal mehr Parametern in seiner Kernaufgabe.
Wie Liquid AI betont, ist der Fokus auf Effizienz und praktischen Nutzen entscheidend – und könnte den Weg für eine neue Generation von Edge-KI-Anwendungen ebnen, die ohne Cloud-Computing auskommen.
In einer Zeit, in der Rechenleistung und Energieverbrauch immer kritischer werden, zeigt LFM2.5-230M: Klein ist das neue Groß. Unternehmen, die auf lokale KI setzen, profitieren nicht nur von Kosteneinsparungen, sondern auch von mehr Kontrolle und Datensouveränität. Die Frage ist nicht mehr, ob Edge-KI die Zukunft prägt, sondern wie schnell sie zur Standardlösung wird.
KI-Zusammenfassung
Liquid AI’nin LFM2.5-230M modeli, veri çıkarımında devleri geride bırakıyor. Yerel cihazlarda çalışabilen bu model, bulut bağımlılığını ortadan kaldırarak işletmelere yeni fırsatlar sunuyor.

