Cortis neue KI-Sprachmodelle setzen neue Maßstäbe in der medizinischen Dokumentation

Die Kopenhagener KI-Firma Corti hat heute ihr neuestes Sprachmodell Symphony for Speech-to-Text vorgestellt – eine klinische KI-Lösung, die speziell für medizinische Dokumentation, Diktate und Gesprächsaufzeichnungen entwickelt wurde. Die Innovation markiert einen Wendepunkt: Während herkömmliche Spracherkennungs-Systeme oft an medizinischen Fachbegriffen scheitern, erreicht Cortis Modell eine bisher unerreichte Genauigkeit.

„Unser Fokus liegt darauf, dass Ärzte, Pflegekräfte und Patienten unseren KI-Scribes vertrauen können – das gesamte Gesundheitssystem muss sich auf diese Technologie verlassen können“, erklärte Andreas Cleve, Mitgründer und CEO von Corti, in einem exklusiven Interview mit VentureBeat. Die Zahlen unterstreichen den Fortschritt: Im Vergleich zu führenden allgemeinen Sprachmodellen reduziert Cortis Lösung die Wortfehlerrate (WER) bei medizinischen Fachbegriffen um bis zu 93 %.

Warum allgemeine KI-Modelle in der Medizin versagen

Im medizinischen Umfeld stoßen universelle Spracherkennungsdienste wie OpenAIs Whisper oder ElevenLabs an ihre Grenzen. Medizinische Abkürzungen, Dosierungsangaben oder komplexe Symptombeschreibungen werden häufig falsch erkannt – ein kritisches Problem, wenn es um Patientensicherheit geht. Cortis Benchmarks belegen dies eindrucksvoll:

Corti Symphony for Speech-to-Text: 1,4 % WER bei englischen medizinischen Fachbegriffen
OpenAI (Whisper): 17,7 % WER
ElevenLabs: 18,1 % WER
Whisper (großes Modell): 17,4 % WER
Parakeet: 18,9 % WER

Ein besonders besorgniserregendes Beispiel ist die Fehlerrate bei der Rückverfolgung klinischer Entitäten wie Dosierungen oder Messwerten. Hier erreicht Cortis Modell eine Erinnerungsrate (Recall) von 98,3 % – im Vergleich zu nur 44,3 % bei generischen Sprachmodellen. „Wenn ein KI-System ein Medikament falsch erkennt, gefährdet das nicht nur die Dokumentation, sondern auch die gesamte Patientenversorgung“, betont Cleve.

Vom statischen Transkript zur intelligenten Wissensbasis

Die Medizin steht vor einem Paradigmenwechsel: Sprachdaten sind nicht länger nur eine statische Textausgabe, sondern die Grundlage für autonome KI-Agenten, die in Echtzeit klinische Entscheidungen unterstützen. Cortis Lösung geht über klassische Diktiersysteme wie Dragon Medical One hinaus, die zwar für gezielte Diktate optimiert sind, aber nicht für mehrsprachige Gespräche, Umgebungsgeräusche oder komplexe klinische Workflows.

In Tests mit realen Arzt-Diktaten übertrifft Corti die etablierte Lösung:

Corti: 4,6 % WER (Wortfehlerrate)
Dragon Medical One: 5,7 % WER (relativer Verbesserung von 19 %)

Zudem erreicht Corti eine höhere Genauigkeit bei medizinischen Fachbegriffen (93,5 % vs. 92,9 %). Durch die Bereitstellung als API ermöglicht das Unternehmen Drittanbietern – etwa EHR-Herstellern oder Telemedizin-Plattformen – die Integration hochpräziser Sprachverarbeitung in ihre eigenen Anwendungen.

„Wir wollen, dass Entwickler unsere Modelle nutzen und darauf aufbauen können“, erklärt Cleve. „Unser Ziel ist es, die Technologie so zugänglich wie möglich zu machen – zum Wohl von Patienten und medizinischem Personal.“

Ein globaler Ansatz für mehrsprachige Gesundheitsversorgung

Die Herausforderungen der medizinischen Dokumentation enden nicht an Sprachgrenzen. Länder wie die Schweiz, wo mehrere Sprachen parallel in der Patientenversorgung genutzt werden, profitieren besonders von Cortis mehrsprachigen Modellen. Erste Pilotprojekte in Europa zeigen, dass die Technologie auch in anspruchsvollen klinischen Umgebungen zuverlässig funktioniert.

Hinter der Entwicklung steht zudem eine persönliche Motivation: Cleves Mutter war selbst im Gesundheitswesen tätig und erlitt während ihrer Berufsausübung einen Angriff durch einen Patienten. Die Folgen prägten seine Vision, durch Technologie die Arbeitsbedingungen im Gesundheitswesen zu verbessern.

Mit Symphony for Speech-to-Text setzt Corti einen neuen Standard für klinische KI-Sprachverarbeitung. Die Technologie könnte nicht nur die Dokumentationslast für Ärzte verringern, sondern auch die Grundlage für zukünftige KI-gestützte Diagnose- und Behandlungssysteme bilden. Die Frage ist nicht mehr, ob KI die Medizin revolutioniert – sondern wer diese Revolution vorantreibt.

Langfristig wird sich zeigen, ob die Industrie Cortis Ansatz als neuen Goldstandard übernimmt oder ob weitere Innovationen folgen werden. Eines ist jedoch sicher: Die Zeit der ungenauen Spracherkennung in der Medizin ist vorbei.

KI-Zusammenfassung

Corti'nin yeni Symphony konuşma tanıma modeli, medical terminoloji doğruluğunda lider oluyor ve sağlık sektöründe devrim yaratıyor

Cortis neue KI-Sprachmodelle setzen neue Maßstäbe in der medizinischen Dokumentation

Warum allgemeine KI-Modelle in der Medizin versagen

Vom statischen Transkript zur intelligenten Wissensbasis

Ein globaler Ansatz für mehrsprachige Gesundheitsversorgung

Kommentare

Warum Enterprise-KI-Agenten scheitern – und wie Entscheidungsgraphen Abhilfe schaffen

GitHub bestätigt Diebstahl von 3.800 internen Repositories

Lance: Neues KI-Modell für Bild- und Videogenerierung in einem System