Die Integration von KI in medizinische Diagnostik hat die Effizienz in Krankenhäusern und Kliniken deutlich erhöht. Doch wenn ein KI-Modell, das Hautveränderungen bewertet, bestimmte Hauttöne bevorzugt, könnten lebenswichtige Befunde übersehen werden. Ein zentrales Problem dabei ist die Verzerrung (Bias) in KI-Systemen – ein Thema, das seit Jahren die Forschung beschäftigt.
Warum Verzerrungen in KI-Modellen gefährlich sind
Verzerrungen in KI-Modellen entstehen nicht nur durch die Trainingsdaten, sondern auch durch die Architektur der Modelle selbst. In Hochrisikoanwendungen wie der Medizin können diese Verzerrungen schwerwiegende Folgen haben. Ein Team von Forschern der MIT, des Worcester Polytechnic Institute und Google hat nun eine innovative Lösung entwickelt, um dieses Problem anzugehen.
Das neue Verfahren mit dem Namen Weighted Rotational DebiasING (WRING) zielt darauf ab, Verzerrungen in Vision-Language-Modellen (VLMs) zu reduzieren. Diese Modelle, wie etwa OpenAI’s OpenCLIP, verarbeiten gleichzeitig Bild-, Video- und Textdaten. Bisherige Ansätze zur Verzerrungsreduktion, wie die Projektionstechnik, stoßen jedoch an Grenzen.
Das „Whac-A-Mole-Dilemma“ und seine Grenzen
Die Projektionstechnik entfernt unerwünschte Informationen aus den Modellrepräsentationen, indem sie bestimmte Teilräume ausblendet. Doch dabei werden oft unbeabsichtigt auch andere, nützliche Zusammenhänge im Modell zerstört. Die Folge: Die Verzerrung wird zwar reduziert, aber an anderer Stelle entstehen neue Probleme.
„Wenn man diese Projektion durchführt, verändert man unweigerlich die gesamte Umgebung im Modell“, erklärt Walter Gerych, Hauptautor der Studie und ehemaliger Postdoc am MIT. Mittlerweile ist Gerych Assistenzprofessor für Informatik am Worcester Polytechnic Institute. „Alle Beziehungen, die das Modell gelernt hat, werden durcheinandergebracht.“
Gemeinsam mit seinen Kollegen Cassandra Parent und Quinn Perian (beide MIT), Rafiya Javed (Google) sowie den MIT-Professoren Justin Solomon und Marzyeh Ghassemi entwickelte Gerych eine Alternative: WRING.
WRING: Eine präzisere Methode zur Verzerrungsreduktion
Anstatt Verzerrungen einfach auszublenden, verändert WRING gezielt bestimmte Koordinaten im hochdimensionalen Raum des Modells. Dadurch werden die Unterschiede zwischen verschiedenen Gruppen in einem bestimmten Konzept aufgehoben – ohne die restlichen Modellfähigkeiten zu beeinträchtigen.
„Unser Ansatz ist sehr effizient“, betont Gerych. „Er erfordert kein erneutes Training des Modells und ist minimal invasiv.“ WRING ist ein Post-Processing-Verfahren, das bereits trainierte Modelle nachträglich optimieren kann. Das spart Ressourcen und vermeidet den aufwendigen Neuanfang eines Trainingsprozesses.
In ihren Tests zeigte WRING, dass es Verzerrungen in einem bestimmten Bereich deutlich reduzieren konnte, ohne neue Verzerrungen in anderen Bereichen zu verursachen. Bisher ist die Methode jedoch auf CLIP-Modelle beschränkt – ein spezieller Typ von VLMs, der Bilder und Texte verknüpft.
Ausblick: Von CLIP zu generativen Sprachmodellen
Die Forscher planen, ihre Methode auf andere KI-Systeme auszuweiten. „Der nächste logische Schritt wäre die Anwendung auf generative Sprachmodelle wie ChatGPT“, sagt Gerych. Diese Modelle, die Texte erzeugen, stellen eine weitere Herausforderung dar, da sie komplexere Verzerrungsmuster aufweisen können.
Die Arbeit wurde unter anderem durch den National Science Foundation CAREER Award, den AI2050 Early Career Fellowship, den Sloan Research Fellow Award sowie Förderungen der Gordon and Betty Moore Foundation und des MIT-Google Computing Innovation Award unterstützt.
Mit WRING könnte ein wichtiger Schritt getan sein, um KI-Systeme sicherer und zuverlässiger zu machen – insbesondere in Bereichen, in denen Verzerrungen schwerwiegende Folgen haben.
KI-Zusammenfassung
Yapay zeka destekli tıbbi görüntüleme sistemlerinde ırk ya da ten rengi gibi unsurlar nedeniyle oluşan önyargılar, hastaların doğru teşhis almasını engelleyebilir. MIT ve diğer kurumlardan araştırmacılar, bu sorunu çözmeyi vaat eden yenilikçi bir yöntem sundu.