Qualcomms neue High-Bandwidth-Compute-Architektur (HBC) markiert einen Wendepunkt in der KI-Beschleunigungstechnologie. Das Unternehmen stellt die Near-Memory-KI-Architektur vor, die das klassische "Memory Wall"-Problem lösen soll – ein Flaschenhals, der durch das Missverhältnis zwischen rasant wachsender Rechenleistung und begrenzter Speicherbandbreite entsteht. Traditionelle Lösungen wie High Bandwidth Memory (HBM) stoßen hier an technische und wirtschaftliche Grenzen.
HBC: KI-Beschleuniger direkt unter dem DRAM-Stapel
Die Kerninnovation von Qualcomm liegt in der physischen Trennung des KI-Beschleunigers vom System-on-Chip (SoC) und dessen Integration direkt unter einem LPDDR-DRAM-Stapel. Diese Architektur nutzt Through-Silicon-Vias (TSVs) zur Datenübertragung, wodurch maximale Bandbreite bei minimalem Energieverbrauch ermöglicht wird. Im Gegensatz zu HBM-Lösungen verzichtet die HBC-Architektur auf teure Silizium-Interposer und fortgeschrittene Verpackungstechnologien.
Tony Pialis, Qualcomms Executive Vice President und General Manager des Data Center Business, erklärt die Vorteile: "Wir haben den KI-Beschleuniger vom XPU getrennt und diesen direkt unter einen DRAM-Stapel platziert. Diese Lösung kombiniert die hohe Performance von SRAM mit der Speicherdichte von Stacked Memory. Dadurch entfallen Engpässe, die bei HBM-Lösungen typisch sind. Die Industrie profitiert von niedrigerem Stromverbrauch, weniger Hitzeentwicklung und der Einsparung kostspieliger Silizium-Interposer. Zudem ermöglicht die Architektur den Einsatz mehrerer HBC-Stapel in einem einzigen Rechensystem – was zu einem deutlichen Kostenvorteil pro Performance führt."
Effizienzgewinne und technische Grenzen
Qualcomm beziffert die Leistungsfähigkeit der HBC-Architektur mit bis zu sechsfach höherer Bandbreite pro Watt im Vergleich zu HBM-Lösungen und über 200-facher Speicherkapazität gegenüber on-Chip-SRAM. Konkrete Bandbreitenwerte werden jedoch nicht genannt, was einen direkten Vergleich mit Konkurrenzlösungen erschwert. Die Architektur könnte theoretisch für verschiedene KI-Anwendungen eingesetzt werden – von transformerspezifischen Near-Memory-Engines bis hin zu universellen Tensor-Kernen oder Vorverarbeitungslogik für Inferenz- und Trainingsprozesse.
Ein Vergleich mit alternativen Near-Memory-Ansätzen zeigt die Herausforderungen des Marktes. GUC, ein fabless ASIC-Designunternehmen, präsentierte kürzlich seine DRAM-on-Logic-Technologie (DoL), die ein bis vier DRAM-Schichten auf Logik-Chips platziert. Diese Lösung erreicht bis zu 5 TB/s Bandbreite und übertrifft damit einige HBM3E-Subsysteme – ohne teure Verpackungstechnologien. Allerdings bleibt unklar, wie sich die HBC-Architektur von Qualcomm in der Praxis gegen solche Ansätze behaupten wird.
Qualcomms KI-Beschleuniger-Roadmap: AI250 und AI350
Neben der HBC-Architektur stellte Qualcomm seine Roadmap für KI-Beschleuniger vor. Der kommende AI200, der noch in diesem Jahr erwartet wird, setzt auf LPDDR5X-Speicher und bietet pro Rack 43 TB RAM. Sein Nachfolger AI250 wird die erste Generation der HBC-Technologie nutzen und eine 18-fach höhere Bandbreite im Vergleich zum AI200 erreichen. Die nächste Generation AI300 soll mit der zweiten HBC-Generation ausgestattet werden und eine 54-fach höhere Bandbreite als der AI300 bieten.
Die Roadmap verdeutlicht Qualcomms Ziel, die Skalierbarkeit von KI-Anwendungen durch Near-Memory-Architekturen zu revolutionieren. Während die genauen Leistungsdaten noch ausstehen, unterstreicht die Ankündigung das Potenzial der HBC-Technologie, die KI-Beschleunigung effizienter und kostengünstiger zu gestalten.
Ausblick: Near-Memory-KI als Zukunftstrend
Die Einführung von Qualcomms HBC markiert einen wichtigen Schritt in der Weiterentwicklung von KI-Hardware. Near-Memory-Architekturen könnten sich als Schlüsseltechnologie erweisen, um die wachsenden Anforderungen an Leistung und Energieeffizienz in Rechenzentren zu erfüllen. Während die praktische Umsetzung und Marktakzeptanz noch zu prüfen sind, zeigt Qualcomm mit seiner HBC-Innovation, wie traditionelle Grenzen der Halbleitertechnologie überwunden werden können. Die kommenden Monate werden zeigen, ob sich die versprochenen Effizienzgewinne in der Praxis bestätigen und ob die Industrie die neue Architektur annimmt.
KI-Zusammenfassung
Qualcomm’un yeni HBC mimarisi, bellek ve hesaplama arasındaki boşluğu kapatarak AI performansını 6 kat artırıyor. HBM’ye alternatif mi? Detaylar burada.



