iToverDose/Girişim· 29 NISAN 2026 · 16:02

İşletmeler Neden Kullanmadıkları GPU’ları Ödemeye Devam Ediyor?

Şirketler, GPU’ları %5 oranında kullanmasına rağmen saatlik faturalandırma nedeniyle yüksek maliyetlerle karşı karşıya. Bu durum, hem tedarik zincirindeki darboğazdan hem de FOMO’dan kaynaklanıyor.

VentureBeat3 dk okuma0 Yorumlar

İşletmeler, kullanmadıkları GPU’lar için yüksek faturalar ödemeye devam ediyor. Bu durumun temel nedeni, FOMO (Fear Of Missing Out) ve tedarik zincirindeki dengesizlikler. Cast AI’nin 2026 Kubernetes Optimizasyonu Raporu’na göre, şirketlerin GPU filolarının yalnızca %5’i kullanılıyor. Bu oran, insan müdahalesi olmadan bile ulaşılabilecek %30’luk hedefin oldukça altında kalıyor.

Bu durumu Cast AI’nin kurucu ortağı ve Başkanı Laurent Gil, “Birçok şirket bulut altyapısını gerçek anlamda bulut olarak kullanmıyor; neo-emlakçılık yapıyor” sözleriyle açıklıyor. Gil, bu verileri iki yıldır takip ediyor ve şirketlerin GPU’ları neden kullanmadıklarını anlatıyor.

Bulut Piyasası İki Katmana Ayrıldı

Bulut bilişimin fiyatlandırma modeli, son 20 yıldır sürekli düşüş eğilimindeydi. Ancak GPU’lar söz konusu olduğunda bu durum değişti. Hiperskalerler artık GPU fiyatlarını artırmaya başladı. Örneğin, AWS Ocak 2026’da H200 GPU’lar için rezervasyon fiyatlarını sessizce %15 oranında yükseltti. Aynı dönemde bellek tedarikçileri de HBM3e fiyatlarını %20 artırdığını duyurdu.

Bu artışlar, bulut bilişimin tarihinin ilk önemli GPU fiyat artışı olarak kayda geçti. Piyasada iki farklı fiyatlandırma katmanı oluşmuş durumda:

  • Hedeflenmiş katman: H100 gibi üst düzey GPU’ların fiyatı düştü. Eylül 2025’te $7,57 olan saatlik kiralama ücreti bugün $3,93’e geriledi. Lambda Labs ve RunPod gibi platformlarda H100’ler $3’ün altında kiralanabiliyor. Eski modeller olan A100’ler ise $1,92’ye kadar düştü.
  • Öncü katman: H200 gibi yeni nesil GPU’larda ise talep arzı aştı. Nvidia, 2026 için 2 milyon H200 siparişi alırken, sadece 700.000 adet stok bulunuyor. TSMC’nin ileri paketleme kapasitesi ise en az 2027’nin ortasına kadar dolu. AMD de 2026 için fiyat artışı yapacağını duyurdu.

Şirketlerin hangi katmanda yer aldığı, maliyetlerini doğrudan etkiliyor.

%5 Kullanım Oranının Ardındaki Tedarik Döngüsü

GPU’ların %5 oranında kullanılmasının temel nedeni, şirketlerin tedarik sürecindeki kaygıları. Gil’in aktardığına göre, şirketler GPU’lara ihtiyaç duyduklarında şu süreç yaşanıyor:

  • Öncelikle bir bekleme listesine kaydoluyorlar.
  • Haftalarca, hatta aylarca yanıt gelmiyor.
  • Sonunda bir telefonla karşılaşıyorlar: “48 adet GPU istediniz, ama elimizde 36 var. Üç yıllık taahhüt karşılığında size verebiliriz. Eğer istemezseniz, beş başka şirket bu slotları alabilir.”

Bu senaryoda şirketler, GPU’ları alıp almamak arasında kararsız kalıyor. Kaygı verici olan şey, GPU’ları geri verme riski. Çünkü GPU’ları serbest bıraktıktan sonra yeniden edinmek aylar sürebilir. Bu nedenle şirketler, GPU’ları kullanmasalar bile saatlik fatura ödemeye devam ediyor.

Gil’in ifadesiyle, şirketler bir yandan %15 daha pahalı olan anlık fiyatlarla ödeme yaparken, diğer yandan yıllık rezervasyonları tercih ediyor. Çünkü kaybettikleri bir GPU’yu yeniden elde etmek imkansız hale geliyor. Bu da fiyat artışlarını tetikleyen bir kısır döngü yaratıyor.

%5 Kullanım Oranının Ardındaki Mimarî Döngüsü

GPU’ların %5 oranında kullanılmasının bir diğer nedeni de mimarî tasarımlarındaki verimsizlik. Cast AI’nin raporuna paralel olarak, Anyscale gibi şirketler de bu sorunu inceliyor.

GPU’lara yapılan talepler genellikle gerçek ihtiyacın beş ila on katı kadar oluyor. Bunun nedeni, eksik kaynak tahsisinin doğrudan sonuçlarını (örneğin, pager uyarıları) görülürken, fazla kaynak tahsisinin maliyetinin görünmez olması. Bu durum, şirketlerin GPU’ları gerektiğinden fazla talep etmelerine ve kullanmamalarına yol açıyor.

Forrester analisti Tracy Woo’dan alınan veriler de bu durumu destekliyor. Woo, şirketlerin Kubernetes kaynak israfını yaklaşık %60 olarak tahmin ettiklerini, Cast AI’nin doğrudan ölçümlerininyse buna yakın sonuçlar verdiğini belirtiyor.

Çözüm Yolları ve Gelecek Beklentileri

Bu kısır döngüyü kırmak için şirketlerin öncelikle GPU’ları serbest bırakma konusunda daha cesur olmaları gerekiyor. Ancak bu, riskli bir adım olabilir. Gil’in önerisi, şirketlerin GPU’ları üç aylık periyotlarla revize etmeleri ve kullanım oranlarını sürekli izlemeleri.

Ayrıca, mimarî optimizasyonlar da önemli bir rol oynuyor. Kubernetes kaynaklarını daha verimli yönetmek için otomatik ölçeklendirme araçları kullanılabilir. Bu sayede GPU’ların %5’lik kullanım oranı artırılabilir.

Ancak tüm bu çözümlerin uygulanması zaman alacak. Şimdilik, şirketlerin GPU’lar için ödedikleri yüksek faturalar devam edecek gibi görünüyor. Bu da AI ve makine öğrenmesi projelerinin maliyetini artırarak, şirketlerin yenilikçilik kapasitesini sınırlayabilir.

Yapay zeka özeti

Şirketlerin GPU filolarını %5 oranında kullanmasının ardındaki FOMO ve tedarik zinciri sorunlarını keşfedin. Bulut GPU fiyatlarındaki artışın nedenlerini öğrenin.

Yorumlar

00
YORUM BIRAK
ID #AUFXF6

0 / 1200 KARAKTER

İnsan doğrulaması

8 + 9 = ?

Editör onayı sonrası yayına girer

Moderasyon · Spam koruması aktif

Henüz onaylı yorum yok. İlk yorumu sen bırak.