Stanford’un DeLM’i: Merkezi Olmayan AI Ajanları Maliyeti %50 Düşürüyor

Yapay zeka dünyasında çoklu ajan sistemleri genellikle bir 'şef' gerektirir: Bu merkezî unsur görevleri dağıtır, yanıtları toplar ve sistemin kargaşa içinde kaybolmasını engeller. Ancak Stanford Üniversitesi’nin yeni bir çalışması, bu varsayımın yanlış olabileceğini ve maliyetin sadece dolar cinsinden değil, aynı zamanda koordinasyon gecikmeleriyle de ölçülebileceğini ortaya koyuyor.

DeLM adı verilen Dağıtılmış Dil Modeli, ajanların doğrudan birbirleriyle iletişim kurabildiği, her güncellemenin merkezi bir kontrolcüye yönlendirilmediği bir sistemdir. Projenin arkasındaki araştırmacılar Yuzhen Mao ve Azalia Mirhoseini, DeLM’in nasıl çalıştığını şu şekilde açıklıyor: Tüm ajanlar, doğrulanmış ilerlemeleri ve belgelenmiş başarısızlıkları paylaşan ortak bir bilgi tabanına erişir. Bu sayede her ajan, diğerlerinin bulgularına doğrudan inşa edebilir ve gereksiz yinelemeleri önleyebilir.

Geleneksel Çoklu Ajan Sistemlerinin Sınırlamaları

Merkezî çoklu ajan sistemlerinde, ana ajan görevleri alt görevlere bölerek paralel çalışan alt ajanlara dağıtır. Bu ajanlardan gelen yanıtlar toplandıktan sonra, ana ajan tüm bilgileri birleştirir, özetler ve ardından yeni talimatlar yayınlar. Bu yaklaşım doğal görünse de, Stanford araştırmacılarına göre ölçeklenebilirliği ciddi şekilde sınırlar.

Her faydalı bulgu, kısmi sonuç ve başarısızlık, ana ajana bildirilmelidir. Ana ajan ise hangi bilgilerin diğer ajanlara iletileceğine karar verir. Araştırmacılar, bu sürecin iletişim ve entegrasyon için bir darboğaz oluşturduğunu vurguluyor. Ayrıca, ana ajan bilgileri yanlış birleştirebilir veya önemli detayları kaçırabilir, bu da ilerlemenin kaybolmasına yol açar.

Uzun bağlamlı akıl yürütme senaryolarında da benzer sorunlar yaşanır. Ana ajan, alt ajanlardan gelen raporları topladıktan sonra verileri gruplandırır ve bunları 'kanıtlama kümeleri' adı verilen yapılara ayırır. Ancak bu kümelerin ne kadar ilgili olduğu henüz bilinmediğinden, alt ajanlar yetersiz bağlama maruz kalabilir ve tekrar ana ajana başvurmak zorunda kalabilir. Bu durum, koordinasyonu yavaşlatan ve sistemin performansını düşüren bir kısır döngüye neden olur.

DeLM’in Çalışma Prensibi

DeLM, merkezî bir kontrolcüye ihtiyaç duymadan çoklu ajanların doğrudan birbirleriyle etkileşimde bulunduğu dağıtılmış bir mimari sunar. Sistem, üç temel bileşenden oluşur:

Paylaşılan bağlam (Shared context): Doğrulanmış bulgular, kısmi sonuçlar ve belgelenmiş başarısızlıkları içeren bir bilgi deposu. Her ajan, ihtiyaç duyduğu detaylı kanıtları buradan çekebilir.

Görev kuyruğu (Task queue): Henüz tamamlanmamış alt görevleri içeren ve ajanların bağımsız olarak talep edebileceği bir yapı.

Sıkıştırma ve doğrulama mekanizması: Ajanlar, sonuçlarını sıkıştırarak yeniden kullanılabilir 'özetler' haline getirir. Bu özetler, destekleyici kanıtlarla doğrulanır ve yalnızca onaylananlar grup içinde paylaşılır.

Sistem şu adımlarla çalışır:

Başlatma: Giriş verileri, farklı iş birimlerine bölünerek kuyruğa eklenir.

Paralel çalışma: Ajanlar bağımsız olarak görevleri yerine getirir ve paylaşılan bağlamdan ilerlemeleri takip eder.

Sıkıştırma ve doğrulama: Sonuçlar, yeniden kullanılabilir özetlere dönüştürülür ve kanıtlarla doğrulanır. Sadece doğrulanmış özetler paylaşılır.

Ek çalışma (gerekiyorsa): Kuyruk boşaldığında, son ajan paylaşılan bağlamı inceleyerek ek çalışmanın gerekli olup olmadığına karar verir.

Sonuçlandırma: Son ajan, tüm adımların tamamlandığına kanaat getirerek nihai yanıtı döndürür.

Araştırmacılar, DeLM’in ajanların ilerlemelerini paylaşılan durum üzerinden asenkron olarak aktardığını, görevleri talep ederek ölçeklenebilir şekilde çalıştığını belirtiyor. Bu sayede, alt görev sayısı arttıkça sistemin performansı da daha verimli hale geliyor.

DeLM’in Gerçek Dünyadaki Performansı

DeLM’in en büyük avantajlarından biri, tekrarlanan araştırmaları ortadan kaldırmasıdır. Ajanlar, birbirlerinin başarısızlıklarından ders çıkarabilir ve bulgularını doğrudan inşa edebilir. Bu özellik, özellikle yazılım mühendisliği test süresi ölçeklendirme gibi senaryolarda faydalıdır. Farklı ajanlar, aynı anda farklı hipotezleri test edebilir ve ara sonuçları paylaşabilir. Örneğin, yazılım hata ayıklama süreçlerinde DeLM’in paralel çalışması, hem doğruluğu artırıyor hem de maliyetleri düşürüyor.

DeLM ayrıca uzun bağlamlı akıl yürütme ve çoklu belge yanıtlama alanlarında da üstün performans gösteriyor. Ajanlar, aynı anda farklı kanıt kümelerini inceleyebilir ve tüm sistemin küresel bir özetini koruyabilir. Bu, özellikle araştırma makaleleri, kod tabanları veya karmaşık belgelerle çalışırken avantaj sağlar.

Araştırmacılar, DeLM’in SWE-bench Verified veri kümesinde en güçlü rakibin %10,5 üzerinde performans gösterdiğini ve her görev için maliyeti yaklaşık %50 oranında azalttığını belirtiyor. Ayrıca LongBench-v2 Multi-Doc QA veri kümesinde en yüksek doğruluğu elde ederek, GPT-5.4, Claude Sonnet, Gemini Flash ve DeepSeek-V4-Pro gibi önde gelen modelleri geride bıraktı.

DeLM’in başarısının altında yatan temel nedenlerden biri, ajanların başarısızlıkları paylaşmasıdır. Bir ajan bir görevi yerine getiremezse, diğerleri bu bilgiden faydalanabilir ve aynı hatayı tekrarlamaktan kaçınabilir. Bu yaklaşım, hem verimliliği hem de doğruluğu önemli ölçüde artırıyor.

Gelecekte, dağıtılmış çoklu ajan sistemleri, yapay zeka uygulamalarının daha ölçeklenebilir, maliyet etkin ve verimli hale gelmesine katkı sağlayabilir. DeLM’in sunduğu bu yenilikçi mimari, özellikle karmaşık görevlerdeki AI performansının iyileştirilmesinde önemli bir adım olarak görülüyor.

Yapay zeka özeti

Stanford'un geliştirdiği DeLM, çoklu AI ajan sistemlerinde merkezi bir orkestra gereksinimini ortadan kaldırarak hem maliyetleri yarıya indiriyor hem de koordinasyon gecikmelerini azaltıyor. Nasıl çalıştığını ve performansını keşfedin.

Etiketler

#çoklu ajan sistemleri #yapay zeka maliyeti #dağıtılmış dil modeli #merkezi olmayan ai #delm stanford #ai ajan koordinasyonu #uzun bağlamlı akıl yürütme #swe-bench verified

Stanford’un DeLM’i: Merkezi Olmayan AI Ajanları Maliyeti %50 Düşürüyor

Geleneksel Çoklu Ajan Sistemlerinin Sınırlamaları

DeLM’in Çalışma Prensibi

DeLM’in Gerçek Dünyadaki Performansı

Yorumlar

Krea 2 Raw ve Turbo: Kurumsal AI Resim Üretiminde Devrim

Anthropic'in yeni AI aracı: Ekibinizin yerini alabilecek 'Claude Tag' Slack'e geldi

AI sistemlerin ölçeklenmesini engelleyen data yolundaki 3 kritik hata