İşletmelerde kullanılan karmaşık yapay zekâ sistemleri, çok adımlı iş akışlarını yönetirken farklı araç ve yeteneklere yönlendirmekte zorlanıyor. AI ajanları, yüzlerce araca sahip olduğunda her adım için doğru aracı seçmek karmaşık bir hale geliyor ve bu da performansı olumsuz etkiliyor.
Bu sorunu çözmek için Alibaba araştırmacıları, SkillWeaver adı verilen yenilikçi bir framework geliştirdi. Bu sistem, verilen görevi yürütme grafiği olarak modelleyerek her adım için en uygun yetenekleri otomatik olarak belirliyor. Ayrıca, Skill-Aware Decomposition (SAD) adı verilen yeni bir teknikle, ajanların ilgili araç adaylarını tekrarlı olarak sorgulamasına ve değerlendirmesine olanak tanıyor. Bu yaklaşım, diğer araç yönlendirme frameworklerinden farklı olarak, görevlerin tek seferde değil, geri besleme döngüsü ile optimize edilmesini sağlıyor.
SkillWeaver’in en dikkat çekici avantajı, ajanların çok adımlı iş akışlarını (örneğin veri indirme, dönüştürme ve görselleştirme) gerçekleştirirken gereksiz token tüketimini %99’un üzerinde azaltması. Araştırmacılar, geliştirdikleri sistemin performansını test etmek için CompSkillBench adlı bir benchmark oluşturdu. Bu test, 300 farklı zorluk seviyesine sahip çok adımlı sorgu ve 2.209 gerçek dünya aracı kullanılarak gerçekleştirildi.
AI ajanlarının karşılaştığı araç yönlendirme problemi
Modern LLM (Büyük Dil Modeli) ajan mimarilerinde beceriler (skills), modüler ve yeniden kullanılabilir araç tanımları olarak kullanılıyor. Bu beceriler, yapılandırılmış doğal dil dokümantasyonu ile tanımlanıyor ve ajanların karmaşık görevleri yerine getirmesini kolaylaştırıyor.
Ancak, işletmelerdeki ajanlar binlerce araca erişim sağladığında, doğru aracı seçmek ciddi bir zorluk haline geliyor. Tüm araç kitaplığını bir LLM’e sunmak, bağlam sınırlarını aşırı zorlarken, yüz binlerce token tüketimine neden olabiliyor. Mevcut çoğu framework, bu problemi tek bir beceri seçimi veya adım adım seçim yaklaşımıyla çözmeye çalışıyor.
Ancak bu yaklaşım, işletme ortamlarında yetersiz kalıyor. Gerçek dünya sorguları genellikle çok adımlı ve bileşik yapıda oluyor. Örneğin, "Veri setini indir, dönüştür ve rapor oluştur" gibi bir talimat, tek bir aracın değil, birden fazla aracın senkronize çalışmasını gerektiriyor.
SkillWeaver ve SAD’nin çalışma prensibi
SkillWeaver, bileşik beceri yönlendirme adı verilen yeni bir problemi çözmek üzere tasarlandı. Bu yaklaşımda, ajan bir kullanıcı sorgusunu alıp onu atomik alt görevlere ayırırken, her alt görevi en uygun beceriye eşleştirmek ve bu becerileri birbirine bağlayan bir yürütme planı oluşturur.
Sistem üç aşamada çalışıyor:
- Bölme (Decompose): Bir LLM, kullanıcının karmaşık sorgusunu tek bir beceri gerektiren alt görevlere ayırıyor. Örneğin, "Veri setini indir, dönüştür ve rapor oluştur" sorgusu üç ayrı alt göreve bölünüyor.
- Çekme (Retrieve): Her alt görev için, gömülü model (embedding model) kullanılarak araç kitaplığından en uygun adaylar seçiliyor. Örneğin, veri indirme görevi için "api-client" veya "http-fetch", veri dönüştürme için "csv-parser" veya "etl-pipeline" gibi araçlar öneriliyor.
- Birleştirme (Compose): Son aşamada, bir planlama modeli, seçilen araçların birbirleriyle uyumluluğunu kontrol ediyor. Bağımsız görevler paralel olarak çalıştırılabilirken, birbirine bağlı görevler için yönlendirilmiş döngüsüz grafik (DAG) oluşturuluyor.
SkillWeaver’in önemli bir zorluğu, LLM’lerin genel adımlar yerine mevcut araçların teknik terminolojisine uygun adımlar üretmesidir. Bu sorunu çözmek için Iterative Skill-Aware Decomposition (SAD) adı verilen bir geri besleme döngüsü kullanılıyor. SAD, LLM’nin ilk planını oluşturduktan sonra araçları arıyor ve bulunan araçları LLM’ye geri bildirim olarak vererek, planın araç terminolojisine uygun şekilde yeniden yazılmasını sağlıyor.
Gelecekteki iş akışlarını otomatikleştirme potansiyeli
SkillWeaver’in sunduğu verimlilik artışı, özellikle büyük ölçekli AI sistemlerinde kritik önem taşıyor. Araştırmacılar, geliştirdikleri sistemin %99’a varan token tasarrufu ve yüksek doğruluk oranı ile gelecekteki AI ajanlarının daha akıllı ve verimli çalışmasına olanak tanıyacağını öne sürüyor.
Bu framework, Model Context Protocol (MCP) gibi çok adımlı iş akışlarını destekleyen sistemlerde kullanılabilir. Özellikle veri analizi, finansal modelleme ve bulut altyapı yönetimi gibi alanlarda, AI ajanlarının otomatik ve hassas şekilde görevleri yerine getirmesini sağlayabilir.
Gelecekte, SkillWeaver gibi sistemlerin, AI ajanlarının insan müdahalesi olmadan karmaşık iş akışlarını yönetmesini mümkün kılması bekleniyor. Bu da işletmelerin üretkenliğini artırırken, AI’nin daha geniş ölçekte benimsenmesini hızlandırabilir.
Yapay zeka özeti
Alibaba’nın geliştirdiği SkillWeaver, AI ajanlarının görevleri otomatik olarak parçalamasını ve gereksiz token tüketimini %99’a kadar azaltmasını sağlayan yenilikçi bir framework. Detayları öğrenin.

