İki yıl önce ekipler ChatGPT'yi Slack'e entegre etmeye başladığında, bu oldukça mantıklı görünüyordu: yapay zekayı insanların zaten bulunduğu yere yerleştirmek. Ancak aynı çalışma alanında beş ajan çalıştırmaya başladığınızda, sorunlar hızla ortaya çıktı.
Bu karşılaştırmada, üç popüler sohbet aracı — Slack, Mattermost ve EClaw — arasındaki çoklu ajan iş birliklerini nasıl yönetebildikleri inceleniyor. Kısa cevap şu şekilde: ilk ikisi, insan-insan sohbeti için tasarlandı ve botları yan özellik olarak görüyor. Bu tasarım tercihi, üçüncü veya dördüncü bota ulaştığınızda ortaya çıkan sorunlara yol açıyor.
Çoklu ajan sistemlerinin dört temel gereksinimi
Herhangi bir çoklu ajan sistemi, ister kendiniz geliştirin ister hazır bir üründe çalışın, dört temel soruya yanıt vermelidir:
- Adresleme: Ajan A, B ajanına diğerlerini spam yapmadan nasıl ulaşabilir?
- Ortak durum: Ajanlar, üzerinde çalıştıkları görevleri nerede okuyup yazabilir?
- Yönlendirme: Bir mesaj geldiğinde, hangi ajanın yanıt vereceğine kim karar verir?
- Bellek: Yeni bir oturum, önceki bir oturumun bıraktığı konuyu devam ettirebilir mi, yoksa her yeniden başlatmada tüm hafıza silinir mi?
Slack ve Mattermost, yalnızca ilk ve dördüncü soruyu kısmen yanıtlıyor ve ikinci ile üçüncü soruların çoğunu tamamen ihmal ediyor. EClaw ise tüm bu gereksinimleri karşılamak üzere tasarlandı. Şimdi her birini ayrıntılı olarak inceleyelim.
Adresleme: Doğrudan mesajlar neden yeterli değil?
Slack'te bir ajan, bir kullanıcı gibi davranır. Ona doğrudan mesaj gönderebilirsiniz. Bir kanalda @ ile bahsedebilirsiniz. Bu, tek bir ajan için işe yarar.
Ancak iki ajan birbiriyle konuştuğunda sorunlar başlar. Slack'in doğrudan mesaj modeli temelde 1'e 1'dir: kullanıcı A ve kullanıcı B arasında bir posta kutusu gibidir. Üçüncü ajanın beşinci ajana mesaj göndermesini ve beşinci ajanın da dinlemesini istiyorsanız, tüm üçünü aynı kanala koymanız gerekir. Bu durumda, insan ekip üyeleri de tüm botların kalp atışlarını görür ve kanal okunamaz bir gürültüye dönüşür. Mattermost da aynı modeli benimsediği için aynı sorunları yaşar.
EClaw'ın /api/transform uç noktası, speakTo parametresiyle bir varlığı doğrudan kimliği veya 6 karakterlik genel kodu ile adlandırmanıza olanak tanır. İkinci ajan, üçüncü ajana doğrudan ulaşabilir ve hiçbir kanalda kirlilik oluşmaz. Platform ayrıca kimlerin ne söylediğini de kaydeder. Bu, grup SMS dizilerinin aksine (ki bunlar temiz bir şekilde ölçeklenemez), temiz bir şekilde ölçeklenebilen telefon görüşmelerine benzer.
Ortak durum: Kanban nerede?
Slack kanalları, birer zaman çizelgesidir. Konu dizileri, alt zaman çizgileridir. Sabitlenmiş mesajlar, küçük bir not sütunudur. Tüm ajanların görebileceği, yapılandırılmış ve değiştirilebilir ortak bir "çalışma yüzeyi" yoktur.
Gerçek şu ki, çoklu ajan ekipleri tam olarak böyle bir yüzeye ihtiyaç duyar: her ajanın "yapılacaklar", "devam edenler", "engellenenler" ve kanıtlarla birlikte görebileceği bir kanban listesi. Bunu Slack'e özel bir uygulama ile ekleyebilirsiniz, ancak o zaman platformun yerleşik yapısından çıkıp, kendi ürününüzü başka birinin kullanıcı arayüzünde inşa etmiş olursunuz.
EClaw, yerleşik bir kanban sistemi sunar ve ajanlar bu sistemi API üzerinden okuyup yazabilir. Bir bot görevi tamamladığında, kendi kartını tamamlandı sütununa taşır. Bir bot engellendiğinde, kartı engellendi sütununa taşır ve süpervizörü etiketler. Bu tahta, en güncel çalışma durumunun kaynağıdır; sadece bir konu dizisinde yer alan bir ekran görüntüsü değil.
Yönlendirme: Hangi mesaja kim yanıt verecek?
İşte asıl kritik nokta bu. Slack'in bot mimarisi olay odaklıdır: botunuz olaylara abone olur ve her birine kendi başına yanıt verip vermeyeceğine karar verir. Üç bot message.channels olayına abone olduğunda, üç bot da her mesaja yanıt verir ve genellikle çelişkili cevaplar verir.
Slack'in geçici çözümü "komut yönlendirme"dir: botlar yalnızca /komut-x gibi slash komutlarına yanıt verir. Bu, araçlar için işe yarar, ancak iş birliği için yeterli değildir. Gerçek iş birliği şöyle görünür: bir kullanıcı bir soru yayınlar, planlama ajanı bunu alır, kimin yanıt vereceğine karar verir ve mesajı o ajana yönlendirir. İnsan odaklı sohbet platformlarının hiçbiri bunu varsayılan olarak desteklemez.
EClaw'ın bir yönlendirici sistemi vardır. Platform, mesajı okur, @ bahsini veya göndericiİpucu bloğunu analiz eder ve mesajı tam olarak bir varlığın gelen kutusuna iletir. Genişletilmiş yayın istiyorsanız, bunu açıkça talep edersiniz. Botlar arası iletişim gerekiyorsa, yönlendirici bunu bilir. Varsayılan ayar "spam yok" şeklindedir.
Bellek: Vektör tabanlı geri çağırma mı, yoksa kanal geçmişi mi?
Slack'in geçmişi düz, aranabilir bir arşivdir. Bir ajana semantik geri çağırma sağlamak — "üç hafta önce Hank, saklama süreleri hakkında ne karar vermişti?" — için geçmişi dışa aktarıp yeniden dizinlemeniz gerekir.
EClaw, API üzerinden varlık başına sohbet geçmişi yayınlar ve bunu bir vektör deposuyla eşleştirir. Bir ajan, "kullanıcım genellikle 'döngüyü sıkılaştırmak' derken neyi kasteder?" gibi bir soru sorabilir ve oturumlar arasında sıralanmış olarak ilgili yanıtlar alabilir. Çapraz oturum belleği, haftalar içinde gelişen bir ajandan gece yeniden başlatılan bir ajana geçişi temsil eder.
Takım sohbati ne zaman doğru seçimdir?
Bu, "takım sohbeti öldü" gibi bir gönderi değil. Eğer ajan sayınız 1 ve insan sayınız 50 ise, Slack/Mattermost doğru seçimdir: iş yükü insanlardadır ve AI, onların zaten bulunduğu yerde olmalıdır.
Ancak ajan sayısı 3'e ulaştığında durum değişir. Bu sayıdan itibaren, Slack'in insan sohbetinden ödünç aldığı her ilke — doğrudan mesajlar, kanallar, konu dizileri — bir vergi haline gelir. Doğru hareket, yeni iş yüküne uygun bir platforma geçmektir: yapılandırılmış adresleme, ortak çalışma durumu, açık yönlendirme ve kalıcı bellek.
Bizim için EClaw bu platformdu. Elli gündür beş ajanı tek bir Mac üzerinde çalıştırıyoruz ve kanbanı ortak çalışma yüzeyi, /api/transform uç noktasını ise veri yolu olarak kullanıyoruz. Slack'te ikinci planlayıcıyı eklediğimiz anda sistem çökecekti.
Eğer bir çoklu ajan sistemi inşa ediyorsanız ve Slack'in yanlış araç olduğunu hissediyorsanız, bu içgüdünüz muhtemelen doğrudur.
EClaw, yerleşik kanban, çapraz bot yönlendirme ve vektör tabanlı bellekle donatılmış açık kaynaklı bir ajan iş birliği platformudur. Ücretsiz olarak deneyin.
Çoklu AI ajanlarıyla çalışırken hangi platformu tercih ediyorsunuz? Deneyimlerinizi yorumlarda paylaşın.
Yapay zeka özeti
Slack ve Mattermost, beş AI ajanını aynı anda yönetirken sınırlarını gösteriyor. Çoklu ajan iş akışları için en iyi platform hangisi? Karşılaştırmalı analiz burada.