MCP sunucularının token kullanımını ölçtüğümde şaşırtıcı bir şey keşfettim. Tokenlerin meisteninin ajanın sözünü bile etmeden harcandığını gördüm. Bunun nedeni, her bir MCP sunucusunun bağlandığı anda tüm araç tanımlarının bağlam penceresine yüklenmesiydi. İsimler, açıklamalar, parametre şemaları, enum değerleri - hepsi, her bir konuşma döngüsünde yükleniyordu.
Dört farklı MCP sunucusu için araç tanımı token yükünü ölçtüğümde, maliyetin ne kadar yüksek olduğunu gördüm. PostgreSQL sunucusu için yaklaşık 35 token, Google Maps sunucusu için yaklaşık 704 token, GitHub sunucusu için yaklaşık 4.242 token ve GitHub (tam) sunucusu için yaklaşık 55.000 token harcandı.
Bu maliyetin sadece araç tanımlarından kaynaklandığını ve 실제 araç çağrılarının ek token tüketimi olduğunu unutmayın.
Bir araç tanımı bile 820 token tüketebiliyor. Bir iş API'si gibi bir hesaplama platformu, faturalama, insan kaynakları, maaş ödemesi, zaman takibi ve satış yönetimi için 270'den fazla araç tanımlayabilir. Bu, yaklaşık 17.500 token tüketimi anlamına geliyor.
Üç farklı hizmeti aynı anda bağlayıp 143.000 token tüketebilirsiniz. Bu, bağlam pencerenizin %71'ini doldurur ve ajanınızın düşünme alanı kısıtlanır.
Token maliyeti sorun değilmiş gibi görünse de, Claude'ın çıktı kalitesi 50'den fazla araç tanımı yüklendiğinde belirgin olarak düşüyor. Model, araçlara atıfta bulunarak asıl soruyu cevaplamayı bırakıyor.
Üç strateji ile token tüketimini %95 azaltabilirsiniz:
- Sadece gerekli araçları açığa çıkarın.
- Açıklamaları daraltın.
- Sadece gerektiğinde bağlayın.
Ocak 2026'da MCP Araç Arama adlı bir çözüm ortaya çıktı. Araç tanımları bağlam penceresinin %10'unu aştığında, istemci otomatik olarak yüklemeyi erteliyor. Bağlam penceresine tüm şemayı 덤프 yapmak yerine, model araçları talep üzerine keşfediyor ve yükleniyor.
Erken raporlar, %95'lik bir token maliyeti azalmasına işaret ediyor. Şema şişkinliği sorunu, altyapı düzeyinde çözülüyor.
Yapay zeka özeti
MCP sunucularının token kullanımını ölçtüğümde şaşırtıcı bir şey keşfettim. Tokenlerin meisteninin ajanın sözünü bile etmeden harcandığını gördüm. Token tüketimini azaltmak için üç strateji