Son Cumartesi uyandığımda, yapay zeka aracım 14 restoran puanını Indiranagar'da gözden geçirdi, paylaşılan bir Google Sheets'i güncelledi, bir haftadır ihmal ettiğim 20 sayfalık bir PDF'i imzaladı ve sunucu günlüklerimi temizlemek için bir bash betiği yazdı.
Bunları yapmasını istemedim. Sadece yapıyor.
Meet OpenClaw — uzun süredir kendi yaşam alanından çalışan, Discord'a bağlı, 24/7 çalışan otonom aracım. Hafızamı yönetiyor, araştırma yapıyor, kod yazıyor, belgeleri düzenlıyor, Bangalore'de hafta sonu için en iyi yerleri canlı puanları tarayarak buluyor — temelde hayatımın yarısını otomatik pilotla yönetiyor.
Kurulum
Yaşadığım odada neler çalışıyor:
Raspberry Pi → OpenClaw, otonom aracımı çalıştırıyor. Discord'dan girdi alıyor, bağlamı, hafızayı ve her şeyi düzenlıyor.
Mac Mini → Beyin çiftliği. Üç şey çalıştırıyor: Ollama ile qwen2.5-coder:7b — ağımı terk etmeyen yerel bir kodlama modeli
AgentGateway — Google'dan açık kaynaklı bir AI ağ geçidi, yönlendirme, kimlik doğrulama, gözlemlenebilirlik işlemlerini yönetiyor
Hafif bir Python yönlendirici — ~50 satır kodla yazdığım "niyet sınıflandırıcı"
Sihir? OpenClaw'ın bunların hiçbirini bilmesi gerekmiyor. Sadece bir uç noktaya bir istek gönderiyor. Arka planda, sistem geri kalanını hallediyor.
Mimarisi
Üç model. Üç fiyat noktası. Birleştirilmiş bir uç nokta. OpenClaw sadece istek gönderiyor ve unutuyor.
Neden AgentGateway?
Birkaç seçeneği değerlendirdim — ham Envoy, Lua betikleri ile Nginx, hatta sıfırdan bir proxy oluşturmak. Ancak AgentGateway beberapa nedenlerden dolayı öne çıktı:
- Protokol çevirisi — Ön tarafta OpenAI uyumlu API konuşur, ancak arka tarafta Gemini, Vertex AI, Bedrock, Ollama ve daha fazlasıyla konuşabilir. Sağlayıcıya özgü hiçbir kod satırı yazmam gerekmez.
- Arka uç kimlik doğrulaması — API anahtarları ağ geçidi düzeyinde yönetilir. OpenClaw hiçbir API anahtarını göremez veya depolayamaz. Sadece backendAuth: key: $GEMINI_API_KEY yapılandırmasını ayarlayıp geri kalanını halleder.
- Model takma adları — OpenClaw her istekte "inteli-llm" modelini gönderir. AgentGateway sessizce bunu qwen2.5-coder:7b, gpt-4o veya gemini-2.5-flash'e göre rotaya göre çevirir. İstemci bundan haberdar değildir.
- Gözlemlenebilirlik — Her istek, sağlayıcı adı, model, token sayısı ve gecikmeyle günlüğe kaydedilir. AçıkAI'ye giden tokenlerin sayısından ziyade yerel olarak kalan tokenlerin sayısını görebilirim.
- İstemci koruması ve hız sınırı — İçerik moderasyonu için webhook tabanlı ve hız sınırı gibi gelişmiş özellikler sunar.
50 Satırlık Yönlendirici
AgentGateway önüne bir FastAPI proxy yazdım. İşte ne yapıyor:
- Gelen OpenAI uyumlu isteği yakalar
- Sohbetin son mesajını okur
- Anahtar kelime eşleştirmesi ve.prompt uzunluğu heuristiklerini kullanarak niyeti sınıflandırır: İçerir
code,python,script,function,bug? → kodlama
İçerir think, analyze, reasoning, deduce? veya prompt > 400 karakter? → akıl yürütme
Her şey else? → basit
- x-intent HTTP başlığını enjekte eder
- İsteyi değişmeden AgentGateway'e iletir
Bu kadar. Sınıflandırma için hiçbir ML modeli, vektör veritabanı veya anlamsal benzerlik yok. Sadece %90 doğru çalışan eski usul anahtar kelime eşleştirmesi — ve bu ev laboratuvarı için yeterli.
Maliyet Denklemleri
Bu kurulum gerçekten bana neler kazandırıyor:
Niyet Model Nerede Çalışır Maliyet (1M token başına)
Kodlama qwen2.5-coder:7b Yerel (Ollama) $0
Basit Q&A gemini-2.5-flash Google Cloud ~$0.15
Derin Akıl Yürütme gpt-4o AçıkAI ~$2.50
Bu kurulumdan önce her istek bir bulut API'sine gidiyordu. Şimdi, yaklaşık %60-70'lik查询 yerel olarak kalıyor — kodlama soruları, hızlı bakışlar, basit düzenleme görevleri. Bunlar hızlı, ücretsiz ve özel.
Pahalı akıl yürütme modeli sadece gerçekten ihtiyacım olduğunda çağrılıyor. Ve orta seviye Gemini her şeyi arada hallediyor.
Aylık API faturam önemli ölçüde düştü ve yerel yanıtlar aslında daha hızlı.
Yapay zeka özeti
Kendi yaşam alanından sürekli çalışan otonom yapay zeka aracını geliştirin. Yerel ve bulut tabanlı modelleri birleştirerek maliyetinizi azaltın.