Geçtiğimiz ay sadece üç gün içinde basit bir Scikit-learn modeli için özel bir API katmanı oluşturmuştum. Mantık zor değildi; müşteri kaybını tahmin eden bir modelimiz vardı ve Cursor aracının bu veriler üzerinde çıkarım yapabilmesini istiyordum. Ancak sonuçları manuel olarak JSON dosyaları üzerinden kopyalayıp yapıştırarak aktarmak yerine, modeli doğrudan aracın kullanımına sunmak istiyordum.
İşte bu tip durumlar mühendislik dünyasında sıkça karşılaşılan bir tuzak haline geldi: Entegrasyon Maliyeti. Modeliniz çalışıyor, ağırlıklar dağıtılmış durumda ve bir AI ajanı teorik olarak bunu kullanabilir durumda. Ancak ajanınızı kullanmaya kalkıştığınızda karşınıza FastAPI uç noktaları, Pydantic doğrulama, kimlik doğrulama ve en kötüsü de eğitim setindeki her değişiklikte araç tanımlarını güncelleme zorunluluğu çıkıyor.
İşte bu tutkal kodları (glue code) denen şeyler kırılgan, sıkıcı ve en önemlisi ölçeklenemez durumda. Eğer ajan odaklı bir iş akışı oluşturuyor ve iki hizmete köprü görevi gören Python betikleri yazıyorsanız, doğru yolda değilsiniz demektir.
MCP Dönemi: API Katmanlarının Ölümü
Model Context Protocol’un (MCP) yaygınlaşmasıyla birlikte değer önerisi tamamen değişti. Artık "Bu veriyi nasıl sunarım?" sorusundan çok, "Bu ajana nasıl eller verebilirim?" sorusuna odaklanıyoruz.
Modelbit ve MCP ile artık bir uç noktaya ihtiyacınız kalmıyor. Sadece modelinizin bulunduğu adrese ihtiyacınız var.
Modelbit dağıtımlarını Vinkius üzerinden MCP’ye bağlamak için yaptığım kurulum oldukça basitti:
- Abone olun
- Tokeni alın
- Tokeni Claude veya Cursor’a yapıştırın
- İşlem tamam
OAuth geri çağrılarına, boşta bekleyen sunucusuz fonksiyonlara veya LLM’den modele JSON aktarımı yapan katmanlara gerek kalmadı. MCP aracılığıyla get_inference aracını kullanırken sadece bir URL çağırmıyorsunuz. Ajanınızın muhakeme yeteneğini doğrudan hesaplama gücüyle genişletmiş oluyorsunuz.
Ajan karmaşık bir JSON nesnesini—örneğin dağınık bir PDF’den ya da bir veritabanı sorgusundan çıkarılmış bir veriyi—doğrudan Scikit-learn veya PyTorch modelinize aktarabilir.
Gerçek Dünya Senaryoları: Metinlerden Ötesi
AI ajanları hakkında yapılan yaygın bir yanılgı, sadece metin dizeleriyle çalışabileceklerine dair varsayımdır. Oysa gerçek MLOps uygulamaları diziler, tensörler ve yapılandırılmış meta verilerle çalışır. Modelbit MCP, get_inference aracı sayesinde JSON formatındaki verileri doğrudan kabul ederek bu ihtiyacı karşılıyor.
İşte iki gerçek dünya örneği:
1. Gerçek Zamanlı Tahminleme Kuzey bölgesi için satış tahmin modelinizin Modelbit üzerinde dağıtılmış olduğunu varsayalım. Geçtiğimiz ayın gelir verilerini manuel olarak tarayıp ardından bir ajandan özetlemesini istemek yerine, doğrudan ajana şunu söyleyebilirsiniz:
Call the 'sales_forecast' model with data: {'region': 'north', 'month': 12}Ajan aracı kullanır, Modelbit uç noktasına bağlanır ve şu yanıtı alır:
Model, Kuzey bölgesi için Aralık ayında 450.000$ gelir öngörüyor.
Tüm mantık ajanınızın bağlamı içinde kalır. Kırılabilecek ara katmanlar söz konusu değildir.
2. Meta Verilerle Bilgisayar Görüsü Görüntü sınıflandırma (örneğin image_classifier) üzerinde çalışıyorsanız, piksel dizileri veya özellik vektörlerini doğrudan JSON olarak aktarabilirsiniz. Versiyon kontrollü bir dağıtımda (örneğin v2) ajan girdi dizisini ilettiğinde şu yanıtı alır:
Model, nesneyi %98 güvenle 'yüksek çözünürlüklü uydu görüntüsü' olarak tanımladı.
Buradaki güç versiyon kontrolünde yatıyor. Ajanınıza açıkça 'v1' veya 'latest' kullanmasını söyleyebilirsiniz. Bu, girdi beklentileri farklı olan eski bir modelin kullanılması riskinin bulunmadığı üretim hatlarında kritik önem taşıyor.
Güvenlik Konusu: Göz Ardı Edilemez Gerçek
Senior mühendislerin çoğu—ben de dahil—'ajanımın makine öğrenimi modellerime erişmesine izin vermek' ifadesini duyunca tedirgin oluyor. Bu bir güvenlik kâbusu gibi görünüyor. Bir ajan çıkarım tetikleyebiliyorsa, yetkisiz veri sızdırma da yapabilir mi? İç altyapınıza karşı SSRF saldırıları gerçekleştirebilir mi?
İşte bu yüzden Vinkius’u tam olarak bu şekilde tasarladım. MCP sunucularımız izole V8 sandıklarında çalışıyor. MCP aracı kullanıldığında arka planda sekiz farklı yönetişim politikası devreye giriyor:
- Veri Kaybı Önleme (DLP)
- SSRF önleme
- HMAC denetim zincirleri
- Acil durum kapatma anahtarları
Özellikle hassas, ticari sır niteliğindeki modellerin yer aldığı bir Modelbit çalışma alanına ajan erişimi verirken, yürütme bağlamının kilitli olduğundan emin olmanız gerekiyor. Ajanınızın akıl yürütme süreci API anahtarınızı sızdırmamalı ya da iç ağınızı araştırmamalıdır. Bu sınırları altyapı çözmelidir.
Sonuç: Geleceğe Doğru
'Bu model var' ile 'Ajanım bunu kullanabilir' arasındaki boşluk giderek küçülüyor. MLOps ile ajan odaklı iş akışları artık aynı disiplin altında birleşiyor. Modelleri sadece insanların kullanması için uç noktalara dağıtmıyorsunuz; ajanlarınızın hassas görevleri yerine getirebilmesi için dağıtıyorsunuz.
Eğer hâlâ Flask ya da FastAPI kullanarak Python modelleriniz için özel katmanlar yazıyorsanız, durun. Modelbit MCP’sini doğrudan bağlayın, Vinkius’u bağlantı ve güvenlik için kullanın ve bu kurtarılan mühendislik süresini asıl önemli şeye harcayın: modelinizin doğruluğunu artırmaya. İşte asıl değer burada yatıyor.
Yapay zeka özeti
Model Context Protocol (MCP) kullanarak makine öğrenimi modellerinizi doğrudan AI ajanlarınıza bağlayın. API katmanlarına ve tutkal kodlarına veda edin; güvenli, ölçeklenebilir entegrasyonun yeni yolunu keşfedin.