AI ajanlarının başarısız olduğu durumlar genellikle altta yatan modelin akıl yürütme yeteneklerinin yetersizliğinden kaynaklandığı düşünülür. Ancak gerçekte, geri alma arayüzü tarafından sağlanan sınırlı bilginin genellikle birincil sınırlayıcı faktör olduğu görülür.
Çoklu üniversiteden araştırmacılar, AI ajanlarının gömme modellerini tamamen atlayarak, standard komut satırı araçlarını kullanarak ham verilere doğrudan erişmesine olanak tanıyan bir teknik olan doğrudan korpus etkileşimi (DCI) adı verilen bir yöntemi öneriyorlar.
Klasik Geri Alma Sistemlerinin Sınırları
Klasik geri alma sistemlerinde, belgeler parçalanır, vektör représentasyonlarına (veya gömmelere) dönüştürülür ve vektör veritabanında offline olarak dizinlenir. Bir AI sistemi bir sorgu işlediğinde, bir geri alıcı tüm veritabanını süzerek sorguya karşılık gelen belgelerin bir listesini döndürür. Tüm kanıtlar, aşağı akışta akıl yürütme gerçekleşmeden önce bu puanlama mekanizmasından geçmek zorundadır.
Ancak modern AI uygulamaları çok daha fazlasını talep etmektedir. 'Yoğun geri alma, geniş anlamsal geri çağırma için çok faydalıdır, ancak bir ajan çok adımlı bir görevi çözmek zorunda kaldığında, genellikle exact dizeleri, sayıları, sürümleri, hata kodlarını, dosya yollarını veya seyrek kombinasyonları aramak zorundadır' diyor araştırmacılar. 'Bu uzun kuyruklu ayrıntılar, tam olarak anlamsal benzerliğin kırılgan olduğu yerlerdir.'
Doğrudan Korpus Etkileşimi
Bu doğrudan erişim, şirket ortamlarında temel bir sorunu ele alır: veri eskimesi. Gömme dizinleri her zaman belirli bir anda alınmış bir anlık görüntüdür ve oluşturmak ve bakımını yapmak için önemli bir hesaplama ve zaman alır.
'Çoklu şirket ortamında, veriler sabit bir belge koleksiyonu değildir. Günlük finansal raporlar, canlı günlükler, biletler, kod taahhütleri, yapılandırma dosyaları, olay zaman çizelgeleri ve iç belgeler gibi sürekli değişen verilerdir' diyor araştırmacılar. DCI, ajanın dünün vektör dizinine değil,当前 çalışma alanının mevcut durumuna akıl yürütmesine olanak tanır.
Ajan, bir terminal benzeri ortamda çalışır ve gözlemleri ham araç çıktılarıdır. DCI tarafından sağlanan temel araçlar az ancak yüksek ifade edicidir. Ajanlar, 'bul' ve 'glob' gibi komutları kullanarak dizin yapılarını gezinir ve dosyaları bulurlar. Exact eşleştirmek için 'grep' ve 'rg' gibi araçları kullanarak belirli anahtar kelimeleri, düzenli ifade kalıplarını ve exact dizeleri bulurlar. Yerel inceleme gerektiğinde, 'head', 'tail', 'sed', 'cat' gibi araçlar ve hafif Python betikleri, ajanın eşleşme etrafındaki bağlamı görmesine veya belirli dosya bölümlerini okumasına olanak tanır.
Ajan, bu araçları komut satırı boruları aracılığıyla birleştirerek karmaşık arama mantığını tek adımda gerçekleştirebilir. Bir ajan, bir dosyada bir terimi arar ve çıktıyı ikinci bir terimi aramak için borular. Belirli bir dosya türünü bulur, 'rapor' gibi bir anahtar kelimeyi arar ve '2024' gibi bir yılı süzgecir. Ayrıca, bir anahtar kelime eşleşmesinin etrafındaki exact satırları inceleyerek bir hipotezi hemen doğrulayabilir.
DCI, anlamsal yorumlamayı doğrudan ajana devreder ve gömme tabanlı benzerlik aramasına güvenmez. Ajan, hipotezler oluşturabilir, exact leksiksel kalıpları test edebilir ve geleneksel anlamsal geri alıcıların kaçırabileceği ayrıntılı bilgiyi çıkarabilir.
Araştırmacılar, bu sistemin iki versiyonunu öneriyorlar. DCI-Ajan-Lite, GPT-5.4 nano modeline dayalı hafif, düşük maliyetli bir kurulum olarak tasarlanmıştır ve salt ham terminal etkileşimlerine gibi bash komutları ve temel dosya okumalarına sınırlıdır. DCI-Ajan-CC, daha yüksek performanslı bir sürümdür ve daha fazla hesaplama bütçesine sahip ekiplere tasarlanmıştır. Claude Code tarafından desteklenen Claude Sonnet 4.6'da çalışır. Claude Code, daha güçlü promtlama, daha güçlü araç orkestrasyonu ve daha iyi yerleşik bağlam işleme sağlar ve bu da ajanın karmaşık, çok adımlı aramalar sırasında stabilitesini artırır.
DCI Etkin
Araştırmacılar, DCI'yiBrowseComp-Plus gibi ajans arama benchmarkları, tek adımlı ve çok adımlı akıl yürütme ile bilgi yoğun QA, ve bilimsel gerçek kontrolü gerektiren görevlerde bilgi geri çağırma sıralaması gibi görevlerde test ettiler.
DCI, üç temel karşılaştırmaya karşı test edildi. İlki, açık ağırlıklı geri alma ajanları ve standart geri alıcılarla birleştirilmiş GPT-5 ve Claude Sonnet 4.6 gibi ön model powerli ajanları içeriyordu. İkinci temel, klasik seyrek geri alıcılar ve OpenAI'nin text-embedding-3-large ve Qwen3-Embedding-8B gibi yoğun geri alıcıları içeriyordu. Üçüncü temel, ReasonRank-32B ve Rank-R1 gibi yüksek performanslı akıl yürütme odaklı yeniden sıralayıcıları içeriyordu.
Araştırmacılara göre, DCI sistematically olarak temel karşılaştırmalara göre daha iyi performans gösterdi. DCI, karmaşık Brows
DCI, AI ajanlarının daha verimli ve etkili bir şekilde bilgiyi işleyebilmeleri için bir terminal benzeri ortam sunar. DCI'nin gelecekte daha da geliştirilmesi ve yaygınlaştırılmasıyla birlikte, AI uygulamalarının performansı ve verimliliği artabilir.
Yapay zeka özeti
AI ajanları daha verimli ve etkili bir şekilde bilgiyi işleyebilmeleri için bir terminal benzeri ortam sunan DCI yöntemi


