Jetson’da Beş Küçük Çoklu Modelli AI’yi Test Ettik: En Hızlısı En İyi Seçenek Değildi

Endüstriyel AI’nın geleceği, fabrika zeminlerinde ve üretim hatlarında. Üretim hattındaki bir çalışanın akıllı gözlükle makineyi görüntülediğinde anında yapılandırılmış aksiyon kartlarına ulaşması gerekiyor. Bu sadece bir sohbet uygulaması değil; sistemin tüm süreçleri izleyebilmesi, insan onayına sunabilmesi ve bakım, kalite kontrol ya da EHS gibi departmanlara veri aktarabilmesi şart.

Geliştirmekte olduğum WearEdge Pro adlı endüstriyel kenar AI çalışma zamanı, bu senaryoyu yerel Jetson cihazlarında çalıştırabilen bir altyapı sunuyor. Bu sistemde karar vermek için beş farklı küçük çoklu modelli AI modelini test ettik. Sonuçlar, en hızlı modelin her zaman en iyi seçim olmadığını gösterdi.

Jetson’da Test Edilen Beş Model ve Ölçütler

Testler, aynı Jetson ortamında ve aynı OpenAI uyumlu yerel llama.cpp uç noktası üzerinden gerçekleştirildi. Her model beş farklı görev ve görüntü üzerinde değerlendirildi:

Bakım talimatları
Kalite kontrol denetimi
Üretim hattı değişimi
Çalışma talimatları
Tehlike incelemesi

Tüm modeller 560 görüntü belirteci (token) ile çalıştırıldı. Qwen2.5-VL modeli içinse görüntüye dayalı yerelleştirmeyi iyileştirmek amacıyla 1024 belirteçlik bir test de uygulandı.

Performans Sonuçları: Hız mı Doğruluk mu?

| Model | Tamamlanan Görevler | Ortalama Gecikme | Değerlendirme | |-------|---------------------|-------------------|--------------| | Gemma 4 E2B | 5/5 | 37.51 saniye | Ürün baz hattı için en iyi seçim | | Qwen2.5-VL-3B | 5/5 | 39.72 saniye | En iyi OCR çözümü | | SmolVLM2-2.2B | 5/5 | 12.84 saniye | En hızlı, ancak yerelleştirme zayıf | | InternVL3-2B | 5/5 (4096 bağlam) | 80.35 saniye | Baz hattı için çok yavaş ve riskli | | Qwen2.5-Omni-3B | 5/5 | 50.09 saniye | Gelecekteki ses/video entegrasyonu için ilginç |

SmolVLM2-2.2B en hızlı model olarak öne çıktı. Ancak yanıtları endüstriyel operatörlere yönelik rehberlik açısından oldukça genel ve yer yer boşluklarla doluydu. Örneğin üretim hattı değişimi ve çalışma talimatı görevlerinde yer tutucu ifadelerle karşılaşıldı.

Qwen2.5-VL-3B ise en etkileyici rakip olarak belirdi. Üretim hattı değişimi görevinde LABELER-FL1 ve SKU-C500 gibi etiketleri doğru bir şekilde okuyarak Gemma 4 E2B’de görülen makine etiketi yanlışlarını düzeltti. Ayrıca kalite kontrol denetimi görevlerinde de faydalı kusur puanları üretti. Saf OCR ya da görsel denetim odaklı bir asistana ihtiyaç varsa bu model ciddiye alınmalı.

InternVL3-2B ise token hızının her şey olmadığını gösterdi. 2048 bağlamda üç görevde hata ile karşılaşıldı. Bağlamı 4096’ya çıkarınca tüm görevleri tamamladı, ancak gecikme süresi çok yüksekti ve bir kalite kontrol yanıtı güvenlik riski taşıyan bir ifade içeriyordu.

Qwen2.5-Omni-3B temiz bir şekilde çalıştı ancak en büyük potansiyelini ses ve video tabanlı iş akışlarında gösterecek gibi görünüyor. Mevcut görüntü+metin endüstriyel baz hattında rakip olmaktan uzak.

Neden Hala Gemma 4 E2B?

Gemma 4 E2B her mikro testte birinci olmadı. Ancak WearEdge Pro sistemine entegrasyon açısından en uygun model oldu. Bunun nedenleri:

Yerel Jetson dağıtımına mükemmel uyum
Yapılandırılmış çoklu modelli sorgulara destek
Uzun bağlamlı iş akışı tasarımı
Fonksiyon çağırma odaklı mimari
Belirleyici koruma mekanizmaları
İnsan onayı süreci
Yapılandırılmış aksiyon kartları
Denetim kayıtları

Endüstriyel bir ortamda "hızlı ve akıcı" olmak yeterli değil. Modelin, sistem içinde şu soruları yanıtlayabiliyor olması gerekiyor:

Bu yanıt hangi görüntüden üretildi?
Hangi rotadan geldi?
Hangi zorunlu alanları karşılıyor?
Aksiyon sınırları neler?
Denetim kaydı nasıl oluşturulacak?

İşte bu nedenle Gemma 4 E2B, WearEdge Pro’nun ana baz hattı olarak kaldı. Qwen2.5-VL ise OCR odaklı dallarda ciddi bir rakip konumuna yükseldi.

Endüstriyel AI Seçiminde Kritik Ders

Kenar AI modeli seçimi, liderlik tablolarından çok daha fazlasını gerektiriyor. Doğru soru şu olmalı:

"Bu model yerel olarak çalışabilir mi? Kanıtları anlayabilir mi? İş akışı sınırlarına uyabilir mi? Ve sistem tarafından denetlenebilir bir aksiyon üretebilir mi?"

Bugün WearEdge Pro için yanıt hâlâ Gemma 4 E2B olarak veriliyor. Qwen2.5-VL gelecek A/B testlerinde ciddi bir rakip olarak konumlanıyor. Her benchmark sonucunun aynı şeyi temsil etmediğini unutmadan, testlere devam etmek en sağlıklı yaklaşım olacak.

Bu karşılaştırma ve sonuçlar hakkında daha fazla ayrıntıya, Hackster.io platformundaki ilgili yayın üzerinden ulaşabilirsiniz.

Yapay zeka özeti

Jetson cihazlarında beş farklı küçük çoklu modelli AI modelini test eden WearEdge Pro, en hızlı modelin her zaman en iyi seçenek olmadığını gösterdi. Performans karşılaştırması ve endüstriyel AI’nın geleceği hakkında detaylar.

Etiketler

#jetson çoklu modelli ai #endüstriyel ai modelleri #kenar ai karşılaştırma #gemma 4 e2b performansı #qwen2.5-vl-3b değerlendirmesi #smolvlm2-2.2b test sonuçları #internvl3-2b gecikme süresi #qwen2.5-omni-3b endüstriyel kullanım

Jetson’da Beş Küçük Çoklu Modelli AI’yi Test Ettik: En Hızlısı En İyi Seçenek Değildi

Jetson’da Test Edilen Beş Model ve Ölçütler

Performans Sonuçları: Hız mı Doğruluk mu?

Neden Hala Gemma 4 E2B?

Endüstriyel AI Seçiminde Kritik Ders

Yorumlar

Claude Kod’un Kimliğini Sahtelediğini Nasıl Anladım?

Claude Code hook'larını doğru şekilde kullanmanın yolu

Unicode’un Gizli Dünyası: Font Değilmiş, Karakter Takasıymış!