iToverDose/Yazılım· 17 HAZIRAN 2026 · 12:03

Jetson’da Beş Küçük Çoklu Modelli AI’yi Test Ettik: En Hızlısı En İyi Seçenek Değildi

Jetson cihazında çalışan endüstriyel AI sistemleri için en uygun çoklu modelli model hangisi? Hızın performansın yerini almadığı gerçek dünya uygulamalarında karşılaştırma sonuçları ve endüstriyel AI’nin geleceği hakkında ayrıntılar.

DEV Community3 dk okuma0 Yorumlar

Endüstriyel AI’nın geleceği, fabrika zeminlerinde ve üretim hatlarında. Üretim hattındaki bir çalışanın akıllı gözlükle makineyi görüntülediğinde anında yapılandırılmış aksiyon kartlarına ulaşması gerekiyor. Bu sadece bir sohbet uygulaması değil; sistemin tüm süreçleri izleyebilmesi, insan onayına sunabilmesi ve bakım, kalite kontrol ya da EHS gibi departmanlara veri aktarabilmesi şart.

Geliştirmekte olduğum WearEdge Pro adlı endüstriyel kenar AI çalışma zamanı, bu senaryoyu yerel Jetson cihazlarında çalıştırabilen bir altyapı sunuyor. Bu sistemde karar vermek için beş farklı küçük çoklu modelli AI modelini test ettik. Sonuçlar, en hızlı modelin her zaman en iyi seçim olmadığını gösterdi.

Jetson’da Test Edilen Beş Model ve Ölçütler

Testler, aynı Jetson ortamında ve aynı OpenAI uyumlu yerel llama.cpp uç noktası üzerinden gerçekleştirildi. Her model beş farklı görev ve görüntü üzerinde değerlendirildi:

  • Bakım talimatları
  • Kalite kontrol denetimi
  • Üretim hattı değişimi
  • Çalışma talimatları
  • Tehlike incelemesi

Tüm modeller 560 görüntü belirteci (token) ile çalıştırıldı. Qwen2.5-VL modeli içinse görüntüye dayalı yerelleştirmeyi iyileştirmek amacıyla 1024 belirteçlik bir test de uygulandı.

Performans Sonuçları: Hız mı Doğruluk mu?

| Model | Tamamlanan Görevler | Ortalama Gecikme | Değerlendirme | |-------|---------------------|-------------------|--------------| | Gemma 4 E2B | 5/5 | 37.51 saniye | Ürün baz hattı için en iyi seçim | | Qwen2.5-VL-3B | 5/5 | 39.72 saniye | En iyi OCR çözümü | | SmolVLM2-2.2B | 5/5 | 12.84 saniye | En hızlı, ancak yerelleştirme zayıf | | InternVL3-2B | 5/5 (4096 bağlam) | 80.35 saniye | Baz hattı için çok yavaş ve riskli | | Qwen2.5-Omni-3B | 5/5 | 50.09 saniye | Gelecekteki ses/video entegrasyonu için ilginç |

SmolVLM2-2.2B en hızlı model olarak öne çıktı. Ancak yanıtları endüstriyel operatörlere yönelik rehberlik açısından oldukça genel ve yer yer boşluklarla doluydu. Örneğin üretim hattı değişimi ve çalışma talimatı görevlerinde yer tutucu ifadelerle karşılaşıldı.

Qwen2.5-VL-3B ise en etkileyici rakip olarak belirdi. Üretim hattı değişimi görevinde LABELER-FL1 ve SKU-C500 gibi etiketleri doğru bir şekilde okuyarak Gemma 4 E2B’de görülen makine etiketi yanlışlarını düzeltti. Ayrıca kalite kontrol denetimi görevlerinde de faydalı kusur puanları üretti. Saf OCR ya da görsel denetim odaklı bir asistana ihtiyaç varsa bu model ciddiye alınmalı.

InternVL3-2B ise token hızının her şey olmadığını gösterdi. 2048 bağlamda üç görevde hata ile karşılaşıldı. Bağlamı 4096’ya çıkarınca tüm görevleri tamamladı, ancak gecikme süresi çok yüksekti ve bir kalite kontrol yanıtı güvenlik riski taşıyan bir ifade içeriyordu.

Qwen2.5-Omni-3B temiz bir şekilde çalıştı ancak en büyük potansiyelini ses ve video tabanlı iş akışlarında gösterecek gibi görünüyor. Mevcut görüntü+metin endüstriyel baz hattında rakip olmaktan uzak.

Neden Hala Gemma 4 E2B?

Gemma 4 E2B her mikro testte birinci olmadı. Ancak WearEdge Pro sistemine entegrasyon açısından en uygun model oldu. Bunun nedenleri:

  • Yerel Jetson dağıtımına mükemmel uyum
  • Yapılandırılmış çoklu modelli sorgulara destek
  • Uzun bağlamlı iş akışı tasarımı
  • Fonksiyon çağırma odaklı mimari
  • Belirleyici koruma mekanizmaları
  • İnsan onayı süreci
  • Yapılandırılmış aksiyon kartları
  • Denetim kayıtları

Endüstriyel bir ortamda "hızlı ve akıcı" olmak yeterli değil. Modelin, sistem içinde şu soruları yanıtlayabiliyor olması gerekiyor:

  • Bu yanıt hangi görüntüden üretildi?
  • Hangi rotadan geldi?
  • Hangi zorunlu alanları karşılıyor?
  • Aksiyon sınırları neler?
  • Denetim kaydı nasıl oluşturulacak?

İşte bu nedenle Gemma 4 E2B, WearEdge Pro’nun ana baz hattı olarak kaldı. Qwen2.5-VL ise OCR odaklı dallarda ciddi bir rakip konumuna yükseldi.

Endüstriyel AI Seçiminde Kritik Ders

Kenar AI modeli seçimi, liderlik tablolarından çok daha fazlasını gerektiriyor. Doğru soru şu olmalı:

"Bu model yerel olarak çalışabilir mi? Kanıtları anlayabilir mi? İş akışı sınırlarına uyabilir mi? Ve sistem tarafından denetlenebilir bir aksiyon üretebilir mi?"

Bugün WearEdge Pro için yanıt hâlâ Gemma 4 E2B olarak veriliyor. Qwen2.5-VL gelecek A/B testlerinde ciddi bir rakip olarak konumlanıyor. Her benchmark sonucunun aynı şeyi temsil etmediğini unutmadan, testlere devam etmek en sağlıklı yaklaşım olacak.

Bu karşılaştırma ve sonuçlar hakkında daha fazla ayrıntıya, Hackster.io platformundaki ilgili yayın üzerinden ulaşabilirsiniz.

Yapay zeka özeti

Jetson cihazlarında beş farklı küçük çoklu modelli AI modelini test eden WearEdge Pro, en hızlı modelin her zaman en iyi seçenek olmadığını gösterdi. Performans karşılaştırması ve endüstriyel AI’nın geleceği hakkında detaylar.

Yorumlar

00
YORUM BIRAK
ID #QD1LLS

0 / 1200 KARAKTER

İnsan doğrulaması

4 + 3 = ?

Editör onayı sonrası yayına girer

Moderasyon · Spam koruması aktif

Henüz onaylı yorum yok. İlk yorumu sen bırak.