iToverDose/Girişim· 29 MAYIS 2026 · 20:00

Pinterest, AI maliyetlerini %90 azaltarak görsel öneri motorunu nasıl geliştirdi?

Pinterest’in CTO’su Matt Madrigal, 620 milyon aktif kullanıcı için her görsel öneride ileri düzey bir model kullanmanın maliyetini %90’a kadar düşürdü. İşte nasıl yaptı? Özel yerleştirilmiş (embedding) sistemler ve Qwen3-VL’in görsel katmanının sökülmesiyle elde edilen başarı.

VentureBeat3 dk okuma0 Yorumlar

Pinterest’in teknoloji liderleri, 620 milyondan fazla aylık aktif kullanıcıya görsel öneriler sunarken karşılaştıkları en büyük zorluklardan biri, ileri düzey yapay zeka modellerinin getirdiği yüksek maliyet ve gecikmelerdi. Pinterest’in CTO’su Matt Madrigal ve ekibi, bu sorunu çözmek için Qwen3-VL modelinin görsel kodlayıcı katmanını tamamen kaldırarak yerine özel yerleştirilmiş (embedding) sistemler geliştirdiler. Sonuç? AI destekli öneri maliyetlerinde %90’a varan bir düşüş ve öneri doğruluğunda %30’luk bir artış. Bu yenilik, şirketin AI stratejisinde devrim yarattı ve görsel keşif alanında yeni bir standart belirledi.

Qwen3-VL’in Görsel Katmanını Sökmek: Pinterest’in Özel Çözümü

Pinterest, kullanıcılarına görsel arama ve keşif deneyimi sunmak için yıllardır açık kaynaklı modellerden yararlanıyor. Google’ın BERT’inden OpenAI’nin CLIP’ine kadar birçok model, şirketin görsel verilerini anlamlandırmasında temel rol oynadı. Ancak Pinterest, kendi Pin CLIP modelini geliştirerek bu katmanı daha da ileriye taşıdı. Bu model, özel görsel yerleştirmeleri ve görüntü meta verilerini entegre ederek, kullanıcıların ilgi alanlarına daha hassas bir şekilde uyum sağlamayı başardı.

Madrigal’ın ekibi, Navigator 1 adlı konuşma tabanlı alışveriş asistanını inşa ederken Qwen3-VL’i temel aldı. Ancak basit bir şekilde kullanmak yerine, modelin görsel kodlayıcı katmanını tamamen kaldırdılar ve yerine çok modlu yerleştirmeleri (multimodal embeddings) yerleştirdiler. Bu yaklaşım, Pinterest’in pimlerin ve görüntülerin meta verilerini yakalayabilmesini ve bu verileri önceden hesaplayarak (precompute) sürekli olarak yeni bilgilerle güncelleyebilmesini sağladı. Sonuçta, kullanıcılara kişiselleştirilmiş deneyimler sunmak çok daha verimli hale geldi.

“Açık kaynaklı modeller, özellikle Apache lisansı altında olanlar, ağırlıkları özgürce ayarlayabilmenizi ve benzersiz kullanım durumlarına göre özelleştirebilmenizi sağlıyor. İşte bu yüzden açık kaynak, bizim için bu kadar güçlü bir araç haline geldi.” — Matt Madrigal, Pinterest CTO’su

Özel Yerleştirmeler: Gecikmeyi Azaltmanın ve Doğruluğu Artırmanın Anahtarı

Pinterest’in yaklaşımının en büyük avantajlarından biri, çalışma zamanındaki (runtime) performansnı önemli ölçüde artırmasıydı. Eğer ekibiniz her görüntüyü çalışma anında kodlayıcıdan geçirmek zorunda kalsaydı, her bir öneri için 20 kat daha fazla gecikme yaşanırdı. Ancak Pinterest, özel yerleştirmeleri önceden hesapladığı için, bu süreci tamamen ortadan kaldırdı. Bu sayede, kullanıcılar anında ve doğru öneriler alırken, şirket de maliyetleri büyük ölçüde düşürdü.

Bu strateji, Pinterest’in 600 milyondan fazla aylık aktif kullanıcısını desteklemesi gereken bir ortamda kritik bir rol oynuyor. Madrigal’ın sözleriyle:

“Kullanıcılarımızın deneyimini doğrudan etkileyen ve onları platformumuzda daha fazla vakit geçirmeye teşvik eden bir şeyi ölçeklendirmek istiyorsak, ya kendimiz inşa ederiz ya da açık kaynaklı modelleri iyice özelleştirerek kullanırız.”

Tat Grafiği: Kullanıcıların İlgi Alanlarını Dinamik Olarak Yakalamak

Pinterest’in başarısının ardındaki bir diğer yenilik de tat grafiği (taste graph) adı verilen bir sistem. Bu sistem, kullanıcıların tıkladıkları şeylerden çok, neyi sevdiklerini temsil eden dinamik bir yapıdır. Madrigal’a göre, insanlar Google gibi arama motorlarını net bir isteğe sahip olduklarında kullanırken, Pinterest’e keşif aşamasında geldiklerinde başvuruyorlar. Bu nedenle Pinterest’in amacı, kullanıcıları ilhamdan niyete (örneğin bir reklamı tıklamaktan satın almaya) yönlendirmek.

Bu sistem, iki temel bileşenden oluşuyor:

  • Graf yapısı: Kullanıcıların tercihlerini ve içeriklerin ilişkilerini temsil eden bir ağ.
  • Temsil öğrenmesi (representational learning): Kullanıcıların değişen ilgi alanlarını yakalayan yerleştirmeler.

Bu yerleştirmeler, kullanıcıların aktiviteleri ve yeni içerikler doğrultusunda sürekli olarak güncelleniyor. Madrigal, bu sistemin sosyal bir graf olmadığını, daha çok bir tercih grafi olduğunu vurguluyor:

“Bu, kullanıcıların neye ilham alacağını ve gelecekte ne yapmak istediklerini temsil eden bir sistem.”

Örneğin, bir kullanıcı orta çağ modern tasarımlarından hoşlanıyorsa, sistem bu tercihi yerleştirmelerde yakalayarak ona ilgili ürünleri sunacaktır. Başka bir kullanıcı Nantucket estetiğini tercih ediyorsa, sistem buna göre uygun önerilerde bulunacaktır. Bu sayede Pinterest, kullanıcıları üst huniden (inspiration discovery) alt huniye (intent) doğru yönlendiriyor.

Gelecekte Neler Bekliyor?

Pinterest’in AI odaklı yenilikleri henüz bitmiş değil. Şirket, güvenli ve kontrollü bir ortamda yaratıcılığı teşvik eden kum havuzları (sandboxes) kullanarak AI modellerini sürekli olarak geliştirmeyi planlıyor. Ayrıca, sürekli geri bildirim döngüleri ve kullanıcı katılımını, performansı ve gecikmeyi ölçmek için sürekli kıyaslama (benchmarking) yapma stratejileri de şirketin yol haritasında yer alıyor.

Bu yaklaşımlar, Pinterest’in AI destekli görsel keşif alanında liderliğini sürdürmesini ve kullanıcılarına daha kişiselleştirilmiş, hızlı ve doğru öneriler sunmasını sağlayacak. Gelecekte, şirketin AI stratejisi, diğer platformlara da ilham verecek gibi görünüyor.

Sıkça Sorulan Sorular

  • Pinterest, AI maliyetlerini nasıl %90’a kadar düşürdü?

Qwen3-VL modelinin görsel kodlayıcı katmanını kaldırarak yerine özel yerleştirmeler geliştirdi. Bu sayede, çalışma zamanı performansı ve doğruluk arttı, maliyetler düştü.

  • Özel yerleştirmeler ne işe yarıyor?

Görüntülerin ve pimlerin meta verilerini yakalayarak, kullanıcılara kişiselleştirilmiş öneriler sunmayı sağlıyor. Ayrıca, gecikmeyi 20 kata kadar azaltıyor.

  • Tat grafiği nedir?

Kullanıcıların tercihlerini dinamik olarak temsil eden bir sistem. Sosyal bir graf değil, bir tercih grafi olarak çalışıyor ve kullanıcıları ilhamdan niyete yönlendiriyor.

Yapay zeka özeti

Pinterest, 620 milyon aktif kullanıcıya görsel öneri sunarken AI maliyetlerini %90’a kadar düşürdü. Qwen3-VL’in görsel katmanının sökülmesi ve özel yerleştirmelerin kullanılmasıyla nasıl başardı?

Yorumlar

00
YORUM BIRAK
ID #YHGU33

0 / 1200 KARAKTER

İnsan doğrulaması

9 + 8 = ?

Editör onayı sonrası yayına girer

Moderasyon · Spam koruması aktif

Henüz onaylı yorum yok. İlk yorumu sen bırak.