Meta Yöneticisi, Llama 4'ün Benchmark Sonuçlarının Yapay Olarak Artırıldığı İddialarını Reddetti

yenidunya · 8 Nisan 2025

Meta'nın Üretken Yapay Zeka Başkan Yardımcısı Ahmad Al-Dahle, şirketin yeni yapay zeka modelleri Llama 4 Maverick ve Llama 4 Scout'un belirli test setleri üzerinde eğitildiği ve bu sayede benchmark sonuçlarının yapay olarak yükseltildiği yönündeki söylentileri yalanladı. Al-Dahle, bu iddiaların "kesinlikle doğru olmadığını" belirtti. The Verge

Hafta sonu boyunca, Meta'nın modellerinin benchmark sonuçlarını yapay olarak artırdığına dair dayanağı olmayan bir söylenti, X ve Reddit platformlarında dolaşıma girdi. Bu söylenti, Meta'dan istifa ettiğini iddia eden bir kullanıcının Çinli bir sosyal medya sitesindeki paylaşımından kaynaklandı. Ayrıca, Maverick ve Scout modellerinin belirli görevlerde zayıf performans gösterdiğine dair raporlar ve Meta'nın LM Arena benchmark'ında daha iyi sonuçlar elde etmek için deneysel, henüz yayımlanmamış bir Maverick versiyonu kullanma kararı da bu söylentileri körükledi.

Al-Dahle, bazı kullanıcıların farklı bulut sağlayıcılarında Maverick ve Scout modellerinin "karışık kalite" sergilediğini kabul etti. Modellerin hazır olur olmaz yayımlandığını ve tüm kamuya açık uygulamaların tam olarak ayarlanmasının birkaç gün sürebileceğini belirtti. Al-Dahle, "Hata düzeltmeleri ve iş ortaklarımızın entegrasyonları üzerinde çalışmaya devam edeceğiz," dedi. The Verge+1Egerin+1

Bu gelişmeler, yapay zeka modellerinin değerlendirilmesinde şeffaflık ve güvenilirlik konularını bir kez daha gündeme getirdi. Meta'nın bu konudaki tutumu ve gelecekte atacağı adımlar, sektör tarafından yakından takip edilecektir.

Ara

Ara

Meta Yöneticisi, Llama 4'ün Benchmark Sonuçlarının Yapay Olarak Artırıldığı İddialarını Reddetti

Trend içerikler

Forum istatistikleri