Neler yeni

Meta Yöneticisi, Llama 4'ün Benchmark Sonuçlarının Yapay Olarak Artırıldığı İddialarını Reddetti

Meta'nın Üretken Yapay Zeka Başkan Yardımcısı Ahmad Al-Dahle, şirketin yeni yapay zeka modelleri Llama 4 Maverick ve Llama 4 Scout'un belirli test setleri üzerinde eğitildiği ve bu sayede benchmark sonuçlarının yapay olarak yükseltildiği yönündeki söylentileri yalanladı. Al-Dahle, bu iddiaların "kesinlikle doğru olmadığını" belirtti. The Verge


Hafta sonu boyunca, Meta'nın modellerinin benchmark sonuçlarını yapay olarak artırdığına dair dayanağı olmayan bir söylenti, X ve Reddit platformlarında dolaşıma girdi. Bu söylenti, Meta'dan istifa ettiğini iddia eden bir kullanıcının Çinli bir sosyal medya sitesindeki paylaşımından kaynaklandı. Ayrıca, Maverick ve Scout modellerinin belirli görevlerde zayıf performans gösterdiğine dair raporlar ve Meta'nın LM Arena benchmark'ında daha iyi sonuçlar elde etmek için deneysel, henüz yayımlanmamış bir Maverick versiyonu kullanma kararı da bu söylentileri körükledi.


Al-Dahle, bazı kullanıcıların farklı bulut sağlayıcılarında Maverick ve Scout modellerinin "karışık kalite" sergilediğini kabul etti. Modellerin hazır olur olmaz yayımlandığını ve tüm kamuya açık uygulamaların tam olarak ayarlanmasının birkaç gün sürebileceğini belirtti. Al-Dahle, "Hata düzeltmeleri ve iş ortaklarımızın entegrasyonları üzerinde çalışmaya devam edeceğiz," dedi. The Verge+1Egerin+1


Bu gelişmeler, yapay zeka modellerinin değerlendirilmesinde şeffaflık ve güvenilirlik konularını bir kez daha gündeme getirdi. Meta'nın bu konudaki tutumu ve gelecekte atacağı adımlar, sektör tarafından yakından takip edilecektir.
 

Trend içerikler

Forum istatistikleri

Konular
77
Mesajlar
83
Kullanıcılar
4
Son üye
alp
Geri
Üst