?>

Meta'nın Llama 4 Modeli Testte Farklı, Gerçekte Farklı Çıktı!

Meta’nın Llama 4 modeliyle yaptığı testlerde kullanılan sürüm ile halka açık sürüm arasında fark olduğu ortaya çıktı.

Gündem - 5 gün önce

Meta, yeni yapay zekâ modellerini tanıttı ama sonrasında işler biraz karıştı. Şirketin, modellerini rakiplerinden daha başarılı göstermek için test sonuçlarını biraz “kendi lehine” oynadığı iddia edildi. Kısacası, Meta’nın yapay zekâsı daha zeki gibi görünüyordu ama bunun arkasında küçük bir oyun varmış.

Şirketin Llama 4 serisinden Maverick modeli, testlerde yüksek puan almasına rağmen bu sonucun halka açık versiyonu yansıtmadığı ortaya çıktı.

Testte görünen Maverick ile halka sunulan model aynı değil

Meta, hafta sonu gerçekleştirdiği duyuruyla Llama 4 çatısı altındaki iki yeni yapay zekâ modelini tanıttı. Scout ve Maverick isimli bu modellerden özellikle Maverick’in, GPT-4o ve Gemini 2.0 Flash gibi rakiplerini geçtiği belirtildi. LMArena isimli popüler karşılaştırma platformunda ikinci sıraya yükselen Maverick, 1417 ELO puanıyla dikkat çekti.

Ancak kısa süre sonra ortaya çıkan detaylar, test edilen Maverick’in kamuya açık versiyondan farklı olduğunu gösterdi. Meta'nın belgelerinde, LMArena’da kullanılan modelin “konuşma yetenekleri için özel olarak optimize edilmiş deneysel bir sürüm” olduğu belirtildi. Patform yöneticilerinin de tepkisini çekti ve kuralların güncelleneceği açıklandı.

Meta, bu özel sürümün kullanımını savunurken, geliştiricilerin açık kaynaklı versiyonu kendi ihtiyaçlarına göre özelleştirebileceğini belirtti. Ancak test platformunda gösterilen performans ile halka sunulan modelin farklı olması, gerçek dünyada alınabilecek verimin sorgulanmasına yol açtı. Şirketin modeli beklenen performansı gösteremediği için daha önce birkaç kez ertelediği de biliniyor.

Yaşanan bu gelişme, yapay zekâ karşılaştırma testlerinin şeffaflık ve güvenilirlik açısından önemini bir kez daha gündeme taşıdı. Aynı zamanda modellerin test koşulları ile kullanıcıya sunulan hâli arasında fark olması, geliştiricilerin karar alma süreçlerini de etkileyebiliyor.

Kaynak: WEBTEKNO.COM

Haftanın Öne Çıkanları

KSTÜ: “Şeffafız, Hazırız, Kararlıyız!”

2025-04-05 11:10 - Kıbrıs

Neden Filmlere Ülkelere Göre Farklı Bir Son Hazırlanıyor?

2025-04-03 18:52 - Gündem

Minibüste genç kızı taciz eden şüpheli yakalandı

2025-04-08 09:37 - Gündem

Uzay Fotoğrafları Nasıl Çekiliyor?

2025-04-03 18:58 - Gündem

Galaxy S20 Serisi Telefonların Güncelleme Desteği Sona Erdi!

2025-04-08 10:03 - Gündem

Kazada ölen anne ve 3 çocuğu toprağa verildi

2025-04-03 19:08 - Gündem

Microsoft Ücretsiz Yapay Zekâ Kurslarını Duyurdu

2025-04-08 10:08 - Gündem

İlaçlar Nasıl İsimlendiriliyor?

2025-04-03 19:33 - Gündem

Euro 41.85, sterlin 48.75, dolar 38.10 TL’den işlem görüyor

2025-04-08 10:23 - Ekonomi

Hyundai ve Kia Neden En Az 3 Milyon Aracı Geri Çağırmıştı?

2025-04-03 19:37 - Gündem

İlgili Haberler

Sakarya'daki feci kazada 1 kişi yaralandı

11:07 - Gündem

Tacikistan'da 5,8 büyüklüğünde deprem oldu

10:38 - Gündem

Trodos beyaza büründü

10:28 - Gündem

Ankara'da apartmanın 4'üncü katında çıkan yangında 5 kişi dumandan etkilendi

10:07 - Gündem

Kuzey Makedonya ile Kosova ortak sınır kapısı uygulamasına başladı

09:47 - Gündem

Günün Manşetleri

DAÜ’de liselere yönelik düzenlenen atölye çalışmaları tamamlandı

11:22 - Kıbrıs

Tacikistan'da 5,8 büyüklüğünde deprem oldu

10:38 - Gündem

Trodos beyaza büründü

10:28 - Gündem

Kuzey Makedonya ile Kosova ortak sınır kapısı uygulamasına başladı

09:47 - Gündem

Dış Basın Birliği 18. Genel Kurulu gerçekleştirildi, başkan Burhan Canbaz oldu

09:03 - Kıbrıs