ABD merkezli teknoloji devi AMD'den dikkat çeken bir hamle geldi. Şirket, düzenlediği bir etkinlikte AMD-135M olarak isimlendirdiği küçük dil modelini duyurdu. Meta'nın "Llama" modelinin bir parçası olarak duyurulan AMD-135M, daha çok özel işletmeler tarafından tercih edilecek gibi görünüyor.
AMD-135M, kendi içerisinde iki farklı versiyona odaklanıyor. Bu versiyonlar AMD-Llama-135M ve AMD-Llama-135M-code olarak karşımıza çıktılar. AMD'nin açıklamasına göre AMD-Llama-135M, 670 milyar genel veri token'ı üzerinde eğitildi. Eğitim sürecinde 4 adet AMD Instinct MI250 kullanıldı. AMD-Llama-135M-code ise kodlamaya özel olarak 20 milyar adet ek token kullanıyor.
Belirli görevler için optimize edilebilecek
AMD'nin küçük dil modelleri, belirli görevler için optimize edilerek kullanılabilecek. Tabii AMD-Llama-135M-code, daha çok kodlamayla ilgili görevler için kullanılacak. AMD'nin açıklamasına göre yeni dil modeli, tahminsel kod çözme teknolojisi kullanıyor. Bu da dil modellerinin oldukça hızlı bir şekilde çalışabilmesini sağlayacak.
Kaynak: WEBTEKNO.COM