Yeni büyük dil modeli Llama 2 ile Meta, kendisini OpenAI’ye açık kaynaklı bir alternatif olarak konumlandırıyor. Microsoft bir ortak olarak gemide.
Llama 2 artık ayda 700 milyona kadar aktif kullanıcıyla araştırma ve ticari kullanım için ücretsiz olarak sunuluyor. Meta’ya göre model, 7, 13 ve 70 milyar parametreli üç boyutta geliyor ve Llama v1’den yüzde 40 daha fazla veriyle eğitildi.

Yapay zekanın kısa süreli belleğinde bulunan ve modelin bir kerede işleyebileceği maksimum veri miktarı olan bağlam uzunluğu, 4096 belirteçtir, bu önceki modelin iki katıdır ve GPT-3.5 kullanan ChatGPT ile eşittir.
Llama v1 ve diğer açık kaynaklı modellerle karşılaştırıldığında, Llama 2 tüm kıyaslamalarda daha iyi performans gösteriyor. Özellikle önemli Massive Multi-Task Language Teaching (MMLU) testinde Llama, öncekinden ve açık kaynaklı rekabetten açıkça daha iyi performans gösteriyor.
reklam

GPT-4 ve PaLM-2 gibi kapalı kaynak modellerle karşılaştırıldığında, Meta’nın kendisi “performans açısından büyük bir boşluktan” bahsediyor. Ancak ChatGPT’nin GPT-3.5 düzeyine çoğu durumda Llama-2 tarafından ulaşılması gerekir.

Kodlama görevleri için, kod yorumlayıcılı GPT-4 veya Starcoder gibi özel modeller, karşılaştırmalı değerlendirmelere göre önde olmalıdır.
Bu modeller [Llama 2] GPT-4 gibi diğer modellerin gerisinde kalsalar da, mevcut açık kaynaklı sohbet modelleriyle rekabet edebilirliklerini ve incelediğimiz değerlendirme setlerindeki bazı tescilli modellere eşdeğer yetkinliği kanıtladılar.
kağıttan
Meta’ya göre Llama 2, halka açık çevrimiçi veri kaynakları kullanılarak eğitildi. İnce ayarlı sohbet modeli Llama-2-chat, herkese açık eğitim veri kümelerini ve bir milyondan fazla insan ek açıklamasını kullanır. Aynı yöntem olan İnsan Geri Bildiriminden (RLHF) Güçlendirmeli Öğrenim kullanan OpenAI, ChatGPT’yi de optimize etti.

Meta, modelleri kullanılabilir hale getirir Llama web sitesinden ücretsiz indirmek için bir kayıt formu doldurduktan sonra. Her indirme, model kodu, ağırlıklar, kullanım kılavuzu, sorumlu kullanım kılavuzu, kabul edilebilir kullanım yönergeleri, model kartı ve lisansla birlikte gelir.
7 ve 13 milyar parametreli sohbet modelinin ücretsiz demo versiyonu bu web sitesinde mevcut.
Öneri
Microsoft ile meta ortakları
Biraz şaşırtıcı bir şekilde Meta, Llama modelini OpenAI’nin en büyük yatırımcısı olan Microsoft ile birlikte sunuyor. Görünüşe göre Microsoft, hem kapalı kaynak hem de açık kaynak alanında kendini konumlandırmak ve modelleri Azure altyapısı aracılığıyla işletmelerin kullanımına sunmak istiyor. Meta ayrıca Amazon Web Services, Hugging Face ve diğer sağlayıcılar aracılığıyla Lama sunar.
Model duyurusuna göre, iki şirketin Microsoft Azure üzerinde açık AI ekosistemleri oluşturma ve Meta tarafından ortak geliştirilen bir AI çerçevesi olan PyTorch’u destekleme konusunda ortak bir geçmişi var.
İşbirliği aynı zamanda metaverse’de iş ve oyunun geleceği için sürükleyici deneyimler sağlamayı amaçlıyor. Microsoft, geçen sonbaharda Meta’nın VR kulaklıkları için Office yazılımını ilk kez duyurdu.
Buna ek olarak Meta, AI’nın sorumlu kullanımının önemini vurgular ve Llama 2’nin adil ve sorumlu kullanımını sağlamak için red-teaming egzersizleri, bir şeffaflık şeması, sorumlu bir kullanım kılavuzu ve kabul edilebilir bir kullanım politikası gibi kaynaklar sağlar.
Meta ayrıca açık kaynak bahsini bir dizi onayla koruyor risklere rağmen modelin piyasaya sürülmesini memnuniyetle karşılayan uzmanlardan. Bildiride, “Sorumlu ve açık yenilik, bu teknolojilere görünürlük, inceleme ve güven getirerek yapay zeka geliştirme sürecinde hepimize pay veriyor. Bugünün Llama modellerini açmak, herkesin bu teknolojiden faydalanmasını sağlayacak.”
Yapay zeka alanında en ünlü araştırmacılardan biri olan Meta’nın AI şefi Yann LeCun, Twitter’da Llama 2’nin çıkışını kutluyor“Bu, LLM pazarının manzarasını değiştirecek.”
Yayın, Llama v2’nin ticari olarak uygun olduğu ve OpenAI’nin büyümesini yavaşlatmasının beklendiği de dahil olmak üzere son haftalardaki bazı söylentileri doğruluyor. Meta’nın kendisi, AI ekosistemi için açık kaynak hareketinden yararlanarak kendisini stratejik olarak ilginç bir konuma getirebilir.