Meta’s Llama 2 is a free open-source alternative to ChatGPT



özet
Özet

Yeni büyük dil modeli Llama 2 ile Meta, kendisini OpenAI’ye açık kaynaklı bir alternatif olarak konumlandırıyor. Microsoft bir ortak olarak gemide.

Llama 2 artık ayda 700 milyona kadar aktif kullanıcıyla araştırma ve ticari kullanım için ücretsiz olarak sunuluyor. Meta’ya göre model, 7, 13 ve 70 milyar parametreli üç boyutta geliyor ve Llama v1’den yüzde 40 daha fazla veriyle eğitildi.

Resim: Meta

Yapay zekanın kısa süreli belleğinde bulunan ve modelin bir kerede işleyebileceği maksimum veri miktarı olan bağlam uzunluğu, 4096 belirteçtir, bu önceki modelin iki katıdır ve GPT-3.5 kullanan ChatGPT ile eşittir.

Llama v1 ve diğer açık kaynaklı modellerle karşılaştırıldığında, Llama 2 tüm kıyaslamalarda daha iyi performans gösteriyor. Özellikle önemli Massive Multi-Task Language Teaching (MMLU) testinde Llama, öncekinden ve açık kaynaklı rekabetten açıkça daha iyi performans gösteriyor.

reklam

Açık kaynaklı modellerle kıyaslamada Llama 2. | Resim: Meta

GPT-4 ve PaLM-2 gibi kapalı kaynak modellerle karşılaştırıldığında, Meta’nın kendisi “performans açısından büyük bir boşluktan” bahsediyor. Ancak ChatGPT’nin GPT-3.5 düzeyine çoğu durumda Llama-2 tarafından ulaşılması gerekir.

GPT-4 ve Google’ın PaLM’si hala Llama 2’nin önünde. | Resim: Meta

Kodlama görevleri için, kod yorumlayıcılı GPT-4 veya Starcoder gibi özel modeller, karşılaştırmalı değerlendirmelere göre önde olmalıdır.

Bu modeller [Llama 2] GPT-4 gibi diğer modellerin gerisinde kalsalar da, mevcut açık kaynaklı sohbet modelleriyle rekabet edebilirliklerini ve incelediğimiz değerlendirme setlerindeki bazı tescilli modellere eşdeğer yetkinliği kanıtladılar.

kağıttan

Meta’ya göre Llama 2, halka açık çevrimiçi veri kaynakları kullanılarak eğitildi. İnce ayarlı sohbet modeli Llama-2-chat, herkese açık eğitim veri kümelerini ve bir milyondan fazla insan ek açıklamasını kullanır. Aynı yöntem olan İnsan Geri Bildiriminden (RLHF) Güçlendirmeli Öğrenim kullanan OpenAI, ChatGPT’yi de optimize etti.

Meta’nın RLHF süreci: sohbet modeli, insan geri bildirimi kullanılarak geliştirildi. OpenAI, bu yöntemi kullanarak ChatGPT’yi başarılı bir ürün haline getirdi. | Resim: Meta

Meta, modelleri kullanılabilir hale getirir Llama web sitesinden ücretsiz indirmek için bir kayıt formu doldurduktan sonra. Her indirme, model kodu, ağırlıklar, kullanım kılavuzu, sorumlu kullanım kılavuzu, kabul edilebilir kullanım yönergeleri, model kartı ve lisansla birlikte gelir.

7 ve 13 milyar parametreli sohbet modelinin ücretsiz demo versiyonu bu web sitesinde mevcut.

Öneri

Meta ayrıca açık kaynak bahsini bir dizi onayla koruyor risklere rağmen modelin piyasaya sürülmesini memnuniyetle karşılayan uzmanlardan. Bildiride, “Sorumlu ve açık yenilik, bu teknolojilere görünürlük, inceleme ve güven getirerek yapay zeka geliştirme sürecinde hepimize pay veriyor. Bugünün Llama modellerini açmak, herkesin bu teknolojiden faydalanmasını sağlayacak.”

Yapay zeka alanında en ünlü araştırmacılardan biri olan Meta’nın AI şefi Yann LeCun, Twitter’da Llama 2’nin çıkışını kutluyor“Bu, LLM pazarının manzarasını değiştirecek.”

Yayın, Llama v2’nin ticari olarak uygun olduğu ve OpenAI’nin büyümesini yavaşlatmasının beklendiği de dahil olmak üzere son haftalardaki bazı söylentileri doğruluyor. Meta’nın kendisi, AI ekosistemi için açık kaynak hareketinden yararlanarak kendisini stratejik olarak ilginç bir konuma getirebilir.



Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top