AI research

OpenAI improves GPT-4’s mathematical reasoning with a new form of supervision

[ad_1] Özet OpenAI, bazı matematik problemlerini çözmede SOTA’ya ulaşan bir AI modeli gösterir. Altta yatan süreç, genel olarak daha iyi dil modellerine yol açabilir. Adım Adım Doğrulayalım makalesinde OpenAI ekibi, MATH veri kümesindeki sorunları çözmek için GPT-4’e dayalı birkaç model eğitti. Amaç, eğitim ödül modelleri için iki geri bildirim süreci varyantını karşılaştırmaktı. Ekip özellikle, yapay …

OpenAI improves GPT-4’s mathematical reasoning with a new form of supervision Read More »

Video-ChatGPT analyzes videos and explains why they might be funny

[ad_1] Özet Video-ChatGPT, bir sahnedeki güvenlik risklerini açıklama, mizahi yönleri vurgulama veya eşleşen reklam metni oluşturma gibi metinsel görevleri çözerek videoyu zaman içinde tanımlayabilir. Runway ML gibi şirketler metni videoya dönüştürme konusunda ilerleme kaydederken, Video-ChatGPT diğer yoldan giderek bir dil modeline videoyu analiz etme yeteneği veriyor. Video-ChatGPT, bir videonun içeriğini metin olarak açıklayabilir, örneğin alışılmadık …

Video-ChatGPT analyzes videos and explains why they might be funny Read More »

Minecraft bot Voyager programs itself using GPT-4

[ad_1] Özet Voyager, öğrenen bir Minecraft ajanına piksel dünyasında rehberlik etmek için GPT-4’ü kullanıyor. Takviyeli öğrenme yerine, Voyager kod oluşturmaya güvenir. Nvidia, Caltech, UT Austin, Stanford ve ASU’dan araştırmacılar Minecraft oynayan ilk hayat boyu öğrenme aracısı olan Voyager’ı tanıttı. Örneğin, klasik takviyeli öğrenme tekniklerini kullanan diğer Minecraft aracılarının aksine, Voyager kendini sürekli geliştirmek için GPT-4’ü …

Minecraft bot Voyager programs itself using GPT-4 Read More »

Open-source language models are no match for GPT-4 and co, study says

[ad_1] Özet Açık kaynak dil modellerinin ilerlemesi tartışılmaz. Ancak OpenAI, Google ve diğerlerinden çok daha pahalı, yoğun şekilde eğitilmiş dil modelleriyle gerçekten rekabet edebilirler mi? Kulağa gerçek olamayacak kadar iyi geliyor: Alpaca Formula kullanılarak eğitilen açık kaynaklı dil modelleri, çok az eğitim çabası ve neredeyse sıfır maliyetle ChatGPT benzeri seviyelere ulaşarak son zamanlarda yeni ölçütler …

Open-source language models are no match for GPT-4 and co, study says Read More »

Study says OpenAI’s business model is sound

[ad_1] Özet Açık kaynak dil modellerinin ilerlemesi tartışılmaz. Ancak OpenAI, Google ve diğerlerinden çok daha pahalı, yoğun şekilde eğitilmiş dil modelleriyle gerçekten rekabet edebilirler mi? Kulağa gerçek olamayacak kadar iyi geliyor: Alpaca Formula kullanılarak eğitilen açık kaynaklı dil modelleri, çok az eğitim çabası ve neredeyse sıfır maliyetle ChatGPT benzeri seviyelere ulaşarak son zamanlarda yeni ölçütler …

Study says OpenAI’s business model is sound Read More »

Guanaco is a ChatGPT competitor trained on a single GPU in one day

[ad_1] Özet QLoRA adlı yeni bir yöntem, büyük dil modellerinin tek bir GPU üzerinde ince ayarının yapılmasını sağlar. Araştırmacılar bunu, ChatGPT performansının %99’una ulaşan bir sohbet robotu olan Guanaco’yu eğitmek için kullandı. Washington Üniversitesi’ndeki araştırmacılar, büyük dil modellerinde ince ayar yapmak için bir yöntem olan QLoRA’yı (Quantized Low Rank Adapters) sunuyor. Ekip, QLoRA ile birlikte …

Guanaco is a ChatGPT competitor trained on a single GPU in one day Read More »

Meta’s new open source models speak more than 1,100 languages

[ad_1] Özet Massively Multilingual Speech projesinin bir parçası olarak Meta, 1.100 dilde konuşulan dili metne ve metni konuşmaya dönüştürebilen yapay zeka modellerini piyasaya sürüyor. Yeni model seti, Meta’nın wav2vec’inin yanı sıra 1.100 dil için derlenmiş bir örnek veri setine ve henüz konuşma teknolojisinin bulunmadığı birkaç yüz kişi tarafından konuşulan diller de dahil olmak üzere yaklaşık …

Meta’s new open source models speak more than 1,100 languages Read More »

“System 2”-inspired method enhances GPT-4’s logic capability

[ad_1] Özet “Düşünce Ağacı” çerçevesi, dil modelinin problem çözme yeteneklerini önemli ölçüde geliştirmek için ağaç arama ile GPT-4’ü birleştirir. “Düşünceler Ağacı”, Princeton Üniversitesi ve Google DeepMind’daki araştırmacıların GPT-4 gibi çıkarım yapan dil modelleri için, Düşünce Zinciri gibi hızlı mühendislik yöntemlerinden ilham alan yeni bir çerçevedir. Bununla birlikte, bunlardan farklı olarak, ToT yalnızca yönlendirmeye dayalı değildir …

“System 2”-inspired method enhances GPT-4’s logic capability Read More »

Metas MegaByte to take LLMs to the next level

[ad_1] Özet Meta, trafo modellerinin performansını ve verimliliğini yeni bir düzeye taşıyabilecek bir yöntem olan MegaByte’ı sunar. Şu anda, tüm Transformer modelleri belirteçler kullanıyor. Bu algoritmalar, kelimeleri, görüntüleri, sesleri veya diğer girdileri, daha sonra GPT-4 veya diğer modeller tarafından bir dizi sayı olarak işlenebilen belirteçlere dönüştürür. Dil modelleri için, kısa sözcükler bir simgeye dönüştürülür ve …

Metas MegaByte to take LLMs to the next level Read More »

Chatbot Arena helps you find the best open-source chatbot

[ad_1] Özet Şimdiye kadar, açık kaynaklı modellerin kalitesini karşılaştırmanın kolay bir yolu yoktu. E-spordan ilham alan bir sistem yardımcı olabilir. Açık kaynak modeli Vicuna’nın arkasındaki Büyük Model Sistem Organizasyonu (LMSYS), büyük dil modellerinin performansını karşılaştırmak için “Chatbot Arena” kıyaslama platformunu başlattı. Farklı modeller, isimsiz, rastgele seçilmiş düellolarda birbirleriyle yarışır. Kullanıcılar daha sonra tercih ettikleri cevaba …

Chatbot Arena helps you find the best open-source chatbot Read More »

Scroll to Top