AI research

Nvidia turns videos into high-quality 3D

Özet Nvidia’nın Neuralangelo’su, nöral ağları kullanarak 2D video kliplerin 3D rekonstrüksiyonu için yeni bir standart belirliyor. Neuralangelo, Nvidia ve Johns Hopkins Üniversitesi’nin video çekimlerinden 3B yeniden yapılandırmayı öğrenen ve bunları 3B nesneler olarak çıkarabilen ve işleyebilen yeni bir yapay zeka modelidir. Önceki yöntemlerle karşılaştırıldığında, Neuralangelo çok daha fazla yüzey ayrıntısı yakalar ve basit nesneleri, ev …

Nvidia turns videos into high-quality 3D Read More »

OpenAI improves GPT-4’s mathematical reasoning with a new form of supervision

Özet OpenAI, bazı matematik problemlerini çözmede SOTA’ya ulaşan bir AI modeli gösterir. Altta yatan süreç, genel olarak daha iyi dil modellerine yol açabilir. Adım Adım Doğrulayalım makalesinde OpenAI ekibi, MATH veri kümesindeki sorunları çözmek için GPT-4’e dayalı birkaç model eğitti. Amaç, eğitim ödül modelleri için iki geri bildirim süreci varyantını karşılaştırmaktı. Ekip özellikle, yapay zeka …

OpenAI improves GPT-4’s mathematical reasoning with a new form of supervision Read More »

Video-ChatGPT analyzes videos and explains why they might be funny

Özet Video-ChatGPT, bir sahnedeki güvenlik risklerini açıklama, mizahi yönleri vurgulama veya eşleşen reklam metni oluşturma gibi metinsel görevleri çözerek videoyu zaman içinde tanımlayabilir. Runway ML gibi şirketler metni videoya dönüştürme konusunda ilerleme kaydederken, Video-ChatGPT diğer yoldan giderek bir dil modeline videoyu analiz etme yeteneği veriyor. Video-ChatGPT, bir videonun içeriğini metin olarak açıklayabilir, örneğin alışılmadık bir …

Video-ChatGPT analyzes videos and explains why they might be funny Read More »

Minecraft bot Voyager programs itself using GPT-4

Özet Voyager, öğrenen bir Minecraft ajanına piksel dünyasında rehberlik etmek için GPT-4’ü kullanıyor. Takviyeli öğrenme yerine, Voyager kod oluşturmaya güvenir. Nvidia, Caltech, UT Austin, Stanford ve ASU’dan araştırmacılar Minecraft oynayan ilk hayat boyu öğrenme aracısı olan Voyager’ı tanıttı. Örneğin, klasik takviyeli öğrenme tekniklerini kullanan diğer Minecraft aracılarının aksine, Voyager kendini sürekli geliştirmek için GPT-4’ü kullanır. …

Minecraft bot Voyager programs itself using GPT-4 Read More »

Open-source language models are no match for GPT-4 and co, study says

Özet Açık kaynak dil modellerinin ilerlemesi tartışılmaz. Ancak OpenAI, Google ve diğerlerinden çok daha pahalı, yoğun şekilde eğitilmiş dil modelleriyle gerçekten rekabet edebilirler mi? Kulağa gerçek olamayacak kadar iyi geliyor: Alpaca Formula kullanılarak eğitilen açık kaynaklı dil modelleri, çok az eğitim çabası ve neredeyse sıfır maliyetle ChatGPT benzeri seviyelere ulaşarak son zamanlarda yeni ölçütler belirledi. …

Open-source language models are no match for GPT-4 and co, study says Read More »

Study says OpenAI’s business model is sound

Özet Açık kaynak dil modellerinin ilerlemesi tartışılmaz. Ancak OpenAI, Google ve diğerlerinden çok daha pahalı, yoğun şekilde eğitilmiş dil modelleriyle gerçekten rekabet edebilirler mi? Kulağa gerçek olamayacak kadar iyi geliyor: Alpaca Formula kullanılarak eğitilen açık kaynaklı dil modelleri, çok az eğitim çabası ve neredeyse sıfır maliyetle ChatGPT benzeri seviyelere ulaşarak son zamanlarda yeni ölçütler belirledi. …

Study says OpenAI’s business model is sound Read More »

Guanaco is a ChatGPT competitor trained on a single GPU in one day

Özet QLoRA adlı yeni bir yöntem, büyük dil modellerinin tek bir GPU üzerinde ince ayarının yapılmasını sağlar. Araştırmacılar bunu, ChatGPT performansının %99’una ulaşan bir sohbet robotu olan Guanaco’yu eğitmek için kullandı. Washington Üniversitesi’ndeki araştırmacılar, büyük dil modellerinde ince ayar yapmak için bir yöntem olan QLoRA’yı (Quantized Low Rank Adapters) sunuyor. Ekip, QLoRA ile birlikte Meta’nın …

Guanaco is a ChatGPT competitor trained on a single GPU in one day Read More »

Meta’s new open source models speak more than 1,100 languages

Özet Massively Multilingual Speech projesinin bir parçası olarak Meta, 1.100 dilde konuşulan dili metne ve metni konuşmaya dönüştürebilen yapay zeka modellerini piyasaya sürüyor. Yeni model seti, Meta’nın wav2vec’inin yanı sıra 1.100 dil için derlenmiş bir örnek veri setine ve henüz konuşma teknolojisinin bulunmadığı birkaç yüz kişi tarafından konuşulan diller de dahil olmak üzere yaklaşık 4.000 …

Meta’s new open source models speak more than 1,100 languages Read More »

“System 2”-inspired method enhances GPT-4’s logic capability

Özet “Düşünce Ağacı” çerçevesi, dil modelinin problem çözme yeteneklerini önemli ölçüde geliştirmek için ağaç arama ile GPT-4’ü birleştirir. “Düşünceler Ağacı”, Princeton Üniversitesi ve Google DeepMind’daki araştırmacıların GPT-4 gibi çıkarım yapan dil modelleri için, Düşünce Zinciri gibi hızlı mühendislik yöntemlerinden ilham alan yeni bir çerçevedir. Bununla birlikte, bunlardan farklı olarak, ToT yalnızca yönlendirmeye dayalı değildir ve …

“System 2”-inspired method enhances GPT-4’s logic capability Read More »

Metas MegaByte to take LLMs to the next level

Özet Meta, trafo modellerinin performansını ve verimliliğini yeni bir düzeye taşıyabilecek bir yöntem olan MegaByte’ı sunar. Şu anda, tüm Transformer modelleri belirteçler kullanıyor. Bu algoritmalar, kelimeleri, görüntüleri, sesleri veya diğer girdileri, daha sonra GPT-4 veya diğer modeller tarafından bir dizi sayı olarak işlenebilen belirteçlere dönüştürür. Dil modelleri için, kısa sözcükler bir simgeye dönüştürülür ve daha …

Metas MegaByte to take LLMs to the next level Read More »

Scroll to Top