AI research

Video-ChatGPT analyzes videos and explains why they might be funny

Özet Video-ChatGPT, bir sahnedeki güvenlik risklerini açıklama, mizahi yönleri vurgulama veya eşleşen reklam metni oluşturma gibi metinsel görevleri çözerek videoyu zaman içinde tanımlayabilir. Runway ML gibi şirketler metni videoya dönüştürme konusunda ilerleme kaydederken, Video-ChatGPT diğer yoldan giderek bir dil modeline videoyu analiz etme yeteneği veriyor. Video-ChatGPT, bir videonun içeriğini metin olarak açıklayabilir, örneğin alışılmadık bir …

Video-ChatGPT analyzes videos and explains why they might be funny Read More »

Minecraft bot Voyager programs itself using GPT-4

Özet Voyager, öğrenen bir Minecraft ajanına piksel dünyasında rehberlik etmek için GPT-4’ü kullanıyor. Takviyeli öğrenme yerine, Voyager kod oluşturmaya güvenir. Nvidia, Caltech, UT Austin, Stanford ve ASU’dan araştırmacılar Minecraft oynayan ilk hayat boyu öğrenme aracısı olan Voyager’ı tanıttı. Örneğin, klasik takviyeli öğrenme tekniklerini kullanan diğer Minecraft aracılarının aksine, Voyager kendini sürekli geliştirmek için GPT-4’ü kullanır. …

Minecraft bot Voyager programs itself using GPT-4 Read More »

Open-source language models are no match for GPT-4 and co, study says

Özet Açık kaynak dil modellerinin ilerlemesi tartışılmaz. Ancak OpenAI, Google ve diğerlerinden çok daha pahalı, yoğun şekilde eğitilmiş dil modelleriyle gerçekten rekabet edebilirler mi? Kulağa gerçek olamayacak kadar iyi geliyor: Alpaca Formula kullanılarak eğitilen açık kaynaklı dil modelleri, çok az eğitim çabası ve neredeyse sıfır maliyetle ChatGPT benzeri seviyelere ulaşarak son zamanlarda yeni ölçütler belirledi. …

Open-source language models are no match for GPT-4 and co, study says Read More »

Study says OpenAI’s business model is sound

Özet Açık kaynak dil modellerinin ilerlemesi tartışılmaz. Ancak OpenAI, Google ve diğerlerinden çok daha pahalı, yoğun şekilde eğitilmiş dil modelleriyle gerçekten rekabet edebilirler mi? Kulağa gerçek olamayacak kadar iyi geliyor: Alpaca Formula kullanılarak eğitilen açık kaynaklı dil modelleri, çok az eğitim çabası ve neredeyse sıfır maliyetle ChatGPT benzeri seviyelere ulaşarak son zamanlarda yeni ölçütler belirledi. …

Study says OpenAI’s business model is sound Read More »

Guanaco is a ChatGPT competitor trained on a single GPU in one day

Özet QLoRA adlı yeni bir yöntem, büyük dil modellerinin tek bir GPU üzerinde ince ayarının yapılmasını sağlar. Araştırmacılar bunu, ChatGPT performansının %99’una ulaşan bir sohbet robotu olan Guanaco’yu eğitmek için kullandı. Washington Üniversitesi’ndeki araştırmacılar, büyük dil modellerinde ince ayar yapmak için bir yöntem olan QLoRA’yı (Quantized Low Rank Adapters) sunuyor. Ekip, QLoRA ile birlikte Meta’nın …

Guanaco is a ChatGPT competitor trained on a single GPU in one day Read More »

Meta’s new open source models speak more than 1,100 languages

Özet Massively Multilingual Speech projesinin bir parçası olarak Meta, 1.100 dilde konuşulan dili metne ve metni konuşmaya dönüştürebilen yapay zeka modellerini piyasaya sürüyor. Yeni model seti, Meta’nın wav2vec’inin yanı sıra 1.100 dil için derlenmiş bir örnek veri setine ve henüz konuşma teknolojisinin bulunmadığı birkaç yüz kişi tarafından konuşulan diller de dahil olmak üzere yaklaşık 4.000 …

Meta’s new open source models speak more than 1,100 languages Read More »

“System 2”-inspired method enhances GPT-4’s logic capability

Özet “Düşünce Ağacı” çerçevesi, dil modelinin problem çözme yeteneklerini önemli ölçüde geliştirmek için ağaç arama ile GPT-4’ü birleştirir. “Düşünceler Ağacı”, Princeton Üniversitesi ve Google DeepMind’daki araştırmacıların GPT-4 gibi çıkarım yapan dil modelleri için, Düşünce Zinciri gibi hızlı mühendislik yöntemlerinden ilham alan yeni bir çerçevedir. Bununla birlikte, bunlardan farklı olarak, ToT yalnızca yönlendirmeye dayalı değildir ve …

“System 2”-inspired method enhances GPT-4’s logic capability Read More »

Metas MegaByte to take LLMs to the next level

Özet Meta, trafo modellerinin performansını ve verimliliğini yeni bir düzeye taşıyabilecek bir yöntem olan MegaByte’ı sunar. Şu anda, tüm Transformer modelleri belirteçler kullanıyor. Bu algoritmalar, kelimeleri, görüntüleri, sesleri veya diğer girdileri, daha sonra GPT-4 veya diğer modeller tarafından bir dizi sayı olarak işlenebilen belirteçlere dönüştürür. Dil modelleri için, kısa sözcükler bir simgeye dönüştürülür ve daha …

Metas MegaByte to take LLMs to the next level Read More »

Chatbot Arena helps you find the best open-source chatbot

Özet Şimdiye kadar, açık kaynaklı modellerin kalitesini karşılaştırmanın kolay bir yolu yoktu. E-spordan ilham alan bir sistem yardımcı olabilir. Açık kaynak modeli Vicuna’nın arkasındaki Büyük Model Sistem Organizasyonu (LMSYS), büyük dil modellerinin performansını karşılaştırmak için “Chatbot Arena” kıyaslama platformunu başlattı. Farklı modeller, isimsiz, rastgele seçilmiş düellolarda birbirleriyle yarışır. Kullanıcılar daha sonra tercih ettikleri cevaba oy …

Chatbot Arena helps you find the best open-source chatbot Read More »

A new era in image editing?

Özet DragGAN, fotogerçekçi görüntülerin kullanıcı tarafından sürükle ve bırak yoluyla özelleştirildiği yepyeni bir görüntü düzenleme kategorisi açar. Ayrıntılar bir GAN tarafından işlenir. Günümüzün Photoshop gibi araçlarla olduğu gibi görüntü işleme yöntemleri, tek tek nesnelerin konumunu, şeklini, ifadesini veya düzenini esnek ve hassas bir şekilde kontrol etmek için yüksek derecede beceri gerektirir. Diğer bir seçenek de, …

A new era in image editing? Read More »

Scroll to Top