Artırılmış dil modelleri olarak adlandırılan araçlara erişimi olan dil modelleri, potansiyel olarak yerel dil modellerinden çok daha fazla yeteneğe sahiptir. ReWoo yöntemi onları çok daha verimli hale getirebilir.
Şu anda, artırılmış dil modelinin en belirgin örneği, İnternet tarayıcıları veya eklentileri ile ChatGPT’dir. Bu araçlar sayesinde ChatGPT, örneğin güncel bilgileri alabilir veya hesaplama görevlerini güvenilir bir şekilde çözebilir.
ReWOO (Gözlemsiz Akıl Yürütme) yöntemi, bu tür artırılmış modellerin verimliliğine katkıda bulunmayı amaçlamaktadır. Mantıksal muhakeme için çok seviyeli bir kıyaslama olan HotpotQA testinde, beş kat daha az belirteç tüketimi ile doğrulukta yüzde dört artış elde etti.
ReWOO bunu, dil modelinin mantığını araçlara erişimden ayırarak başarır. Sonuç olarak, bilgi istemindeki belirteçlerin araca birden çok kez değil, yalnızca bir kez iletilmesi gerekir.
reklam
Verimlilik için kesilmiş araç erişimi
Şu anda, dil modelleri araçlara onları çağırarak, isteklerini ileterek, yanıtı bekleyerek, kabul ederek ve ardından yanıt boyunca oluşturmaya devam ederek erişir. Model çalışır, durur, çalışır, durur vb. Bu, zaman ve işlem gücü gerektirir ve araca birden çok kez bilgi istemi belirteçleri göndermeyi gerektirir.
ReWOO, dil modelinin muhakemeyi öngörmesine ve yanıtta araçların nerede gerekli olduğunu tanımlamasına olanak tanıyan bir planlama modülü kullanarak bu süreci daha verimli hale getirir. Daha sonra model, araçlardan gelen bilgiler henüz mevcut olmasa bile tüm soruları ve tam metni içeren tüm alt görevleri oluşturur.

Kabaca söylemek gerekirse, bu, daha sonra araçlardan alınan bilgilerle tek bir adımda doldurulan boşluk dolduran bir metinle karşılaştırılabilir. Yazarlara göre, önceden eğitilmiş büyük dil modelleri, bu tür bir öngörüye izin vermek için aracın yanıtlarının “şekli” hakkında yeterli bilgiye sahiptir.
Dil modeli, araca yönelik sorguları alt görevler olarak sakladığından ve bunları yalnızca bir kez ve ardından doğrudan tüm sorularla birlikte sorduğundan, oluşturma işleminin birkaç kez durdurulması ve yeniden başlatılması gerekmez.
Araç görevlerinin bu “toplu” işlenmesi, artırılmış LLM’leri daha verimli hale getirerek bilgi işlem gücünden tasarruf sağlar. Özellikle küçük modeller, araçların bu verimli, planlamaya dayalı kullanımıyla daha yüksek kaliteli sonuçlar üretebilir. Araştırmacıların vardığı sonuç: “Planlama ihtiyacınız olan tek şey” – “İhtiyacınız olan tek şey dikkat” başlıklı efsanevi Transformer makalesine bir gönderme.
Öneri
Araştırmacılar, Alpaca 7B’ye dayalı bir ReWOO planlama modeli ve eğitim için kullanılan veri setlerini sağlıyor. Github.