Two systems of thinking – when AI leverages human psychology



özet
Özet

Konuk yazar Aditya Anil, Google Bard’ı örnek olarak kullanarak, Daniel Kahneman’ın fikirlerinin daha iyi sohbet robotları oluşturmaya nasıl yardımcı olabileceğini açıklıyor.

“Düşünmek, Hızlı ve Yavaş”, psikolog ve Nobel Ödüllü Daniel Kahneman’ın New York Times’ın en çok satan kitabıdır. Kitap, düşüncemizi nasıl ve neyin yönlendirdiğine dair hipotezini sundu.

Bu hipotezi şu anda Google’ın Bard’ı gibi AI sohbet robotları tarafından kendilerini daha verimli ve doğru hale getirmek için kullanılıyor.

Ancak Daniel Kahneman’ın kitapta yer alan hipotezi, yapay zeka sohbet robotlarının geliştirilmesine tam olarak nasıl yardımcı oluyor?

reklam

Düşünmeyi Yönlendiren İki Sistem

Bild: Aditya Anıl

Kaheman’ın kitabı iki düşünce sistemini araştırıyor –

  • sezgiye dayalı düşünme (Sistem 1 düşüncesi olarak anılır) ve
  • yavaş düşünme (Sistem 2 düşüncesi olarak anılır).

Kaheman’a göre 1. Sistem hızlı, içgüdüsel ve duygusaldır; Sistem 2 ise yavaş, bilinçli ve mantıklıdır. Her iki sistem de karar vermede çok önemli bir rol oynamakla birlikte, duruma bağlı olarak bir sistem diğerinden daha aktif olma eğilimindedir.

Sistem 1 hızlı ve zahmetsizce çalışır. Bu sistem altındaki eylem, gönüllü kontrol duygusu olmadan çok az çaba gerektirir veya hiç çaba gerektirmez.

Bu, bir posterdeki kelimeleri okumak, bir nesnenin başka bir nesneye göre uzak mı yoksa yakın mı olduğunu algılamak, duyduğunuz bir sesi belirlemek vb. eylemleri içerir.

2. Sistem ise daha bilinçli ve mantıklı. Bu sistemdeki aksiyonlar gönüllü kontrollerle uzun zaman almaktadır. Soyut ve mantıksal düşünmeyi gerçekleştirdiğinizde bu sistem devreye girer.

Öneri

Bu nedenle, Bard’ın yapay zeka botunu daha az önyargı veya yanlış bilgi içerecek şekilde daha doğru hale getirmesi önemliydi. Bu, neredeyse tüm yapay zeka araçlarında yanlış bilgileri azaltmak ve verimliliği artırmak için zorlu bir hedef.

Böylece Google, bu vesileyle 7 Haziran’da “-” başlığı altında bir blog yayınladı.Bard mantık ve muhakemede daha iyi hale geliyor”.

Blog, Bard’daki iki yeni özelliği vurguladı.

Bunlardan biri, kullanıcının tabloları içeren çıktılarını Google E-Tablolar’a aktarmasına olanak tanıyan Google E-Tablolar’a dışa aktarma özelliğiydi.

Diğer özellik, Bard’ın – kendi sözleriyle – “matematiksel görevlerde, kodlama sorularında ve dizi manipülasyonunda daha iyi olmasına” izin verdi.

Bard daha önce matematik problemleriyle mücadele etti ve hala ara sıra oluyor. Ancak yukarıda bahsettiğim iki Sistemi birleştirme yaklaşımını kullanan Bard, saçma sapan matematik hatalarını düzelterek şimdi daha iyi olmayı hedefliyor.

Bard’ın kullandığı bu yeni tekniğe “örtük kod yürütme” adı verilir.

LLM’ler (hızlı ve model tabanlı yanıtlardan oluşan Sistem 1) istemi alırken, örtük kod yürütme, Bard’ın hesaplamalı istemleri (mantık ve sistematik yürütmeden oluşan Sistem 2) algılamasına ve arka planda kod çalıştırmasına olanak tanır.

Bu, Bard’ın matematiksel ve dize tabanlı istemlere çok daha kolay yanıt vermesine yardımcı olur.

Blogdan bahsedilen örnekte Google, Bard’ın aşağıdaki gibi istemleri yanıtlamada daha iyi olacağını söyledi:

  • 15683615’in asal çarpanları nelerdir?
  • Birikimlerimin büyüme oranını hesapla
  • Benim için “Lollipop” kelimesini tersine çevir

Aşağıdaki blog alıntıları, bu yaklaşımı kullanmanın özünü ve motivasyonunu yakalamaktadır (iki düşünce sistemi yaklaşımını kullanma) –

“Sonuç olarak, dil ve yaratıcı görevlerde son derece yetenekliler, ancak muhakeme ve matematik gibi alanlarda daha zayıflar.

Gelişmiş muhakeme ve mantık yetenekleriyle daha karmaşık sorunları çözmeye yardımcı olmak için yalnızca LLM çıktısına güvenmek yeterli değildir.

LLM’lerin tamamen 1. Sistem altında çalıştığı düşünülebilir – hızlı ama derinlemesine düşünmeden metin üretir …Geleneksel hesaplama, 2. Sistem düşüncesiyle yakından uyumludur: Formüle dayalıdır ve esnek değildir, ancak doğru adım sırası, uzun bölme çözümleri gibi etkileyici sonuçlar üretebilir.

— Google blogunda

LLM’leri ve Geleneksel bilgi işlemi sırasıyla Sistem 1 ve Sistem 2’de tutmaya yönelik bu yaklaşım, yanıtın çok daha doğru ve verimli olmasını sağlar.

Bloga göre, bu yaklaşımı kullanan Bard, kelime ve matematik problemleriyle başa çıkmada yaklaşık %30’luk bir doğruluk artışı gösterdi.

Bu Yeni Yaklaşım Ne Kadar Güvenilir?

Bu, Bard’ın matematiksel ve sözlü problemlerle uğraşırken doğruluğunu artırsa da, sohbet robotunu verimli kılmak için en iyi yaklaşım olmayabilir.

Matematik ve kelime problemleriyle uğraşırken önemli ölçüde doğruluk gösterse de, kodla ilgili problemlerle uğraşırken hala mücadele ediyor.

Google, blogun sonunda “Bu iyileştirmelere rağmen, Bard her zaman doğru anlamayabilir – örneğin, Bard hızlı yanıta yardımcı olacak kod oluşturmayabilir, ürettiği kod yanlış olabilir veya Bard, yürütülen kodu yanıtına dahil etmeyebilir” diyor.

Bu nedenle, bu önemli bir değişiklik olsa da, Bard’ın tamamen güvenilir olması için daha uzun mesafeler kat etmesi gerekiyor.

Yanlış bilgileri azaltmak ve verimliliği artırmak, neredeyse tüm sohbet robotlarının karşılaştığı zorluklardır.

İlerleme kaydedilirken, daha gidilecek çok yol var.



Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top