Konuk yazar Aditya Anil, Google Bard’ı örnek olarak kullanarak, Daniel Kahneman’ın fikirlerinin daha iyi sohbet robotları oluşturmaya nasıl yardımcı olabileceğini açıklıyor.
“Düşünmek, Hızlı ve Yavaş”, psikolog ve Nobel Ödüllü Daniel Kahneman’ın New York Times’ın en çok satan kitabıdır. Kitap, düşüncemizi nasıl ve neyin yönlendirdiğine dair hipotezini sundu.
Bu hipotezi şu anda Google’ın Bard’ı gibi AI sohbet robotları tarafından kendilerini daha verimli ve doğru hale getirmek için kullanılıyor.
Ancak Daniel Kahneman’ın kitapta yer alan hipotezi, yapay zeka sohbet robotlarının geliştirilmesine tam olarak nasıl yardımcı oluyor?
reklam
Düşünmeyi Yönlendiren İki Sistem

Kaheman’ın kitabı iki düşünce sistemini araştırıyor –
- sezgiye dayalı düşünme (Sistem 1 düşüncesi olarak anılır) ve
- yavaş düşünme (Sistem 2 düşüncesi olarak anılır).
Kaheman’a göre 1. Sistem hızlı, içgüdüsel ve duygusaldır; Sistem 2 ise yavaş, bilinçli ve mantıklıdır. Her iki sistem de karar vermede çok önemli bir rol oynamakla birlikte, duruma bağlı olarak bir sistem diğerinden daha aktif olma eğilimindedir.
Sistem 1 hızlı ve zahmetsizce çalışır. Bu sistem altındaki eylem, gönüllü kontrol duygusu olmadan çok az çaba gerektirir veya hiç çaba gerektirmez.
Bu, bir posterdeki kelimeleri okumak, bir nesnenin başka bir nesneye göre uzak mı yoksa yakın mı olduğunu algılamak, duyduğunuz bir sesi belirlemek vb. eylemleri içerir.
2. Sistem ise daha bilinçli ve mantıklı. Bu sistemdeki aksiyonlar gönüllü kontrollerle uzun zaman almaktadır. Soyut ve mantıksal düşünmeyi gerçekleştirdiğinizde bu sistem devreye girer.
Öneri
Bu, kalabalıkta birini tanımak, kafanızda uzun hesaplamalar yapmak, satranç oynamak vb. eylemleri içerir.
Son zamanlarda, iki sistem kavramı, Bard (Google’ın yapay zeka sohbet robotu) tarafından matematiksel ve dize işlemlerini iyileştirmek için kullanılıyor ve yanıtını daha dinamik ve doğru hale getiriyor.
Ancak Bard, kendi yapay zeka sistemini geliştirmek için bu psikolojik konsepti nasıl kullanıyor?
Düşünme İlkeleri Yapay Zekaya Nasıl Yardımcı Olur?

Hemen dalmadan önce, her sistemin ana avantajlarını ve dezavantajlarını anlayalım.
Kitap, Sistem 1 düşüncesinin tüm düşüncelerimizin %98’inden sorumlu olduğuna, Sistem 2 düşüncesinin ise kalan %2’den sorumlu olduğuna ve Sistem 1’in kölesi olduğuna dikkat çekiyor.
Ancak her iki sistemin de avantajları ve dezavantajları vardır ve karar verme becerilerimizi büyük ölçüde etkiler.
Her Sistemin Dezavantajları
1. Sistem düşüncesine çok fazla güvenmek önyargılara ve hatalara yol açabilir. 1. Sistem düşüncesinin uyarılarından bazıları şunlardır:
- Onaylama yanlılığına aşırı düşkünlük
- Somut ve önemli detayları gözden kaçırma eğilimi
- Sevmediğimiz kanıtları görmezden gelmek, cehalete yol açar
- Görünüşte basit veya alakasız kararları fazla düşünmek
- Kötü kararlar için sorgulanabilir gerekçeler üretmek
ve benzeri.
Öte yandan, 2. Sistem düşüncesine çok fazla güvenmek de hatalara ve olumsuz sonuçlara yol açabilir. Bunlar şunları içerir:
- Basit kararları fazla düşünmek ve çok fazla zaman kaybetmek
- Hızlı karar verememe
- Çok şüpheci olmak ve çok fazla yargılamamak
- Karar verme yorgunluğu ve bilişsel aşırı yüklenme yaşamak
- Çok mantıklı ve duyguları hesaba katmayan kararlar vermek
İki Düşünme Sistemi: Yapay Zekaya Uygulanır
İnsan alanında bu oldukça psikolojik olsa da, bu kavram AI ve Bilgi İşleme uygulandığında işler oldukça ilginç hale geliyor.
LLM’lerin (Bard ve CHatGPT gibi sohbet robotlarına güç sağlayan yapay zeka modeli) Sistem 1’de çalıştığı düşünülebilir.
Nasıl?
LLM’ler (bu sohbet robotlarını çalıştıran AI modelleri), daha önce üzerinde eğitildiği milyarlarca eğitim verisinde kalıplar bularak çalışır ve ortak kalıpla eşleşen bir yanıt üretir. Örneğin, bir chatbot’a “İklim Değişikliği üzerine bir makale yaz” dediğinizde, arka uçtaki süreç şu şekildedir –
- Geniş eğitim veritabanında eşleşen sorguları bulun. Chatbot, “iklim değişikliği” ve “denemeler” anahtar kelimelerini içeren ortak bir sorgu bulmaya çalışır.
- Bir trend veya model bulma. Chatbot daha sonra seçilen tüm veriler arasında ortak bir eğilim veya model bulmaya çalışır. Örneğin, model, neredeyse tüm verilerin “karbon emisyonları”, “karbon ayak izi”, “plastik kirlilik”, “küresel ısınma” vb.’den bahsetmesi olabilir. Dahası, makalelerin başlık ve paragraf biçimleri de kendi içinde bir kalıptır (şiir, blog vb. diğer biçimlerin aksine).
- Desene göre bir metin oluşturma. Bu eğlenceli kısım. Bu süreci bir yapbozu çözmek gibi düşünün.
Bot, veri parçalarını (yapboz parçaları) kullanarak metni oluşturmaya çalışır ve bu durumda iklim değişikliği üzerine bir deneme olan benzer bir makalenin (son resimler) modeline benzetmeye çalışır. Verdiğiniz istemin birkaç yinelemesini (yani çıktılarını) oluşturur ve bunu, iklim değişikliği üzerine önceden yazılmış bir makale olabilecek referans verilerle karşılaştırır. - çıktı vermek. İstenilen sonuca en yakın iterasyon seçilir ve ekrana yazdırılır.
Bu süreç uzun görünebilir, ancak geleneksel LLM’lerde gerçekleştirilmesi yalnızca birkaç saniye sürer. 1. adım, milyarlarca veri içeren veri kümeleri üzerinde eğitilen yapay zeka modelinden oluşan LLM’lerin geliştirme ve eğitim aşamasında çok daha önce yapılır. Bu devasa veri kümesinden öğrendikten ve hepsindeki modeli bulduktan sonra, LLM sürecinin tıknaz ve zor kısmı yapılır.
Adımın geri kalanı, büyük ölçüde modelin üzerinde eğitildiği verilerin kalitesi nedeniyle oldukça hızlıdır. Genel olarak, sağlanan eğitim verileri ne kadar iyi olursa, tahminler ve üretim de o kadar iyi olur.
Böylece LLM, fazla ‘düşünmeden’ metinleri zahmetsizce üretir. Sadece modeli bulur ve çıktıyı referansla karşılaştırır.
Bu nedenle, LLM’ler, hızlı ve verimli olan Sistem 1’de yer alır. Bununla birlikte, bunun dezavantajı, LLM’lerin yanlış ve önyargılı çıktılar üretebilmesi ve hatta kendi gerçeklerini ve rakamlarını oluşturabilmesidir (AI halüsinasyonu).
Bu, Ozanın bazen zor istemler için zahmetsiz sonuç gösterdiği, ancak aşağıdaki gibi kolay görevlerde sefil bir şekilde başarısız olduğu aşağıdaki durumun nedenidir –

Bunun nedeni, belirli bir matematik problemini çözmenin, benzer matematik problemlerinin ‘kalıplarına’ güvenmek yerine belirli bir adım dizisini takip ettiğinizde verimli olmasıdır.
Geleneksel bilgi işlemin daha iyi çalıştığı yer burasıdır. Örneğin, bilgisayarınızdaki hesap makinelerinin çalışma şekli.
Geleneksel bilgi işlem, kod veya basit bir algoritma biçimindeki bir sırayı veya yapıyı takip eder. Bu bakımdan, geleneksel hesaplama, matematiksel problemler yapmak, dizi işlemlerini değiştirmek, dönüştürmeler yapmak ve benzeri görevleri yapmak için tercih edilir. Dezavantajı, belirli bir formatı izlediği için çoğu zaman hızlı veya verimli olmayabilir. Geleneksel bilgisayar 12*24 = 288 gibi soruların cevabını bulabilir ancak matematikle ilgili soruları yapmak daha uzun zaman alır.
Ancak buradaki artı nokta, çoğu zaman doğru cevabı almanın neredeyse kesin olmasıdır.
LLM’lere kıyasla Geleneksel bilgi işlemin oldukça yavaş, daha mantıklı ve yapılandırılmış olduğunu gözlemleyin
Bu nedenle, Geleneksel hesaplama 2. sistem kapsamına girer. Nispeten yavaş, çok daha sistematik ve mantıklıdır. Bir algoritma, kod veya başka herhangi bir sabit kodlu yürütme sisteminden oluşur.
Google’dan Bard, oldukça ilginç bir şekilde, sohbet robotlarının yanıtını daha optimum hale getirmek için her iki sistemi de kullanmaya çalışıyor.
Bard bunu nasıl kullanır?

Bard piyasaya sürüldüğünde zor bir başlangıç yaptı. Bard’ın yeteneğini sergileyen ilk tanıtım videosu, yanıtın yanlış bilgilerden oluşmasının ardından büyük eleştirilere maruz kaldı.
Gerçekten salak olmak istemem ve eminim Bard etkileyici olacaktır, ancak kayıtlara geçsin: JWST “güneş sistemimizin dışındaki bir gezegenin ilk görüntüsünü” çekmedi.
ilk görüntü bunun yerine Chauvin ve arkadaşları tarafından yapıldı. (2004) uyarlanabilir optik kullanan VLT/NACO ile. pic.twitter.com/KnrZ1SSz7h
— Grant Tremblay (@astrogrant) 7 Şubat 2023
Bu nedenle, Bard’ın yapay zeka botunu daha az önyargı veya yanlış bilgi içerecek şekilde daha doğru hale getirmesi önemliydi. Bu, neredeyse tüm yapay zeka araçlarında yanlış bilgileri azaltmak ve verimliliği artırmak için zorlu bir hedef.
Böylece Google, bu vesileyle 7 Haziran’da “-” başlığı altında bir blog yayınladı.Bard mantık ve muhakemede daha iyi hale geliyor”.
Blog, Bard’daki iki yeni özelliği vurguladı.
Bunlardan biri, kullanıcının tabloları içeren çıktılarını Google E-Tablolar’a aktarmasına olanak tanıyan Google E-Tablolar’a dışa aktarma özelliğiydi.
Diğer özellik, Bard’ın – kendi sözleriyle – “matematiksel görevlerde, kodlama sorularında ve dizi manipülasyonunda daha iyi olmasına” izin verdi.
Bard daha önce matematik problemleriyle mücadele etti ve hala ara sıra oluyor. Ancak yukarıda bahsettiğim iki Sistemi birleştirme yaklaşımını kullanan Bard, saçma sapan matematik hatalarını düzelterek şimdi daha iyi olmayı hedefliyor.
Bard’ın kullandığı bu yeni tekniğe “örtük kod yürütme” adı verilir.
LLM’ler (hızlı ve model tabanlı yanıtlardan oluşan Sistem 1) istemi alırken, örtük kod yürütme, Bard’ın hesaplamalı istemleri (mantık ve sistematik yürütmeden oluşan Sistem 2) algılamasına ve arka planda kod çalıştırmasına olanak tanır.
Bu, Bard’ın matematiksel ve dize tabanlı istemlere çok daha kolay yanıt vermesine yardımcı olur.
Blogdan bahsedilen örnekte Google, Bard’ın aşağıdaki gibi istemleri yanıtlamada daha iyi olacağını söyledi:
- 15683615’in asal çarpanları nelerdir?
- Birikimlerimin büyüme oranını hesapla
- Benim için “Lollipop” kelimesini tersine çevir
Aşağıdaki blog alıntıları, bu yaklaşımı kullanmanın özünü ve motivasyonunu yakalamaktadır (iki düşünce sistemi yaklaşımını kullanma) –
“Sonuç olarak, dil ve yaratıcı görevlerde son derece yetenekliler, ancak muhakeme ve matematik gibi alanlarda daha zayıflar.
Gelişmiş muhakeme ve mantık yetenekleriyle daha karmaşık sorunları çözmeye yardımcı olmak için yalnızca LLM çıktısına güvenmek yeterli değildir.
LLM’lerin tamamen 1. Sistem altında çalıştığı düşünülebilir – hızlı ama derinlemesine düşünmeden metin üretir …Geleneksel hesaplama, 2. Sistem düşüncesiyle yakından uyumludur: Formüle dayalıdır ve esnek değildir, ancak doğru adım sırası, uzun bölme çözümleri gibi etkileyici sonuçlar üretebilir.
— Google blogunda
LLM’leri ve Geleneksel bilgi işlemi sırasıyla Sistem 1 ve Sistem 2’de tutmaya yönelik bu yaklaşım, yanıtın çok daha doğru ve verimli olmasını sağlar.
Bloga göre, bu yaklaşımı kullanan Bard, kelime ve matematik problemleriyle başa çıkmada yaklaşık %30’luk bir doğruluk artışı gösterdi.
Bu Yeni Yaklaşım Ne Kadar Güvenilir?
Bu, Bard’ın matematiksel ve sözlü problemlerle uğraşırken doğruluğunu artırsa da, sohbet robotunu verimli kılmak için en iyi yaklaşım olmayabilir.
Matematik ve kelime problemleriyle uğraşırken önemli ölçüde doğruluk gösterse de, kodla ilgili problemlerle uğraşırken hala mücadele ediyor.
Google, blogun sonunda “Bu iyileştirmelere rağmen, Bard her zaman doğru anlamayabilir – örneğin, Bard hızlı yanıta yardımcı olacak kod oluşturmayabilir, ürettiği kod yanlış olabilir veya Bard, yürütülen kodu yanıtına dahil etmeyebilir” diyor.
Bu nedenle, bu önemli bir değişiklik olsa da, Bard’ın tamamen güvenilir olması için daha uzun mesafeler kat etmesi gerekiyor.
Yanlış bilgileri azaltmak ve verimliliği artırmak, neredeyse tüm sohbet robotlarının karşılaştığı zorluklardır.
İlerleme kaydedilirken, daha gidilecek çok yol var.