Çok modlu modeller görüntüleri tanıyabilir ve içeriklerini tanımlayabilir. Bu, sorunlu olabilecek insan görüntülerini içerir.
New York Times, OpenAI’nin şu anda görüntülerdeki yüzleri maskelediğini ve GPT-4’ün bunları görüntü tanıma ile işlemesine izin vermediğini bildirdi.
Bu, özellikle çevrenin yanı sıra insanların ayrıntılı açıklamalarını almak için “Gözlerim Ol” deneyinde GPT-4’ü görüntü geliştirme ile kullanan kör insanları etkiler. Ortamın açıklaması hala mevcut ancak kişilerin açıklaması yakın zamanda devre dışı bırakıldı ve görüntülerdeki yüzler bulanık.
OpenAI, GPT-4’ün yüz tanıma için kötüye kullanılmasını istemiyor
Görüntü yeteneklerine sahip GPT-4, AI eğitiminde birçok görüntüsünü gördüğü OpenAI CEO’su Sam Altman gibi önde gelen kişileri tanıyabilir. GPT-4, İnternette bulunan birçok görüntüde görünmeyen kişileri tanımayacaktır.
reklam
Sonuç olarak, tanımlama ve izleme yetenekleri, Clearview AI veya PimEyes gibi bu senaryo için optimize edilmiş ve görüntülerdeki insanları ince ayrıntılara dayalı olarak tanımlayabilen AI sistemleri kadar kapsamlı değildir.
Bununla birlikte, tanımlamanın ötesinde OpenAI, yüzleri analiz ederken daha fazla sorunla karşılaşır: Bir görüntüdeki kişi bilinmese bile, örneğin yanlış cinsiyet veya duygusal durumla tanımlanabilir ve ilişkilendirilebilir.
Yüz milyonlarca kullanıcıyla bu, çok sayıda şikayete yol açabilir. Ek olarak, görüntü analizinin yeterince güçlü olduğu söyleniyor. yaygın captcha sistemlerini atlayın.
OpenAI politika araştırmacısı Sandhini Agarwal, modelin örneğin bir kişinin CEO rolünü doğru bir şekilde tanımladığı, ancak bu role yanlış isim verdiği yanlış tanımlamaların da mümkün olduğunu söylüyor.
Agarwal, “Bunun halkla iki yönlü bir konuşma olmasını çok istiyoruz. ‘Aslında hiçbirini istemiyoruz’ gibi bir şey duyarsak, bu bizim için çok uygun bir şeydir” diyor Agarwal.
Öneri
Microsoft ve Google ayrıca yüz tanımayı da engeller
Google’ın sohbet botu Bard ayrıca görüntü analizi sunar. Şu anda Bard, bilinen ve bilinmeyen kişilerin görüntüleri hakkında açıklama yapmayı reddediyor ve bir kişinin yüklenen görüntüsünü daha fazla sorgulamadan siliyor. Google’ın Lens görsel araması ise Sam Altman’ın bir görüntüsünü tanır ve onu doğru bir şekilde tanımlar.
Microsoft ayrıca görsel resim aramayı Bing Chat’e entegre ediyor. Bing Chat, bir kişinin görüntüsünü yükledikten sonra görüntünün “gizlilik nedenleriyle” bulanıklaştırılacağını belirtir. Bununla birlikte, sohbet robotu, kişinin Google Görseller, sosyal medya veya TinEyes aracılığıyla nasıl bulunacağına dair öneriler sunacaktır.