Google, PaLM dil modelinin tıbbi versiyonu olan Med-PaLM 2’yi klinik bir ortamda erken müşterilerle sahada test ediyor.
Med-PaLM 2, tıbbi soruları yanıtlama yeteneğini geliştirmek için tıbbi ruhsatlandırma sınavlarından gelen sorular ve yanıtlar konusunda eğitilmiştir. Model, tıbbi belgeleri özetleyebilir, sağlık verilerini düzenleyebilir ve tıbbi sorulara yanıtlar üretebilir.
Wall Street Journal’a göre, Med-PaLM 2’nin ilk testleri Mayo Clinic de dahil olmak üzere ABD’deki sağlık tesislerinde yapılıyor. Google, modelinin özellikle “doktorlara sınırlı erişimin” olduğu ülkelerde yararlı olabileceğine inanıyor.
WSJ’nin bildirdiğine göre, Med-PaLM 2 denemesi sırasında gönderilen müşteri verileri şifrelenecek, Google tarafından erişilemeyecek ve müşterilerin kendileri tarafından kontrol edilecek.
reklam
Med-PaLM 2, uzman düzeyinde tıbbi bilgi sağlayabilir, ancak yine de hatalar yapacaktır.
Google, bu yılın Nisan ayında Med-PaLM 2’nin ilk klinik denemelerini duyurdu. Google’a göre Med-PaLM 2, öncekinden yüzde 18 daha iyi performans sağlıyor ve tıbbi görevler için benzer modellerden çok daha iyi performans gösteriyor.
Google, Med-PaLM 2’nin ABD Tıbbi Lisanslama Sınavındaki (USMLE) benzer sorularda yüzde 85’in üzerinde doğruluk elde eden ilk dil modeli olduğunu söylüyor. Model, Hindistan’ın AIIMS ve NEET tıbbi giriş sınavlarından gelen soruları içeren MedMCQA veri setinde yüzde 72,3’lük bir “tatmin edici puan” elde etti.
Med-PaLM 2’nin geliştirilmesine yardımcı olan Google araştırmacısı Greg Corrado, modeli henüz ailesinin sağlık hizmetleri için kullanmayacağı bir teknoloji olarak tanımlıyor. Ancak Coraddo, yapay zekanın tıptaki olanaklarını yine de on kat artırdığını söylüyor.
Yapay zeka sağlık sektörüne girerken, hassas hasta verilerinin işlenmesiyle ilgili endişeler dile getirildi. AI tarafından üretilen tıbbi tavsiyenin potansiyel riskleri de tartışılmaktadır. Google, 2022’nin sonunda ilk Med-PaLM’yi tanıttı.
Nisan 2023’ün sonunda yayınlanan bir çalışma, ChatGPT’nin GPT 3.5’e dayalı, tıbben ince ayarlanmamış bir sürümünün bile tıbbi yanıtlarda insanlar tarafından derecelendirildiğinde doktor yanıtlarından daha yüksek kalite ve empati derecelendirmeleri elde edebildiğini gösterdi.
Öneri