Uzmanların değerlendirmesi sonucunda, verilen yanıtların yüzde 20'sinin "yüksek derecede sorunlu", yüzde 50'sinin "sorunlu" ve yüzde 30'unun "kısmen sorunlu" olduğu tespit edildi. Araştırma kapsamında, botların hiçbirinin tamamen doğru bir referans listesi sunamadığı görüldü. Sohbet botlarının sağladığı kaynakçalarda genellikle yanlış yazar isimleri, çalışmayan bağlantılar veya tamamen uydurulmuş makaleler yer aldı. Platformlar arasında en düşük performansı yüzde 58 hata oranıyla Grok sergiledi. Onu yüzde 52 hata oranıyla ChatGPT ve yüzde 50 hata oranıyla Meta AI izledi. Yapay zekanın özellikle beslenme ve atletik performans gibi internet üzerinde çelişkili bilgilerin yoğun olduğu alanlarda daha fazla hata yaptığı kaydedildi. Çalışmada, yapay zekanın "doğru mu yanlış mı" şeklindeki kapalı uçlu sorularda daha başarılı olduğu belirlendi. Ancak kullanıcıların günlük hayatta sıkça başvurduğu açık uçlu sorularda hata payının arttığı saptandı. Açık uçlu sorulara verilen yanıtların yüzde 32'si yüksek derecede sorunlu bulundu. Uzmanlar, dil modellerinin gerçek bilgiye sahip olmadığını, sadece eğitim verilerindeki istatistiksel olasılıklara göre kelime tahmini yaptığını hatırlattı. Bu eğitim verilerinin içinde hakemli dergilerin yanı sıra forum siteleri ve sosyal medya tartışmalarının da bulunması, hatalı sonuçların temel nedeni olarak gösterildi. Nature Medicine dergisinde yayımlanan bir başka çalışma ise ilginç bir veriyi ortaya koydu. Yapay zeka modelleri tıbbi sorulara kendi başlarına yüzde 95 oranında doğru yanıt verebilirken, gerçek kullanıcılar bu araçları kullandığında doğru bilgiye ulaşma oranı yüzde 35'e kadar düştü. Bilim insanları, bu araçların karmaşık konuları özetlemek veya doktora sorulacak soruları hazırlamak için yardımcı olabileceğini vurguladı. Ancak yapay zekanın tek başına bir tıbbi otorite olarak kabul edilmemesi gerektiğinin altını çizdi. Kullanıcılara, yapay zekadan aldıkları sağlık tavsiyelerini mutlaka doğrulamaları ve sunulan kaynakları kontrol etmeleri tavsiye edildi. Sizce sağlık konularında yapay zekaya ne kadar güvenilebilir? |
|