Geniş dil modellerinin halüsinasyonları
Fotoğraf: Gordon Johnson/Pixabay
Cambridge Sözlüğü, yılın kelimesini “halüsinasyon görmek” olarak açıkladı. TDK’nin çevrimiçi Güncel Türkçe Sözlük’ü halüsinasyonu “sanrı”, halüsinasyon görmeyi ise “Gerçekte olmayan birtakım olayları yaşadığını sanmak” olarak tanımlıyor. Cambridge’in halüsinasyonu yılın kelimesi seçme nedeni ise kelimeye yeni bir bağlam içinde yüklenmiş yeni bir anlamdan dolayı. Yapay zekâ ve geniş dil modellerinin yanlış bilgi üretmeleri halüsinasyon görme olarak adlandırılıyor.
Halüsinasyonlar, geniş dil modellerinin oluşturulma ve işleyiş mekanizmalarının doğal bir sonucu olarak ortaya çıkıyor. Geniş dil modelleri oldukça büyük veri setleri ile “eğitilerek” ortaya çıkartılan sistemler. Herhangi bir modelin eğitiminde kullanılan veri seti hatalı, yanlış, tutarsız ya da taraflı bilgi içerebiliyor ve bütün bu doğrulu yanlışlı içeriğin modelin yanıtlarına etkisi var. Veri seti kusursuz bir tutarlılıkta ve doğrulukta olsa dahi geniş dil modelleri veriler arasında hatalı ilişkiler kurmaya oldukça müsait araçlar. Modelin eğitimi sırasında kurulan hatalı ilişkilendirmeler de halüsinasyonlar olarak sonuçlanabiliyor. Bunlara ek olarak girdilerin niteliği ya da nitelik yoksunluğu da halüsinasyonlara yol açabiliyor.
Halüsinasyonlar, geniş dil modellerin önündeki en önemli sorunlardan biri. Türkiye’nin başkentini sorduğunuzda büyük bir öz güvenle Adana yanıtını verip ardından da uydurma veri ve makalelerle Adana’nın nasıl ve ne zaman başkent olduğunu anlatabilen bir geniş dil modeline ne kadar güvenebileceğinizi düşünün. Daha incelikli ve yanlışlığının anlaşılması zor halüsinasyonların geniş dil modellerinin inandırıcı cümleleri ve yalan referanslarıyla ne kadar kolay yayılabileceği ortada.
En aza indirmeye dönük çabalar olsa da halüsinasyonlar geniş dil modellerinin olağan ve ortadan kaldırılması tümüyle mümkün olmayan bir sonucu. Ancak bu geniş dil modelleri tümüyle kullanışsız araçlar anlamına da gelmiyor. Halüsinasyonlarına rağmen yeterli denetimle geliştirildiklerinde/kullanıldıklarında pek çok alanda ciddi kolaylıklar sağlayabilen ve alanları değiştirebilecek potansiyele sahip araçlar geniş dil modelleri.
Geniş dil modellerinin doğru ve yeterli denetim ile sorumluluk sahibi bir şekilde kullanımı ne kadar mümkün sorusu ise oldukça karmaşık bir tartışma. Bir yanda modelleri geliştiren şirketler var. Bu şirketlerin ilk önceliklerinin kârlılık olduğunu söylemeye gerek bile yok. Yine şirketlerle aynı safta yapay zekâ pastasından pay kapmada geri kalmak istemeyen bu nedenle de denetimleri, yasal düzenlemeleri öteleme eğilimde olan devletler var. Kullanıcı tarafına indiğinizde ise hatasına halüsinasyonuna bakmadan haber metninden ürün yorumuna, bilimsel makaleden kitap yazımına kontrolsüzce bir kullanım söz konusu.
Geçen haftalarda ülkenin büyük haber sitelerinden birinde yayımlanan haberlerden birinde unutulan “Bir yapay zekâ dil modeli olarak…” diye başlayan cümle güncel duruma dair de bir veri aslında. Kontrolsüzce ve denetimsizce kullanıma daha fazla kanıt arıyorsanız ChatGPT’nin yanıtlarındaki standart uyarısı olan “as an AI language model” cümlesini sosyal medyada arama motorlarında aratın. Bu cümlenin geçtiği içeriklerin ChatGPT ile oluşturulduğunu söylemek işin kolay kısmı. Peki ya içinde bu cümlenin geçmedikleri? Böyle kolayca tespit edilemeyen; yeterli kontrol ve denetimden geçmediği için de muhtemelen geniş dil modellerinin halüsinasyonlarını da içeren metinleri ne yapacağız?
- Çocukları çevrimiçi tehlikelerden kim koruyacak? 14 Aralık 2024 04:24
- Sosyal medyaya yaş sınırlaması çocukları koruyabilir mi? 30 Kasım 2024 04:50
- Medyanın arama tekeli ile imtihanı 23 Kasım 2024 05:01
- Teknoloji patronları ABD seçiminin galiplerinden 09 Kasım 2024 04:32
- Platformlar ve yayıncılar çevrim içi radikalleşmenin neresinde? 19 Ekim 2024 06:56
- Hamam böceği yuvası mutfakta değil 10 Ekim 2024 04:55
- ‘Yerli ve milli’lik siber güvenliğin neresinde? 21 Eylül 2024 06:01
- Sızan/sızmayan veri ve sonrası 14 Eylül 2024 04:54
- Modern İskenderiye Kütüphanesi yanarken 07 Eylül 2024 04:43
- Genç oyun geliştiricilere vadedilen kabus 24 Ağustos 2024 05:58
- Oyunları kim, neden hedefe koyar? 17 Ağustos 2024 05:04
- Sansür, ebeveynler ve oyunlar 10 Ağustos 2024 06:30