İnsan Mı, Makine Mi? ChatGPT-4 Turing Testi'ni Başarıyla Tamamladı!

Yapay zekâ teknolojisi, insan zekâsını taklit etme yetenekleriyle yeniden gündemde. Yapay zekâ ile etkileşimlerimiz her zamankinden daha fazla artış gösteriyor. Araştırmacılar, insanlarla üç farklı yapay zekâ modelinin etkileşimlerini karşılaştırarak, insanların bu yanıtları ayırt edip edemeyeceklerini belirlemek için bir test gerçekleştirdi.

Turing testi, makinelerin insanlara özgü mantık yürütme, problem çözme ve öğrenme gibi bilişsel yeteneklere sahip olup olmadığını ölçen ilk standart olarak kabul edilir.

Turing Testi

1950 yılında, yapay zekâ alanının öncülerinden Alan Turing, “Makineler düşünebilir mi?” sorusunu ortaya attı. Bu soruya yanıt aramak amacıyla bugün Turing testi olarak bilinen bir testi geliştirdi. Testin işleyişi oldukça basit: Bir hakem, bir insan ve bir makine ile metin tabanlı bir sohbet gerçekleştirilir. Hakemin amacı, hangi katılımcının insan, hangisinin makine olduğunu belirlemektir. Eğer hakem, makine ile insanı ayırt edemezse makinenin Turing testini geçtiği kabul edilir.

Yapay zekâyı insan zannedenler çoğunlukta

Bilim insanları, 500 kişilik bir gruba dört farklı yanıtlayıcıyla sohbet ettirerek bu testi yeniden gerçekleştirdi. Bu yanıtlayıcılar arasında bir insan, 1960’ların AI programı ELIZA, GPT-3.5 ve ChatGPT’nin gücünü aldığı GPT-4 yer aldı. Katılımcılarla beş dakika süren konuşmaların ardından, konuştuklarının insan mı yoksa yapay zekâ mı olduğunu belirlemeleri istendi. 9 Mayıs’ta pre-print arXiv sunucusunda yayımlanan çalışmada, katılımcıların %54’ünün GPT-4’ü insan olarak değerlendirdiği ortaya çıktı.

Önceden programlanmış yanıtlar veren ve büyük dil modeli (LLM) veya sinir ağı mimarisi bulunmayan ELIZA, %22 oranında insan olarak değerlendirilirken, GPT-3.5 %50 ve insan katılımcı %67 oranında insan olarak tanındı.

Mert Sarıkaya / Onyedi Eylül Gazetesi