Günümüzde yapay zekanın hızlı gelişimi nedeniyle insanları pek çok alanda geride bırakması yeni testlere olan ihtiyacı ortaya çıkarmaktadır. Stanford Üniversitesi’nin yayınladığı AI Endeksi raporunda yapay zekanın insanlarla kıyaslandığında gösterdiği üstün performans ön plana çıkmaktadır. Yapay zeka, geçmiş yıllarda görüntü sınıflandırma, temel okuduğunu anlama, görsel muhakeme ve doğal dil çıkarımı gibi alanlarda insanları geride bırakmıştır. Bu hızlı gelişim nedeniyle mevcut kriterlerin artık yetersiz olduğu ve yeni, daha zorlu ölçütlerin geliştirilmesi gerektiği vurgulanmaktadır.
Yapay zeka, karmaşık bilişsel görevlerde bazı zorluklar yaşamaktadır. 2021’de yapay zeka sistemlerinin sadece %6,9’unun çözebildiği problemleri, 2023’te GPT-4 tabanlı modellerin %84,3’ünü çözmesine rağmen insanların %90 düzeyinde başarılı olduğu belirtilmektedir. Ayrıca görsel sağduyu muhakemesi (VCR) alanında da yapay zeka hızla gelişmekte ve insanlarla benzer seviyelere ulaşmaktadır.
Yapay zekanın doğruluğu konusunda da ilerleme kaydedildiği görülmektedir. Yapay zeka modelleri, yazılı içerikler üretirken hala yanlış veya hatalı bilgiler üretebilmektedir. Ancak, 2024’te piyasaya sürülen GPT-4 modelinin doğruluk konusunda önemli bir ilerleme kaydettiği belirtilmektedir.
Sonuç olarak, yapay zeka alanındaki hızlı gelişmeler dikkate alındığında insanların yapay zeka ile rekabet edebilmesi için yeni testler ve ölçütler geliştirilmesi gerekmektedir. Yine de yapay zeka modellerinin karmaşık görevlerde, doğruluk konusunda ve genel performanslarıyla sürekli olarak iyileşmeye devam ettiği gözlemlenmektedir. Bu durum, yapay zekanın gelecekte insanlığın birçok alanında daha fazla rol oynaması ve gelişmesi ihtimalini güçlendirmektedir.