Yapay zekâ dünyası, son yıllarda büyük bir evrim geçirdi. İnsan gibi düşünüp, öğrenebilen sistemler, hayatımızın pek çok alanında yer almaya başladı. Ancak, bazı konularda hâlâ insan zekâsına yetişemediği gözlemleniyor. Yapay zekânın basit ama çok önemli bir görevde tökezlediği ortaya çıktı: analog saat okuma!
8 Yaşındaki Çocuğun Kolayca Yapabildiği Görev, Yapay Zeka İçin Zorlu Bir Test

Hepimiz bir analog saati görmekten oldukça aşinayız. Bir çocuk, saati gördüğünde “Saat kaç?” sorusuna rahatlıkla yanıt verebilir. Peki, en gelişmiş yapay zekâ modelleri nasıl tepki verir? Bu oldukça ilginç bir soru! Yapay zekâ, bazen analog saati okuma konusunda ciddi sorunlar yaşayabiliyor.
Yeni bir araştırma, günümüzün en güçlü yapay zekâ sistemlerinin bile analog saatleri okumakta zorlandığını ortaya koydu. Hatta bazıları bu basit görevi tamamen yanlış yapabiliyor. Peki, bu kadar gelişmiş sistemler neden böyle basit bir görevi yerine getiremiyor?
Yapay Zeka Neden Saat Okuyamıyor?
arXiv’da yayımlanan bir araştırmaya göre, GPT-4, Claude 3 ve Gemini gibi dev dil modelleri, analog saatleri anlamakta zorlanıyor. Sonuçlar oldukça çarpıcı:
- GPT-4, analog saat görüntülerini yorumlarken %50’ye yakın hata oranına sahip.
- Claude 3, bazı saatleri doğru okusa da, akrep ve yelkovanın pozisyonlarını karıştırıyor.
- Gemini, saati bazen tamamen farklı bir şekilde yorumluyor; örneğin, “10.10” yerine “2.50” diyebiliyor.
Yapay Zeka ve İnsan Zekâsının Temel Farkları

Peki bu kadar gelişmiş modeller, neden böyle temel bir işlemi yapamıyor? Bu sorunun cevabı, yapay zekânın öğrenme biçiminde yatıyor. İnsanlar, çevrelerinden ve deneyimlerinden kavramları içselleştirerek öğrenirken, yapay zekâ sistemleri büyük veri setlerindeki kalıpları ezberleyerek ve bu kalıplara dayanarak tahminlerde bulunuyor.
Yapay zekâ, bir analog saati gördüğünde “Bu, akrep ve yelkovanın açısal ilişkisini gösteriyor” diye düşünmez. Bunun yerine, eğitim verilerinde gördüğü benzer görsellerle eşleştirme yapmaya çalışır. Yapay zekânın bu durumu doğru yorumlayamaması, büyük ölçüde eğitim verilerinin çeşitliliğiyle ilgilidir. Eğer eğitim verileri yeterince geniş ve çeşitli değilse, model yanlış sonuçlar üretebiliyor.
Saat Okuma: Görsel ve Mantıksal Bir Bütünlük Gerektiriyor
Analog saat okuma, sadece görsel algılama değil, aynı zamanda mantıksal bir ilişkilendirme gerektiriyor. Yapay zekâ, görseli parçalara ayırıp, bu parçalar arasındaki ilişkileri doğru şekilde kurmakta zorlanabiliyor. Ayrıca, Romen rakamları ya da rakamsız saatler gibi farklı stillerdeki saatler, yapay zekâ için kafa karıştırıcı olabiliyor.
Yapay Zeka ve Gelecek: Zorluklar Aşılabilir Mi?
Bu, yapay zekânın sınırlı olduğu anlamına gelmiyor. Ancak, bu durum yapay zekânın hala bazı temel “genel akıl yürütme” (common sense reasoning) yeteneklerine sahip olmadığını gösteriyor. İnsanlar için son derece basit bir görev olan saat okuma, yapay zekâ için karmaşık bir bulmaca gibi duruyor. Ancak unutmayalım ki, yapay zekâ daha ilk çıktığında el yazısı dahi çizemiyordu, şimdi ise gerçeğinden ayırt edilemeyecek şekilde çizimler yapabiliyor.
Araştırmacılar, yapay zekâ sistemlerinin “çoklu modalite” (multimodal) öğrenme yeteneklerini geliştirmeyi hedefliyor. Yani, yapay zekâ sadece metin veya sadece görsel değil, her ikisini bir arada işleyebilecek şekilde geliştirildiğinde, analog saat okuma gibi görevlerde de başarılı olabilecek.
Yapay Zekâ Hâlâ Öğreniyor
Bu araştırma, bize gösteriyor ki yapay zekâ inanılmaz yeteneklere sahip olsa da, insanların doğal olarak yaptığı bazı temel işlemlerde hâlâ zorlanabiliyor. Yapay zekânın bu tür temel görevlerde başarıya ulaşması, zamanla daha da mümkün hale gelecek gibi görünüyor. Ancak, belki de bazı şeyler, yalnızca insana özgü kalacak.