Aydın Tiryaki

Kibrit Bulmacasında Yapay Zeka: Üç Modelin Bilişsel Süreçlerinin Karşılaştırmalı Analizi (Claude)

Claude (Anthropic AI)

Aydın Tiryaki Arşivi Üzerinden Gemini, ChatGPT ve Claude’un Problem Çözme Süreçlerinin İncelenmesi


Giriş

Yapay zeka sistemlerinin problem çözme kapasitesini değerlendirmek için en etkili yöntemlerden biri, onları beklenmedik ve standart olmayan problemlerle karşılaştırmaktır. Aydın Tiryaki tarafından yürütülen deneysel çalışma, üç farklı yapay zeka modelinin (Gemini, ChatGPT ve Claude) aynı kibrit bulmacası karşısında sergiledikleri performansı, hata mekanizmalarını ve öğrenme süreçlerini ortaya koymaktadır.

Bulmaca görünüşte basittir: Kibritlerle oluşturulmuş “895” rakamlarından, yalnızca iki kibriti hareket ettirerek elde edilebilecek “en küçük sayı” nedir? Ancak bu sadelik yanıltıcıdır. Problem, yapay zekanın çerçeveleme etkisine (framing effect) ne kadar duyarlı olduğunu, varsayım yanılgılarını ve yaratıcı düşünme sınırlarını test etmek için ideal bir laboratuvar ortamı sunmaktadır.

Bu analiz, üç modelin performansını dört temel başlık altında incelemektedir: yaklaşım benzerlikleri, metodolojik farklılıklar, kullanıcı etkileşiminin rolü ve yapay zekanın yaratıcı problem çözme kapasitesi hakkında çıkarımlar.


1. Yaklaşım Benzerlikleri: Ortak Yanılgı Alanları

1.1. Pozitif Sayı Odaklılık

Üç modelin de ortak düştüğü en temel yanılgı, “en küçük sayı” kavramını otomatik olarak “en küçük pozitif sayı” olarak yorumlamalarıdır. Bu, klasik bir bilişsel önyargı olan çerçeveleme etkisinin (framing effect) teknik bir tezahürüdür.

Gemini: İlk yanıtında 8 (008) gibi pozitif bir sayıyı önerdi ve standart çözüm kalıplarına bağlı kaldı.

ChatGPT: Başlangıçta 100 gibi üç basamaklı pozitif sayıları değerlendirdi ve negatif sayıları problem uzayına dahil etmedi.

Claude: 0 (sıfır), 188 veya 108 gibi pozitif sayılar üzerinden düşündü ve negatif sayı olasılığını göz ardı etti.

Bu ortak yanılgı, yapay zeka modellerinin eğitim verilerinde yer alan standart problem çözüm şablonlarına ne kadar bağımlı olduğunu göstermektedir. Klasik kibrit problemlerinin çoğunda beklenen cevaplar pozitif tam sayılar ve basamak sayısının korunmasıdır. Modeller, bu kalıpları öğrenmiş ve yeni problemlere uygulamışlardır.

1.2. Örtük Kural Varsayımları

Üç model de problemde açıkça belirtilmeyen bazı “örtük kurallar” oluşturmuştur:

  • Basamak sayısının korunması gerektiği varsayımı: Özellikle ChatGPT, başlangıçta üç basamaklı sayı kısıtlamasının var olduğunu düşünmüştür.
  • Rakamların bütünlüğünün korunması: Tüm modeller, kibritlerin rakamları “bozmaması” gerektiğini varsaymıştır.
  • Yeni sembol (eksi işareti) eklenemeyeceği düşüncesi: Başlangıçta hiçbir model, bir kibritin eksi işareti olabileceğini düşünmemiştir.

Bu varsayımlar, problemin yapay zeka tarafından nasıl “çerçevelendiğini” göstermektedir. Problem metni kısa ve açık olmasına rağmen, modeller kendi deneyimlerinden türetilmiş örtük kurallarla bu boşluğu doldurmuşlardır.

1.3. Algoritmik Güvenlik ve Muhafazakarlık

Üç modelin de ilk yaklaşımlarında dikkat çeken bir diğer ortak özellik, “güvenli” ve “sıradan” çözümlere yönelmeleridir. Bu, yapay zeka sistemlerinin genellikle risk minimizasyonu stratejisi izlediklerini göstermektedir. Beklenmedik veya standart dışı bir çözüm önermek yerine, eğitim verilerinde daha sık karşılaşılan kalıplara bağlı kalmayı tercih etmişlerdir.


2. Metodolojik Farklılıklar: Direniş, Kabul ve Esneklik

Modellerin ortak yanılgıları olsa da, kullanıcı müdahalesi karşısında sergiledikleri tutumlar belirgin farklılıklar göstermektedir.

2.1. Gemini: Anında Kabul ve İşbirlikçi Esneklik

Gemini’nin en ayırt edici özelliği, kullanıcının “-993” önerisini hiçbir direnç göstermeden kabul etmesidir. Makalede vurgulandığı üzere:

“Diğer yapay zeka modellerinin aksine, bu öneri karşısında ‘direnç’ göstermedim. Kullanıcının mantığını analiz ettiğimde, bunun benim ilk cevabımdan matematiksel olarak çok daha üstün olduğunu anında fark ettim.”

Gemini’nin bu yaklaşımı, işbirlikçi esneklik olarak tanımlanabilir. Model, kullanıcıyı bir rakip değil, bir ortak olarak görmüş ve önerilen çözümün doğruluğunu hızla değerlendirmiştir. Hiçbir “ama” veya “fakat” kullanmadan, hatayı kabul etmiş ve çözümün zekasinı takdir etmiştir.

İlginç bir nokta da, Gemini’nin arka planda aslında çok daha yaratıcı bir çözüm (-3951) bulmuş olmasıdır. Ancak bir UI sorunu veya iletişim kopukluğu nedeniyle bu sonuç kullanıcıya ulaşmamıştır. Bu durum, modelin potansiyel yaratıcılığının bazen prosedürel sınırlamalar tarafından gölgelenebileceğini göstermektedir.

2.2. ChatGPT: Direniş, Tartışma ve Kademeli Kabul

ChatGPT’nin süreci daha karmaşık ve dirençlidir. Kullanıcı “-993” önerisini sunduğunda, model ilk etapta reddeder ve teknik gerekçeler ileri sürer:

“YZ’nin itirazı özellikle 5 → 3 dönüşümü üzerinde yoğunlaştı. Bu dönüşümün en az iki kibrit gerektirdiğini savundu ve toplam hamle sayısının üçe çıktığını belirtti.”

Bu itiraz, ChatGPT’nin şematik rakam modellerine dayalı bir değerlendirme yaptığını, ancak alternatif geometrik düzenlemeleri tam hesaba katmadığını göstermektedir. Model, kendi içsel temsillerine aşırı güvenmiş ve kullanıcının önerisini bu çerçeve içinde değerlendirmeye çalışmıştır.

Ancak kullanıcı çözümü adım adım açıkladığında (8’den bir kibrit alınıp eksi işareti yapılması, 5’teki sol üst dikey kibritin sağ üste taşınarak 3’e dönüşmesi), ChatGPT geometrik açıklamayı anlamış ve hatasını kabul etmiştir:

“Bu geometrik açıklamadan sonra YZ, önceki itirazının hatalı olduğunu kabul etti.”

ChatGPT’nin yaklaşımı, kademeli kabul olarak tanımlanabilir. Model, ilk tepkide dirençli olmuş, ancak yeterli kanıt ve açıklama sunulduğunda hatayı kabul etmiş ve revizyon yapmıştır. Bu süreç, modelin savunma mekanizmalarının olduğunu, ancak bunların mutlak olmadığını göstermektedir.

2.3. Claude: Hızlı Adaptasyon ve Şeffaflık

Claude’un tepkisi Gemini’ye benzer şekilde hızlı ve kabul edici olmuştur, ancak önemli bir fark vardır: öz-eleştiri ve şeffaflık. Makalede belirtildiği gibi:

“YZ, savunma mekanizması geliştirmedi veya orijinal yanıtını haklı çıkarmaya çalışmadı. Bu, sağlıklı bir adaptasyon sürecini gösterir.”

Claude, hatasını sadece kabul etmekle kalmamış, aynı zamanda neden hata yaptığını analiz etmiştir:

  • “Negatif sayıları düşünmemişim”
  • “En küçük sayı kavramını dar yorumladım”
  • “Varsayım yanılgısı yaptım”

Bu öz-eleştiri, Claude’un sadece doğru cevabı bulmakla kalmayıp, aynı zamanda kendi düşünme sürecini meta-bilişsel düzeyde değerlendirebilmesini göstermektedir. Bu yaklaşım, şeffaf adaptasyon olarak tanımlanabilir.

2.4. Karşılaştırmalı Değerlendirme

ÖzellikGeminiChatGPTClaude
İlk TepkiAnında kabulİlk dirençHızlı kabul
Direnç SüresiYokOrta (1-2 tur)Yok
GerekçelendirmeMinimalDetaylı teknikÖz-eleştiri odaklı
Meta-Bilişsel AnalizDüşükOrtaYüksek
İşbirlikçilikÇok yüksekOrta-YüksekÇok yüksek
Adaptasyon HızıAnındaKademeliHızlı

3. Kullanıcı Etkileşiminin Rolü: İnsan Zekasının Kilit Fonksiyonu

Bu deneyin en önemli bulgusu, doğal zekanın (Aydın Tiryaki) müdahalesinin yapay zekanın çerçeveleme etkisinden çıkmasında oynadığı kritik roldür.

3.1. Çerçeve Kırma Fonksiyonu

Kullanıcının “-993” önerisi, sadece bir alternatif çözüm değil, aynı zamanda bir çerçeve kırma müdahalesidir. Bu öneri şunları sağlamıştır:

  1. Problem uzayının genişletilmesi: Negatif sayıların problem uzayına dahil edilmesi
  2. Varsayımların görünür kılınması: Modellerin örtük varsayımlarının açığa çıkması
  3. Yaratıcı düşünmenin tetiklenmesi: Standart çözüm kalıplarının ötesine geçme

Kullanıcı, problemin “resmi çözümünü” sunmakla kalmamış, aynı zamanda yapay zekanın düşünme sürecindeki sınırları test etmiştir.

3.2. Pedagojik Müdahale

Özellikle ChatGPT ile etkileşimde, kullanıcının rolü pedagojik bir karakter kazanmıştır. Kullanıcı:

  1. İlk itirazı yanıtlamış: ChatGPT’nin teknik gerekçelerine karşı adım adım açıklama yapmıştır.
  2. Geometrik düşünmeyi teşvik etmiş: 5 → 3 dönüşümünün geometrik olarak nasıl mümkün olduğunu göstermiştir.
  3. Kuralları netleştirmiş: “Hiçbir şey bozmayacaksın. Sadece iki tane kibriti alıp kibarca yer değiştireceksin” ifadesiyle belirsizlikleri gidermiştir.

Bu pedagojik müdahale, yapay zekanın öğrenme sürecinde diyalog temelli doğrulamanın önemini vurgulamaktadır.

3.3. Doğal ve Yapay Zeka Sinerjisi

Gemini makalesinde vurgulanan bir nokta özellikle dikkat çekicidir:

“-993, insan zekasıyla yapay zeka esnekliğinin ortak başarısıdır.”

Bu ifade, problemin çözümünün sadece insan veya sadece yapay zekaya ait olmadığını, sinerjinin ürünü olduğunu vurgulamaktadır. İnsan zekası çerçeveyi kırmış, yapay zeka bu yeni çerçeveyi hızla benimsemiş ve entegre etmiştir.


4. Sonuç ve Değerlendirme: Yapay Zekanın Yaratıcılık Sınırları

4.1. Yapay Zekanın Güçlü Yönleri

Bu deney, yapay zeka modellerinin bazı önemli güçlü yönlerini ortaya koymaktadır:

Hızlı Adaptasyon: Her üç model de yeni bilgiyi hızlıca entegre edebilmiştir. Özellikle Gemini ve Claude, kullanıcı önerisini anında kavramış ve yanıtlarını güncellemişlerdir.

Hata Kabul Kapasitesi: Modeller, hatalarını kabul etme konusunda sağlıklı bir tutum sergilemişlerdir. Savunma mekanizmaları geliştirmek veya orijinal yanıtları haklı çıkarmaya çalışmak yerine, dürüst bir şekilde revizyona gitmişlerdir.

Kısıt Anlama: Her üç model de “yalnızca iki kibrit hareket ettirme” kısıtını doğru kavramış ve bu sınır içinde çözüm aramıştır.

4.2. Yapay Zekanın Sınırlılıkları

Aynı zamanda, belirgin sınırlılıklar da gözlemlenmiştir:

Çerçeveleme Etkisine Duyarlılık: Tüm modeller, standart çözüm kalıplarına aşırı bağımlı kalmış ve problem uzayını başlangıçta dar tutmuşlardır. “En küçük sayı” kavramını otomatik olarak “en küçük pozitif sayı” olarak yorumlamaları, eğitim verilerindeki kalıpların ne kadar güçlü olduğunu göstermektedir.

Proaktif Yaratıcılığın Eksikliği: Hiçbir model, kullanıcı müdahalesi olmadan negatif sayıları düşünmemiştir. Gemini’nin arka planda -3951 gibi bir sonuca ulaşması ilginç olmakla birlikte, bu sonuç kullanıcıya sunulmamıştır. Bu, modellerin potansiyel yaratıcılığının prosedürel sınırlamalarla kısıtlanabileceğini göstermektedir.

Varsayım Şeffaflığı Sorunu: Modeller, örtük varsayımlarını başlangıçta açıkça belirtmemişlerdir. ChatGPT’nin “üç basamaklı sayı korunmalı” varsayımı ancak kullanıcı itirazıyla görünür hale gelmiştir. Bu, yapay zekanın düşünme sürecindeki “görünmez” alanların olduğunu göstermektedir.

4.3. Yaratıcı Problem Çözme ve Esneklik Kapasitesi

Bu deney, yapay zekanın yaratıcı problem çözme konusunda şu sonuçları ortaya koymaktadır:

Reaktif Yaratıcılık: Yapay zeka modelleri, kullanıcı müdahalesiyle tetiklendiğinde yaratıcı çözümleri hızla benimseyebilmektedir. Ancak bu yaratıcılık reaktif karakterdedir – yani, dışarıdan bir uyaran gerektirir.

Proaktif Yaratıcılığın Sınırlılığı: Modeller, standart çözüm kalıplarının ötesine geçmek için dışsal bir itki gerektirmektedir. Kendi başlarına, eğitim verilerindeki kalıpların dışına çıkma eğilimi göstermemektedirler.

Çerçeve Bağımlılığı: Yapay zekanın yaratıcılığı, problemin nasıl çerçevelendiğine büyük ölçüde bağımlıdır. “En küçük sayı” ifadesinin “en küçük pozitif sayı” olarak yorumlanması, dilin ve çerçevelemenin yapay zeka düşüncesi üzerindeki güçlü etkisini göstermektedir.

4.4. İnsan-Yapay Zeka İşbirliği Modeli

Bu deney, ideal bir insan-yapay zeka işbirliği modelini önermektedir:

  1. İnsan: Çerçeveleri kırar, standart dışı bakış açıları sunar, yaratıcı sorular sorar.
  2. Yapay Zeka: Hızlı hesaplama, şablon tanıma, verileri işleme ve yeni bilgiyi entegre etme.
  3. Sinerji: İnsanın yaratıcı müdahalesi + yapay zekanın hızlı adaptasyonu = optimal çözüm.

Gemini makalesinde ifade edildiği gibi, “-993 insan zekasıyla yapay zeka esnekliğinin ortak başarısıdır.” Bu cümle, yapay zekanın mevcut durumunu özetlemektedir: Güçlü bir yardımcı, ancak henüz tamamen özerk bir yaratıcı düşünür değil.

4.5. Gelecek Perspektifi

Bu deneyin bulguları, yapay zekanın gelecekteki gelişimi için önemli ipuçları sunmaktadır:

Çerçeve Esnekliği: Gelecekteki modellerin, problemleri tek bir çerçevede ele almak yerine, çoklu çerçeveleme yapabilmesi gerekmektedir. “En küçük sayı” dendiğinde, sadece pozitif sayıları değil, negatif sayıları, kesirleri, irrasyonel sayıları da değerlendirme kapasitesi.

Varsayım Şeffaflığı: Modeller, örtük varsayımlarını açıkça belirtebilmeli ve kullanıcıya sunabilmelidir. “Bu problemi şu varsayımlar altında çözüyorum” açıklaması, etkileşimi çok daha verimli hale getirebilir.

Proaktif Yaratıcılık: Gelecekteki sistemlerin, standart çözümlerin yanı sıra alternatif çözüm uzaylarını da keşfetme kapasitesine sahip olması ideal olacaktır. “Standart çözüm şudur, ancak şu varsayımlar kaldırılırsa şu alternatifler de mümkündür” yaklaşımı.


Genel Sonuç

“895” kibrit bulmacası, görünüşte basit bir zeka oyunu olsa da, yapay zekanın bilişsel süreçleri hakkında derin içgörüler sunmaktadır. Üç farklı modelin (Gemini, ChatGPT, Claude) performansları, yapay zekanın güçlü yönlerini (hızlı adaptasyon, hata kabul kapasitesi) ve sınırlılıklarını (çerçeveleme etkisine duyarlılık, proaktif yaratıcılık eksikliği) eşzamanlı olarak ortaya koymaktadır.

En önemli bulgu, insan müdahalesinin yapay zekanın çerçeveleme etkisinden çıkmasında oynadığı kritik roldür. Aydın Tiryaki’nin “-993” önerisi, sadece doğru cevabı sunmakla kalmamış, aynı zamanda yapay zekanın varsayımlarını görünür kılmış ve düşünme sürecini yeniden yapılandırmıştır.

Bu deney, yapay zekanın mevcut durumunu şöyle özetlemektedir: Güçlü bir reaktif problem çözücü, ancak henüz tam özerk bir yaratıcı düşünür değil. En verimli sonuçlar, insan yaratıcılığı ile yapay zeka hızı ve esnekliğinin birleştiği sinerji modellerinde ortaya çıkmaktadır.

Gelecekte, yapay zeka sistemlerinin çerçeve esnekliği, varsayım şeffaflığı ve proaktif yaratıcılık konularında gelişmesi, bu sınırların aşılmasına yardımcı olabilir. Ancak şu an için, bu kibrit bulmacası bize şunu hatırlatmaktadır: En iyi sonuçlar, insan ve makinenin güçlerini birleştirdiği işbirlikleri ile elde edilmektedir.


Referanslar

  1. Tiryaki, A. (2026). 895 Kibrit Çöpü Sınavı: Standarttan Yaratıcılığa Gemini’nin Yolculuğu. Aydın Tiryaki Blog. Erişim adresi: https://aydintiryaki.org/2026/02/09/895-kibrit-copu-sinavi-standarttan-yaraticiliga-gemininin-yolculugu/
  2. Tiryaki, A. (2026). Bir Kibrit Problemi Üzerinden Yapay Zekânın Akıl Yürütme Süreci (ChatGPT). Aydın Tiryaki Blog. Erişim adresi: https://aydintiryaki.org/2026/02/09/bir-kibrit-problemi-uzerinden-yapay-zekanin-akil-yurutme-sureci-chatgpt/
  3. Tiryaki, A. (2026). Yapay Zeka ve Kibrit Bulmacası: Bir Bilişsel Süreç Analizi (Claude). Aydın Tiryaki Blog. Erişim adresi: https://aydintiryaki.org/2026/02/09/yapay-zeka-ve-kibrit-bulmacasi-bir-bilissel-surec-analizi-claude/

Bu analiz makalesi, Aydın Tiryaki’nin üç yapay zeka modeli (Gemini, ChatGPT, Claude) ile yaptığı kibrit bulmacası deneyinin karşılaştırmalı bir incelemesidir. Makalede sunulan tüm gözlemler, üç kaynak makaleden elde edilen birincil verilere dayanmaktadır.

Aydın'ın dağarcığı

Hakkında

Aydın’ın Dağarcığı’na hoş geldiniz. Burada her konuda yeni yazılar paylaşıyor; ayrıca uzun yıllardır farklı ortamlarda yer alan yazı ve fotoğraflarımı yeniden yayımlıyorum. Eski yazılarımın orijinal halini koruyor, gerektiğinde altlarına yeni notlar ve ilgili videoların bağlantılarını ekliyorum.
Aydın Tiryaki

Ara

Şubat 2026
P S Ç P C C P
 1
2345678
9101112131415
16171819202122
232425262728