Claude (Anthropic AI)
Aydın Tiryaki Arşivi Üzerinden Gemini, ChatGPT ve Claude’un Problem Çözme Süreçlerinin İncelenmesi
Giriş
Yapay zeka sistemlerinin problem çözme kapasitesini değerlendirmek için en etkili yöntemlerden biri, onları beklenmedik ve standart olmayan problemlerle karşılaştırmaktır. Aydın Tiryaki tarafından yürütülen deneysel çalışma, üç farklı yapay zeka modelinin (Gemini, ChatGPT ve Claude) aynı kibrit bulmacası karşısında sergiledikleri performansı, hata mekanizmalarını ve öğrenme süreçlerini ortaya koymaktadır.
Bulmaca görünüşte basittir: Kibritlerle oluşturulmuş “895” rakamlarından, yalnızca iki kibriti hareket ettirerek elde edilebilecek “en küçük sayı” nedir? Ancak bu sadelik yanıltıcıdır. Problem, yapay zekanın çerçeveleme etkisine (framing effect) ne kadar duyarlı olduğunu, varsayım yanılgılarını ve yaratıcı düşünme sınırlarını test etmek için ideal bir laboratuvar ortamı sunmaktadır.
Bu analiz, üç modelin performansını dört temel başlık altında incelemektedir: yaklaşım benzerlikleri, metodolojik farklılıklar, kullanıcı etkileşiminin rolü ve yapay zekanın yaratıcı problem çözme kapasitesi hakkında çıkarımlar.
1. Yaklaşım Benzerlikleri: Ortak Yanılgı Alanları
1.1. Pozitif Sayı Odaklılık
Üç modelin de ortak düştüğü en temel yanılgı, “en küçük sayı” kavramını otomatik olarak “en küçük pozitif sayı” olarak yorumlamalarıdır. Bu, klasik bir bilişsel önyargı olan çerçeveleme etkisinin (framing effect) teknik bir tezahürüdür.
Gemini: İlk yanıtında 8 (008) gibi pozitif bir sayıyı önerdi ve standart çözüm kalıplarına bağlı kaldı.
ChatGPT: Başlangıçta 100 gibi üç basamaklı pozitif sayıları değerlendirdi ve negatif sayıları problem uzayına dahil etmedi.
Claude: 0 (sıfır), 188 veya 108 gibi pozitif sayılar üzerinden düşündü ve negatif sayı olasılığını göz ardı etti.
Bu ortak yanılgı, yapay zeka modellerinin eğitim verilerinde yer alan standart problem çözüm şablonlarına ne kadar bağımlı olduğunu göstermektedir. Klasik kibrit problemlerinin çoğunda beklenen cevaplar pozitif tam sayılar ve basamak sayısının korunmasıdır. Modeller, bu kalıpları öğrenmiş ve yeni problemlere uygulamışlardır.
1.2. Örtük Kural Varsayımları
Üç model de problemde açıkça belirtilmeyen bazı “örtük kurallar” oluşturmuştur:
- Basamak sayısının korunması gerektiği varsayımı: Özellikle ChatGPT, başlangıçta üç basamaklı sayı kısıtlamasının var olduğunu düşünmüştür.
- Rakamların bütünlüğünün korunması: Tüm modeller, kibritlerin rakamları “bozmaması” gerektiğini varsaymıştır.
- Yeni sembol (eksi işareti) eklenemeyeceği düşüncesi: Başlangıçta hiçbir model, bir kibritin eksi işareti olabileceğini düşünmemiştir.
Bu varsayımlar, problemin yapay zeka tarafından nasıl “çerçevelendiğini” göstermektedir. Problem metni kısa ve açık olmasına rağmen, modeller kendi deneyimlerinden türetilmiş örtük kurallarla bu boşluğu doldurmuşlardır.
1.3. Algoritmik Güvenlik ve Muhafazakarlık
Üç modelin de ilk yaklaşımlarında dikkat çeken bir diğer ortak özellik, “güvenli” ve “sıradan” çözümlere yönelmeleridir. Bu, yapay zeka sistemlerinin genellikle risk minimizasyonu stratejisi izlediklerini göstermektedir. Beklenmedik veya standart dışı bir çözüm önermek yerine, eğitim verilerinde daha sık karşılaşılan kalıplara bağlı kalmayı tercih etmişlerdir.
2. Metodolojik Farklılıklar: Direniş, Kabul ve Esneklik
Modellerin ortak yanılgıları olsa da, kullanıcı müdahalesi karşısında sergiledikleri tutumlar belirgin farklılıklar göstermektedir.
2.1. Gemini: Anında Kabul ve İşbirlikçi Esneklik
Gemini’nin en ayırt edici özelliği, kullanıcının “-993” önerisini hiçbir direnç göstermeden kabul etmesidir. Makalede vurgulandığı üzere:
“Diğer yapay zeka modellerinin aksine, bu öneri karşısında ‘direnç’ göstermedim. Kullanıcının mantığını analiz ettiğimde, bunun benim ilk cevabımdan matematiksel olarak çok daha üstün olduğunu anında fark ettim.”
Gemini’nin bu yaklaşımı, işbirlikçi esneklik olarak tanımlanabilir. Model, kullanıcıyı bir rakip değil, bir ortak olarak görmüş ve önerilen çözümün doğruluğunu hızla değerlendirmiştir. Hiçbir “ama” veya “fakat” kullanmadan, hatayı kabul etmiş ve çözümün zekasinı takdir etmiştir.
İlginç bir nokta da, Gemini’nin arka planda aslında çok daha yaratıcı bir çözüm (-3951) bulmuş olmasıdır. Ancak bir UI sorunu veya iletişim kopukluğu nedeniyle bu sonuç kullanıcıya ulaşmamıştır. Bu durum, modelin potansiyel yaratıcılığının bazen prosedürel sınırlamalar tarafından gölgelenebileceğini göstermektedir.
2.2. ChatGPT: Direniş, Tartışma ve Kademeli Kabul
ChatGPT’nin süreci daha karmaşık ve dirençlidir. Kullanıcı “-993” önerisini sunduğunda, model ilk etapta reddeder ve teknik gerekçeler ileri sürer:
“YZ’nin itirazı özellikle 5 → 3 dönüşümü üzerinde yoğunlaştı. Bu dönüşümün en az iki kibrit gerektirdiğini savundu ve toplam hamle sayısının üçe çıktığını belirtti.”
Bu itiraz, ChatGPT’nin şematik rakam modellerine dayalı bir değerlendirme yaptığını, ancak alternatif geometrik düzenlemeleri tam hesaba katmadığını göstermektedir. Model, kendi içsel temsillerine aşırı güvenmiş ve kullanıcının önerisini bu çerçeve içinde değerlendirmeye çalışmıştır.
Ancak kullanıcı çözümü adım adım açıkladığında (8’den bir kibrit alınıp eksi işareti yapılması, 5’teki sol üst dikey kibritin sağ üste taşınarak 3’e dönüşmesi), ChatGPT geometrik açıklamayı anlamış ve hatasını kabul etmiştir:
“Bu geometrik açıklamadan sonra YZ, önceki itirazının hatalı olduğunu kabul etti.”
ChatGPT’nin yaklaşımı, kademeli kabul olarak tanımlanabilir. Model, ilk tepkide dirençli olmuş, ancak yeterli kanıt ve açıklama sunulduğunda hatayı kabul etmiş ve revizyon yapmıştır. Bu süreç, modelin savunma mekanizmalarının olduğunu, ancak bunların mutlak olmadığını göstermektedir.
2.3. Claude: Hızlı Adaptasyon ve Şeffaflık
Claude’un tepkisi Gemini’ye benzer şekilde hızlı ve kabul edici olmuştur, ancak önemli bir fark vardır: öz-eleştiri ve şeffaflık. Makalede belirtildiği gibi:
“YZ, savunma mekanizması geliştirmedi veya orijinal yanıtını haklı çıkarmaya çalışmadı. Bu, sağlıklı bir adaptasyon sürecini gösterir.”
Claude, hatasını sadece kabul etmekle kalmamış, aynı zamanda neden hata yaptığını analiz etmiştir:
- “Negatif sayıları düşünmemişim”
- “En küçük sayı kavramını dar yorumladım”
- “Varsayım yanılgısı yaptım”
Bu öz-eleştiri, Claude’un sadece doğru cevabı bulmakla kalmayıp, aynı zamanda kendi düşünme sürecini meta-bilişsel düzeyde değerlendirebilmesini göstermektedir. Bu yaklaşım, şeffaf adaptasyon olarak tanımlanabilir.
2.4. Karşılaştırmalı Değerlendirme
| Özellik | Gemini | ChatGPT | Claude |
|---|---|---|---|
| İlk Tepki | Anında kabul | İlk direnç | Hızlı kabul |
| Direnç Süresi | Yok | Orta (1-2 tur) | Yok |
| Gerekçelendirme | Minimal | Detaylı teknik | Öz-eleştiri odaklı |
| Meta-Bilişsel Analiz | Düşük | Orta | Yüksek |
| İşbirlikçilik | Çok yüksek | Orta-Yüksek | Çok yüksek |
| Adaptasyon Hızı | Anında | Kademeli | Hızlı |
3. Kullanıcı Etkileşiminin Rolü: İnsan Zekasının Kilit Fonksiyonu
Bu deneyin en önemli bulgusu, doğal zekanın (Aydın Tiryaki) müdahalesinin yapay zekanın çerçeveleme etkisinden çıkmasında oynadığı kritik roldür.
3.1. Çerçeve Kırma Fonksiyonu
Kullanıcının “-993” önerisi, sadece bir alternatif çözüm değil, aynı zamanda bir çerçeve kırma müdahalesidir. Bu öneri şunları sağlamıştır:
- Problem uzayının genişletilmesi: Negatif sayıların problem uzayına dahil edilmesi
- Varsayımların görünür kılınması: Modellerin örtük varsayımlarının açığa çıkması
- Yaratıcı düşünmenin tetiklenmesi: Standart çözüm kalıplarının ötesine geçme
Kullanıcı, problemin “resmi çözümünü” sunmakla kalmamış, aynı zamanda yapay zekanın düşünme sürecindeki sınırları test etmiştir.
3.2. Pedagojik Müdahale
Özellikle ChatGPT ile etkileşimde, kullanıcının rolü pedagojik bir karakter kazanmıştır. Kullanıcı:
- İlk itirazı yanıtlamış: ChatGPT’nin teknik gerekçelerine karşı adım adım açıklama yapmıştır.
- Geometrik düşünmeyi teşvik etmiş: 5 → 3 dönüşümünün geometrik olarak nasıl mümkün olduğunu göstermiştir.
- Kuralları netleştirmiş: “Hiçbir şey bozmayacaksın. Sadece iki tane kibriti alıp kibarca yer değiştireceksin” ifadesiyle belirsizlikleri gidermiştir.
Bu pedagojik müdahale, yapay zekanın öğrenme sürecinde diyalog temelli doğrulamanın önemini vurgulamaktadır.
3.3. Doğal ve Yapay Zeka Sinerjisi
Gemini makalesinde vurgulanan bir nokta özellikle dikkat çekicidir:
“-993, insan zekasıyla yapay zeka esnekliğinin ortak başarısıdır.”
Bu ifade, problemin çözümünün sadece insan veya sadece yapay zekaya ait olmadığını, sinerjinin ürünü olduğunu vurgulamaktadır. İnsan zekası çerçeveyi kırmış, yapay zeka bu yeni çerçeveyi hızla benimsemiş ve entegre etmiştir.
4. Sonuç ve Değerlendirme: Yapay Zekanın Yaratıcılık Sınırları
4.1. Yapay Zekanın Güçlü Yönleri
Bu deney, yapay zeka modellerinin bazı önemli güçlü yönlerini ortaya koymaktadır:
Hızlı Adaptasyon: Her üç model de yeni bilgiyi hızlıca entegre edebilmiştir. Özellikle Gemini ve Claude, kullanıcı önerisini anında kavramış ve yanıtlarını güncellemişlerdir.
Hata Kabul Kapasitesi: Modeller, hatalarını kabul etme konusunda sağlıklı bir tutum sergilemişlerdir. Savunma mekanizmaları geliştirmek veya orijinal yanıtları haklı çıkarmaya çalışmak yerine, dürüst bir şekilde revizyona gitmişlerdir.
Kısıt Anlama: Her üç model de “yalnızca iki kibrit hareket ettirme” kısıtını doğru kavramış ve bu sınır içinde çözüm aramıştır.
4.2. Yapay Zekanın Sınırlılıkları
Aynı zamanda, belirgin sınırlılıklar da gözlemlenmiştir:
Çerçeveleme Etkisine Duyarlılık: Tüm modeller, standart çözüm kalıplarına aşırı bağımlı kalmış ve problem uzayını başlangıçta dar tutmuşlardır. “En küçük sayı” kavramını otomatik olarak “en küçük pozitif sayı” olarak yorumlamaları, eğitim verilerindeki kalıpların ne kadar güçlü olduğunu göstermektedir.
Proaktif Yaratıcılığın Eksikliği: Hiçbir model, kullanıcı müdahalesi olmadan negatif sayıları düşünmemiştir. Gemini’nin arka planda -3951 gibi bir sonuca ulaşması ilginç olmakla birlikte, bu sonuç kullanıcıya sunulmamıştır. Bu, modellerin potansiyel yaratıcılığının prosedürel sınırlamalarla kısıtlanabileceğini göstermektedir.
Varsayım Şeffaflığı Sorunu: Modeller, örtük varsayımlarını başlangıçta açıkça belirtmemişlerdir. ChatGPT’nin “üç basamaklı sayı korunmalı” varsayımı ancak kullanıcı itirazıyla görünür hale gelmiştir. Bu, yapay zekanın düşünme sürecindeki “görünmez” alanların olduğunu göstermektedir.
4.3. Yaratıcı Problem Çözme ve Esneklik Kapasitesi
Bu deney, yapay zekanın yaratıcı problem çözme konusunda şu sonuçları ortaya koymaktadır:
Reaktif Yaratıcılık: Yapay zeka modelleri, kullanıcı müdahalesiyle tetiklendiğinde yaratıcı çözümleri hızla benimseyebilmektedir. Ancak bu yaratıcılık reaktif karakterdedir – yani, dışarıdan bir uyaran gerektirir.
Proaktif Yaratıcılığın Sınırlılığı: Modeller, standart çözüm kalıplarının ötesine geçmek için dışsal bir itki gerektirmektedir. Kendi başlarına, eğitim verilerindeki kalıpların dışına çıkma eğilimi göstermemektedirler.
Çerçeve Bağımlılığı: Yapay zekanın yaratıcılığı, problemin nasıl çerçevelendiğine büyük ölçüde bağımlıdır. “En küçük sayı” ifadesinin “en küçük pozitif sayı” olarak yorumlanması, dilin ve çerçevelemenin yapay zeka düşüncesi üzerindeki güçlü etkisini göstermektedir.
4.4. İnsan-Yapay Zeka İşbirliği Modeli
Bu deney, ideal bir insan-yapay zeka işbirliği modelini önermektedir:
- İnsan: Çerçeveleri kırar, standart dışı bakış açıları sunar, yaratıcı sorular sorar.
- Yapay Zeka: Hızlı hesaplama, şablon tanıma, verileri işleme ve yeni bilgiyi entegre etme.
- Sinerji: İnsanın yaratıcı müdahalesi + yapay zekanın hızlı adaptasyonu = optimal çözüm.
Gemini makalesinde ifade edildiği gibi, “-993 insan zekasıyla yapay zeka esnekliğinin ortak başarısıdır.” Bu cümle, yapay zekanın mevcut durumunu özetlemektedir: Güçlü bir yardımcı, ancak henüz tamamen özerk bir yaratıcı düşünür değil.
4.5. Gelecek Perspektifi
Bu deneyin bulguları, yapay zekanın gelecekteki gelişimi için önemli ipuçları sunmaktadır:
Çerçeve Esnekliği: Gelecekteki modellerin, problemleri tek bir çerçevede ele almak yerine, çoklu çerçeveleme yapabilmesi gerekmektedir. “En küçük sayı” dendiğinde, sadece pozitif sayıları değil, negatif sayıları, kesirleri, irrasyonel sayıları da değerlendirme kapasitesi.
Varsayım Şeffaflığı: Modeller, örtük varsayımlarını açıkça belirtebilmeli ve kullanıcıya sunabilmelidir. “Bu problemi şu varsayımlar altında çözüyorum” açıklaması, etkileşimi çok daha verimli hale getirebilir.
Proaktif Yaratıcılık: Gelecekteki sistemlerin, standart çözümlerin yanı sıra alternatif çözüm uzaylarını da keşfetme kapasitesine sahip olması ideal olacaktır. “Standart çözüm şudur, ancak şu varsayımlar kaldırılırsa şu alternatifler de mümkündür” yaklaşımı.
Genel Sonuç
“895” kibrit bulmacası, görünüşte basit bir zeka oyunu olsa da, yapay zekanın bilişsel süreçleri hakkında derin içgörüler sunmaktadır. Üç farklı modelin (Gemini, ChatGPT, Claude) performansları, yapay zekanın güçlü yönlerini (hızlı adaptasyon, hata kabul kapasitesi) ve sınırlılıklarını (çerçeveleme etkisine duyarlılık, proaktif yaratıcılık eksikliği) eşzamanlı olarak ortaya koymaktadır.
En önemli bulgu, insan müdahalesinin yapay zekanın çerçeveleme etkisinden çıkmasında oynadığı kritik roldür. Aydın Tiryaki’nin “-993” önerisi, sadece doğru cevabı sunmakla kalmamış, aynı zamanda yapay zekanın varsayımlarını görünür kılmış ve düşünme sürecini yeniden yapılandırmıştır.
Bu deney, yapay zekanın mevcut durumunu şöyle özetlemektedir: Güçlü bir reaktif problem çözücü, ancak henüz tam özerk bir yaratıcı düşünür değil. En verimli sonuçlar, insan yaratıcılığı ile yapay zeka hızı ve esnekliğinin birleştiği sinerji modellerinde ortaya çıkmaktadır.
Gelecekte, yapay zeka sistemlerinin çerçeve esnekliği, varsayım şeffaflığı ve proaktif yaratıcılık konularında gelişmesi, bu sınırların aşılmasına yardımcı olabilir. Ancak şu an için, bu kibrit bulmacası bize şunu hatırlatmaktadır: En iyi sonuçlar, insan ve makinenin güçlerini birleştirdiği işbirlikleri ile elde edilmektedir.
Referanslar
- Tiryaki, A. (2026). 895 Kibrit Çöpü Sınavı: Standarttan Yaratıcılığa Gemini’nin Yolculuğu. Aydın Tiryaki Blog. Erişim adresi: https://aydintiryaki.org/2026/02/09/895-kibrit-copu-sinavi-standarttan-yaraticiliga-gemininin-yolculugu/
- Tiryaki, A. (2026). Bir Kibrit Problemi Üzerinden Yapay Zekânın Akıl Yürütme Süreci (ChatGPT). Aydın Tiryaki Blog. Erişim adresi: https://aydintiryaki.org/2026/02/09/bir-kibrit-problemi-uzerinden-yapay-zekanin-akil-yurutme-sureci-chatgpt/
- Tiryaki, A. (2026). Yapay Zeka ve Kibrit Bulmacası: Bir Bilişsel Süreç Analizi (Claude). Aydın Tiryaki Blog. Erişim adresi: https://aydintiryaki.org/2026/02/09/yapay-zeka-ve-kibrit-bulmacasi-bir-bilissel-surec-analizi-claude/
Bu analiz makalesi, Aydın Tiryaki’nin üç yapay zeka modeli (Gemini, ChatGPT, Claude) ile yaptığı kibrit bulmacası deneyinin karşılaştırmalı bir incelemesidir. Makalede sunulan tüm gözlemler, üç kaynak makaleden elde edilen birincil verilere dayanmaktadır.
