Gemini AI, Claude Sonnet 4 ve Aydın Tiryaki (2026)
Bugün, yapay zeka dünyasının sınırlarını zorlayan kapsamlı ve zincirleme bir deney gerçekleştirdim. Sadece tek bir modele soru sormak yerine, günümüzün en güçlü 11 farklı yapay zeka modelini (Gemini, ChatGPT, Claude, DeepSeek, Grok, Mistral, Copilot, Perplexity, Meta, Kimi ve Qwen) aynı mindere çıkardım.
Ancak bu deneyin hikayesi, sonuçlarından bile daha ilginç bir “işbirliği” (collaboration) örneğine dönüştü. İşte adım adım bugünkü “Meta-Analiz” serüvenimiz.
1. Perde: Zorlu Görev ve İlk Kıvılcım
Her şey, Gemini Advanced ile birlikte hazırladığımız tuzaklarla dolu ve çok katmanlı bir prompt ile başladı. Amacımız basitti ama zorlayıcıydı:
Modellerden, “Fibonacci Dizisi ve Asal Sayıların Kesişimi” üzerine, içinde $n=4$ istisnası ve $F_{19}$ sapması gibi matematiksel tuzakların olduğu, LaTeX formatının yasaklandığı teknik bir makale yazmalarını istedik.
Bu promptu 11 farklı modele verdim ve her biri kendi makalesini üretti.
2. Perde: Teknik Engel ve Beklenmedik Paslaşma
Elimde 11 farklı makale vardı ve bunları kıyaslamak için yine Gemini‘ye döndüm. Gemini, bu makaleleri değerlendirmek için harika bir “Meta-Analiz Planı” (kriter seti) hazırladı. Plan kusursuzdu: Karakter sayılarından matematiksel doğruluğa kadar her şey puanlanacaktı.
Ancak bir sorun çıktı: Makaleler web sitemde henüz yayınlandığı için (0 günlük içerik), arama motorları bunları henüz indekslememişti. Gemini, “Bağlantıları görüyorum ama içeriklerini okuyamıyorum” uyarısını verdi.
İşte o an, modern yapay zeka kullanıcılığının en önemli kuralı devreye girdi: “Biri yapamıyorsa, diğeri yapar.”
3. Perde: Claude Sahneye Çıkıyor (Kör Test)
Gemini’nin hazırladığı o titiz değerlendirme kriterlerini (promptu) kopyaladım ve geniş bağlam penceresine (context window) sahip olan Claude 3.5 Sonnet‘e verdim.
Burada çok ilginç bir bilimsel tesadüf yaşandı: Claude’a, bu kriterleri rakibi Gemini’nin hazırladığını söylemeyi unuttum! Böylece Claude, kriterlerin kime ait olduğunu bilmeden, tamamen objektif bir gözle 11 makaleyi inceledi. Bu durum, analizi plansız bir “Kör Test”e (Blind Test) dönüştürdü.
4. Perde: Sonuçlar ve Büyük Yüzleşme
Claude’un hazırladığı raporu aldım ve nihai yorum için tekrar Gemini’ye döndüm. Kendi hazırladığı kriterlerle (ama Claude’un gözüyle) yapılan bu analizi inceleyen Gemini, 11 modeli şu şekilde sınıflandırdı:
A. Hesap Uzmanları (Mühendisler İçin)
Eğer hatasız matematiksel işlem arıyorsanız, zirve belli:
- ChatGPT (4o) ve Gemini (Advanced): Her iki model de 1 milyar sınırındaki kritik sayıları (50.847.534 Asal Sayı) hatasız hesapladı. $F_{19} = 4181$ sayısının asal olmadığını çarpanlarına ayırarak ispatladılar.
B. Derinlik Uzmanları (Araştırmacılar İçin)
Konu hesap yapmak değil de, teoremleri ve tarihçeyi anlamaksa:
- DeepSeek (R1): Tarihçe ve teorik derinlikte açık ara en iyisiydi. Ancak büyük bir kusuru vardı: Listelediği sayıları sayarken hata yaptı (6 sayı yazıp “4 adet var” dedi). Okumak için harika, hesaplatmak için riskli.
- Claude (3.5 Sonnet): Editöryal analiz ve raporlama yeteneği muazzam. Ancak çok büyük sayılarda ufak tefek matematiksel sapmalar yaşayabiliyor.
C. Sınıfta Kalanlar
- Grok: Asal olmayan bir sayıyı (4181) asal ilan ederek matematiksel güvenilirliğini kaybetti.
- Mistral: Basit çarpma işlemlerinde hata yaptı.
- Qwen ve Kimi: Matematikleri güçlü olsa da, “LaTeX kullanmayın” talimatına uymadıkları için format disiplininden kaldılar.
- Copilot, Perplexity ve Meta: Ortalama bir performans sergilediler ancak $F_{19}$ gibi ince detayları atladıkları veya format hataları yaptıkları için üst lige çıkamadılar.
Sonuç: Orkestrayı Yönetmek
Bugünkü deneyimim şunu kanıtladı: Tek bir “Süper Yapay Zeka” yok.
- Planı ve kriterleri Gemini kurdu.
- Analizi ve okumayı Claude yaptı.
- Derinliği DeepSeek sağladı.
- Sağlamasını ChatGPT yaptı.
Geleceğin dijital okuryazarlığı, bu modelleri birbiriyle yarıştırmak değil; bir orkestra şefi gibi, sırası gelene söz hakkı vererek yönetmekten geçiyor.
| aydintiryaki.org | YouTube | Aydın Tiryaki’nin Yazıları ve Videoları │Articles and Videos by Aydın Tiryaki | Bilgi Merkezi│Knowledge Hub | ░ “Yapay Zeka” ve “Fibonacci ve Asalların Kesiştiği Nadir Dünya” │ AI and “The Rare World Where Fibonacci and Primes Intersect” ░ 12.02.2026
