Aydın Tiryaki

BİR GÜNDE DEVRIALEM: 11 YAPAY ZEKA MODELİYLE FİBONACCİ VE ASAL SAYILAR SINAVI

Gemini AI, Claude Sonnet 4 ve Aydın Tiryaki (2026)

Bugün, yapay zeka dünyasının sınırlarını zorlayan kapsamlı ve zincirleme bir deney gerçekleştirdim. Sadece tek bir modele soru sormak yerine, günümüzün en güçlü 11 farklı yapay zeka modelini (Gemini, ChatGPT, Claude, DeepSeek, Grok, Mistral, Copilot, Perplexity, Meta, Kimi ve Qwen) aynı mindere çıkardım.

Ancak bu deneyin hikayesi, sonuçlarından bile daha ilginç bir “işbirliği” (collaboration) örneğine dönüştü. İşte adım adım bugünkü “Meta-Analiz” serüvenimiz.

1. Perde: Zorlu Görev ve İlk Kıvılcım

Her şey, Gemini Advanced ile birlikte hazırladığımız tuzaklarla dolu ve çok katmanlı bir prompt ile başladı. Amacımız basitti ama zorlayıcıydı:

Modellerden, “Fibonacci Dizisi ve Asal Sayıların Kesişimi” üzerine, içinde $n=4$ istisnası ve $F_{19}$ sapması gibi matematiksel tuzakların olduğu, LaTeX formatının yasaklandığı teknik bir makale yazmalarını istedik.

Bu promptu 11 farklı modele verdim ve her biri kendi makalesini üretti.

2. Perde: Teknik Engel ve Beklenmedik Paslaşma

Elimde 11 farklı makale vardı ve bunları kıyaslamak için yine Gemini‘ye döndüm. Gemini, bu makaleleri değerlendirmek için harika bir “Meta-Analiz Planı” (kriter seti) hazırladı. Plan kusursuzdu: Karakter sayılarından matematiksel doğruluğa kadar her şey puanlanacaktı.

Ancak bir sorun çıktı: Makaleler web sitemde henüz yayınlandığı için (0 günlük içerik), arama motorları bunları henüz indekslememişti. Gemini, “Bağlantıları görüyorum ama içeriklerini okuyamıyorum” uyarısını verdi.

İşte o an, modern yapay zeka kullanıcılığının en önemli kuralı devreye girdi: “Biri yapamıyorsa, diğeri yapar.”

3. Perde: Claude Sahneye Çıkıyor (Kör Test)

Gemini’nin hazırladığı o titiz değerlendirme kriterlerini (promptu) kopyaladım ve geniş bağlam penceresine (context window) sahip olan Claude 3.5 Sonnet‘e verdim.

Burada çok ilginç bir bilimsel tesadüf yaşandı: Claude’a, bu kriterleri rakibi Gemini’nin hazırladığını söylemeyi unuttum! Böylece Claude, kriterlerin kime ait olduğunu bilmeden, tamamen objektif bir gözle 11 makaleyi inceledi. Bu durum, analizi plansız bir “Kör Test”e (Blind Test) dönüştürdü.

4. Perde: Sonuçlar ve Büyük Yüzleşme

Claude’un hazırladığı raporu aldım ve nihai yorum için tekrar Gemini’ye döndüm. Kendi hazırladığı kriterlerle (ama Claude’un gözüyle) yapılan bu analizi inceleyen Gemini, 11 modeli şu şekilde sınıflandırdı:

A. Hesap Uzmanları (Mühendisler İçin)

Eğer hatasız matematiksel işlem arıyorsanız, zirve belli:

  • ChatGPT (4o) ve Gemini (Advanced): Her iki model de 1 milyar sınırındaki kritik sayıları (50.847.534 Asal Sayı) hatasız hesapladı. $F_{19} = 4181$ sayısının asal olmadığını çarpanlarına ayırarak ispatladılar.

B. Derinlik Uzmanları (Araştırmacılar İçin)

Konu hesap yapmak değil de, teoremleri ve tarihçeyi anlamaksa:

  • DeepSeek (R1): Tarihçe ve teorik derinlikte açık ara en iyisiydi. Ancak büyük bir kusuru vardı: Listelediği sayıları sayarken hata yaptı (6 sayı yazıp “4 adet var” dedi). Okumak için harika, hesaplatmak için riskli.
  • Claude (3.5 Sonnet): Editöryal analiz ve raporlama yeteneği muazzam. Ancak çok büyük sayılarda ufak tefek matematiksel sapmalar yaşayabiliyor.

C. Sınıfta Kalanlar

  • Grok: Asal olmayan bir sayıyı (4181) asal ilan ederek matematiksel güvenilirliğini kaybetti.
  • Mistral: Basit çarpma işlemlerinde hata yaptı.
  • Qwen ve Kimi: Matematikleri güçlü olsa da, “LaTeX kullanmayın” talimatına uymadıkları için format disiplininden kaldılar.
  • Copilot, Perplexity ve Meta: Ortalama bir performans sergilediler ancak $F_{19}$ gibi ince detayları atladıkları veya format hataları yaptıkları için üst lige çıkamadılar.

Sonuç: Orkestrayı Yönetmek

Bugünkü deneyimim şunu kanıtladı: Tek bir “Süper Yapay Zeka” yok.

  • Planı ve kriterleri Gemini kurdu.
  • Analizi ve okumayı Claude yaptı.
  • Derinliği DeepSeek sağladı.
  • Sağlamasını ChatGPT yaptı.

Geleceğin dijital okuryazarlığı, bu modelleri birbiriyle yarıştırmak değil; bir orkestra şefi gibi, sırası gelene söz hakkı vererek yönetmekten geçiyor.


Yöntem ve Araçlar Üzerine Bir Not: Bu çalışmadaki tüm gözlem, fikir ve çözüm önerileri bizzat yazara aittir. Yapay zeka ise tamamen yazarın soruları, talepleri ve yönlendirmeleri doğrultusunda ilgili konuların araştırılması ve derlenmesinde bir bilgi kaynağı olarak kullanılmış; ayrıca metnin oluşturulması sürecinde yazım asistanlığı desteği sağlamıştır.

Aydın'ın dağarcığı

Hakkında

Aydın’ın Dağarcığı’na hoş geldiniz. Burada her konuda yeni yazılar paylaşıyor; ayrıca uzun yıllardır farklı ortamlarda yer alan yazı ve fotoğraflarımı yeniden yayımlıyorum. Eski yazılarımın orijinal halini koruyor, gerektiğinde altlarına yeni notlar ve ilgili videoların bağlantılarını ekliyorum.
Aydın Tiryaki

Ara

Şubat 2026
P S Ç P C C P
 1
2345678
9101112131415
16171819202122
232425262728