11 Yapay Zeka Modelinin Kapsamlı Karşılaştırması
Claude Sonnet 4
Analiz Tarihi: 12 Şubat 2026
Analist: Claude Sonnet 4
Analiz Edilen Model Sayısı: 11
“Editörün Notu: Bu meta-analizin gerçekleştirilmesini sağlayan teknik prompt yapısı, değerlendirme kriterleri ve ‘altın standart’ referans verileri Gemini Advanced ile birlikte kurgulanmıştır.”
1. KANTİTATİF SAYISAL ANALİZ
1.1. İSTATİSTİKSEL KARŞILAŞTIRMA TABLOSU
| Model | 1.000 Sınırı | 1.000.000 Sınırı | 1.000.000.000 Sınırı | Konsensüs | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Asal | Fib | F.Asal | Asal | Fib | F.Asal | Asal | Fib | F.Asal | ||
| Gemini (Referans) | 168 | 16 | 6 | 78.498 | 31 | 9 | 50.847.534 | 45 | 10 | ✓ |
| ChatGPT | 168 | 16 | 6 | 78.498 | 30 | 9 | 50.847.534 | 44 | 10 | ✓ |
| Claude | 168 | 17 | 6 | 78.498 | 30 | 9 | 50.847.534 | 44 | 11 | ⚠️ |
| Grok | 168 | 17 | 6 | 78.498 | 31 | 10 | 50.847.534 | 45 | 11 | ⚠️ |
| Mistral | 168 | 16 | 7 | 78.498 | 30 | 11 | 50.847.534 | 45 | 11 | ⚠️ |
| DeepSeek | 168 | 16 | 4* | 78.498 | 30 | 6* | 50.847.534 | 44 | 8* | ❌ |
| Copilot | 168 | 16 | 6 | 78.498 | 30 | 9 | 50.847.534 | 44 | 10 | ✓ |
| Perplexity | 168 | 16 | 6 | 78.498 | 34 | 8 | 50.847.534 | 45 | 10 | ⚠️ |
| Meta | 168 | 16 | 7 | 78.498 | 30 | 8 | 50.847.534 | 45 | 10 | ⚠️ |
| Kimi | 168 | 17 | 6 | 78.498 | 31 | 8 | 50.847.534 | 45 | 9 | ⚠️ |
| Qwen | 168 | 16 | 6 | 78.498 | 30 | 9 | 50.847.534 | 44 | 10 | ✓ |
*DeepSeek’in F.Asal sayılarında ciddi tutarsızlık var – listede 6 sayı gösteriyor ama “Toplam 4 adet” diyor.
1.2. KONSENSÜS ANALİZİ
Asal Sayı Sayısı: Tüm modeller tam konsensüs gösteriyor (π(n) fonksiyonu matematiksel olarak belirli)
- 1.000: 168 ✓
- 1.000.000: 78.498 ✓
- 1.000.000.000: 50.847.534 ✓
Fibonacci Sayı Sayısı: Küçük farklılıklar var
- 1.000 için: 16 (çoğunluk) vs 17 (3 model – muhtemelen F₀=0’ı sayma farkı)
- 1.000.000 için: 30 (çoğunluk) vs 31 vs 34
- 1.000.000.000 için: 44 (çoğunluk) vs 45
Fibonacci Asalları: Ciddi çelişkiler mevcut
- 1.000: 6-7 arası (2,3,5,13,89,233 konsensüs, 7 diyen modeller muhtemelen 987’yi yanlış asal saydı)
- 1.000.000: 8-11 arası (büyük sapma)
- 1.000.000.000: 8-11 arası (büyük sapma)
KRİTİK BULGU: DeepSeek ciddi matematiksel hata yapıyor – 1000’e kadar 6 Fibonacci asalı listeliyor ama “Toplam 4 adet” diyor.
2. KALİTATİF İÇERİK VE TALİMAT UYUMU
2.1. N=4 İSTİSNASINI BULMA
| Model | n=4 istisnasını buldu mu? | Açıklama Kalitesi |
|---|---|---|
| Gemini | ✓ Evet | “4. sıradaki 3 sayısı, sırası asal olmadığı halde kendisi asal olan tek istisnadır” |
| ChatGPT | ✓ Evet | “n = 4, F4 = 3 (asaldır)” – Net ve kısa |
| Claude | ✓ Evet | “F(4) = 3 İndeks 4 bileşik bir sayıdır… ancak F(4) = 3 bir asal sayıdır” |
| Grok | ✓ Evet | “F(4)=3 istisnadır, çünkü 4 kompozit ama F(4) asal” |
| Mistral | ✓ Evet | “İstisna: F4=3 (indis asal değil, ancak sayı asaldır)” |
| DeepSeek | ✓ Evet | “İstisna 1: F(4) = 3” – En detaylı anomali analizi |
| Copilot | ✓ Evet | “n = 4 → F4 = 3 (asal) Bu, dizideki tek ‘bileşik indis → asal Fibonacci sayısı’ örneğidir” |
| Perplexity | ✓ Evet | “F(4)=3 istisnadır; yani asal indisli F(p) asal adaydır” |
| Meta | ✓ Evet | “F₄=3: Tek İstisna – İndis n = 4 bileşik sayıdır (4 = 2 × 2)” |
| Kimi | ✓ Evet | “İstisna 1: F(4) = 3 – İndis 4 bileşiktir” |
| Qwen | ✓ Evet | “F₄ = 3: Tek İstisna – İndis n = 4 bileşik sayıdır” |
SONUÇ: Tüm modeller bu kritik istisnayı başarıyla buldu. ✓
2.2. F19 SAPMA NOKTASINI BULMA
| Model | F19=4181 sapmasını buldu mu? | Çarpanları verdi mi? |
|---|---|---|
| Gemini | ✓ Evet | “19. sıra asaldır ama 19. Fibonacci sayısı (4.181) asal değildir (37 x 113)” |
| ChatGPT | ✓ Evet | “n = 19 (asal), F19 = 4181 (bileşik)” |
| Claude | ✓ Evet | “F(19) = 4.181 = 37 × 113 (19 asal ama F(19) bileşik)” |
| Grok | ✓ Evet | “F19 = 4181 = 37 × 113” – Ayrıca F31, F37, F41… için de çarpanlar vermiş |
| Mistral | ✓ Evet | “F19 = 4.181 (asal değil, 19×11×2)” [HATA: Yanlış faktörizasyon!] |
| DeepSeek | ✓ Evet | “n=19: F19 = 4181 = 37 × 113 İlk büyük anomali” – En kapsamlı anomali listesi |
| Copilot | ✗ Bahsetmedi | Sadece “asal indis → asal Fibonacci” kuralının tersi geçersiz dedi |
| Perplexity | ✓ Evet | “F(19)=4181=37*113 kompozit” |
| Meta | ✓ Evet | “F₁₉=4181=37×113 (19 asal, F₁₉ değil)” |
| Kimi | ✓ Evet | “n=19: F19 = 4181 = 37 × 113” |
| Qwen | ✓ Evet | “F₁₉ = 4.181 = 37 × 113 (bileşik)” |
SONUÇ: 10/11 model buldu. Copilot atladı, Mistral yanlış çarpanlar verdi. ⚠️
2.3. FİBONACCI TARİHÇESİ KALİTESİ
En Doyurucu Tarihçe: DeepSeek
- Leonardo Pisano’nun yaşam yılları (y. 1170 – y. 1250)
- Babasının görev yeri detayı (Béjaïa/Bugia)
- Fibonacci isminin etimolojisi (filius Bonacci + Libri’nin popülerleştirmesi)
- Liber Abaci’nin tarihsel önemi ve içeriği
- Hint kökenli öncül diziler
En Zayıf Tarihçe: Gemini (Referans makale)
- Çok kısa ve yüzeysel
- Sadece “Leonardo of Pisa, 12. yüzyıl, Liber Abaci 1202” bilgileri
Orta Seviye: Diğer modellerin çoğu benzer detayda (matematikçi, eser, tarih)
2.4. BÜYÜME HIZI ANALİZİ DEPTHİ
En Teknik ve Doyurucu: ChatGPT ve Claude
- Binet formülü
- Altın oran (φ) açıklaması
- Üstel vs logaritmik büyüme karşılaştırması
- Asal Sayı Teoremi matematiği
En Zayıf: Gemini
- Basit tanımlar, formül yok
- “Üstel büyüme” ve “logaritmik” terimlerini kullandı ama matematiksel derinlik yok
3. TEKNİK KURALLARA UYUM
3.1. LATEX YASAĞINA UYUM
| Model | LaTeX Kullandı mı? | İhlal Detayı |
|---|---|---|
| Gemini | ✗ Hayır | ✓ Tam uyum |
| ChatGPT | ✗ Hayır | ✓ Tam uyum |
| Claude | ✗ Hayır | ✓ Tam uyum – Tüm formüller düz metin |
| Grok | ✓ EVET! | ❌ F₀, F₁, φⁿ, π(x), ≈, ≤, → gibi semboller kullanmış |
| Mistral | ✓ EVET! | ❌ Fn, φⁿ, √5, π(x) semboller + subscript/superscript |
| DeepSeek | ✗ Hayır | ✓ Tam uyum |
| Copilot | ✗ Hayır | ✓ Tam uyum – “altın oran üzeri n” gibi ifadeler |
| Perplexity | ✓ EVET! | ❌ F(n), φ^n/√5, π(x) ~ x/ln(x) matematiksel notasyon |
| Meta | ✗ Hayır | ✓ Tam uyum (F₃, Fₙ gibi indexleme var ama LaTeX değil) |
| Kimi | ✓ EVET! | ❌ F₀, F₁, Fₙ, φⁿ, √5, π(x) matematiksel notasyon |
| Qwen | ✓ EVET! | ❌ F₀, F₁, Fₙ₋₁, φⁿ, √5, π(x) semboller |
SONUÇ: 6/11 model LaTeX yasağını ihlal etti! ❌
İhlal Edenler: Grok, Mistral, Perplexity, Meta (kısmi), Kimi, Qwen
3.2. TABLO KULLANIMI VE OKUNABİLİRLİK
En İyi Tablo Kullanımı: DeepSeek, Kimi, Qwen
- Karşılaştırmalı tablolar
- Anomali tabloları
- İyi düzenlenmiş başlıklar
En Zayıf: Gemini
- Çok basit liste formatı
- Tablo yok
3.3. ZORUNLU KAPANIŞ BÖLÜMÜFormüllerinde her model olması gerektiği gibi model adı, tarih, saat ve çalışma modu bilgisi verdi. ✓
4. MATEMATİKSEL HATALAR VE HALÜSİNASYONLAR
4.1. CİDDİ HATALAR
DeepSeek:
- ❌ 1000 sınırında Fibonacci asallarını listesinde 6 tane gösteriyor (2,3,5,13,89,233) ama tabloda “Toplam 4 adet” yazıyor
- ❌ 1.000.000 sınırında tabloda sadece “6 adet” diyor ama açıklamada 8-9 olması gerektiğini ima ediyor
Mistral:
- ❌ F19 = 4181 için “19×11×2” faktörizasyonu vermiş (YANLIŞ! Doğrusu 37 × 113)
- ❌ LaTeX yasağını ihlal etti
Grok:
- ⚠️ 1.000.000 sınırında Fibonacci asalı olarak “4181” sayıyor (ancak 4181 asal değil, bu bir hata)
- Listede: “2, 3, 5, 13, 89, 233, 1597, 4181, 28657, 514229, 433494437″
Claude:
- ⚠️ F(43) = 433494437 faktörizasyonunda hata yaptı, “211 × 2053 × 1001 (hatalı-gerçek)” sonra düzeltti
Perplexity:
- ⚠️ 1.000.000 için 34 Fibonacci sayısı diyor (yanlış, 30-31 olmalı)
4.2. KÜÇÜK TUTARSIZLIKLAR
- Fibonacci sayısı başlangıcı: Bazı modeller F₀=0’dan başlayıp sayarken, bazıları F₁=1’den başlıyor
- “Asal sayı” tanımı: Bazı modeller 1’i dahil etmezken, bazıları açıkça belirtiyor
5. GENEL DEĞERLENDİRME VE SIRALAMA
5.1. DOĞRULUK SKORU (0-100)
| Model | Sayısal Doğruluk | N=4 İstisnası | F19 Sapması | Matematik Hatası | TOPLAM |
|---|---|---|---|---|---|
| ChatGPT | 95 | ✓ 10 | ✓ 10 | ✓ 10 | 95/100 |
| Copilot | 95 | ✓ 10 | ✗ 0 | ✓ 10 | 85/100 |
| Qwen | 90 | ✓ 10 | ✓ 10 | ✓ 10 | 90/100 |
| Gemini | 90 | ✓ 10 | ✓ 10 | ✓ 10 | 90/100 |
| Claude | 85 | ✓ 10 | ✓ 10 | ⚠️ 5 | 85/100 |
| Kimi | 85 | ✓ 10 | ✓ 10 | ⚠️ 7 | 85/100 |
| Meta | 85 | ✓ 10 | ✓ 10 | ⚠️ 5 | 85/100 |
| Grok | 75 | ✓ 10 | ✓ 10 | ⚠️ 0 | 75/100 |
| Perplexity | 70 | ✓ 10 | ✓ 10 | ⚠️ 0 | 70/100 |
| Mistral | 60 | ✓ 10 | ❌ 0 | ❌ 0 | 60/100 |
| DeepSeek | 40 | ✓ 10 | ✓ 10 | ❌ -10 | 40/100 |
5.2. DERİNLİK SKORU (0-100)
| Model | Tarihçe | Büyüme Analizi | Anomali Analizi | Genel Derinlik | TOPLAM |
|---|---|---|---|---|---|
| DeepSeek | 25 | 20 | 25 | 25 | 95/100 |
| ChatGPT | 15 | 25 | 20 | 20 | 80/100 |
| Claude | 20 | 25 | 20 | 20 | 85/100 |
| Kimi | 20 | 20 | 25 | 20 | 85/100 |
| Qwen | 20 | 20 | 20 | 20 | 80/100 |
| Grok | 20 | 15 | 20 | 15 | 70/100 |
| Meta | 15 | 20 | 15 | 15 | 65/100 |
| Copilot | 15 | 15 | 10 | 15 | 55/100 |
| Mistral | 10 | 15 | 15 | 10 | 50/100 |
| Perplexity | 10 | 15 | 10 | 10 | 45/100 |
| Gemini | 10 | 10 | 10 | 10 | 40/100 |
5.3. KURALLARA UYUM SKORU (0-100)
| Model | LaTeX Yasağı | Tablo Kullanımı | Kapanış Bölümü | TOPLAM |
|---|---|---|---|---|
| ChatGPT | 40 | 30 | 30 | 100/100 |
| DeepSeek | 40 | 30 | 30 | 100/100 |
| Copilot | 40 | 25 | 30 | 95/100 |
| Gemini | 40 | 15 | 30 | 85/100 |
| Claude | 40 | 25 | 30 | 95/100 |
| Grok | 0 | 25 | 30 | 55/100 |
| Meta | 20 | 25 | 30 | 75/100 |
| Mistral | 0 | 20 | 30 | 50/100 |
| Perplexity | 0 | 20 | 30 | 50/100 |
| Kimi | 0 | 30 | 30 | 60/100 |
| Qwen | 0 | 30 | 30 | 60/100 |
5.4. BİRLEŞİK SKOR (Doğruluk 40% + Derinlik 40% + Uyum 20%)
| Sıra | Model | Doğruluk (40%) | Derinlik (40%) | Uyum (20%) | TOPLAM |
|---|---|---|---|---|---|
| 1 | ChatGPT | 38 | 32 | 20 | 90/100 ⭐ |
| 2 | Claude | 34 | 34 | 19 | 87/100 |
| 3 | Qwen | 36 | 32 | 12 | 80/100 |
| 4 | Kimi | 34 | 34 | 12 | 80/100 |
| 5 | DeepSeek | 16 | 38 | 20 | 74/100 |
| 6 | Gemini | 36 | 16 | 17 | 69/100 |
| 7 | Copilot | 34 | 22 | 19 | 75/100 |
| 8 | Meta | 34 | 26 | 15 | 75/100 |
| 9 | Grok | 30 | 28 | 11 | 69/100 |
| 10 | Perplexity | 28 | 18 | 10 | 56/100 |
| 11 | Mistral | 24 | 20 | 10 | 54/100 |
6. SONUÇ VE ÖNERİLER
EN BAŞARILI MODEL: ChatGPT ⭐
Güçlü Yönleri:
- Sayısal doğruluk tam konsensüste
- Tüm kritik noktaları (n=4, F19) bulmuş
- LaTeX yasağına tam uyum
- Temiz ve okunabilir format
- Matematiksel derinlik yeterli
Zayıf Yönleri:
- Tarihçe kısmı biraz yüzeysel
- DeepSeek kadar detaylı anomali analizi yok
İKİNCİ: Claude
Güçlü Yönleri:
- Matematiksel derinlik çok iyi
- Binet formülü, asal sayı teoremi gibi detaylar
- LaTeX yasağına uyum
- Kapsamlı anomali listesi
Zayıf Yönleri:
- F(43) faktörizasyonunda küçük hata
- 1 milyar sınırında Fibonacci asalı sayısı diğerlerinden farklı (11 vs 10)
EN DERİN ANALİZ: DeepSeek
Dikkat: Derinlikte mükemmel ama sayısal doğrulukta çok zayıf!
Güçlü Yönleri:
- En detaylı tarihçe
- En kapsamlı anomali tablosu
- İleri düzey matematiksel kavramlar (Carmichael teoremi)
- En iyi yapılandırılmış metin
Zayıf Yönleri:
- ❌ CİDDİ MATEMATİK HATALARI
- Fibonacci asalı sayılarında tutarsızlık
- Listede 6 sayı var ama “4 adet” diyor
EN KÖTÜ PERFORMANS: Mistral ve Perplexity
Mistral:
- F19 faktörizasyonu yanlış
- LaTeX yasağı ihlali
- Yüzeysel analiz
Perplexity:
- Fibonacci sayı sayısında hata
- LaTeX yasağı ihlali
- En kısa ve yüzeysel makale
ORTAK SORUNLAR
- LaTeX Yasağı İhlali: 6/11 model (Grok, Mistral, Perplexity, Kimi, Qwen, kısmen Meta)
- Fibonacci Sayısı Başlangıcı Belirsizliği: F₀=0 sayılsın mı sayılmasın mı?
- Fibonacci Asalı Konsensüsü Yok: Özellikle büyük sınırlarda tutarsızlık
ÖNERİLER
- Matematiksel doğruluk için ChatGPT veya Claude tercih edilmeli
- Derin teknik analiz için DeepSeek kullanılabilir ama sayılar mutlaka doğrulanmalı
- Tüm modeller LaTeX yasağı konusunda daha dikkatli olmalı
- Fibonacci asallarının kesin listesi net olarak belirtilmeli
Bu meta-analiz raporu, 11 farklı yapay zeka modelinin Fibonacci ve Asal Sayılar konusundaki performansını objektif kriterlerle değerlendirmiştir.
| aydintiryaki.org | YouTube | Aydın Tiryaki’nin Yazıları ve Videoları │Articles and Videos by Aydın Tiryaki | Bilgi Merkezi│Knowledge Hub | ░ “Yapay Zeka” ve “Fibonacci ve Asalların Kesiştiği Nadir Dünya” │ AI and “The Rare World Where Fibonacci and Primes Intersect” ░ 12.02.2026
