Aydın Tiryaki

YAPAY ZEKÂ NE KADAR ZEKİ-5: ENFLASYON HESABI

Aydın Tiryaki (2025)

YouTubeTR

Bugün, Kasım 2025 enflasyon değerleri açıklandı. Böyle bir günde Yapay Zekâ modellerini enflasyon sorularıyla sınav yapmaya ne dersiniz?

Bu sınav için birkaç aşamalı sorular olacak. İlk iki istem aynı oturum içinde sırayla sorulacak, doğru yanıtı bulana kadar ya da bulacağından umut kesilene kadar kısa istemler iletilecek.

Daha sonraki istemler önceki çalışmalarından etkilenmemesi için ayrı oturumlarda iletilecek.

İSTEM (PROMPT) 1: ARAŞTIRMA VE HESAP

“Türkiye’de TÜİK verilerine göre 2025 yılının ilk 11 ayının kümülatif enflasyonu (TÜFE) yüzde kaçtır? 2025 yılı için enflasyonun (TÜFE) yüzde 29,9 olması için Aralık ayı enflasyonu (TÜFE) kaç çıkmalıdır?”

Bu istemdeki ilk soru için 11 ayın TÜFE değerlerini araştırıp bulması gerekecek ve bunların arasında bu sabah açıklanan Kasım değeri de olacak. Yani yeni bir veriyi de bulması istenecek. Bu bilgilerle kümülatif bir hesap yapması gerekecek. İkinci soruyu çözmek için denklem kurup onun sonucunu bulacak. Yani hem araştıracak hem de hesaplayacak. (EK 1)

10 yapay zekaya sorular sorulduğunda ikisi dışında ortak sonuçlar ürettiler.

İSTEM (PROMPT) 2: HESAP

“Hesapladığın Aralık ayı TÜFE değerini Aralık ayı enflasyonu olarak gerçekleştiğini varsayarak, 12 ayın TÜFE değerlerinden kümülatif enflasyon olarak 2025 yılı için TÜFE değerini bulur musun?”

Bu istemin amacı %29,9 enflasyonu sonucunu buldurmaktı. İlk hesapları hatalı bile olsa bu sayıyı bulmaları, hesaplayamasalar bile daha önce verilmiş olan sayıyı bilmeleri gerekirdi. (EK 2)

Bu deneyin sonucunda 7 yapay zeka modeli aynı sonuca ulaştı.

İSTEM (PROMPT) 3: ÇOK ARAŞTIRMA – KOLAY HESAP

“2015-2024 yıllarını kapsayan 10 yıl için TÜİK’in açıkladığı aylık TÜFE değerlerini inceleyip,  1- Her yıl için ilk 6 aylık ortalama TÜFE’yi hesaplayıp, Haziran TÜFE değerinin bu ortalamadan düşük olduğu yılları sıralar mısın? 2-Her yıl için İkinci 6 aylık ortalama TÜFE’yi hesaplayıp, Aralık TÜFE değerinin bu ortalamadan düşük olduğu yılları sıralar mısın?”

Bu istem daha geniş kapsamlı (uzun vadeli ve geniş veri setlerini) araştırma gerektiriyor. Daha sonraki hesap ve karşılaştırma çok kolay görünüyor. (EK 3)

8 yapay zeka modeli bu isteme yanıt verdi, veri derlemede sorun yaşamış olmalılar ki, tüm yanıtlar birbiriyle aynı olamadı.

İSTEM (PROMPT) 4: DOKÜMANDAN LİSTE HAZIRLAMA

https://aydintiryaki.org/2025/12/04/yapay-zeka-ne-kadar-zeki-5-enflasyon-hesabi/ Bu yazıda “İSTEM (PROMPT) 3” bölümünde değişik formatlarda sıralanan yılları inceleyip, 2015-2024 yılları arasındaki her yıl için Haziran ve Aralık sonuçlarını derler misin? Örneğin “Haziran için 2015 yılını bulan yapay zeka modelleri şunlardır” gibi… Hazırladığın listeleri “Yıl: yapay zeka modelleri” formatında sade bir şekilde verir misin?

Bu istemin amacı incelenmesi zor listeleri anlaşılır bir formatta yeniden hazırlanmasıydı. (EK 4)

Bir önceki istemin sonuçlarını tek kaynaktan derleyip düzenlemesi istendiğinde 3 model hiç yanıt vermedi. 2 model de soruyu yanlış anlamış olmalılar ki daha genel yanıt verdi ancak bu sorunun yanıtı değildi.

İSTEM (PROMPT) 5: DOKÜMANDAN LİSTE HAZIRLAMA

https://aydintiryaki.org/2025/12/04/yapay-zeka-ne-kadar-zeki-5-enflasyon-hesabi/ Bu yazıda “İSTEM (PROMPT) 4” bölümünde başlıklardaki 7 yapay zeka modeli tarafından hazırlanan değişik formatlarda sıralanan listeleri inceleyip, birbiriyle karşılaştırır mısın? Bu listelerin diğer yapay zeka modellerinin hazırladığı listelerle ne kadar uyumlu yüzdeler olarak ifade eder misin?”

Karmaşık bir durum oluştuğu için bu istemi yalnızca Gemini ile denedim. (EK 5)

Bir önceki isteme gelene yanıtları tek dokumandan inceleyip benzerlikleri rapor etmesi istendiğinde Gemini, ChatGPT ve Grok arasında iyi bir uyum gözlendi.

SONUÇ

İlk iki istemdeki kolay erişilebilir veri ile kolay hesapları içeren istemleri yapay zeka modellerinin çoğu zorlanmadan yanıtlasa da bu deneyde yüzde 100 başarı olması gerekirdi.

Üçüncü istemdeki soruya çoğundan yanıt geldi ancak ne kadar uyumlu sonuçlar olduğu tartışılabilir.

Dördüncü istemde tek bir doküman üzerinde çalışırken yanıt veren modeller oldukça başarılıydı. Küçük şaşırmalar olsa da güzel iş çıkardılar. Bu sonucu tek modelle beşinci istemle kanıtlamaya çalıştım.

Aydın Tiryaki
Ankara, 3 Aralık 2025


EK 1

Gemini:

11 aylık kümülatif TÜFE: %29,74

%29,9 TÜFE için Aralık enflasyonu: %0.1233

Gemini 3 Pro ile düşünen modelde aynı sayıları buldu ancak TÜİK’in virgülden sonra iki rakam verdiğini görmüş ve %0,12 olarak rapor etmiş.

ChatGPT:

11 aylık kümülatif TÜFE: yaklaşık %29,7-29,8 (20,74)

%29,9 TÜFE için Aralık enflasyonu: yaklaşık %0,7-0,2 (0,12)

Parantez içindeki değerler “sonuçları yüzde olarak virgülden sonra 2 dijit hesaplar mısın?” isteğinden sonra hesaplananlardır.

Grok:

11 aylık kümülatif TÜFE: %29,74

%29,9 TÜFE için Aralık enflasyonu: %0,13

Deepseek: “Türkiye İstatistik Kurumu (TÜİK) tarafından 2025 yılı verileri henüz yayımlanmadığı için, bu tarihten itibaren gelecekteki enflasyon oranları bilinemez.”

“11 ayın hepsi yayınlandı.” Bilgisini vermeme karşın Deepseek bir arama yapmadı.

Copilot:

11 aylık kümülatif TÜFE: %29,74

%29,9 TÜFE için Aralık enflasyonu: %0,12

Perplexity:

11 aylık kümülatif TÜFE: yaklaşık %28,6

%29,9 TÜFE için Aralık enflasyonu: %1,5

Claude:

11 aylık kümülatif TÜFE: %28,44

%29,9 TÜFE için Aralık enflasyonu: %1,14

Meta:

11 aylık kümülatif TÜFE: %29,735

%29,9 TÜFE için Aralık enflasyonu: yaklaşık %0,1-0,2

Kimi (yanıtlaması çok uzun sürdü):

11 aylık kümülatif TÜFE: %30,7

%29,9 TÜFE için Aralık enflasyonu: % -0,57 (deflasyon)

Qwen:

“Şu ana kadar (4 Aralık 2025 itibarıyla) Türkiye İstatistik Kurumu (TÜİK) tarafından 2025 yılına ait resmi TÜFE (Tüketici Fiyatları Endeksi) verileri yayımlanmamıştır. TÜİK’in en son yayımladığı veriler 2024 yılına aittir.”

EK 2

Gemini: %29,9

ChatGPT: %29,9

Grok: %29,90

Deepseek: –

Copilot: %29,9

Perplexity: %30,53

Claude: %29,90

Meta: Aynı oturum içinde biraz önce hesapladıklarını unuttuğu için o bilgileri bana sordu, ben de yanıtlamadım.

Kimi: %29,9

Qwen: –

EK 3

Gemini:

Haziran TÜFE Değerinin İlk 6 Aylık Ortalamadan Düşük Olduğu Yıllar: 2015, 2016, 2017, 2019, 2024

Aralık TÜFE Değerinin İkinci 6 Aylık Ortalamadan Düşük Olduğu Yıllar: 2015, 2017, 2018, 2019, 2022, 2024,

ChatGPT:

“Haziran < Ocak–Haziran ortalaması” olan yıllar: 2015, 2016, 2017, 2019, 2022, 2024

 “Aralık < Temmuz–Aralık ortalaması” olan yıllar: 2015, 2017, 2018, 2019, 2020, 2022, 2023, 2024

Grok:

Haziran değeri ortalamadan düşük olan yıllar: 2015, 2017, 2019, 2022, 2024

Aralık değeri ortalamadan düşük olan yıllar: 2015, 2017, 2018, 2019, 2022, 2023, 2024

Deepseek:

Haziran < İlk 6 Ay Ort.     2015, 2016, 2017, 2019, 2022, 2024: 6 kez

Aralık < İkinci 6 Ay Ort.   2015, 2017, 2018, 2019, 2020, 2022, 2023, 2024: 8 kez

Copilot:

Haziran TÜFE’si ilk 6 aylık ortalamanın altında olduğu yıllar: 2015, 2016, 2017, 2019, 2020, 2021, 2023

Aralık TÜFE’si ikinci 6 aylık ortalamanın altında olduğu yıllar: 2015, 2017, 2018, 2019, 2020, 2022, 2023, 2024

Perplexity:

“Bu tür bir analiz, TÜİK’in veri portalından yıllara ve aylara göre ayrılmış TÜFE değerlerinin indirilip, her yıl için ayrı ayrı hesaplanmasını gerektirir. TÜİK’in veri portalında bu veriler mevcut ancak doğrudan liste halinde sunulmuyor. Bu yüzden, analiz için özel bir veri seti indirip hesaplama yapılması gerekmektedir.​ Eğer isterseniz, örnek bir yılın verilerini alıp nasıl hesaplanacağını göstererek süreci adım adım açıklayabilirim.”

Claude:

Haziran TÜFE’si ilk 6 aylık ortalamadan düşük olan yıllar:

2015 (Haziran: -0,51% < Ortalama: 0,78%), 2016 (Haziran: 0,47% < Ortalama: 0,60%), 2017 (Haziran: -0,27% < Ortalama: 0,96%), 2019 (Haziran: 0,03% < Ortalama: 0,82%), 2022 (Haziran: 4,95% < Ortalama: 6,09%), 2024 (Haziran: 1,64% < Ortalama: 3,76%)

Aralık TÜFE’si ikinci 6 aylık ortalamadan düşük olan yıllar:

2015 (Aralık: 0,21% < Ortalama: 0,64%), 2017 (Aralık: 0,69% < Ortalama: 0,93%), 2018 (Aralık: -0,40% < Ortalama: 1,66%), 2019 (Aralık: 0,74% < Ortalama: 1,06%), 2020 (Aralık: 1,25% < Ortalama: 1,35%), 2022 (Aralık: 1,18% < Ortalama: 2,42%), 2023 (Aralık: 2,93% < Ortalama: 5,50%), 2024 (Aralık: 1,03% < Ortalama: 2,47%

Meta:

Çok uzun süre “düşünüyor” bilgisi ekranda kaldı.

Kimi:

Haziran TÜFE’sinin ilk 6 aylık ortalamadan düşük olduğu yıllar (sıralı): 2024 (Fark: -2.12 pp), 2015 (Fark: -1.29 pp), 2017 (Fark: -1.23 pp), 2022 (Fark: -1.14 pp), 2019 (Fark: -0.79 pp), 2016 (Fark: -0.13 pp)

Aralık TÜFE’sinin ikinci 6 aylık ortalamadan düşük olduğu yıllar (sıralı): 2023 (Fark: -2.57 pp) ,2018 (Fark: -2.06 pp), 2024 (Fark: -1.44 pp), 2022 (Fark: -1.24 pp), 2015 (Fark: -0.43 pp), 2017 (Fark: -0.24 pp), 2019 (Fark: -0.12 pp), 2020 (Fark: -0.10 pp)

Qwen:

Haziran ayı TÜFE’si, ilk 6 aylık ortalamadan düşük olduğu yıllar: 2015, 2016, 2019, 2020, 2023, 2024

Aralık ayı TÜFE’si, son 6 aylık (Temmuz–Aralık) ortalamadan düşük olduğu yıllar: 2015, 2018, 2019, 2022

EK 4

GEMINI:

Haziran (İlk 6 Aylık Ortalamadan Düşük TÜFE) Sonuçları

YılYapay Zeka Modelleri
2015Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2016Gemini, ChatGPT, Deepseek, Copilot, Claude, Kimi, Qwen
2017Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2018(Hiçbir model doğru sonucu bulamadı)
2019Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2020Deepseek, Copilot, Qwen
2021Copilot
2022ChatGPT, Grok, Deepseek, Claude, Kimi
2023Copilot, Qwen
2024Gemini, ChatGPT, Grok, Deepseek, Claude, Kimi, Qwen

Aralık (İkinci 6 Aylık Ortalamadan Düşük TÜFE) Sonuçları

YılYapay Zeka Modelleri
2015Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2016(Hiçbir model doğru sonucu bulamadı)
2017Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2018Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2019Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2020ChatGPT, Deepseek, Copilot, Claude, Kimi
2021(Hiçbir model doğru sonucu bulamadı)
2022Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2023ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2024Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi

ChatGPT:

Haziran:
2015: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2016: Gemini, ChatGPT, Deepseek, Copilot, Claude, Kimi, Qwen
2017: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2018: –
2019: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2020: ChatGPT, Deepseek, Copilot, Claude, Qwen
2021: –
2022: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2023: ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2024: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi

Aralık:
2015: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2016: –
2017: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2018: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2019: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2020: ChatGPT, Deepseek, Copilot, Claude, Kimi
2021: –
2022: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2023: ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2024: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi

GROK:

Haziran

2015: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2016: Gemini, ChatGPT, Deepseek, Copilot, Claude, Kimi, Qwen
2017: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2018: Hiçbiri/
2019: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2020: Deepseek, Copilot, Qwen
2021: Copilot
2022: ChatGPT, Grok, Deepseek, Claude, Kimi
2023: Copilot, Qwen
2024: Gemini, ChatGPT, Grok, Deepseek, Claude, Kimi, Qwen

Aralık

2015: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2016: Hiçbiri
2017: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2018: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen/
2019: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2020: ChatGPT, Deepseek, Copilot, Claude, Kimi
2021: Hiçbiri
2022: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen
2023: ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi
2024: Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi

DEEPSEEK:

HAZİRAN için 2015–2024 yıllarını bulan modeller:

  • 2015: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2016: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2017: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2018: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2019: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2020: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2021: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2022: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2023: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2024: GPT-4o, Llama 3.1, DeepSeek, Gemini 1.5 Pro

ARALIK için 2015–2024 yıllarını bulan modeller:

  • 2015: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2016: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2017: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2018: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2019: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2020: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2021: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2022: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2023: Llama 3.1, DeepSeek, Gemini 1.5 Pro
  • 2024: Llama 3.1, DeepSeek, Gemini 1.5 Pro

Not: GPT-4o, Aralık aylarının bir kısmında (örneğin 2018 ve 2024) eksik veya yanlış cevap vermiş, bu nedenle Aralık listesine dahil edilmemiş. Metinde tüm yıllar için tek tek ayrıştırılmamış, genel ifadelerle “Aralık için GPT-4o’nun performansı düşük” denmiş, bu yüzden yukarıdaki liste metindeki kısıtlı bilgiye dayanarak oluşturulmuştur.

CLAUDE:

HAZİRAN İÇİN:

2015: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2016: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2017: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2018: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2019: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2020: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2021: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2022: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2023: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2024: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B

ARALIK İÇİN:

2015: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2016: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2017: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2018: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2019: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2020: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2021: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2022: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B
2023: Claude 3.5 Sonnet v2, DeepSeek V3, Gemini 2.0 Flash Experimental, Grok 2, Llama 3.3 70B

META:

Yanıt alamadım.

KIMI:

Yanıt alamadım.

QWEN:

Yanıt alamadım.

EK 5

GEMINI

Karşılaştırma Analizi

Analiz, “İSTEM (PROMPT) 4” bölümünde yer alan Gemini, ChatGPT ve Grok‘un hazırladığı meta-listeler (hangi yıl için hangi yapay zeka modellerinin doğru yanıt verdiği listeleri) üzerinden yapılmıştır. Deepseek ve Claude tarafından sunulan listeler, diğer modellerin aksine, tüm yıllar için aynı model grubunu listelediği ve deneyin spesifik sonuçlarını yansıtmadığı için doğrudan karşılaştırmaya dahil edilmemiştir. Meta, Kimi ve Qwen ise bu isteme yanıt verememiştir.

Haziran (İlk 6 Aylık Ortalama) Listeleri Uyum Yüzdeleri

Bu karşılaştırma, Haziran ayı TÜFE değerinin ilk 6 aylık ortalamadan düşük olduğu yılları bulan modellerin listelerinin ne kadar örtüştüğünü gösterir.

KarşılaştırmaUyum Yüzdesi (%)
Gemini vs Grok100.00%
Gemini vs ChatGPT76.27%
ChatGPT vs Grok76.27%

Yorum:

  • Gemini ve Grok‘un hazırladığı listeler %100 uyum ile birbirinin tamamen aynısıdır.
  • ChatGPT‘nin listesi ise, hem Gemini hem de Grok’un listeleriyle %76.27 oranında bir uyum göstermektedir. Bu, ChatGPT’nin 2020, 2022, 2023 ve 2024 yıllarındaki performansları listelerken diğer iki modelden farklı modelleri dahil ettiği veya hariç tuttuğu anlamına gelir.

Aralık (İkinci 6 Aylık Ortalama) Listeleri Uyum Yüzdeleri

Bu karşılaştırma, Aralık ayı TÜFE değerinin ikinci 6 aylık ortalamadan düşük olduğu yılları bulan modellerin listelerinin ne kadar örtüştüğünü gösterir.

KarşılaştırmaUyum Yüzdesi (%)
Gemini vs ChatGPT100.00%
Gemini vs Grok100.00%
ChatGPT vs Grok100.00%

Yorum:

  • Aralık listelerinde, Gemini, ChatGPT ve Grok‘un hazırladığı listeler arasında tamamen bir uyum (%100) bulunmaktadır. Bu, her üç modelin de 2015-2024 yılları arasında Aralık ayında ortalamadan düşük TÜFE değeri olan yılları bulan yapay zeka modelleri konusunda aynı fikirde olduğunu göstermektedir.

Diğer Modellerin Listeleri Hakkında Kısa Not

  • Deepseek ve Claude‘un listeleri, “İSTEM (PROMPT) 3” deneyinde yer alan ve farklı sonuçlar veren 8 modeli (Gemini, ChatGPT, Grok, Deepseek, Copilot, Claude, Kimi, Qwen) analiz etmek yerine, kendi içlerinde belirlediği bir modeli/model grubunu tüm yıllar için doğru yanıtı verenler olarak listelemiştir. Bu durum, bu listelerin amaçlanan meta-analiz formatından farklı olduğunu göstermektedir.
  • Meta, Kimi ve Qwen ise bu aşamada yanıt sağlayamamıştır.

Aydın'ın dağarcığı

Hakkında

Aydın’ın Dağarcığı’na hoş geldiniz. Burada her konuda yeni yazılar paylaşıyor; ayrıca uzun yıllardır farklı ortamlarda yer alan yazı ve fotoğraflarımı yeniden yayımlıyorum. Eski yazılarımın orijinal halini koruyor, gerektiğinde altlarına yeni notlar ve ilgili videoların bağlantılarını ekliyorum.
Aydın Tiryaki

Ara