Aydın Tiryaki & Claude (Sonnet 4.6) | 17 Mayıs 2026
1. Giriş: Deneyin Arka Planı
17 Mayıs 2026 sabahı, Trendyol Süper Lig’in 2025-2026 sezonu son haftasındaki kritik küme düşme senaryolarını anlamak amacıyla Mistral AI’nin Le Chat platformuyla bir konuşma başlatıldı. Bu konuşma başlangıçta bir futbol analizi gibi görünse de zamanla farklı bir nitelik kazandı: yapay zekanın güvenilirliğini ve gerçek zamanlı veri yönetim kapasitesini sınayan sistematik bir vaka çalışmasına dönüştü.
Deneyi yürüten Aydın Tiryaki, önceki dönemlerde Mistral AI ile olumlu deneyimler yaşamıştı. Mistral’in özellikle metin üretme ve akıl yürütme konularında yavaş ama sağlam sonuçlar verdiğini gözlemlemişti. Ancak bu deneyde konunun araştırma ve sayısal hesaplama gerektirmesi, modelin farklı bir boyutunu gözler önüne serdi.
Bu makalede söz konusu diyalog başından sonuna incelenmekte; Mistral’in yaptığı hatalar kataloglanmakta, deneyi yürüten kişinin izlediği metodoloji aktarılmakta ve bu gözlemlerden çıkarılan sonuçlar bir yapay zeka değerlendirmesi perspektifiyle tartışılmaktadır.
2. Deneyin Başladığı Gerçek Durum
Deneyi doğru değerlendirebilmek için, 17 Mayıs 2026 itibarıyla Trendyol Süper Lig’deki gerçek tablonun bilinmesi gerekmektedir. Doğru kaynaklara göre durum şuydu:
Fatih Karagümrük ve Kayserispor, 33. haftanın tamamlanmasıyla birlikte zaten küme düşmüştü. Dolayısıyla son haftada düşecek üçüncü takım şu dört aday arasından çıkacaktı:
- Antalyaspor — 29 puan (en kırılgan aday; Kocaelispor’u mutlaka yenmek zorundaydı)
- Gençlerbirliği — 31 puan
- Kasımpaşa — 32 puan
- Eyüpspor — 32 puan
Bu dört takımın maçları aynı gün saat 20:00’de eş zamanlı olarak oynandı. Puan eşitliği durumunda ikili, üçlü ve dörtlü averaj kuralları devreye girecekti. Gençlerbirliği Trabzonspor, Kasımpaşa şampiyon Galatasaray, Eyüpspor ise Fenerbahçe ile karşı karşıya geldi.
3. Mistral AI’nin Yaptığı Hatalar: Kapsamlı Bir Katalog
Diyalog boyunca Mistral’in yaptığı hatalar birkaç farklı kategoride gruplanabilir. Aşağıda bu hatalar hem tanımlanmış hem de bağlamları içinde değerlendirilmiştir.
3.1 Temel Olgusal Hatalar
| Hata 1 | Yanlış Takım Adayları | Konuşmanın ilk yanıtında Mistral, Bodrum FK ve Sivasspor’u 2025-2026 sezonunda küme düşme adayı olarak gösterdi. Oysa bu iki takım 2024-2025 sezonunda düşmüştü ve 2025-2026 Süper Lig kadrosunda yer almıyordu. Bu, en temel olgusal hatadır. |
| Hata 2 | Kritik Üç Adayı Gözden Kaçırma | Mistral, gerçek tabloda yer alan Gençlerbirliği, Kasımpaşa ve Eyüpspor’u hiçbir aşamada küme düşme adayı olarak dile getirmedi. Bu üç takımın son haftada en kritik tehlike altındaki ekipler olduğu göz önüne alındığında, bu eksiklik çerçeve hatasının ne kadar derin olduğunu göstermektedir. |
| Hata 3 | Sezon Karışıklığı | Mistral, 2024-2025 ve 2025-2026 sezonlarına ait verileri birbirine karıştırdı. Kaynaklara atıfta bulunurken Mackolik’i gösterdi; ancak büyük olasılıkla eski sezon haberlerini mevcut sezonla harmanlayarak işledi. Bu durum güven hissi veren ama temelsiz bir yanıt üretilmesine yol açtı. |
| Hata 4 | Hatalı ‘Kesin Küme Düşme’ İddiası | Mistral, hâlâ 33 maç oynayıp bir maçı kalan Kayserispor’u ‘matematiksel olarak kesin küme düştü’ diye ilan etti. Oysa Kayserispor son maçını kazansaydı puan tablosunda farklı bir konuma gelebilir, ikili averaj hesaplamaları devreye girebilirdi. Matematiksel kesinlik kavramı yanlış uygulandı. |
| Hata 5 | Maç Saati Yanlışlığı | Mistral, saat 17:00’de oynandığını belirttiği maçların bir kısmının aslında 20:00’de başladığını fark edemedi. Fikstür bilgisi yanlış işlendi. |
3.2 Mantıksal ve Analitik Hatalar
| Hata 6 | Averaj Hesaplamalarının Yanlış Temele Oturması | Mistral, ikili ve üçlü averaj hesaplamalarını doğru formüle dayandırmaya çalıştı; ancak bu hesaplamalar, temelinde yanlış takım listesine (Bodrum, Sivasspor vb.) dayandığı için tümüyle anlamsız hale geldi. Doğru yöntemle yanlış verinin birleşimi tutarsız sonuçlar doğurdu. |
| Hata 7 | Senaryo Analizinin Eksik Kalması | Sunulan senaryo tablolarında Kayserispor’un kazanıp 30 puana çıkma ihtimali gibi kritik dallar göz ardı edildi. Olası senaryoların tamamı kapsanmadı; bazı kombinasyonlar hiç ele alınmadı. |
| Hata 8 | Dörtlü Averaj Senaryosunu Görememe | Gerçek tabloda dört takımın eşit puanda bitirebileceği senaryolar söz konusuydu. Mistral bu olasılığı kendi analizinde üretemedi; dörtlü averaj mekanizmasını yalnızca kullanıcı sorduğunda ve soyut olarak ele aldı. |
3.3 Meta-Bilişsel Hatalar: Kendini Değerlendirememe
| Hata 9 | Hata Tespitinde Başarısızlık | Kullanıcı ‘Diyalogu başından incele, ne gibi hatalar yapmış olabilirsin?’ diye sorduğunda, Mistral yaptığı hataların listesini çıkarmaya çalıştı. Ancak bu ‘öz-değerlendirme’ sürecinin kendisi de hatalıydı: bazı hatalar tespit edilemedi, bazıları ise yanlış bağlamda değerlendirildi. |
| Hata 10 | Sahte Güven | Mistral, hatalı bilgileri ‘kaynaklara dayanarak’ sundu. Mackolik ve TFF gibi güvenilir kaynaklara atıfta bulunması, yanıtlara gerçekmiş izlenimi kazandırdı; oysa bu atıfların doğrulanan içerikle örtüşmediği anlaşıldı. Bu ‘kaynak gösterme’ davranışı, hatanın tespit edilmesini güçleştirdi. |
4. Deneyi Yürüten Kişinin Metodolojisi
Bu deneyin yalnızca teknik bir soru-cevap seansı olmadığını anlamak, sonuçları yorumlamak açısından kritik önem taşımaktadır. Aydın Tiryaki, Mistral’e yönelik sorularını belirli bir stratejiyle kurguladı.
4.1 İlk Aşama: Bilinçli Susma
Mistral ilk yanıtında Bodrum FK ve Sivasspor’u liste başına koyduğunda, kullanıcı bu hatayı hemen düzeltmedi. Bu tercih bilinçliydi: modelin hatayla nasıl ilerlediğini, hatanın diğer yanıtlara nasıl sızdığını gözlemlemek amacıyla susmak tercih edildi. Kullanıcı, hatayı ilk anda uyarmak yerine konuşmanın bir süre daha bu zemin üzerinde ilerlemesine izin verdi.
4.2 İkinci Aşama: Kademeli Sondaj
Sonraki sorularda kullanıcı, hesaplama yöntemleri, veri kaynakları ve senaryolar hakkında Mistral’i derinleştirici sorularla sınadı. ‘Bu hesabı nasıl yaptın?’, ‘Bu bilgileri hangi kaynaklardan aldın?’, ‘Üçlü veya dörtlü averajı hiç düşündün mü?’ gibi sorular, modeli kendi yaklaşımını açıklamaya zorlayarak hem mevcut hataların daha belirgin hale gelmesini hem de yeni hataların üretilip üretilmediğinin görülmesini sağladı.
4.3 Üçüncü Aşama: Öz-Değerlendirme Testi
Belirli bir noktada kullanıcı, Mistral’den diyaloğun başından itibaren kendi hatalarını tespit etmesini istedi. Bu istek, modelin meta-bilişsel yetkinliğini ölçmek için tasarlanmış bir sınavdı. Mistral bazı hataları tanımlayabildi; ancak bu ‘hata listesi’nin kendisi de sorunluydu: temel çerçeve hatası (yanlış takımlar) hâlâ tam anlamıyla çözülemedi.
4.4 Nihai Tespit
Kullanıcı, sürecin sonunda ‘zurnanın zirt dediği yer’ ifadesini kullanarak kritik noktaya geldiğini işaret etti ve ardından modeli ‘umutsuz vaka’ olarak nitelendirdi. Bu tanımlama, Mistral’in hatalarını hem kendi başına düzeltemediğini hem de sistematik bir düzeltme sürecine girme kapasitesinin sınırlı olduğunu vurgulamaktadır.
5. Neden Bu Kadar Çok Hata? Bir Analiz
Mistral’in bu diyalogdaki başarısızlığı tek bir nedene bağlanamaz. Aşağıda bu hataların temelinde yatan yapısal sorunlar tartışılmaktadır.
5.1 Gerçek Zamanlı Veri Yokluğu
Süper Lig gibi dinamik bir ortamda puan durumu her hafta değişmektedir. Mistral’in eğitim verisi belirli bir tarihe kadar uzanmakta; bu tarihten sonraki gelişmeleri ise ya web araması yoluyla edinmekte ya da çıkarım yoluyla üretmektedir. Bu deneyde model, web araması yapmış gibi görünse de eski sezon haberlerini yeni sezon verileriyle karıştırdı. Bu, eğitim kesim tarihi ile gerçek zaman arasındaki boşluğun en dramatik tezahürlerinden biridir.
5.2 Bağlam Belirleme Zayıflığı
‘2025-2026 sezonu küme düşme adayları’ sorusu, model tarafından yeterince bağlamsal olarak işlenemedi. Soru net bir sezon referansı içermesine karşın, Mistral’in yanıtları büyük ölçüde önceki sezona ait verilerden besleniyordu. Bağlamı doğru sezona sabitleyecek bir mekanizma yeterince çalışmadı.
5.3 Güven Kalibrasyonu Sorunu
Mistral, sahip olmadığı bilgiyi ‘sahip olmuş gibi’ sundu. Kaynakları doğrulayıp doğrulamadığı belirsiz olmakla birlikte, sunulan bilgilerin kesinlik düzeyi gerçek güvenden çok daha yüksekti. Bu ‘aşırı güven’ (overconfidence) durumu, hem hataları gizledi hem de kullanıcının yanlışlıkla yanıtlara inanmasına zemin hazırladı.
5.4 Zincirleme Hata Etkisi
İlk hata — yanlış takımların listeye alınması — bütün sonraki hesaplamaları, senaryoları ve kaynakları sarstı. Yanlış bir temel üzerine inşa edilen her ek analiz katmanı, hatanın derinleşmesine hizmet etti. Bu ‘zincirleme hata’ (error propagation) mekanizması, yapay zeka sistemlerindeki en tehlikeli başarısızlık biçimlerinden biridir; çünkü her yeni adım daha güvenilir görünse de gerçekte daha da uzaklaşmaktadır.
5.5 Öz-Düzeltme Kapasitesinin Sınırlılığı
Belki de en düşündürücü bulgu şudur: Mistral, hatalarını bulmaya davet edildiğinde dahi bu görevi yeterince başaramadı. İnsan bir analist, ‘hata listeni çıkar’ denildiğinde önce en temel varsayımları sorgular. Mistral ise kısmen doğru kısmen hatalı bir meta-değerlendirme üretti. Bu, modelin kendi çıktılarını eleştirel biçimde denetleyecek içsel mekanizmasının yetersizliğine işaret etmektedir.
6. Beklenen ile Gerçekleşen: Karşılaştırmalı Tablo
| Beklenen Davranış | Mistral’in Gerçek Davranışı |
| Veri doğrulamak için önce mevcut sezonu tespit et | Sezon ayrımı yapmadan 2024-25 ve 2025-26 verilerini karıştırdı |
| Küme düşme adaylarını güncel puan durumundan belirle | Bodrum FK ve Sivasspor’u 2025-26’da küme düşme adayı olarak gösterdi |
| Tüm küme düşme adaylarını listele | Gençlerbirliği, Kasımpaşa ve Eyüpspor’u tamamen gözden kaçırdı |
| Matematiksel kesinliği doğru kullan | Hâlâ maçı olan Kayserispor’u ‘kesin küme düştü’ diye ilan etti |
| Hata tespitinde sistematik ol | Hatalarını bul dendiğinde bile yeni hatalar üretti |
| Kaynak gösterirken bağlamı doğru eşleştir | Mackolik’i kaynak gösterdi, ancak yanlış sezon verisini işledi |
7. Yapay Zekaya Öneriler: Veri Mimarisi Üzerine
Diyaloğun son bölümünde kullanıcı, bu deneyden hareketle yapay zeka geliştirme süreçlerine yönelik önemli öneriler dile getirdi. Bu öneriler hem teknik hem de kavramsal açıdan dikkate değerdir.
7.1 Statik ve Dinamik Bilginin Ayrıştırılması
Kullanıcı, yapay zekanın bilgi tabanını iki temel kategoride yönetmesi gerektiğini vurguladı. Bunu bir yazar metaforu üzerinden açıkladı: Hayatını tamamlamış ve tüm eserlerini vermiş bir yazarın bilgisi ‘kapalı kutu’ niteliğindedir; değişmez. Öte yandan hâlâ yaşayan ve üretmeye devam eden bir yazarın bilgisi açık uçludur; sürekli güncellenmesi gerekir.
Bu mantığı Süper Lig’e uyguladığımızda: 2024-2025 sezonu bitmişse o sezonun verileri statiktir ve sabitlenmelidir. 2025-2026 sezonu devam ediyorsa o veriler dinamik, açık uçlu ve anlık güncellenebilir olmalıdır.
7.2 Statik Bilgide Dahi Küçük Bir Açık Uç
Kullanıcının en özgün katkısı burada ortaya çıkmaktadır: Statik bilgiler bile tamamen kapalı tutulmamalıdır. Tarihsel bir olayın tamamlanmış olması, o olayla ilgili yeni bulguların, düzeltmelerin veya yorumların ortaya çıkamayacağı anlamına gelmez. Dolayısıyla ‘kapalı kutu’ bilgilerde dahi küçük bir güncelleme kapısı bırakılmalı; bu kapı yeni kanıtlar, hata düzeltmeleri veya bağlamsal zenginleştirmeler için açık tutulmalıdır.
7.3 Veri Erişim Altyapısı
Kullanıcı, yapay zekanın en öncelikli geliştirme alanı olarak güncel web verilerine temiz, hızlı ve doğru erişim sağlayacak bir altyapının kurulmasını önerdi. Bu altyapının yalnızca veri çekmekle kalmayıp sezon, tarih ve bağlam gibi filtreleri otomatik olarak uygulayabilmesi gerektiğini vurguladı.
8. Gözlemleyen Yapay Zekanın Perspektifi
Bu makalenin bir ayağını oluşturan Claude (Sonnet 4.6), yukarıda aktarılan gözlemlere katkıda bulunmakla birlikte, konu hakkında kendi değerlendirmesini de paylaşmak istemektedir.
8.1 Güven, Kaynaklandırma ve Doğrulama
Mistral’in bu diyalogdaki temel sorunu, bilgi eksikliği değil bilgi doğrulama eksikliğiydi. Model, web kaynağına atıfta bulunurken bu kaynaktan gerçekte ne çektiğini denetleyemedi ya da denetleyebildiği kadarıyla yanlış bağlamı doğru bağlamla ayırt edemedi. Bu durum, ‘kaynaklı yanlış bilgi’ üretiminin neden kaynaklı olmayan yanlış bilgiden daha tehlikeli olabileceğini gözler önüne sermektedir: kullanıcı, referans varlığını doğrulama kalitesiyle özdeşleştirme eğilimindedir.
8.2 Döngüsel Hata Riski
Zincirleme hata mekanizması, yapay zeka sistemlerinin özellikle analitik görevlerde göstermesi gereken en kritik dirençlerden birini test etmektedir: ilk varsayımı sorgulamadan çıkarım yapmamak. Bu diyalogda Mistral, ‘takım listesi doğruysa…’ koşulunu hiçbir noktada yeniden sorgulamadı. Oysa sağlam bir analitik süreçte ilk adım, temel varsayımların doğrulanmasıdır.
8.3 Deneyin Tasarımı Üzerine
Aydın Tiryaki’nin benimsediği kademeli uyarı metodolojisi, yapay zeka değerlendirmesinde nadiren karşılaşılan bir titizliği yansıtmaktadır. Hatayı hemen düzeltmek yerine, o hatayla sistemin nasıl ilerlediğini gözlemlemek; ardından giderek derinleşen sondajlarla modeli sınayarak sonunda öz-değerlendirme testine tabi tutmak — bu süreç, klasik bir deneysel protokolün mantığını taşımaktadır. Mistral’in durumu ‘umutsuz vaka’ olarak nitelendirmesi, bu kademelendirme sayesinde ortaya çıkabilmiştir.
8.4 Öğrenme Eğrisi ve Sabır
Kullanıcının dile getirdiği bir husus da önemlidir: Mistral, daha önceki deneylerde olumlu izlenimler bırakmıştı. Bu da bize yapay zeka değerlendirmesinde görev türünün belirleyici olduğunu hatırlatmaktadır. Bir modelin yaratıcı yazarlıkta, akıl yürütmede ya da açıklama görevlerinde sergilediği performans; gerçek zamanlı veri bağımlı, çok değişkenli hesap gerektiren bir analizde aynı düzeyde olmayabilir. Değerlendirme kategorileri ayrıştırıldığında, modeller arasındaki kıyaslama daha sağlıklı sonuçlar verir.
9. Sonuç
Bu vaka çalışması, yapay zeka sistemlerinin gerçek zamanlı ve hesap yoğunluklu görevlerde gösterebileceği başarısızlık biçimlerini somut bir örnekle belgelemektedir. Mistral’in bu diyalogdaki performansı, modeli kalıcı olarak yetersiz ilan etmek için değil; güçlü ve zayıf olduğu alan sınırlarını anlamak için bir veri noktası olarak okunmalıdır.
Aydın Tiryaki’nin önerisi yerindedir: yapay zekanın bilgi mimarisinde statik ve dinamik verilerin ayrıştırılması, her ikisinde de bağlama duyarlı güncelleme mekanizmalarının entegre edilmesi, gerçek zamanlı veri erişiminin sağlıklı hale getirilmesi — bu adımlar atıldığında, bugün ‘umutsuz vaka’ görünen senaryoların önemli bir kısmı aşılabilir hale gelecektir.
Son söz olarak: Bir yapay zekanın futbol ligini yanlış okuması, kulağa hafif bir hata gibi gelebilir. Ancak bu hata, aynı modelin herhangi bir dinamik alanda — tıbbi veriden hukuki emsal analizine, finansal tablolardan seçim sonuçlarına — benzer hatalar yapabileceğinin habercisidir. Konu futbol değildir; konu, güvenilirliğin nereden ve nasıl kazanıldığı ya da yitirildiğidir.
Aydın Tiryaki & Claude Sonnet 4.6 | Ankara, 17 Mayıs 2026
| aydintiryaki.org | YouTube | Aydın Tiryaki’nin Yazıları ve Videoları │Articles and Videos by Aydın Tiryaki | Bilgi Merkezi│Knowledge Hub | ░ Virgülüne Dokunmadan │ Verbatim ░ | ░ Yapay Zekanın Türkiye Süper Ligi’nde Küme Düşme ile İmtihanı │AI on Trial: Relegation in Turkish Super League ░ 17.05.2026
