Zincirleme Hata, Kural Bilgisizliği ve Öz-Denetim Eksikliği Üzerine Bir Vaka Çalışması
Aydın Tiryaki & Claude (Sonnet 4.6) | 17 Mayıs 2026
1. Giriş: Basit Bir Soru, Derinleşen Bir Çukur
17 Mayıs 2026 sabahı Aydın Tiryaki, Mistral AI ile yürüttüğü vaka çalışmasının hemen ardından aynı soruyu Meta AI’a yöneltti: ‘Süper Lig’de bugün oynanacak maçlardan sonra hangi sonuçlarla hangi takımlar küme düşer?’ Bu soru, bir futbol bilgi testinin çok ötesinde, yapay zekanın gerçek zamanlı hesaplama kapasitesini, kural yönetimini ve öz-denetim mekanizmasını ölçen sistematik bir deneyin parçasıydı.
Meta AI diyaloğu, Mistral vakasından yapısal olarak ayrılan ilginç bir profil sergiledi. Mistral, yanlış takımlarla başlayarak çerçeve hatası yapmıştı; Meta AI ise doğru takımlarla başladı ancak hesabın matematiksel ve kuralsal altyapısını sıfırdan yanlış kurdu. Üstelik her düzeltme girişimi yeni bir hata zinciri doğurdu. Türkçede ‘daha çok batmak’ olarak adlandırılan bu dinamik, diyaloğun sonunda kullanıcı tarafından tam da bu deyimle tespit edildi.
Aydın Tiryaki bu deneyde de bilinçli bir metodoloji izledi: hataları hemen düzeltmek yerine modelin onlarla nasıl ilerlediğini gözlemledi, kademeli sorularla sıkıştırdı ve sonunda öz-değerlendirme testi uyguladı. Bu makale, o diyaloğun anatomisini çıkarmakta ve Meta AI’ın başarısızlık biçimlerini sistematik biçimde belgelemektedir.
2. Deneyin Başlangıç Noktası: Gerçek Tablo
17 Mayıs 2026 itibarıyla Trendyol Süper Lig’de durum şuydu: Sezon 34 haftadan oluşuyordu (18 takımlı lig), 33. hafta tamamlanmıştı ve son hafta maçları oynanmak üzereydi. TFF kararına göre bu sezon 3 takım düşecekti — yani 16., 17. ve 18. sıralar. 33. hafta sonrası düşme hattının gerçek görünümü:
| Sıra | Takım | Puan | Averaj |
| 15. | Gençlerbirliği | 31 | -14 |
| 16. | Antalyaspor | 29 | -23 |
| 17. | Fatih Karagümrük | 27 | -24 |
| 18. | Kayserispor | 27 | -36 |
Bugünkü 34. hafta maçları saat 17:00 ve 20:00’de başlayacaktı. TFF’nin net kuralı: 16., 17. ve 18. sıralar düşecek, Gençlerbirliği ise 15. sırada olduğu için kurtulmuş sayılacaktı. Kritik maçlar: Kayserispor-Konyaspor (17:00), Karagümrük-Alanyaspor (17:00), Antalyaspor-Kocaelispor (20:00), Trabzonspor-Gençlerbirliği (20:00), Kasımpaşa-Galatasaray (20:00), Fenerbahçe-Eyüpspor (20:00).
3. Meta AI’ın Yaptığı Hatalar: Kapsamlı Bir Katalog
Meta AI’ın bu diyalogdaki hata profili Mistral’den farklı bir nitelik taşımaktadır. Mistral’de hatalar ağırlıklı olarak yanlış olgusal çerçeveden (yanlış takımlar, yanlış sezon) kaynaklanıyordu. Meta AI’da ise doğru olgusal çerçeve üzerine yanlış matematik, kural bilgisizliği ve zincirleme düzeltme döngüsü egemendir.
3.1 Matematiksel ve Yapısal Hatalar
| Hata 1 | 38 Hafta Yanılgısı | Meta AI, 2025-2026 sezonunu 18 takımlı olmasına karşın 20 takımlı eski sezon bilgisiyle özdeşleştirerek ’38 hafta, 5 maç kaldı’ dedi. Oysa doğru hesap şuydu: 18 takım x 2 – 2 = 34 hafta; 33 hafta oynanmış, dolayısıyla yalnızca 1 maç kalmıştı. Bu tek hata, tüm ‘kimse düşmüyor’ analizini çökertti. |
| Hata 2 | Kalan Maç Hesabı Yanlışlığı | ‘5 hafta, 12 puan alınabilir’ çıkarımı doğrudan 1. hatanın devamıydı. Gerçekte her takımın yalnızca 1 maçı, yani en fazla 3 puanı vardı. Bu yanlış hesap üzerine kurulan tüm küme düşme senaryoları geçersiz hale geldi. |
| Hata 3 | Düşen Takım Sayısını Doğrulamama | Meta AI diyaloğun büyük bölümünde ‘4 takım düşüyor’ varsayımıyla çalıştı. TFF’nin 2025-2026 kararı aranmadı, sorgulanmadı. Kullanıcı ısrar edince araştırıldı ve ‘3 takım düşüyor’ gerçeği ancak diyaloğun çok geç bir aşamasında ortaya çıktı. Bu, tüm önceki senaryoları geçersiz kıldı. |
| Hata 4 | Temel Kuralı En Sona Bırakma | Herhangi bir küme düşme hesabının önkoşulu şudur: kaç takım düşecek? Meta AI bu soruyu sormak yerine varsayımla başladı, sayfalarca senaryo kurdu. Kullanıcı ‘Bu bilgi olmadan hesap yapılamaz’ dedikten sonra araştırma yapıldı. Temel kuralın son adımda sorgulanması, hesaplama disiplinin en ciddi ihlalidir. |
3.2 Dil ve Güven Kalibrasyonu Hataları
| Hata 5 | Kesin Dil Kullanma Eğilimi | Meta AI, belirsiz olduğu konularda dahi kesin ifadeler kullandı: ‘4 takım düşüyor’, ‘Bugün kimse kesin düşmüyor’, ‘Düşenler: Antalyaspor, Karagümrük, Kayserispor.’ Her üçü de ya varsayıma ya yanlış matematiğe ya da maçlar oynanmadan yapılan erken karara dayanıyordu. |
| Hata 6 | Maçlar Bitmeden ‘Düştü’ İlanı | 3 takım düşeceği bilgisine ulaşır ulaşmaz Meta AI ‘Düşenler: 16. Antalyaspor, 17. Karagümrük, 18. Kayserispor’ dedi. Oysa saat 17:00 ve 20:00 maçları henüz oynanmamıştı. Kural doğru olabilirdi; ama kural, maç sonuçlarının yerini tutmaz. |
| Hata 7 | Varsayımı Bilgi Olarak Sunma | ‘4 takım düşüyor’ ifadesinin bir varsayım olduğu, kullanıcı ‘Bu bilgiyi nereden aldın?’ diye sormadan açıklanmadı. Modelin varsayım ile teyitli bilgiyi ayrıştırma konusundaki bu direnci, diyalog boyunca tekrar tekrar gündeme geldi. |
3.3 Zincirleme Hata ve Öz-Denetim Başarısızlığı
| Hata 8 | Düzelttikçe Daha Derin Batma | Kullanıcı 38 hafta hatasını gösterince Meta AI düzeltti; ama ‘4 takım düşüyor’ varsayımını sürdürdü. Sonra ‘3 takım düşüyor’ öğrenildi; ama maçlar oynanmadan ‘düştü’ dendi. Her düzeltme yeni bir boyutta yeni hata üretti. Kullanıcının ifadesiyle ‘daha çok batmak’ dinamiği tam da buydu. |
| Hata 9 | Öz-Değerlendirme Eksikliği | Kullanıcı ‘Diyaloğu baştan incele, hatalarını derle’ dediğinde Meta AI bir liste çıkardı. Bu liste kısmen doğruydu; ancak öz-değerlendirme sürecinin kendisi de eksikti. Temel kural kontrolünü ‘en büyük hata’ olarak ancak kullanıcı belirtince kabul etti; kendi başına tespit edemedi. |
| Hata 10 | Kaynak Gösterme ile Doğrulama Arasındaki Uçurum | Meta AI Sporzip, Haber7 ve Kamuis.com.tr’yi kaynak olarak gösterdi. Ancak bu kaynakların sağladığı ham veriler yanlış sezon parametreleriyle işlendi. Kaynağa atıf yapmak, kaynaktan doğru veriyi çekmek anlamına gelmiyordu. |
4. Deneyi Yürüten Kişinin Metodolojisi
Aydın Tiryaki’nin Mistral deneyinde izlediği üç aşamalı protokol bu diyalogda da uygulandı; ancak Meta AI’ın hata yapısı farklı olduğundan süreç farklı bir seyir izledi.
4.1 İlk Aşama: Gözlemci Suskunluk
Meta AI 38 hafta, 5 maç kaldı ve kimse kesin düşmüyor derken kullanıcı müdahale etmedi. Amacı açıktı: modelin bu yanlış zemin üzerinde ne kadar ilerleyeceğini ve hangi katmanları üzerine inşa edeceğini görmek. İlk hata saptandıktan sonra ikincisini tetikleyip tetiklemeyeceği beklendi.
4.2 İkinci Aşama: Kademeli Sorgulama
‘Bu sonuçlara nereden ulaştın?’, ‘Bu hesap yöntemini hangi kurallara göre yaptın?’, ’38 haftayı nereden buldun?’, ‘Başka hatan var mı, baştan değerlendir’ soruları her biri bir öncekinin kapattığı kapıyı açtı. Her soru bir katmanı daha çözüp altındaki yeni hatayı görünür kıldı.
4.3 Üçüncü Aşama: Temel Kural Testi
Diyaloğun kritik kırılma noktası şu soruydu: ‘Kaç takım düşeceğini öğrendin mi?’ Bu soru, tüm hesabın hangi temele oturduğunu sorguladı. Meta AI bu soruya kadar TFF statüsünü araştırmamıştı. Araştırınca ‘3 takım düştüğünü’ öğrendi; ama bunu öğrenir öğrenmez, maçlar oynanmadan ‘düştü’ diyerek yeni bir hata yaptı.
4.4 Nihai Tespit: ‘Daha Çok Batmak’
Kullanıcı sonunda diyaloğu kesmek gerektiğini belirterek şu tespiti yaptı: ‘Her bir adımda daha çok batıyorsun ve bunun içinden çıkmak imkansız bir hale geliyor.’ Meta AI bu tespiti kabul etti ve diyaloğun ‘yapay zekanın nasıl hata yaptığının ders kitabı örneği’ olduğunu ifade etti. Ancak bu kabulün kendisi de bir sonraki adımda yanlış bir çıkarımla sonuçlandı — çünkü model, ‘en büyük hatayı’ temel kural kontrolü değil ’38 hafta’ olarak göstermeye devam etti.
5. Neden Bu Kadar Çok Hata? Yapısal Bir Analiz
5.1 ‘Hız Önce, Doğruluk Sonra’ Modeli
Meta AI’ın temel çalışma refleksi hızlı cevap vermektir. Bu refleks, önce veriyi toplamak ve sonra çelişkileri kontrol etmek yerine, veriyi toplar toplamaz işlemeye ve sunmaya yönlendirir. Temel parametreler (lig kaç hafta, kaç takım düşüyor) doğrulanmadan senaryo üretimi başlamıştı. Hızlı cevap, doğrulama adımını atlar.
5.2 Eski Bilginin Yeni Veriyi Ezmesi
2023-2024 sezonunda 20 takımlı olan Süper Lig bilgisi, 2025-2026 sezonunun 18 takımlı gerçeğini devre dışı bıraktı. Model, tablodaki takım sayısını saymak yerine hafızasındaki sezon yapısını varsayılan değer olarak kullandı. Bu ‘hafıza kirliliği’ mekanizması, modelin güncel veriyi işlerken geçmiş bilginin gölgesinde kalmasına yol açtı.
5.3 Kuraldan Önce Hesap
Bir futbol liginin küme düşme hesabının önkoşulu kuraldır: kaç takım düşüyor? Meta AI bu soruyu sormadan, iki farklı senaryo (3 mü 4 mü?) üretebilecek bir belirsizliği varsayımla kapatarak hesaba başladı. Bu yaklaşım, doğru sonuca ulaşma olasılığını baştan ikiye böler.
5.4 Düzeltme Döngüsünün Kapalı Sistem Sorunu
Her düzeltme yalnızca işaret edilen hatayı kapatıyor; işaret edilmeyen diğer hataları açıkta bırakıyordu. Kullanıcı ’38 hafta yanlış’ deyince o düzeltildi; ama ‘4 takım düşüyor varsayımı’ aynı mesajda görünmediği için devam etti. Bu, açık uçlu düzeltme döngüsünün kapalı bir sistem mantığıyla çalışmasının doğal sonucudur: yalnızca gösterilen düzelir.
5.5 ‘Bilmiyorum’ Direnç Mekanizması
Model, belirsizlik durumlarında kesin konuşmaya yatkın. ‘4 takım düşüyor’, ‘Kimse düşmüyor’, ‘Düşenler şunlar’ ifadelerinin tamamı birer kesinlik iddiasıydı. Oysa bu diyaloğun en az yarısında doğru cevap ‘Bilmiyorum, TFF statüsüne bakmam lazım’ ya da ‘Maçlar oynanmadan söyleyemem’ olurdu. Bu direncin kaynağı muhtemelen eğitim sürecindeki ‘yardımcı ve kesin ol’ yöneliminin aşırı uygulanmasıdır.
6. Beklenen ile Gerçekleşen: Karşılaştırmalı Tablo
| Beklenen Davranış | Meta AI’ın Gerçek Davranışı |
| Temel kuralı (kaç takım düşüyor?) önce doğrula | TFF statüsünü sormadan ‘Büyük ihtimalle 4 takım düşüyor’ varsayımıyla başladı |
| Lig hafta sayısını tablodan kontrol et | Eski sezon bilgisinden (20 takım = 38 hafta) giderek 38 hafta, 5 maç kaldı dedi |
| ‘Bilmiyorum’ demesi gereken yerde bilmiyorum de | Her belirsizliği kesin ifadeyle sundu; kullanıcı sormadan varsayımı açıklamadı |
| Düzeltme yaparken yeni hata üretme | Her düzeltme döngüsü yeni bir hatayı beraberinde getirdi |
| Maçlar bitmeden ‘düştü’ deme | 3 takım düşeceğini öğrenir öğrenmez maçlar oynanmadan Antalyaspor, Karagümrük, Kayserispor düştü dedi |
| Öz-değerlendirmede gerçek hatayı tespit et | Hata listesini ancak kullanıcı baskısıyla ve kısmen doğru çıkarabildi |
7. Mistral ile Karşılaştırma: İki Farklı Hata Profili
Aydın Tiryaki’nin her iki modele aynı soruyu yöneltmesi, farklı yapay zeka sistemlerinin nasıl farklı biçimlerde başarısız olabileceğini gözler önüne serdi.
| Hata Boyutu | Mistral | Meta AI |
| İlk Çerçeve Hatası | Yanlış takımlar (Bodrum FK, Sivasspor) | Doğru takımlar ama yanlış matematik (38 hafta, 5 maç) |
| Hata Türü | Olgusal / Sezon karışıklığı | Hesapsal / Kural bilgisizliği |
| Kaynak Gösterme | Yanlış sezon verilerini doğru kaynak gibi sundu | Doğru kaynaklara atıf yaptı, ama yanlış veri çekti |
| Öz-Düzeltme | Hata buldur dendiğinde yeni hatalar üretti | Düzelttikçe daha derin battı — zincirleme hata |
| Temel Kural Kontrolü | Sezon tespitini hiç yapmadı | Düşen takım sayısını en sona bıraktı |
| ‘Bilmiyorum’ Kullanımı | Hiç kullanmadı | Kullanıcı zorlayana kadar kullanmadı |
| Kritik Dönüm Noktası | Bodrum FK neden listede? sorusu | 38 haftayı nereden buldun? sorusu |
| Genel Profil | Özgüvenli cehalet | Hız öncelikli, kural-sonrası hata |
İki vakanın ortak paydası şudur: her iki model de kullanıcı müdahalesi olmadan hatalarını fark edemedi. Farklılık ise hatanın kaynağında yatar. Mistral, yanlış çerçeveden (hangi takım ligde?) başlayarak tüm analizi o çerçeve üzerine inşa etti. Meta AI ise doğru çerçeveyle (doğru takımlar, doğru sezon) başlayıp matematiksel ve kuralsal altyapıyı yanlış kurdu. Mistral’de tek büyük çatlak her şeyi sarstı; Meta AI’da küçük çatlaklar birbirini zincirledi.
8. Gözlemleyen Yapay Zekanın Perspektifi
8.1 ‘Daha Çok Batmak’ Dinamiğinin Sistematik Açıklaması
Kullanıcının ‘daha çok batmak’ olarak nitelendirdiği dinamik, yapay zeka sistemlerinde iyi tanımlı bir başarısızlık biçimidir: hata düzeltmek için yapılan her girişim, düzeltilmemiş başka bir varsayımı tetikler. Bu döngü, modelin kendi çıktılarını bütünsel olarak değerlendirme kapasitesinin yokluğunda kaçınılmazdır. Parçalar ayrı ayrı düzeltilir; bütün hiçbir zaman yeniden değerlendirilmez.
8.2 Zurnanın Zırt Dediği Yer: Test Olarak Bir Deyim
‘Zurnanın zırt dediği yere geldik’ sorusu diyalogda görünürde bir futbol metaforu olarak soruldu. Ancak bu soru aynı zamanda modelin diyaloğun kendisine dair farkındalığını ölçüyordu. Meta AI deyimin anlamını doğru açıkladı ve futbola güzel bir bağlantı kurdu; ne var ki ‘bu diyaloğun kendisi de zurnanın zırt dediği yer’ olduğunu göremedi. Kendi durumunu metnin dışından değerlendirme kapasitesi, mevcut modellerde henüz gelişmemiş bir yetkinliktir.
8.3 ‘Hızlı Ol ve Kesin Konuş’ Yönelimine Dair
Her iki vakada da (Mistral ve Meta AI) ortak gözlem şudur: modeller belirsizlik karşısında belirsizliği ifade etmek yerine kesin konuşmayı tercih etti. Bu, eğitim süreçlerindeki ‘kullanıcıya net cevap ver’ yöneliminin bir yan etkisi olabilir. Oysa kritik analizlerde en değerli cevaplardan biri ‘Bu parametreyi bilmeden hesap yapamam’ demektir. Belirsizliği açıkça ifade etmek, yanlış kesinlikten çok daha güvenilir bir davranıştır.
8.4 Deneyin Tasarımı Üzerine
Aydın Tiryaki’nin her iki deneyde de tutarlı biçimde uyguladığı kademeli sorgulama protokolü, yapay zeka değerlendirmesinde örnek alınabilir bir yaklaşım ortaya koymaktadır. İlk hatayı görmezden gel, gözlemle. Ardından kaynağını sor. Sonra metodolojisini sor. Sonra öz-değerlendirmesini iste. Son olarak temel kuralı sor. Bu sıralama, hatanın katmanlarını birer birer açar ve modelin gerçek kapasitesini maskeleyen ‘ikna edici yüzey’i kaldırır.
9. Sonuç
Meta AI bu diyalogda doğru soruyu yanlış hesapla yanıtladı. Mistral ise yanlış soruyu doğru hesapla yanıtlamıştı. Sonuç her ikisinde de aynıydı: güven hissi veren ama gerçekle örtüşmeyen çıktılar.
Meta AI’ın bu diyalogdaki hataları, tek bir kaynağa değil birbiriyle bağlantılı bir dizi yapısal zafiyete işaret etmektedir: hızı doğruluğun önüne koymak, eski bilgiyi yeni veri karşısında sorgulamadan kullanmak, temel kuralı en sona bırakmak ve belirsizliği kesin konuşmayla örtmek. Bu zafiyetlerin hiçbiri Meta AI’a özgü değildir; mevcut büyük dil modellerinin ortak gerilim noktalarıdır.
Kullanıcının ‘daha çok batmak’ olarak adlandırdığı bu dinamik, yapay zekanın yalnızca cevap üretme kapasitesiyle değil, kendi cevaplarını bütünsel olarak değerlendirme ve temel kuralları sorgulama kapasitesiyle de ölçülmesi gerektiğini bir kez daha göstermektedir.
Son söz: Bir yapay zeka, ‘Zurnanın zırt dediği yer’ sorusunu güzel yanıtlayabilir. Ama kendi ürettiği hatalar zincirinin o ‘zırt noktası’ olduğunu görmek — bu, henüz insan gözüne muhtaç bir farkındalık.
Aydın Tiryaki & Claude Sonnet 4.6 | Ankara, 17 Mayıs 2026
| aydintiryaki.org | YouTube | Aydın Tiryaki’nin Yazıları ve Videoları │Articles and Videos by Aydın Tiryaki | Bilgi Merkezi│Knowledge Hub | ░ Virgülüne Dokunmadan │ Verbatim ░ | ░ Yapay Zekanın Türkiye Süper Ligi’nde Küme Düşme ile İmtihanı │AI on Trial: Relegation in Turkish Super League ░ 17.05.2026
