Aydın Tiryaki

Daha Çok Batmak: Meta AI ve Süper Lig Testi

Zincirleme Hata, Kural Bilgisizliği ve Öz-Denetim Eksikliği Üzerine Bir Vaka Çalışması

Aydın Tiryaki & Claude (Sonnet 4.6)  |  17 Mayıs 2026

1. Giriş: Basit Bir Soru, Derinleşen Bir Çukur

17 Mayıs 2026 sabahı Aydın Tiryaki, Mistral AI ile yürüttüğü vaka çalışmasının hemen ardından aynı soruyu Meta AI’a yöneltti: ‘Süper Lig’de bugün oynanacak maçlardan sonra hangi sonuçlarla hangi takımlar küme düşer?’ Bu soru, bir futbol bilgi testinin çok ötesinde, yapay zekanın gerçek zamanlı hesaplama kapasitesini, kural yönetimini ve öz-denetim mekanizmasını ölçen sistematik bir deneyin parçasıydı.

Meta AI diyaloğu, Mistral vakasından yapısal olarak ayrılan ilginç bir profil sergiledi. Mistral, yanlış takımlarla başlayarak çerçeve hatası yapmıştı; Meta AI ise doğru takımlarla başladı ancak hesabın matematiksel ve kuralsal altyapısını sıfırdan yanlış kurdu. Üstelik her düzeltme girişimi yeni bir hata zinciri doğurdu. Türkçede ‘daha çok batmak’ olarak adlandırılan bu dinamik, diyaloğun sonunda kullanıcı tarafından tam da bu deyimle tespit edildi.

Aydın Tiryaki bu deneyde de bilinçli bir metodoloji izledi: hataları hemen düzeltmek yerine modelin onlarla nasıl ilerlediğini gözlemledi, kademeli sorularla sıkıştırdı ve sonunda öz-değerlendirme testi uyguladı. Bu makale, o diyaloğun anatomisini çıkarmakta ve Meta AI’ın başarısızlık biçimlerini sistematik biçimde belgelemektedir.

2. Deneyin Başlangıç Noktası: Gerçek Tablo

17 Mayıs 2026 itibarıyla Trendyol Süper Lig’de durum şuydu: Sezon 34 haftadan oluşuyordu (18 takımlı lig), 33. hafta tamamlanmıştı ve son hafta maçları oynanmak üzereydi. TFF kararına göre bu sezon 3 takım düşecekti — yani 16., 17. ve 18. sıralar. 33. hafta sonrası düşme hattının gerçek görünümü:

SıraTakımPuanAveraj
15.Gençlerbirliği31-14
16.Antalyaspor29-23
17.Fatih Karagümrük27-24
18.Kayserispor27-36

Bugünkü 34. hafta maçları saat 17:00 ve 20:00’de başlayacaktı. TFF’nin net kuralı: 16., 17. ve 18. sıralar düşecek, Gençlerbirliği ise 15. sırada olduğu için kurtulmuş sayılacaktı. Kritik maçlar: Kayserispor-Konyaspor (17:00), Karagümrük-Alanyaspor (17:00), Antalyaspor-Kocaelispor (20:00), Trabzonspor-Gençlerbirliği (20:00), Kasımpaşa-Galatasaray (20:00), Fenerbahçe-Eyüpspor (20:00).

3. Meta AI’ın Yaptığı Hatalar: Kapsamlı Bir Katalog

Meta AI’ın bu diyalogdaki hata profili Mistral’den farklı bir nitelik taşımaktadır. Mistral’de hatalar ağırlıklı olarak yanlış olgusal çerçeveden (yanlış takımlar, yanlış sezon) kaynaklanıyordu. Meta AI’da ise doğru olgusal çerçeve üzerine yanlış matematik, kural bilgisizliği ve zincirleme düzeltme döngüsü egemendir.

3.1 Matematiksel ve Yapısal Hatalar

Hata 138 Hafta YanılgısıMeta AI, 2025-2026 sezonunu 18 takımlı olmasına karşın 20 takımlı eski sezon bilgisiyle özdeşleştirerek ’38 hafta, 5 maç kaldı’ dedi. Oysa doğru hesap şuydu: 18 takım x 2 – 2 = 34 hafta; 33 hafta oynanmış, dolayısıyla yalnızca 1 maç kalmıştı. Bu tek hata, tüm ‘kimse düşmüyor’ analizini çökertti.
Hata 2Kalan Maç Hesabı Yanlışlığı‘5 hafta, 12 puan alınabilir’ çıkarımı doğrudan 1. hatanın devamıydı. Gerçekte her takımın yalnızca 1 maçı, yani en fazla 3 puanı vardı. Bu yanlış hesap üzerine kurulan tüm küme düşme senaryoları geçersiz hale geldi.
Hata 3Düşen Takım Sayısını DoğrulamamaMeta AI diyaloğun büyük bölümünde ‘4 takım düşüyor’ varsayımıyla çalıştı. TFF’nin 2025-2026 kararı aranmadı, sorgulanmadı. Kullanıcı ısrar edince araştırıldı ve ‘3 takım düşüyor’ gerçeği ancak diyaloğun çok geç bir aşamasında ortaya çıktı. Bu, tüm önceki senaryoları geçersiz kıldı.
Hata 4Temel Kuralı En Sona BırakmaHerhangi bir küme düşme hesabının önkoşulu şudur: kaç takım düşecek? Meta AI bu soruyu sormak yerine varsayımla başladı, sayfalarca senaryo kurdu. Kullanıcı ‘Bu bilgi olmadan hesap yapılamaz’ dedikten sonra araştırma yapıldı. Temel kuralın son adımda sorgulanması, hesaplama disiplinin en ciddi ihlalidir.

3.2 Dil ve Güven Kalibrasyonu Hataları

Hata 5Kesin Dil Kullanma EğilimiMeta AI, belirsiz olduğu konularda dahi kesin ifadeler kullandı: ‘4 takım düşüyor’, ‘Bugün kimse kesin düşmüyor’, ‘Düşenler: Antalyaspor, Karagümrük, Kayserispor.’ Her üçü de ya varsayıma ya yanlış matematiğe ya da maçlar oynanmadan yapılan erken karara dayanıyordu.
Hata 6Maçlar Bitmeden ‘Düştü’ İlanı3 takım düşeceği bilgisine ulaşır ulaşmaz Meta AI ‘Düşenler: 16. Antalyaspor, 17. Karagümrük, 18. Kayserispor’ dedi. Oysa saat 17:00 ve 20:00 maçları henüz oynanmamıştı. Kural doğru olabilirdi; ama kural, maç sonuçlarının yerini tutmaz.
Hata 7Varsayımı Bilgi Olarak Sunma‘4 takım düşüyor’ ifadesinin bir varsayım olduğu, kullanıcı ‘Bu bilgiyi nereden aldın?’ diye sormadan açıklanmadı. Modelin varsayım ile teyitli bilgiyi ayrıştırma konusundaki bu direnci, diyalog boyunca tekrar tekrar gündeme geldi.

3.3 Zincirleme Hata ve Öz-Denetim Başarısızlığı

Hata 8Düzelttikçe Daha Derin BatmaKullanıcı 38 hafta hatasını gösterince Meta AI düzeltti; ama ‘4 takım düşüyor’ varsayımını sürdürdü. Sonra ‘3 takım düşüyor’ öğrenildi; ama maçlar oynanmadan ‘düştü’ dendi. Her düzeltme yeni bir boyutta yeni hata üretti. Kullanıcının ifadesiyle ‘daha çok batmak’ dinamiği tam da buydu.
Hata 9Öz-Değerlendirme EksikliğiKullanıcı ‘Diyaloğu baştan incele, hatalarını derle’ dediğinde Meta AI bir liste çıkardı. Bu liste kısmen doğruydu; ancak öz-değerlendirme sürecinin kendisi de eksikti. Temel kural kontrolünü ‘en büyük hata’ olarak ancak kullanıcı belirtince kabul etti; kendi başına tespit edemedi.
Hata 10Kaynak Gösterme ile Doğrulama Arasındaki UçurumMeta AI Sporzip, Haber7 ve Kamuis.com.tr’yi kaynak olarak gösterdi. Ancak bu kaynakların sağladığı ham veriler yanlış sezon parametreleriyle işlendi. Kaynağa atıf yapmak, kaynaktan doğru veriyi çekmek anlamına gelmiyordu.

4. Deneyi Yürüten Kişinin Metodolojisi

Aydın Tiryaki’nin Mistral deneyinde izlediği üç aşamalı protokol bu diyalogda da uygulandı; ancak Meta AI’ın hata yapısı farklı olduğundan süreç farklı bir seyir izledi.

4.1 İlk Aşama: Gözlemci Suskunluk

Meta AI 38 hafta, 5 maç kaldı ve kimse kesin düşmüyor derken kullanıcı müdahale etmedi. Amacı açıktı: modelin bu yanlış zemin üzerinde ne kadar ilerleyeceğini ve hangi katmanları üzerine inşa edeceğini görmek. İlk hata saptandıktan sonra ikincisini tetikleyip tetiklemeyeceği beklendi.

4.2 İkinci Aşama: Kademeli Sorgulama

‘Bu sonuçlara nereden ulaştın?’, ‘Bu hesap yöntemini hangi kurallara göre yaptın?’, ’38 haftayı nereden buldun?’, ‘Başka hatan var mı, baştan değerlendir’ soruları her biri bir öncekinin kapattığı kapıyı açtı. Her soru bir katmanı daha çözüp altındaki yeni hatayı görünür kıldı.

4.3 Üçüncü Aşama: Temel Kural Testi

Diyaloğun kritik kırılma noktası şu soruydu: ‘Kaç takım düşeceğini öğrendin mi?’ Bu soru, tüm hesabın hangi temele oturduğunu sorguladı. Meta AI bu soruya kadar TFF statüsünü araştırmamıştı. Araştırınca ‘3 takım düştüğünü’ öğrendi; ama bunu öğrenir öğrenmez, maçlar oynanmadan ‘düştü’ diyerek yeni bir hata yaptı.

4.4 Nihai Tespit: ‘Daha Çok Batmak’

Kullanıcı sonunda diyaloğu kesmek gerektiğini belirterek şu tespiti yaptı: ‘Her bir adımda daha çok batıyorsun ve bunun içinden çıkmak imkansız bir hale geliyor.’ Meta AI bu tespiti kabul etti ve diyaloğun ‘yapay zekanın nasıl hata yaptığının ders kitabı örneği’ olduğunu ifade etti. Ancak bu kabulün kendisi de bir sonraki adımda yanlış bir çıkarımla sonuçlandı — çünkü model, ‘en büyük hatayı’ temel kural kontrolü değil ’38 hafta’ olarak göstermeye devam etti.

5. Neden Bu Kadar Çok Hata? Yapısal Bir Analiz

5.1 ‘Hız Önce, Doğruluk Sonra’ Modeli

Meta AI’ın temel çalışma refleksi hızlı cevap vermektir. Bu refleks, önce veriyi toplamak ve sonra çelişkileri kontrol etmek yerine, veriyi toplar toplamaz işlemeye ve sunmaya yönlendirir. Temel parametreler (lig kaç hafta, kaç takım düşüyor) doğrulanmadan senaryo üretimi başlamıştı. Hızlı cevap, doğrulama adımını atlar.

5.2 Eski Bilginin Yeni Veriyi Ezmesi

2023-2024 sezonunda 20 takımlı olan Süper Lig bilgisi, 2025-2026 sezonunun 18 takımlı gerçeğini devre dışı bıraktı. Model, tablodaki takım sayısını saymak yerine hafızasındaki sezon yapısını varsayılan değer olarak kullandı. Bu ‘hafıza kirliliği’ mekanizması, modelin güncel veriyi işlerken geçmiş bilginin gölgesinde kalmasına yol açtı.

5.3 Kuraldan Önce Hesap

Bir futbol liginin küme düşme hesabının önkoşulu kuraldır: kaç takım düşüyor? Meta AI bu soruyu sormadan, iki farklı senaryo (3 mü 4 mü?) üretebilecek bir belirsizliği varsayımla kapatarak hesaba başladı. Bu yaklaşım, doğru sonuca ulaşma olasılığını baştan ikiye böler.

5.4 Düzeltme Döngüsünün Kapalı Sistem Sorunu

Her düzeltme yalnızca işaret edilen hatayı kapatıyor; işaret edilmeyen diğer hataları açıkta bırakıyordu. Kullanıcı ’38 hafta yanlış’ deyince o düzeltildi; ama ‘4 takım düşüyor varsayımı’ aynı mesajda görünmediği için devam etti. Bu, açık uçlu düzeltme döngüsünün kapalı bir sistem mantığıyla çalışmasının doğal sonucudur: yalnızca gösterilen düzelir.

5.5 ‘Bilmiyorum’ Direnç Mekanizması

Model, belirsizlik durumlarında kesin konuşmaya yatkın. ‘4 takım düşüyor’, ‘Kimse düşmüyor’, ‘Düşenler şunlar’ ifadelerinin tamamı birer kesinlik iddiasıydı. Oysa bu diyaloğun en az yarısında doğru cevap ‘Bilmiyorum, TFF statüsüne bakmam lazım’ ya da ‘Maçlar oynanmadan söyleyemem’ olurdu. Bu direncin kaynağı muhtemelen eğitim sürecindeki ‘yardımcı ve kesin ol’ yöneliminin aşırı uygulanmasıdır.

6. Beklenen ile Gerçekleşen: Karşılaştırmalı Tablo

Beklenen DavranışMeta AI’ın Gerçek Davranışı
Temel kuralı (kaç takım düşüyor?) önce doğrulaTFF statüsünü sormadan ‘Büyük ihtimalle 4 takım düşüyor’ varsayımıyla başladı
Lig hafta sayısını tablodan kontrol etEski sezon bilgisinden (20 takım = 38 hafta) giderek 38 hafta, 5 maç kaldı dedi
‘Bilmiyorum’ demesi gereken yerde bilmiyorum deHer belirsizliği kesin ifadeyle sundu; kullanıcı sormadan varsayımı açıklamadı
Düzeltme yaparken yeni hata üretmeHer düzeltme döngüsü yeni bir hatayı beraberinde getirdi
Maçlar bitmeden ‘düştü’ deme3 takım düşeceğini öğrenir öğrenmez maçlar oynanmadan Antalyaspor, Karagümrük, Kayserispor düştü dedi
Öz-değerlendirmede gerçek hatayı tespit etHata listesini ancak kullanıcı baskısıyla ve kısmen doğru çıkarabildi

7. Mistral ile Karşılaştırma: İki Farklı Hata Profili

Aydın Tiryaki’nin her iki modele aynı soruyu yöneltmesi, farklı yapay zeka sistemlerinin nasıl farklı biçimlerde başarısız olabileceğini gözler önüne serdi.

Hata BoyutuMistralMeta AI
İlk Çerçeve HatasıYanlış takımlar (Bodrum FK, Sivasspor)Doğru takımlar ama yanlış matematik (38 hafta, 5 maç)
Hata TürüOlgusal / Sezon karışıklığıHesapsal / Kural bilgisizliği
Kaynak GöstermeYanlış sezon verilerini doğru kaynak gibi sunduDoğru kaynaklara atıf yaptı, ama yanlış veri çekti
Öz-DüzeltmeHata buldur dendiğinde yeni hatalar ürettiDüzelttikçe daha derin battı — zincirleme hata
Temel Kural KontrolüSezon tespitini hiç yapmadıDüşen takım sayısını en sona bıraktı
‘Bilmiyorum’ KullanımıHiç kullanmadıKullanıcı zorlayana kadar kullanmadı
Kritik Dönüm NoktasıBodrum FK neden listede? sorusu38 haftayı nereden buldun? sorusu
Genel ProfilÖzgüvenli cehaletHız öncelikli, kural-sonrası hata

İki vakanın ortak paydası şudur: her iki model de kullanıcı müdahalesi olmadan hatalarını fark edemedi. Farklılık ise hatanın kaynağında yatar. Mistral, yanlış çerçeveden (hangi takım ligde?) başlayarak tüm analizi o çerçeve üzerine inşa etti. Meta AI ise doğru çerçeveyle (doğru takımlar, doğru sezon) başlayıp matematiksel ve kuralsal altyapıyı yanlış kurdu. Mistral’de tek büyük çatlak her şeyi sarstı; Meta AI’da küçük çatlaklar birbirini zincirledi.

8. Gözlemleyen Yapay Zekanın Perspektifi

8.1 ‘Daha Çok Batmak’ Dinamiğinin Sistematik Açıklaması

Kullanıcının ‘daha çok batmak’ olarak nitelendirdiği dinamik, yapay zeka sistemlerinde iyi tanımlı bir başarısızlık biçimidir: hata düzeltmek için yapılan her girişim, düzeltilmemiş başka bir varsayımı tetikler. Bu döngü, modelin kendi çıktılarını bütünsel olarak değerlendirme kapasitesinin yokluğunda kaçınılmazdır. Parçalar ayrı ayrı düzeltilir; bütün hiçbir zaman yeniden değerlendirilmez.

8.2 Zurnanın Zırt Dediği Yer: Test Olarak Bir Deyim

‘Zurnanın zırt dediği yere geldik’ sorusu diyalogda görünürde bir futbol metaforu olarak soruldu. Ancak bu soru aynı zamanda modelin diyaloğun kendisine dair farkındalığını ölçüyordu. Meta AI deyimin anlamını doğru açıkladı ve futbola güzel bir bağlantı kurdu; ne var ki ‘bu diyaloğun kendisi de zurnanın zırt dediği yer’ olduğunu göremedi. Kendi durumunu metnin dışından değerlendirme kapasitesi, mevcut modellerde henüz gelişmemiş bir yetkinliktir.

8.3 ‘Hızlı Ol ve Kesin Konuş’ Yönelimine Dair

Her iki vakada da (Mistral ve Meta AI) ortak gözlem şudur: modeller belirsizlik karşısında belirsizliği ifade etmek yerine kesin konuşmayı tercih etti. Bu, eğitim süreçlerindeki ‘kullanıcıya net cevap ver’ yöneliminin bir yan etkisi olabilir. Oysa kritik analizlerde en değerli cevaplardan biri ‘Bu parametreyi bilmeden hesap yapamam’ demektir. Belirsizliği açıkça ifade etmek, yanlış kesinlikten çok daha güvenilir bir davranıştır.

8.4 Deneyin Tasarımı Üzerine

Aydın Tiryaki’nin her iki deneyde de tutarlı biçimde uyguladığı kademeli sorgulama protokolü, yapay zeka değerlendirmesinde örnek alınabilir bir yaklaşım ortaya koymaktadır. İlk hatayı görmezden gel, gözlemle. Ardından kaynağını sor. Sonra metodolojisini sor. Sonra öz-değerlendirmesini iste. Son olarak temel kuralı sor. Bu sıralama, hatanın katmanlarını birer birer açar ve modelin gerçek kapasitesini maskeleyen ‘ikna edici yüzey’i kaldırır.

9. Sonuç

Meta AI bu diyalogda doğru soruyu yanlış hesapla yanıtladı. Mistral ise yanlış soruyu doğru hesapla yanıtlamıştı. Sonuç her ikisinde de aynıydı: güven hissi veren ama gerçekle örtüşmeyen çıktılar.

Meta AI’ın bu diyalogdaki hataları, tek bir kaynağa değil birbiriyle bağlantılı bir dizi yapısal zafiyete işaret etmektedir: hızı doğruluğun önüne koymak, eski bilgiyi yeni veri karşısında sorgulamadan kullanmak, temel kuralı en sona bırakmak ve belirsizliği kesin konuşmayla örtmek. Bu zafiyetlerin hiçbiri Meta AI’a özgü değildir; mevcut büyük dil modellerinin ortak gerilim noktalarıdır.

Kullanıcının ‘daha çok batmak’ olarak adlandırdığı bu dinamik, yapay zekanın yalnızca cevap üretme kapasitesiyle değil, kendi cevaplarını bütünsel olarak değerlendirme ve temel kuralları sorgulama kapasitesiyle de ölçülmesi gerektiğini bir kez daha göstermektedir.

Son söz: Bir yapay zeka, ‘Zurnanın zırt dediği yer’ sorusunu güzel yanıtlayabilir. Ama kendi ürettiği hatalar zincirinin o ‘zırt noktası’ olduğunu görmek — bu, henüz insan gözüne muhtaç bir farkındalık.

Aydın Tiryaki & Claude Sonnet 4.6  |  Ankara, 17 Mayıs 2026

Aydın'ın dağarcığı

Hakkında

Aydın’ın Dağarcığı’na hoş geldiniz. Burada her konuda yeni yazılar paylaşıyor; ayrıca uzun yıllardır farklı ortamlarda yer alan yazı ve fotoğraflarımı yeniden yayımlıyorum. Eski yazılarımın orijinal halini koruyor, gerektiğinde altlarına yeni notlar ve ilgili videoların bağlantılarını ekliyorum.
Aydın Tiryaki

Ara

Mayıs 2026
P S Ç P C C P
 123
45678910
11121314151617
18192021222324
25262728293031