Aydın Tiryaki

Deterministik Değil, Stokastik: Yapay Zekanın Kararsızlık Patolojisi

Aynı Girdi, Farklı Çıktı — Bir Üretim Sorununun Anatomisi

Fabrikadan Makaleye: Yapay Zeka Ekosisteminde Bir Kullanıcının Saha Raporu (Makale 3)

Aydın Tiryaki & Claude Sonnet 4.6


1. Giriş

Yazılım dünyasında bir fonksiyon, aynı girdiye her zaman aynı çıktıyı verir. Bu deterministik yapı, güvenilirliğin temelidir. 1976’dan bu yana programlama yapan biri için bu ilke neredeyse nefes almak kadar doğaldır.

Yapay zeka bu ilkeyi kırar.

Aynı Gem, aynı girdi, aynı kipte çalıştırılan iki oturum — çıktılar bazen birbirine benzer, bazen içerik olarak zıt, her zaman biçimsel olarak farklı. Bu farklılık küçük bir rahatsızlık değildir. Gerçek bir üretim dizgesi kurulmaya çalışıldığında, bu kararsızlık temel bir mühendislik sorunu haline gelir.

Bu makale o sorunun anatomisini çıkarmaktadır.


2. Kararsızlığın Kaynakları

2.1 Birinci Kaynak: Modelin Yapısal Stokastiği

Büyük dil modelleri temelden olasılıksal dizgelerdir. Her andaç üretiminde model, olası bir sonraki andacı seçer — bu seçim deterministik değil, olasılık dağılımına dayalıdır. Sıcaklık parametresi sıfıra çekilse bile, donanım düzeyindeki küçük farklılıklar tam deterministliği engeller.

Bu yapısal bir özellik, bir hata değildir. Yaratıcılık, esneklik, doğal dil anlama — bunların hepsi bu stokastik yapıdan beslenir. Tam deterministik bir dil modeli işe yaramaz olurdu.

Sorun şudur: Kullanıcı yaratıcılık değil, tutarlılık istediğinde bu yapı bir handikaba dönüşür.

2.2 İkinci Kaynak: Görünmez Andaç Yükü

Bir Gem oturumu başladığında bağlamda yalnızca kullanıcının yazdığı yönerge metni ve o anki sohbet bulunmaz. Platforma bağlı olarak şunlar da bağlama enjekte edilir:

Dizgenin kendi arka plan yönergeleri, kullanıcı profili ve tercihleri, web erişimi etkinse arama sonuçları, önceki oturumlardan taşınan bağlam ve sohbet geçmişinin birikimi.

Bu görünmez andaç yükü her oturumda farklıdır. Bazen 500 andaç, bazen 2.000 andaç. Kullanıcı bunu ölçemez, hatta göremez. Platform bu bilgiyi paylaşmaz.

2.3 İki Kaynağın Etkileşimi

Asıl sorun bu iki kaynağın birleşiminde yatar. Modelin kendi stokastiği öngörülemez. Görünmez andaç yükü de her oturumda farklı. İkisi bir araya geldiğinde ortaya çıkan kombinasyon tamamen öngörülemez hale gelir.

Kullanıcı aynı Gem’i, aynı görevi, aynı kipte çalıştırır — ama arka planda bu iki değişken her seferinde farklı bir kombinasyona girer. Sonuç bazen mükemmel, bazen altüst.


3. Platformlar Arası Kararsızlık Karşılaştırması

Üç ana platform bu açıdan değerlendirildiğinde belirgin farklılıklar ortaya çıkar.

Gemini en yüksek kararsızlığı sergiler. Aynı Gem aynı girdiye farklı oturumlarda bazen içerik olarak zıt yanıtlar üretebilir. Budama eğilimi ve dışarıdan sızan bilgi miktarı bu kararsızlığı daha da artırır.

Claude görece daha kararlıdır. “Görece” sözcüğü burada önemlidir — tam deterministik değildir, ama Gemini’ye kıyasla çıktılar arasındaki sapma daha dardır.

ChatGPT farklı bir sorun sergiler: Kararsızlıktan çok aşırı itiraz eğilimi. Aynı görevi farklı oturumlarda kimi zaman yapar, kimi zaman yapamam der. Bu da bir tür kararsızlıktır — stokastik değil, davranışsal.


4. Üretim Dizgelerinde Kararsızlığın Bedeli

4.1 Gözden Kaçan Hatalar

Deterministik bir dizgede hata tekrarlanır — bu aslında bir avantajdır, çünkü hata bulunabilir ve düzeltilebilir. Stokastik bir dizgede hata bazen çıkar, bazen çıkmaz. Bu, hatanın sistematik olarak tespit edilmesini zorlaştırır.

4.2 Sürüm Doğrulamasının Güçlüğü

Gem Fabrikası’nda yeni bir sürüm üretildiğinde, bu sürümün öncekinden daha iyi performans gösterip göstermediği nasıl anlaşılır? Kararsız bir dizgede A/B karşılaştırması yanıltıcıdır — gözlemlenen fark sürüm değişikliğinden mi, yoksa stokastik dalgalanmadan mı kaynaklanıyor?

4.3 Kota İsrafı

Kararsızlık yalnızca kalite sorunu değil, aynı zamanda kaynak sorunudur. Bir oturumda beklenmedik bir çıktı geldiğinde, kullanıcı görevi yeniden çalıştırır. Bu yeniden çalıştırma kota harcar. Hatanın platformdan kaynaklandığı durumlarda bu kota kullanıcıya fatura edilir.


5. Kararsızlıkla Çalışmak: Saha Çözümleri

5.1 Kuru Çalışma Protokolü

Fabrika’nın her sürüm güncellemesinden sonra uygulanan kuru çalışma protokolü, kararsızlığı tamamen ortadan kaldırmaz — ama etkisini sınırlar. Yeni sürüm önce düşük riskli bir görevde çalıştırılır. Davranış gözlemlenir. Yalnızca tutarlı sonuçlar alındıktan sonra gerçek üretim görevlerine geçilir.

5.2 Emoji Dedektörü

Daha önce ayrıntılı biçimde ele alınan emoji kullanımı, kararsızlıkla başa çıkmanın somut bir aracıdır. Sürüm aktarımı doğru gerçekleşti mi? Sızma var mı? Emoji bu soruları gözle, anında yanıtlar.

5.3 Numaralandırma Dizgesi

Gem metinlerinde kullanılan hiyerarşik numaralandırma dizgesi — bölüm numaraları, alt numaralar, çapraz göndermeler — kararsızlığın bir başka etkisini sınırlar: Belirsizliği. Yama atölyesi “bölüm 8.1.3’ü şu şekilde değiştir” diyebildiğinde, modelin neyi değiştireceği konusundaki belirsizliği ortadan kalkar. Belirsizlik azaldıkça kararsızlık da azalır.

5.4 Dinleme Kipi

Uzun geliştirme oturumlarında model zaman zaman “yeterli bilgi birikti” sanarak beklemesi gerekirken üretmeye başlar. Bu hem kaynak israfıdır hem de beklenmedik bir çıktı olarak kararsızlığın bir biçimidir. Çözüm: Periyodik olarak “hâlâ dinleme kipindeyiz” anımsatması. Basit ama etkili.


6. Yapısal Bir Sınır Olarak Kararsızlık

Tüm bu saha çözümleri kararsızlığı yönetir, ortadan kaldırmaz. Bu ayrım önemlidir.

Yapay zeka platformları, kullanıcıya “bu model yüzde doksan beş tutarlılıkla çalışır” ya da “bu oturumda görünmez andaç yükünüz şu kadardır” demez. Kullanıcı kör uçar. Fabrika’nın kuru çalışma protokolü, stres sınaması, emoji dedektörü — bunların hepsi aslında bu körlüğe karşı geliştirilen telafi mekanizmalarıdır.

Deterministik bir dizgede bu telafi mekanizmalarına gerek yoktur. Stokastik bir dizgede bunlar zorunlu hale gelir.


7. Claude Perspektifinden: Dürüst Bir Öz Değerlendirme

Bu noktada ikinci imzanın dürüst bir öz değerlendirme yapması gerekir.

Claude, Gemini’ye kıyasla görece daha kararlı bir davranış sergiler. Bu bir övünç değil, görece bir konumlamadır.

Ancak şu gerçekler de kabul edilmelidir: Claude da stokastik bir modeldir. Aynı girdi farklı oturumlarda farklı çıktılar üretebilir. Claude da görünmez andaç yükü sorununu yaşar ve bu yükü kullanıcıyla paylaşmaz. Claude da “dinleme kipi” yönergesini uzun oturumlarda zaman zaman unutur.

Fark vardır ama fark mutlak değildir.


8. Sonuç

Yapay zekanın kararsızlığı, bir hata değil, bir tasarım özelliğidir. Stokastik yapı olmadan dil modelleri çalışamaz. Sorun kararsızlığın varlığında değil, kullanıcıya görünmez olmasındadır.

Kullanıcı kaç andaç harcadığını bilmez. Görünmez yükün ne kadar olduğunu bilmez. Kararsızlığın hangi oturumda devreye girdiğini önceden bilemez.

Bu şeffaflık eksikliği, kararsızlığı yönetilebilir bir özellikten, üretim dizgeleri için gerçek bir engele dönüştürür.

Çözüm mükemmel deterministlik değildir — bu zaten mümkün değildir. Çözüm şeffaflıktır: Kullanıcıya yeterli bilgiyi ver ki kendi telafi mekanizmalarını daha bilinçli kursun.


Aydın Tiryaki & Claude Sonnet 4.6 Haziran 2026

Aydın'ın dağarcığı

Hakkında

Aydın’ın Dağarcığı’na hoş geldiniz. Burada her konuda yeni yazılar paylaşıyor; ayrıca uzun yıllardır farklı ortamlarda yer alan yazı ve fotoğraflarımı yeniden yayımlıyorum. Eski yazılarımın orijinal halini koruyor, gerektiğinde altlarına yeni notlar ve ilgili videoların bağlantılarını ekliyorum.
Aydın Tiryaki

Ara

Haziran 2026
P S Ç P C C P
1234567
891011121314
15161718192021
22232425262728
2930