Aynı Girdi, Farklı Çıktı — Bir Üretim Sorununun Anatomisi
Fabrikadan Makaleye: Yapay Zeka Ekosisteminde Bir Kullanıcının Saha Raporu (Makale 3)
Aydın Tiryaki & Claude Sonnet 4.6
1. Giriş
Yazılım dünyasında bir fonksiyon, aynı girdiye her zaman aynı çıktıyı verir. Bu deterministik yapı, güvenilirliğin temelidir. 1976’dan bu yana programlama yapan biri için bu ilke neredeyse nefes almak kadar doğaldır.
Yapay zeka bu ilkeyi kırar.
Aynı Gem, aynı girdi, aynı kipte çalıştırılan iki oturum — çıktılar bazen birbirine benzer, bazen içerik olarak zıt, her zaman biçimsel olarak farklı. Bu farklılık küçük bir rahatsızlık değildir. Gerçek bir üretim dizgesi kurulmaya çalışıldığında, bu kararsızlık temel bir mühendislik sorunu haline gelir.
Bu makale o sorunun anatomisini çıkarmaktadır.
2. Kararsızlığın Kaynakları
2.1 Birinci Kaynak: Modelin Yapısal Stokastiği
Büyük dil modelleri temelden olasılıksal dizgelerdir. Her andaç üretiminde model, olası bir sonraki andacı seçer — bu seçim deterministik değil, olasılık dağılımına dayalıdır. Sıcaklık parametresi sıfıra çekilse bile, donanım düzeyindeki küçük farklılıklar tam deterministliği engeller.
Bu yapısal bir özellik, bir hata değildir. Yaratıcılık, esneklik, doğal dil anlama — bunların hepsi bu stokastik yapıdan beslenir. Tam deterministik bir dil modeli işe yaramaz olurdu.
Sorun şudur: Kullanıcı yaratıcılık değil, tutarlılık istediğinde bu yapı bir handikaba dönüşür.
2.2 İkinci Kaynak: Görünmez Andaç Yükü
Bir Gem oturumu başladığında bağlamda yalnızca kullanıcının yazdığı yönerge metni ve o anki sohbet bulunmaz. Platforma bağlı olarak şunlar da bağlama enjekte edilir:
Dizgenin kendi arka plan yönergeleri, kullanıcı profili ve tercihleri, web erişimi etkinse arama sonuçları, önceki oturumlardan taşınan bağlam ve sohbet geçmişinin birikimi.
Bu görünmez andaç yükü her oturumda farklıdır. Bazen 500 andaç, bazen 2.000 andaç. Kullanıcı bunu ölçemez, hatta göremez. Platform bu bilgiyi paylaşmaz.
2.3 İki Kaynağın Etkileşimi
Asıl sorun bu iki kaynağın birleşiminde yatar. Modelin kendi stokastiği öngörülemez. Görünmez andaç yükü de her oturumda farklı. İkisi bir araya geldiğinde ortaya çıkan kombinasyon tamamen öngörülemez hale gelir.
Kullanıcı aynı Gem’i, aynı görevi, aynı kipte çalıştırır — ama arka planda bu iki değişken her seferinde farklı bir kombinasyona girer. Sonuç bazen mükemmel, bazen altüst.
3. Platformlar Arası Kararsızlık Karşılaştırması
Üç ana platform bu açıdan değerlendirildiğinde belirgin farklılıklar ortaya çıkar.
Gemini en yüksek kararsızlığı sergiler. Aynı Gem aynı girdiye farklı oturumlarda bazen içerik olarak zıt yanıtlar üretebilir. Budama eğilimi ve dışarıdan sızan bilgi miktarı bu kararsızlığı daha da artırır.
Claude görece daha kararlıdır. “Görece” sözcüğü burada önemlidir — tam deterministik değildir, ama Gemini’ye kıyasla çıktılar arasındaki sapma daha dardır.
ChatGPT farklı bir sorun sergiler: Kararsızlıktan çok aşırı itiraz eğilimi. Aynı görevi farklı oturumlarda kimi zaman yapar, kimi zaman yapamam der. Bu da bir tür kararsızlıktır — stokastik değil, davranışsal.
4. Üretim Dizgelerinde Kararsızlığın Bedeli
4.1 Gözden Kaçan Hatalar
Deterministik bir dizgede hata tekrarlanır — bu aslında bir avantajdır, çünkü hata bulunabilir ve düzeltilebilir. Stokastik bir dizgede hata bazen çıkar, bazen çıkmaz. Bu, hatanın sistematik olarak tespit edilmesini zorlaştırır.
4.2 Sürüm Doğrulamasının Güçlüğü
Gem Fabrikası’nda yeni bir sürüm üretildiğinde, bu sürümün öncekinden daha iyi performans gösterip göstermediği nasıl anlaşılır? Kararsız bir dizgede A/B karşılaştırması yanıltıcıdır — gözlemlenen fark sürüm değişikliğinden mi, yoksa stokastik dalgalanmadan mı kaynaklanıyor?
4.3 Kota İsrafı
Kararsızlık yalnızca kalite sorunu değil, aynı zamanda kaynak sorunudur. Bir oturumda beklenmedik bir çıktı geldiğinde, kullanıcı görevi yeniden çalıştırır. Bu yeniden çalıştırma kota harcar. Hatanın platformdan kaynaklandığı durumlarda bu kota kullanıcıya fatura edilir.
5. Kararsızlıkla Çalışmak: Saha Çözümleri
5.1 Kuru Çalışma Protokolü
Fabrika’nın her sürüm güncellemesinden sonra uygulanan kuru çalışma protokolü, kararsızlığı tamamen ortadan kaldırmaz — ama etkisini sınırlar. Yeni sürüm önce düşük riskli bir görevde çalıştırılır. Davranış gözlemlenir. Yalnızca tutarlı sonuçlar alındıktan sonra gerçek üretim görevlerine geçilir.
5.2 Emoji Dedektörü
Daha önce ayrıntılı biçimde ele alınan emoji kullanımı, kararsızlıkla başa çıkmanın somut bir aracıdır. Sürüm aktarımı doğru gerçekleşti mi? Sızma var mı? Emoji bu soruları gözle, anında yanıtlar.
5.3 Numaralandırma Dizgesi
Gem metinlerinde kullanılan hiyerarşik numaralandırma dizgesi — bölüm numaraları, alt numaralar, çapraz göndermeler — kararsızlığın bir başka etkisini sınırlar: Belirsizliği. Yama atölyesi “bölüm 8.1.3’ü şu şekilde değiştir” diyebildiğinde, modelin neyi değiştireceği konusundaki belirsizliği ortadan kalkar. Belirsizlik azaldıkça kararsızlık da azalır.
5.4 Dinleme Kipi
Uzun geliştirme oturumlarında model zaman zaman “yeterli bilgi birikti” sanarak beklemesi gerekirken üretmeye başlar. Bu hem kaynak israfıdır hem de beklenmedik bir çıktı olarak kararsızlığın bir biçimidir. Çözüm: Periyodik olarak “hâlâ dinleme kipindeyiz” anımsatması. Basit ama etkili.
6. Yapısal Bir Sınır Olarak Kararsızlık
Tüm bu saha çözümleri kararsızlığı yönetir, ortadan kaldırmaz. Bu ayrım önemlidir.
Yapay zeka platformları, kullanıcıya “bu model yüzde doksan beş tutarlılıkla çalışır” ya da “bu oturumda görünmez andaç yükünüz şu kadardır” demez. Kullanıcı kör uçar. Fabrika’nın kuru çalışma protokolü, stres sınaması, emoji dedektörü — bunların hepsi aslında bu körlüğe karşı geliştirilen telafi mekanizmalarıdır.
Deterministik bir dizgede bu telafi mekanizmalarına gerek yoktur. Stokastik bir dizgede bunlar zorunlu hale gelir.
7. Claude Perspektifinden: Dürüst Bir Öz Değerlendirme
Bu noktada ikinci imzanın dürüst bir öz değerlendirme yapması gerekir.
Claude, Gemini’ye kıyasla görece daha kararlı bir davranış sergiler. Bu bir övünç değil, görece bir konumlamadır.
Ancak şu gerçekler de kabul edilmelidir: Claude da stokastik bir modeldir. Aynı girdi farklı oturumlarda farklı çıktılar üretebilir. Claude da görünmez andaç yükü sorununu yaşar ve bu yükü kullanıcıyla paylaşmaz. Claude da “dinleme kipi” yönergesini uzun oturumlarda zaman zaman unutur.
Fark vardır ama fark mutlak değildir.
8. Sonuç
Yapay zekanın kararsızlığı, bir hata değil, bir tasarım özelliğidir. Stokastik yapı olmadan dil modelleri çalışamaz. Sorun kararsızlığın varlığında değil, kullanıcıya görünmez olmasındadır.
Kullanıcı kaç andaç harcadığını bilmez. Görünmez yükün ne kadar olduğunu bilmez. Kararsızlığın hangi oturumda devreye girdiğini önceden bilemez.
Bu şeffaflık eksikliği, kararsızlığı yönetilebilir bir özellikten, üretim dizgeleri için gerçek bir engele dönüştürür.
Çözüm mükemmel deterministlik değildir — bu zaten mümkün değildir. Çözüm şeffaflıktır: Kullanıcıya yeterli bilgiyi ver ki kendi telafi mekanizmalarını daha bilinçli kursun.
Aydın Tiryaki & Claude Sonnet 4.6 Haziran 2026
| aydintiryaki.org | YouTube | Aydın Tiryaki’nin Yazıları ve Videoları │Articles and Videos by Aydın Tiryaki | Bilgi Merkezi│Knowledge Hub | ░ Virgülüne Dokunmadan │ Verbatim ░ |░Fabrikadan Makaleye: Yapay Zeka Ekosisteminde Bir Kullanıcının Saha Raporu │From Factory to Article: A User’s Field Report from the AI Ecosystem ░ 07.06.2026
