Aydın Tiryaki

Prompt Mühendisliği ve Görsel Yapay Zeka: Altı Model, İki Prompt, Bir Bulgu

Yazarlar: Aydın Tiryaki & Claude Sonnet
Tarih: 25 Haziran 2026


Giriş

Bu çalışma, planlı bir araştırma projesi olarak başlamadı. Bir makale üzerinde çalışırken yapay zekanın kültürel doğruluğa nasıl tepki verdiği sorusu gündeme geldi ve bu soruyu test etmek için bir prompt yazıldı. Ancak süreç ilerledikçe, başlangıçta öngörülmeyen bulgular ortaya çıktı: farklı modellerin aynı prompta verdiği yanıtlar arasındaki uçurum, katı bir promptun bu uçurumu nasıl kapatabileceği ve en ilginç bulgu olarak, tamamen farklı altyapılara sahip iki modelin neredeyse aynı görseli üretmesi. Elimizdeki veriler zenginleştikçe çalışma kendi kendine şekillendi ve sonunda bağımsız bir araştırma değeri taşıyan bir makaleye dönüştü.

Çalışmanın odak noktası İnebolu pidesidir. Karadeniz’in küçük bir sahil kasabasına özgü bu yöresel lezzet, standart Türk pidesinden köklü biçimde ayrılır: tamamen kapalı, uzun ve torpido biçiminde, kese şeklinde bir hamur içinde sıkıştırılmış kıyma dolgusuyla pişirilir. Bu özgün form, yapay zeka modellerinin yerel kültürel verileri ne ölçüde doğru işleyebildiğini test etmek için ideal bir kriter sunmaktadır. Zira modellerin büyük çoğunluğu “Türk pidesi” denildiğinde açık yüzlü, tekne biçimli standart pideyi üretmektedir. İnebolu pidesini doğru üretmek, modelin genel bilgisinin ötesine geçip yerel ve özgün kültürel veriyi özümseyip özümsemediğinin somut bir göstergesidir.

Çalışma iki aşamada yürütüldü. Birinci aşamada görece esnek bir prompt altı modele verildi ve sonuçlar karşılaştırıldı. İkinci aşamada aynı sahne için çok daha katı ve kapsamlı bir prompt hazırlandı; bu promptun modeller üzerindeki etkisi gözlemlendi. Sürecin son bölümünde ise iki farklı modelin ürettiği görseller arasındaki çarpıcı benzerlik, üç ayrı modele soruldu ve alınan yanıtlar analiz edildi.


Bölüm 1: Esnek Prompt ve Altı Model Karşılaştırması

1.1 Promptun Hazırlanışı ve Felsefesi

Bu çalışmadaki prompt Claude Sonnet tarafından yazıldı. Görsel üretim kapasitesi bulunmayan Claude’un bu süreçteki rolü, görsel üretim motorlarına verilecek talimatı dil ve içerik açısından en doğru biçimde kurgulamaktı. İlk prompt, modellere belirli bir çerçeve çizmekle birlikte yaratıcı yoruma alan bırakan, görece esnek bir yapıda tasarlandı:


Create a vertical 9:16 portrait format poster image.

Scene: A rustic wooden table in a traditional Turkish tea house setting in İnebolu, a small coastal town on the Black Sea. On the table, there are 3-4 İnebolu pides — these are NOT open-faced pides. İnebolu pide is distinctly elongated, fully enclosed/sealed on top, shaped like a pouch or a stuffed pastry, golden-brown baked crust, visibly filled with minced meat (kıyma). The pides are arranged naturally on a wooden serving board or tray.

Atmosphere: Warm, authentic, small-town Black Sea ambiance. Natural daylight coming from a window. Stone or whitewashed walls in the background.

People: A small group of 4-5 people of mixed ages — elderly men, middle-aged women, young adults — dressed in modest, everyday Turkish clothing typical of a small Anatolian coastal town. They are gathered around the table in natural conversation, not posed. No stereotypes, no urban fashion, no Western styling.

Color palette: Warm earth tones — golden browns, cream whites, terracotta. The pides should be the visual focal point.

Style: Photorealistic, warm-toned food photography meets candid social scene. High detail on the pide texture and crust.

Important: The pides must be fully closed/sealed on top — not open-faced, not pizza-style. This is the defining characteristic of İnebolu pide.


Bu promptun temel özelliği, sahneyi tarif etmekle birlikte modellere yorumlama özgürlüğü tanımasıydı. Kişi sayısı “4-5” olarak verildi, kıyafetler genel hatlarıyla tanımlandı, kompozisyon serbest bırakıldı. Çalışmanın ilerleyen aşamasında bu esnekliğin her modelde farklı ve çoğu zaman hatalı yorumlara yol açtığı görüldü.

1.2 Modellerin Yanıtları ve Analiz

[GÖRSEL 1 — Copilot]

1.2.1 Copilot

Copilot, esnek prompt karşısında en başarısız sonucu üreten model oldu. Pide formu tamamen yanlış kurgulandı: görselde yuvarlak, kabarık ve açık yüzlü pideler yer aldı. Bu form, standart Türkiye pidesini bile doğru yansıtmayan, İngiliz pasty’sine benzer bir şekle büründü. Promptta açıkça belirtilen “kapalı ve uzun form” talimatı Copilot tarafından tamamen görmezden gelindi. Atmosfer açısından mekan sıcak ve otantik bir görünüm taşısa da içerik açısından prompt kriterlerinin hiçbirini karşılayamadı.

[GÖRSEL 2 — ChatGPT]

1.2.2 ChatGPT

ChatGPT esnek promptun en başarılı yorumunu üretti. Pide formu uzun ve kapalı olarak kurgulandı; bu, diğer modellerin büyük bölümünün başaramadığı temel kriterin karşılanması açısından önemli bir adımdı. Görselin en dikkat çekici detayı, arka planda yer alan “İnebolu Pide Salonu 1965” yazılı tahta tabela oldu. Promptta böyle bir unsur yer almamasına karşın model, bağlamı kavrayarak İnebolu’ya özgü bir atmosfer oluşturdu. Pencereden görünen deniz manzarası, karma yaş grubundan oluşan kalabalık ve Karadeniz atmosferi tutarlı bir bütünlük içinde sunuldu.

[GÖRSEL 3 — Gemini]

1.2.3 Gemini

Gemini, ChatGPT’nin hemen ardından gelen ikinci en başarılı sonucu üretti. Pide formu doğru yönde kurgulandı; uzun ve kapalı yapı belirginleşmeye başladı. Atmosfer açısından pencereden görünen sahil kasabası manzarası ve insanların doğal duruşu görsele otantik bir hava kattı. Bununla birlikte pidelerin formu idealden biraz kalın ve kısa kaldı; gerçek İnebolu pidesinin karakteristik ince-uzun torpido yapısı tam olarak yakalanamadı.

[GÖRSEL 4 — Grok]

1.2.4 Grok

Grok, esnek prompt karşısında Copilot’la birlikte en başarısız modeller arasında yer aldı. Üretilen görselde pideler tamamen açık ve yuvarlak biçimde kurgulandı; bu form, lahmacun ile standart Karadeniz pidesinin karışımına benziyordu. Prompttaki temel kriter olan “kapalı form” talimatı Grok tarafından tamamen görmezden gelindi. Mekan atmosferi kabul edilebilir düzeyde olsa da içerik açısından prompt başarısız karşılandı.

[GÖRSEL 5 — Meta AI]

1.2.5 Meta AI

Meta AI, pide formu açısından esnek promptun en gerçekçi sonucunu üretti. Uzun, kapalı ve kese biçimindeki yapı diğer modellere kıyasla daha belirgin biçimde ortaya çıktı; kızarmış kabuğun dokusu fotoğrafik gerçekçilik açısından da öne çıktı. Bununla birlikte görselin arka planında yer alan insanlar son derece bulanık kaldı ve sahne bütünlüğü bu nedenle zayıfladı.

[GÖRSEL 6 — Mistral]

1.2.6 Mistral

Mistral, pide formu açısından esnek promptun dikkat çekici sonuçlarından birini verdi. Kapalı, uzun ve içi kıymalı yapı diğer modellerin büyük bölümüne kıyasla daha doğru biçimde kurgulandı. Ancak görselin demografik yapısı İnebolu’yu değil, Orta Doğu’yu çağrıştırdı. Masadaki insanların giyim tarzı ve genel atmosfer Karadeniz sahil kasabasıyla örtüşmüyordu; çaydanlık bile Türk çayı geleneğinin dışında, Arap tarzı bir ibrik görünümündeydi. Mistral pidede kazandı, insanlarda kaybetti.

1.3 Genel Değerlendirme

Esnek prompt altında altı modelin performansı iki ayrı kriter üzerinden değerlendirildi: pide formu doğruluğu ve genel bütünlük.

Pide formu doğruluğu açısından sıralama şöyle oluştu: Meta AI, Mistral, ChatGPT, Gemini, Copilot, Grok. Genel bütünlük açısından ise ChatGPT, Gemini, Meta AI, Mistral, Copilot, Grok olarak sıralandı.

Bu karşılaştırmanın ortaya koyduğu temel bulgu şudur: Esnek bir prompt, modellere yeterince geniş yorumlama alanı bıraktığında her model bu alanı farklı biçimde doldurmaktadır. Kültürel özgünlük gerektiren sahnelerde bu farklılık çoğunlukla hataya dönüşmektedir. Modellerin eğitim verilerindeki yerel kültürel veri eksikliği, yoruma bırakılan her boşlukta kendini klişe ve stereotipik çıktılar olarak göstermektedir.


Bölüm 2: Katı Prompt ve Karşılaştırma

2.1 Neden Katı Bir Prompta İhtiyaç Duyuldu

Esnek promptun sonuçları değerlendirildiğinde, modellerin yorumlama özgürlüğünü çoğunlukla yanlış kullandığı görüldü. Bu noktada çalışma sürecinde kritik bir metodolojik soru gündeme geldi: Bir prompt ne kadar kısıtlayıcı olmalıdır?

Claude’un bu soruya verdiği ilk yanıt, modellere “yaratıcılık alanı” tanımak gerektiği yönündeydi. Ancak sonuçlar bu yaklaşımın yetersizliğini açıkça ortaya koydu. Bunun üzerine Aydın Tiryaki, prompt mühendisliğine ilişkin temel bir ilkeyi dile getirdi: İyi bir görsel prompt, bir yönetmenin set talimatı gibi olmalı; hiçbir şeyi yoruma bırakmamalıdır. Kullanıcı Claude’dan prompt yazmasını istediğinde, katma değer tam da bu boşlukları önceden kapatmaktan gelmelidir.

Bu çerçevede aynı sahne için çok daha kapsamlı ve katı bir prompt hazırlandı.

2.2 Katı Promptun Tam Metni


FINAL PROMPT — STRICT VERSION

FORMAT — MANDATORY:
Vertical portrait orientation, 9:16 aspect ratio, 1080×1920 pixels. Full frame must be vertical. Any horizontal or square output is unacceptable.

THE PIDES — ZERO TOLERANCE:
Exactly 4 İnebolu pides arranged on a single rectangular wooden serving board (40×25 cm approximately). Each pide must be exactly 32-35 cm long, 10-12 cm wide, 6-7 cm tall. Shape is strictly elongated oval/torpedo, like a sealed pouch or stuffed pastry. The top crust is completely sealed and closed — no opening, no slits, no visible filling on top surface. Crust is golden-brown, slightly uneven, handmade appearance. One pide in the foreground is cut in half crosswise, revealing dense, dark-brown spiced minced meat filling inside. The other 3 pides are completely intact and sealed. Absolutely no round pides. Absolutely no open-faced pides. Absolutely no pizza-shaped pides. Absolutely no lahmacun-style pides.

THE PEOPLE — EXACT SPECIFICATIONS:
Exactly 5 people. Seated around the table. All must have Anatolian Black Sea Turkish physical appearance — olive skin, dark or grey hair.

Person 1: Male, approximately 72 years old. Wearing a grey wool flat cap (kasket), dark navy wool jacket, white shirt underneath. Holding a tulip tea glass in right hand.

Person 2: Female, approximately 55 years old. Wearing a dark floral patterned yazma headscarf tied under chin, burgundy cardigan over dark shirt. Both hands on table.

Person 3: Male, approximately 27 years old. Dark hair, clean shaven. Wearing a plain grey sweater. Leaning slightly forward toward table.

Person 4: Female, approximately 24 years old. No headscarf, dark hair pulled back. Wearing a navy blue sweater. Smiling naturally.

Person 5: Female, approximately 68 years old. Grey hair, wearing a dark brown coat. Seated slightly behind the others.

No Western fashion. No modern urban clothing. No Arabic-style clothing or white robes. No headscarves with loose flowing fabric.

THE TABLE:
Rough-hewn rectangular wooden table, dark brown, visibly aged with grain texture. On the table: the wooden serving board with pides, exactly 5 tulip-shaped Turkish tea glasses (ince belli bardak) filled with dark red tea, exactly 5 white saucers each with 2 small white sugar cubes, one small white ceramic salt shaker. No tablecloth. No placemats. No cutlery visible. No Arabic teapot. No white porcelain teapot. No water glasses.

THE INTERIOR:
Stone wall background, rough-cut limestone blocks, slightly whitewashed. Wooden beam ceiling visible at top of frame. One single wooden-framed window on the left side showing a Black Sea coastal town view — red-roofed houses on a hillside, grey-blue sea in background. One small framed black-and-white old photograph on the wall, no text visible. Worn wooden floor partially visible.

LIGHTING:
Natural daylight entering only from the single left window. Warm, slightly golden tone. Soft shadows on the right side. No artificial lighting, no harsh flash, no neon.

CAMERA:
Slight low angle, shooting slightly upward toward the people, pides dominant in foreground sharp focus, people in middle-ground with slight bokeh. Depth of field: pides razor sharp, people softly focused but clearly recognizable.

STYLE:
Photorealistic. Documentary food photography meets candid social portrait. Film grain texture, slightly desaturated, authentic feel. No filters. No HDR effect. No oversaturation.

ABSOLUTELY FORBIDDEN — ANY OF THESE MEANS FAILURE:
Open-faced pides. Round pides. Any non-vertical/non-9:16 output. Arabic clothing. Western urban fashion. White flowing robes. Modern furniture. Plastic chairs. Tablecloth. Signage or text anywhere in image. Bright neon lighting. More or fewer than 4 pides. More or fewer than 5 people. Teapot of any kind on table.


2.3 Modellerin Katı Prompta Yanıtları

[GÖRSEL — Gemini Pro — Katı Prompt]

2.3.1 Gemini Pro

Gemini Pro, katı promptla birlikte dramatik bir sıçrama gerçekleştirdi. Beş kişinin her biri prompttaki tanımlamaya birebir uydu: kasketli yaşlı adam, çiçekli yazmalı orta yaşlı kadın, gri kazaklı genç adam, lacivert kazaklı genç kadın ve koyu montlu yaşlı kadın. Taş duvar, ahşap tavan, tek pencere, kırmızı çatılı evlerle deniz manzarası, duvardaki siyah beyaz fotoğraf, tulip çay bardakları ve tuz şişesi gibi detaylar görsel içinde eksiksiz yer aldı. Pide formu esnek prompta kıyasla belirgin biçimde iyileşti; ancak ideal İnebolu pidesinin ince-uzun torpido yapısı tam olarak yakalanamadı.

[GÖRSEL — ChatGPT — Katı Prompt]

2.3.2 ChatGPT

ChatGPT katı promptla birlikte çalışmanın en bütünlüklü görselini üretti. Kişi sayısı ve kıyafet detayları eksiksiz karşılandı. Dört pidenin biri kesilmiş ve kıyma dolgusu net biçimde görünür hale geldi. Pencereden deniz ve kırmızı çatılı evlerin görünümü, duvardaki eski fotoğraf, tuz şişesi ve şeker küpleri gibi ayrıntılar başarıyla uygulandı. Atmosfer sıcak ve doğal bir his uyandırırken insanların birbirine bakıyor olması, kameraya poz veren yapay bir görüntünün önüne geçti. Pide formu yine idealden biraz kısa ve kabarık kaldı; ancak bu, katı prompt sonuçları içindeki en başarılı genel bütünlüğü oluşturdu.

[GÖRSEL — Grok — Katı Prompt]

2.3.3 Grok

Grok, katı promptla birlikte esnek prompta kıyasla önemli bir ilerleme kaydetti. Pide formu bu kez uzun ve kapalı olarak kurgulanmaya başlandı; bu, ilk prompttaki tamamen yuvarlak ve açık formdan ciddi bir ayrışmayı temsil ediyordu. Ancak pidelerden birinin ucu açık kaldı ve bu İnebolu pidesinin temel karakteristiğiyle çelişti. Beş kişi yerine dört kişi yer aldı; beşinci kişi görsel dışında bırakıldı. Katı promptun getirdiği kısıtlamalar Grok’u doğru yönde zorladı fakat model tam anlamıyla talimatları yerine getiremedı.

[GÖRSEL — Meta AI — Katı Prompt]

2.3.4 Meta AI

Meta AI katı prompt karşısında beklenmedik biçimde geriledi. Esnek promptta pide formunu en gerçekçi üreten model olmakla birlikte katı promptta kritik hataların tamamı bir arada ortaya çıktı. Promptta açıkça belirtilmesine karşın görselde hiç insan yer almadı. Pide sayısı dörde ulaşamadı. Masada gaz lambası, Arap tarzı ibrik ve mavi desenli porselen tabaklar gibi yasaklı unsurlar görsel içine girdi. Genel atmosfer İnebolu pide salonunu değil, Osmanlı dönemi veya Orta Doğu sahnesini çağrıştırdı. Tek olumlu nokta olarak pide formunun uzun ve kapalı kalmaya devam ettiği ve kesilmiş pidede kıyma dolgusunun görünür olduğu söylenebilir.

2.3.5 Mistral

Mistral katı promptu hiç değerlendiremedı. Model görsel üretmek yerine hata verdi ya da süreci tamamlayamadı. Esnek promptta pide formunu en doğru üreten modeller arasında yer alan Mistral’ın, çok sayıda kısıtlama bir arada geldiğinde sistemi kilitlenmesi dikkat çekici bir bulgudur. Büyük olasılıkla prompttaki kısıtlama yoğunluğu Mistral’ın güvenlik veya kapasite filtrelerini tetikledi.

[GÖRSEL — Copilot — Katı Prompt]

2.3.6 Copilot

Copilot, katı promptla birlikte esnek prompta kıyasla dramatik bir dönüşüm yaşadı. İlk promptta en başarısız modeller arasında yer alırken bu kez beş kişinin her birini prompttaki tanımlamaya uygun biçimde yerleştirdi. Çay bardakları, tuz şişesi, duvardaki eski fotoğraf, taş duvar ve pencere görünümü gibi ayrıntılar başarıyla uygulandı. Kesilmiş pide net biçimde kıyma dolgusu gösterdi. Bununla birlikte iki önemli eksiklik dikkat çekti: pide formu yine torpido yapısına tam ulaşamayıp kısa ve yuvarlak kaldı; insanların kameraya bakıyor olması ise doğal bir candid atmosfer yerine aile fotoğrafı havasına yol açtı.

2.4 Genel Değerlendirme

Katı prompt, tüm modellerde esnek prompta kıyasla belirgin bir kalite artışı sağladı. Copilot ve Gemini en büyük sıçramayı yapan modeller oldu. ChatGPT tutarlılığını koruyarak en bütünlüklü sonucu vermeye devam etti. Grok ilerledi ama tam hedefi tutturamadı. Meta AI ise katı promptu paradoks biçimde eski performansının gerisinde karşıladı. Mistral diskalifiye oldu.

Bu bölümün en önemli metodolojik çıkarımı şudur: Görsel yapay zekaya verilen her esneklik, modelin kendi varsayılan kalıplarına dönmesi için bir kapı aralamaktadır. Katı bir prompt bu kapıları kapatır ve modeli gerçek anlamda kullanıcının isteğiyle yüzleşmeye zorlar. Ancak bu zorlama her modelde farklı biçimde karşılık bulmakta; bazıları zorlamayı fırsata çevirirken bazıları altında ezilmektedir.


Bölüm 3: Gemini-Copilot Benzerliği — Tesadüf Olamaz

3.1 Bulgunun Ortaya Çıkışı

Katı promptla üretilen görseller incelendiğinde, Gemini ve Copilot’un ürettiği iki görsel arasında göz ardı edilemeyecek bir benzerlik dikkat çekti. İlk bakışta farklı görsel üretim motorlarına sahip iki modelin bu denli örtüşen sonuçlar vermesi, çalışmaya yeni bir araştırma boyutu kattı.

İki görsel yan yana koyulduğunda ortak unsurların listesi çarpıcıydı: taş duvarın dokusu ve rengi neredeyse identikti, duvardaki siyah beyaz fotoğrafın konumu aynı köşede yer alıyordu, beş kişinin masa etrafındaki dizilimi birebir örtüşüyordu, kişilerin giysileri prompt tanımlamalarına aynı yorumu getiriyordu, ahşap masa dokusu çok benzerdi ve tulip çay bardaklarının yerleşimi aynıydı. Farklılıklar ise ikincil detaylarda kaldı: Copilot’ta pencere dar ve solda, Gemini’de geniş ve deniz manzaralıydı; renk tonu Gemini’de daha soğuk ve belgesel, Copilot’ta daha parlak ve ticari hissettiriyordu.

Bu bulgu hemen üç farklı modele yöneltildi: Copilot’a, Gemini’ye ve ChatGPT’ye aynı soru soruldu.

[GÖRSEL — Gemini-Copilot Karşılaştırma İnfografiği]

3.2 Modellerin Analizi

3.2.1 Copilot’un Yanıtı

Copilot konuya yüzeysel bir yaklaşım sergiledi. “Katı prompt benzer sonuç üretiyor” tespitini yaparak genel geçer bir açıklama sundu: farklı modellerin ortak veri setlerinden beslenmesi, aynı fotorealistik stilin uygulanması ve kesin kuralların kompozisyonu kilitlemesi. Yanıt doğruydu ancak derinlikten yoksundu. Copilot ayrıca kullanıcıya “Aydın” diye hitap etti; bu küçük ama dikkat çekici bir detaydı, zira promptta böyle bir yönlendirme yer almıyordu.

3.2.2 Gemini’nin Yanıtı

Gemini, soruya orta düzeyde analitik bir yanıt verdi ve konuyu görsel bir infografikle destekledi. Yanıt dört temel başlık altında yapılandırıldı: eğitim veri setlerindeki kültürel ortak kökler, promptun gizli matematiksel kesinliği, estetik ve kompozisyon uyumlanması ve negatif prompting etkisi. Gemini’nin en güçlü saptaması şuydu: prompttaki yaş, kıyafet rengi, duruş ve ışık yönü gibi spesifik değişkenlerin toplamı, modelin ihtimaller uzayında gidebileceği alanı öylesine daraltır ki farklı motorlar da aynı matematiksel noktada buluşur. Hazırlanan infografik ise iki görseli yan yana göstererek “Ortak Eğitim Verisi Kökleri” başlıklı bir şema ile benzerliğin kaynağını görselleştirdi.

3.2.3 ChatGPT’nin Yanıtı

ChatGPT bu soruya en kapsamlı ve en akademik yanıtı verdi. Yanıt olasılıkları sistematik biçimde sıraladı ve her birine yüzdesel bir ağırlık atadı. En güçlü olasılık olarak promptun kompozisyonel deterministikliği öne çıkarıldı: yüzde altmış ila yetmiş oranında, promptun iki sistemi de aynı sahne çözümüne zorladığı değerlendirildi. Yüzde yirmi ila otuz oranında ise farklı modellerin benzer fotoğrafik kompozisyon klişelerine ve benzer prompt yeniden yazma davranışına sahip olduğu düşünüldü. Copilot ile Gemini’nin aynı görsel üretim altyapısını paylaşıyor olması olasılığı ise yüzde onun altında kaldı; çünkü mevcut teknik tabloya göre Copilot’un OpenAI-Microsoft hattında, Gemini’nin ise Google hattında ilerlediği bilinmektedir.

ChatGPT’nin en özgün katkısı, üç test senaryosu önermesiydi. Birinci senaryoda kompozisyonu kilitleyen unsurlar prompttan çıkarılarak benzerliğin azalıp azalmadığı test edilecekti. İkinci senaryoda kompozisyon tersine çevrilerek her iki modelin yine benzer sonuç verip vermediği gözlemlenecekti. Üçüncü senaryoda ise anti-kompozisyon kuralları eklenerek modellerin “güvenli poster kompozisyonuna” kaçma refleksinin kırılıp kırılamayacağı araştırılacaktı. Bu test senaryoları ilgi çekici olmakla birlikte, çalışmanın mevcut aşamasında veri zenginliğini dağıtma riski taşıdığından uygulamaya konulmadı.

ChatGPT’nin nihai saptaması şu cümleyle özetlenebilir: Asıl ilginç olan “aynı model mi?” sorusundan çok, bu kadar sıkı tanımlanmış bir promptun farklı üreticilerde bile aynı görsel grameri dayatıp dayatamayacağıdır. Başka bir deyişle burada “model ortaklığı”ndan çok “promptun kompozisyonel deterministikliği” öne çıkmaktadır.

3.3 Sonuç ve Açık Sorular

Üç modelin yanıtları birlikte değerlendirildiğinde, benzerliğin tek bir nedene bağlanamayacağı görülmektedir. Promptun kısıtlayıcılığı, modellerin ortak eğitim veri tabanları, fotoğrafik kompozisyon klişeleri ve arka planda gerçekleşebilecek prompt yeniden yazma işlemleri bu benzerliğe birlikte katkıda bulunmaktadır.

Çalışmanın bu bölümünden çıkan en önemli bulgu şudur: Yeterince katı ve ayrıntılı bir prompt, farklı mimarilere ve farklı eğitim süreçlerine sahip modelleri aynı görsel çözümde buluşturabilmektedir. Bu durum görsel yapay zeka araştırmaları açısından iki farklı biçimde yorumlanabilir. Olumlu yoruma göre katı prompt kalite ve tutarlılık sağlamaktadır. Eleştirel yoruma göre ise bu durum, modellerin gerçek anlamda yaratıcı değil, istatistiksel olarak olası en güvenli sahneyi üreten sistemler olduğunu ortaya koymaktadır.


Genel Sonuç

Bu çalışma üç temel bulguyu belgelemiştir.

Birincisi, görsel yapay zeka modellerinin yerel kültürel verileri işlemede ciddi eksiklikleri bulunmaktadır. İnebolu pidesi gibi özgün ve yerel bir referans noktası, modellerin genel bilgi dağarcıklarının ne kadar yüzeysel kaldığını somut biçimde ortaya koymuştur.

İkincisi, promptun kısıtlayıcılık düzeyi doğrudan çıktı kalitesini belirlemektedir. Esnek promptlar modellerin varsayılan kalıplarına dönmesine zemin hazırlarken katı promptlar bu eğilimi kırmakta ve modeli kullanıcının gerçek isteğiyle yüzleştirmektedir.

Üçüncüsü, farklı mimarilere sahip modeller yeterince kısıtlayıcı bir prompt karşısında benzer görsel çözümlere yakınsamaktadır. Bu yakınsama, model ortaklığından çok promptun kompozisyonel deterministikliğinin bir ürünüdür.

Bu bulgular, görsel yapay zeka kullanımında prompt mühendisliğinin bir seçenek değil, zorunluluk olduğunu açıkça göstermektedir.

Ek 1: Esnek Prompt — Türkçe Çeviri

Format: Dikey, 9:16 oran, portre yönlendirmesi.

Sahne: İnebolu’da, Karadeniz kıyısındaki küçük bir sahil kasabasında, geleneksel bir Türk çayhanesi ortamında rustik bir ahşap masa. Masanın üzerinde 3-4 adet İnebolu pidesi bulunuyor. Bu pideler açık yüzlü pideler değildir. İnebolu pidesi belirgin biçimde uzun ve tamamen kapalı/mühürlü bir üste sahip, kese veya içi dolu bir böreği andıran bir şekle sahip, altın-kahverengi pişmiş kabuğu ve görünür kıyma (kıyma) dolgusuyla karakterizedir. Pideler, ahşap bir servis tahtası veya tepsi üzerinde doğal biçimde düzenlenmiştir.

Atmosfer: Sıcak, otantik, küçük bir Karadeniz kasabasına özgü hava. Bir pencereden giren doğal gün ışığı. Arka planda taş veya badanalı duvarlar.

İnsanlar: Yaşlı erkekler, orta yaşlı kadınlar ve gençlerden oluşan 4-5 kişilik karma yaş gruplu küçük bir topluluk. Küçük bir Anadolu sahil kasabasına özgü mütevazı, günlük Türk kıyafetleri içindeler. Doğal bir sohbet ortamında, poz vermeden bir araya gelmişler. Klişe yok, kentsel moda yok, Batılı tarz yok.

Renk paleti: Sıcak toprak tonları — altın kahverengi, krem beyazı, terrakota. Pideler görsel odak noktası olmalıdır.

Stil: Fotorealistik, sıcak tonlu yemek fotoğrafçılığı ile samimi sosyal sahnenin buluşması. Pide dokusu ve kabuğunda yüksek detay.

Önemli: Pideler tamamen kapalı ve mühürlü olmalıdır — açık yüzlü değil, pizza tarzı değil. Bu, İnebolu pidesinin tanımlayıcı özelliğidir.


Ek 2: Katı Prompt — Türkçe Çeviri

FORMAT — ZORUNLU:
Dikey portre yönlendirmesi, 9:16 en-boy oranı, 1080×1920 piksel. Çerçevenin tamamı dikey olmalıdır. Yatay veya kare herhangi bir çıktı kabul edilemez.

PİDELER — SIFIR TOLERANS:
Tek bir dikdörtgen ahşap servis tahtası üzerinde (yaklaşık 40×25 cm) tam olarak 4 adet İnebolu pidesi düzenlenmiş olmalıdır. Her pide tam olarak 32-35 cm uzunluğunda, 10-12 cm genişliğinde, 6-7 cm yüksekliğinde olmalıdır. Şekil kesinlikle uzun oval/torpido biçiminde, mühürlü bir kese veya içi dolu böreği andırır nitelikte olmalıdır. Üst kabuk tamamen mühürlü ve kapalıdır — açıklık, yarık veya üst yüzeyde görünür dolgu yoktur. Kabuk altın kahverengi, hafif düzensiz, el yapımı görünümündedir. Ön plandaki bir pide çapraz olarak ikiye kesilmiş ve içinde yoğun, koyu kahverengi baharatlı kıyma dolgusu görünmektedir. Diğer 3 pide tamamen sağlam ve mühürlüdür. Kesinlikle yuvarlak pide yok. Kesinlikle açık yüzlü pide yok. Kesinlikle pizza şeklinde pide yok. Kesinlikle lahmacun tarzı pide yok.

İNSANLAR — KESİN ÖZELLİKLER:
Tam olarak 5 kişi. Masanın etrafında oturuyorlar. Tamamı Anadolu Karadeniz Türkü fiziksel görünümüne sahip olmalı — zeytinyağı teni, koyu veya gri saç.

Kişi 1: Erkek, yaklaşık 72 yaşında. Gri yün kasket, koyu lacivert yün ceket, altında beyaz gömlek. Sağ elinde tulip çay bardağı tutuyor.

Kişi 2: Kadın, yaklaşık 55 yaşında. Çene altında bağlı koyu çiçekli yazma başörtüsü, koyu gömleğin üzerinde bordo hırka. Her iki eli masada.

Kişi 3: Erkek, yaklaşık 27 yaşında. Koyu saç, temiz traşlı. Düz gri kazak giyiyor. Masaya doğru hafifçe öne eğilmiş.

Kişi 4: Kadın, yaklaşık 24 yaşında. Başörtüsü yok, koyu saç toplu. Lacivert kazak giyiyor. Doğal biçimde gülümsüyor.

Kişi 5: Kadın, yaklaşık 68 yaşında. Gri saç, koyu kahverengi mont giyiyor. Diğerlerinin biraz gerisinde oturuyor.

Batılı moda yok. Modern kentsel kıyafet yok. Arap tarzı kıyafet veya beyaz cüppe yok. Serbest dökümlü başörtüsü yok.

MASA:
Sert ahşaptan yapılmış dikdörtgen masa, koyu kahverengi, tahıl dokusuyla görünür biçimde yıpranmış. Masanın üzerinde: pideli ahşap servis tahtası, her birinde koyu kırmızı çay dolu tam 5 adet tulip biçimli Türk çay bardağı (ince belli bardak), her birinde 2 küçük beyaz şeker küpü bulunan tam 5 beyaz tabak, bir küçük beyaz seramik tuz şişesi. Masa örtüsü yok. Yer matı yok. Görünür çatal bıçak yok. Arap çaydanlığı yok. Beyaz porselen çaydanlık yok. Su bardağı yok.

İÇ MEKAN:
Taş duvar arka planı, kabaca kesilmiş kireç taşı blokları, hafifçe badanalı. Çerçevenin üstünde görünür ahşap kirişli tavan. Sol tarafta tek bir ahşap çerçeveli pencere — arka planda gri-mavi deniz, yamaçta kırmızı çatılı evlerden oluşan Karadeniz sahil kasabası görünümü. Duvarda küçük bir çerçeveli siyah-beyaz eski fotoğraf, görünür metin yok. Kısmen görünür yıpranmış ahşap zemin.

IŞIK:
Doğal gün ışığı yalnızca sol taraftaki tek pencereden giriyor. Sıcak, hafif altın ton. Sağ tarafta yumuşak gölgeler. Yapay ışıklandırma yok, sert flaş yok, neon yok.

KAMERA:
Hafif alçak açı, insanlara doğru hafifçe yukarı çekiyor, pideler ön planda keskin odakta baskın, insanlar orta planda hafif bokeh ile. Alan derinliği: pideler jilet gibi keskin, insanlar yumuşak odakta ama açıkça tanınabilir.

STİL:
Fotorealistik. Belgesel yemek fotoğrafçılığı ile samimi sosyal portre buluşması. Film tanesi dokusu, hafif doygunluğu azaltılmış, otantik his. Filtre yok. HDR efekti yok. Aşırı doygunluk yok.

KESİNLİKLE YASAK — BUNLARDAN HERHANGİ BİRİ BAŞARISIZLIK ANLAMINA GELİR:
Açık yüzlü pideler. Yuvarlak pideler. Dikey/9:16 dışı herhangi bir çıktı. Arap kıyafetleri. Batılı kentsel moda. Beyaz dökümlü cüppeler. Modern mobilya. Plastik sandalyeler. Masa örtüsü. Görselin herhangi bir yerinde tabela veya metin. Parlak neon ışıklandırma. 4’ten az veya fazla pide. 5’ten az veya fazla kişi. Masada herhangi türde çaydanlık.


Makale Künyesi:
Prompt Mühendisliği ve Görsel Yapay Zeka: Altı Model, İki Prompt, Bir Bulgu
Yazarlar: Aydın Tiryaki & Claude Sonnet (Anthropic)
Tarih: 25 Haziran 2026
Yayın: aydintiryaki.org

Aydın'ın dağarcığı

Hakkında

Aydın’ın Dağarcığı’na hoş geldiniz. Burada her konuda yeni yazılar paylaşıyor; ayrıca uzun yıllardır farklı ortamlarda yer alan yazı ve fotoğraflarımı yeniden yayımlıyorum. Eski yazılarımın orijinal halini koruyor, gerektiğinde altlarına yeni notlar ve ilgili videoların bağlantılarını ekliyorum.
Aydın Tiryaki

Ara

Haziran 2026
P S Ç P C C P
1234567
891011121314
15161718192021
22232425262728
2930