|

Tinggalkan petunjuk yang berlebihan: 7 prinsip efisiensi di era Nano Banana 2 dan gpt-image-2

Di dunia kreasi AI, banyak kreator masih menggunakan "rumus petunjuk" yang diwarisi dari era Stable Diffusion 1.5. Contohnya adalah deretan petunjuk yang berlebihan seperti ini:

Tambahkan tirai putih di jendela kaca, ruang interior yang sangat realistis, estetika pencahayaan kelas master, cahaya alami masuk dengan lembut melalui jendela besar dari lantai ke langit-langit, kontras terang-gelap yang lembut, lapisan cahaya dan bayangan yang halus, efek cahaya Tyndall, rendering cahaya fisik yang nyata, pencahayaan global, bayangan lembut, tekstur detail tinggi, 8K ultra HD, kualitas tingkat film, tekstur material yang realistis, suasana ruang yang bersih dan transparan, fotografi interior profesional, dipotret dengan Canon 5D Mark IV, aperture f/1.8, tekstur nyata, tanpa rendering berlebihan, minimalis elegan, nyaman dan hangat, detail kaya. Resolusi 8K HD, realisme tingkat film, gaya fotografi nyata, ultra-realistis, tekstur transparan, detail maksimal ——

Petunjuk ini mengandung 23 kata sifat, 8 istilah teknis, dan 3 pengulangan kualitas. Dalam ekosistem SD sebelum tahun 2024, gaya penulisan seperti ini mungkin memang memberikan hasil tertentu. Namun, di era Nano Banana 2 dan gpt-image-2 tahun 2026, "petunjuk berlebihan" seperti ini tidak hanya mubazir, tetapi justru bisa menurunkan kualitas gambar yang dihasilkan.

Artikel ini akan menjelaskan mengapa zaman telah berubah berdasarkan perbedaan mendasar pada data pelatihan, serta memberikan 7 prinsip perampingan petunjuk yang bisa langsung Anda gunakan agar Anda bisa menghasilkan gambar yang lebih baik dengan deskripsi yang lebih singkat dan akurat.

stop-hyperbolic-prompts-nano-banana-2-gpt-image-2-guide-id 图示

Satu: Mengapa petunjuk yang berlebihan tidak lagi efektif di era Nano Banana 2

Untuk memahami perubahan ini, kita perlu menelusuri evolusi sejarah penulisan petunjuk.

1.1 Akar sejarah petunjuk berlebihan: Era tag Danbooru

Kata-kata seperti "8K", "masterpiece", "best quality", dan "ultra realistic" pernah dianggap sebagai "kata kunci ajaib" karena alasan teknis yang sangat spesifik: kata-kata tersebut adalah tag asli dari situs gambar Danbooru.

Data pelatihan Stable Diffusion 1.5 dan model turunannya (seperti NovelAI, Waifu Diffusion, dll.) mencakup banyak gambar dari Danbooru. Saat diunggah, gambar-gambar tersebut diberi tag oleh pengguna dengan label kualitas seperti masterpiece atau best quality. Hubungan yang dipelajari model adalah:

kata "masterpiece" ⟷ gaya gambar yang ditandai sebagai masterpiece dalam set pelatihan

Oleh karena itu, pada SD 1.5, menumpuk kata seperti (masterpiece:1.2), (best quality:1.2), 8k, ultra detailed memang efektif—karena itu memanggil distribusi gambar yang "ditandai sebagai karya terbaik oleh banyak suara" dalam set pelatihan.

1.2 Paradigma pelatihan telah berubah: Dari tag ke bahasa alami

Nano Banana 2 (gemini-3.1-flash-image-preview), Nano Banana Pro (gemini-3-pro-image-preview), gpt-image-2, serta Stable Diffusion 3.5, yang merupakan generasi model gambar modern, telah mengalami perubahan paradigma pelatihan yang mendasar:

Dimensi Perbandingan Era SD 1.5 Era Nano Banana 2 / gpt-image-2
Anotasi data pelatihan Daftar tag gaya Danbooru Deskripsi gambar (caption) bahasa alami
Pengode teks Batasan 77 token CLIP LLM multimodal (konteks puluhan ribu token)
Cara memahami Pencocokan tag Pemahaman semantik + penalaran
Petunjuk terbaik Tumpukan kata kunci dipisah koma Deskripsi adegan yang naratif
Bobot kata berlebihan Efektif, memanggil distribusi gaya Pengenceran semantik, bahkan negatif
Panjang yang disarankan 30-80 token Kalimat alami 50-500 kata

Google secara eksplisit menulis dalam panduan petunjuk Nano Banana: "Nano Banana 2 memahami kalimat deskriptif, bukan spam kata kunci yang dipisah koma."

OpenAI dalam Cookbook resmi gpt-image-2 juga menyatakan dengan jelas: "spesifikasi kamera yang mendetail mungkin diinterpretasikan secara longgar" — parameter teknis yang sangat spesifik seperti "Canon 5D Mark IV, f/1.8" tidak akan disimulasikan secara fisik oleh model, melainkan hanya dianggap sebagai petunjuk kasar untuk gaya komposisi.

1.3 Tiga dampak negatif petunjuk berlebihan pada model modern

Membawa kebiasaan era SD 1.5 ke Nano Banana 2 justru akan menimbulkan masalah berikut:

Dampak Negatif 1: Pengenceran semantik. Model harus mencari subjek dan tindakan yang sebenarnya di antara 20 kata sifat, sehingga perhatiannya terpecah.

Dampak Negatif 2: Perintah yang bertentangan. "Sangat realistis" + "estetika kelas master" + "minimalis canggih" + "sinematik" + "fotografi nyata" memiliki konflik gaya yang halus. Model harus berkompromi di antara berbagai distribusi, yang sering kali menyebabkan semuanya tidak berjalan dengan baik.

Dampak Negatif 3: Pemborosan bobot. Panduan petunjuk resmi OpenAI menyatakan bahwa gpt-image-2 memberikan bobot lebih tinggi pada 50 kata pertama. Jika 50 kata pertama semuanya adalah kata kosong seperti "sangat realistis, kelas master, 8K HD", deskripsi subjek yang sebenarnya justru terdorong ke posisi belakang dengan bobot yang lebih rendah.

stop-hyperbolic-prompts-nano-banana-2-gpt-image-2-guide-id 图示

二、Membedah Petunjuk (Prompt) Berlebihan yang Tipikal: Mana Sinyal, Mana Derau

Mari kita ambil contoh petunjuk berlebihan sepanjang 115 karakter di awal tadi dan mengklasifikasikannya satu per satu:

2.1 Kata Sinyal: Deskripsi yang Benar-benar Digunakan Model

Kata Asli Klasifikasi Alasan Dipertahankan
玻璃橱添加白色遮光链 Subjek spesifik + aksi Elemen visual yang jelas
室内空间 Ruang Penempatan spasial yang diperlukan
自然光透过大幅落地窗 Deskripsi sumber cahaya Desain pencahayaan yang konkret
f/1.8 光圈 Implikasi komposisi Model mengartikannya sebagai "depth of field dangkal"

Total: Sekitar 4-5 kata sinyal yang benar-benar berguna.

2.2 Kata Derau: Modifikasi yang Kosong atau Redundan

Kata Asli Tipe Derau Masalah
极致写实的 Kata sifat kabur "Ekstrem" tidak memiliki definisi terukur
大师级光影美学 Slogan pemasaran Model tidak memiliki fitur visual terkait
柔和的明暗对比 Duplikasi dengan "cahaya alami" Informasi redundan
细腻的光影层次 Sama seperti di atas Pengulangan
丁达尔光效 Istilah profesional tapi disalahgunakan Hanya berlaku di lingkungan berdebu tertentu
真实物理光影渲染 Istilah rendering 3D Tidak bermakna untuk adegan fotografi
全局光照 Istilah rendering 3D Sama seperti di atas
软阴影 Duplikasi dengan "kontras lembut" Pengulangan
高细节质感 Kata kualitas Model tidak memiliki distribusi spesifik
8K 超高清 Kata resolusi Tidak relevan dengan parameter API
电影级画质 Slogan Tidak memiliki instruksi operasional
逼真材质纹理 Kata kualitas kosong Material tidak ditentukan
干净通透的空间氛围 Tumpukan kata sifat Tidak ada instruksi spesifik
专业室内摄影 Label gaya redundan Pengulangan
佳能 5D Mark IV Merek kamera Model tidak melakukan simulasi fisik
真实质感 Pengulangan Berulang kali disebutkan sebelumnya
无过度渲染 Instruksi negatif Mudah diabaikan oleh model
高级简约 Kata pemasaran Tidak ada instruksi visual
舒适温馨 Kata emosi Kabur
细节丰富 Kata kualitas Duplikasi dengan "detail tinggi"
8K 高清分辨率 Berulang lagi Redundansi parah
电影级写实 Berulang lagi Redundansi parah
真实摄影风格 Berulang lagi Redundansi parah
超写实 Berulang lagi Redundansi parah
通透质感 Berulang lagi Redundansi parah
细节拉满 Berulang lagi Redundansi parah

Total: Sekitar 26 kata derau, mencakup hampir 85% dari total kata.

2.3 Penulisan Ulang: Pertahankan Sinyal, Hapus Derau

Setelah menghapus semua derau, petunjuk ini bisa dipangkas hingga kurang dari 20% panjang aslinya, namun dengan semantik yang jauh lebih jelas:

Sebuah ruang interior modern, terdapat lemari kaca di depan jendela besar,
rantai penutup putih tergantung di lemari, cahaya alami masuk menyamping dari jendela,
menjatuhkan bintik cahaya lembut di lantai kayu. Diambil dengan lensa 85mm,
depth of field dangkal, pantulan kaca di latar depan jelas, latar belakang sedikit blur.

Petunjuk sepanjang 61 karakter ini akan memberikan hasil gambar pada Nano Banana 2 yang jauh lebih baik daripada versi 115 karakter yang berlebihan. Alasannya sederhana: setiap kata memiliki instruksi visual yang jelas.

🎯 Saran Pengujian: Kami menyarankan Anda menggunakan kunci API yang sama di APIYI apiyi.com untuk membandingkan petunjuk asli yang berlebihan dengan versi ringkas. Jalankan masing-masing 5 kali melalui gemini-3-pro-image-preview untuk merasakan perbedaannya secara langsung. Platform ini mendukung antarmuka terpadu untuk model utama seperti Nano Banana 2, gpt-image-2, dan lainnya, sehingga memudahkan perbandingan horizontal yang cepat.


Tiga: 7 Prinsip Pemangkasan Petunjuk di Era Nano Banana 2 dan gpt-image-2

Berikut adalah 7 prinsip yang telah diverifikasi melalui dokumentasi resmi Google, OpenAI, dan banyak praktik lapangan, diurutkan berdasarkan kepentingannya.

stop-hyperbolic-prompts-nano-banana-2-gpt-image-2-guide-id 图示

3.1 Prinsip Satu: Hapus Semua Kata Sifat Kualitas

Daftar kata yang aman untuk dihapus:

  • 8K 超高清 / 4K / 高清
  • masterpiece / best quality / 大师级
  • 极致写实 / 超写实 / hyper realistic
  • 电影级 / cinematic (kecuali benar-benar merujuk pada rasio aspek film)
  • 细节拉满 / ultra detailed / 高细节
  • 高级 / 专业 (jika tidak ada objek spesifik)

Kata-kata ini adalah label untuk memanggil distribusi set pelatihan di era SD 1.5, namun di Nano Banana 2, ini hanyalah derau semantik. Jika Anda benar-benar perlu mengontrol resolusi, lakukan melalui parameter permintaan API, bukan melalui petunjuk.

3.2 Prinsip Dua: Nano Banana 2 Membutuhkan Aksi Spesifik, Bukan Emosi Kabur

❌ Tumpukan kata emosi:

hangat dan nyaman, tenang dan damai, penuh vitalitas, indah seperti mimpi, waktu yang tenang

✅ Adegan spesifik:

Setengah cangkir kopi yang mengepul di atas meja kayu tua, di sampingnya ada buku yang terbuka,
halaman-halamannya disinari bintik cahaya lembut oleh sinar matahari yang masuk menyamping dari jendela.

Model secara alami menyimpulkan emosi dari adegan spesifik, Anda tidak perlu memberi tahu model secara langsung bahwa itu "hangat".

3.3 Prinsip Tiga: Hapus Semua Istilah Rendering 3D (Kecuali Benar-benar Melakukan Rendering 3D)

Dalam adegan fotografi/realistis, istilah-istilah berikut adalah kontaminasi lintas paradigma—mereka berasal dari bidang rendering 3D dan bukan bagian dari bahasa fotografi:

  • 全局光照 / GI / global illumination
  • 光线追踪 / ray tracing
  • 真实物理光影渲染
  • SSS / subsurface scattering
  • PBR 材质

Memasukkan kata-kata ini ke dalam petunjuk gaya fotografi sama dengan memaksa model untuk memotong secara paksa di antara dua distribusi gaya, hasilnya sering kali tidak terlihat seperti foto maupun rendering.

3.4 Prinsip Empat: Parameter Kamera Digunakan untuk Komposisi, Bukan Simulasi Fisik

Panduan resmi OpenAI: "detailed camera specs may be interpreted loosely, so use them mainly for high-level look and composition rather than exact physical simulation."

Artinya: Jika Anda menulis 佳能 5D Mark IV, f/1.8, model tidak akan benar-benar mensimulasikan karakteristik CMOS kamera ini dan rumus depth of field f/1.8. Model hanya akan mengenali dua sinyal: "kemungkinan besar foto fotografi profesional" + "depth of field dangkal".

Karena itu, menulis niat komposisi secara langsung jauh lebih efisien:

❌ Menumpuk model kamera:

Diambil dengan Canon 5D Mark IV, aperture f/1.8, lensa 50mm, ISO 100, format RAW

✅ Mengekspresikan niat komposisi:

Depth of field dangkal, subjek jelas latar depan blur, perspektif potret

Jumlah kata berkurang dari 32 menjadi 18, dan model justru memahaminya dengan lebih akurat.

3.5 Prinsip Lima: Letakkan Informasi Inti di 50 Kata Pertama gpt-image-2

OpenAI secara resmi menyatakan bahwa gpt-image-2 memberikan bobot lebih tinggi pada 50 kata pertama. Ini berarti awal petunjuk harus berisi "informasi terpenting"—subjek, aksi, adegan, bukan "hiasan paling indah"—kata kualitas, kata gaya, kata merek.

❌ Ketidakcocokan bobot (kata hiasan di depan):

8K ultra HD, kualitas film kelas master, fotografi profesional Canon 5D Mark IV,
seorang wanita berbaju putih berdiri di tepi pantai...

50 kata pertama semuanya adalah kata kosong, subjek sebenarnya "wanita, baju putih, pantai" terdorong ke posisi setelah 50 kata.

✅ Optimalisasi bobot (subjek di depan):

Seorang wanita berbaju putih berdiri di atas batu karang tepi pantai, menatap cakrawala laut di kejauhan,
angin meniup rambut panjangnya, cahaya matahari keemasan sore hari menyinari dari samping belakang, depth of field dangkal.

50 kata pertama mencakup subjek, aksi, adegan, pencahayaan, komposisi, semua sinyal kunci berada di area berbobot tinggi.

3.6 Prinsip Enam: Jangan Mengulang Sinonim di Nano Banana 2

Salah satu ciri khas petunjuk berlebihan adalah takut model tidak mengerti, sehingga menulis arti yang sama sebanyak 3 kali:

Sangat realistis, ultra realistis, gaya fotografi nyata, hidup, tekstur nyata

Kemampuan pemahaman semantik Nano Banana 2 jauh melampaui SD 1.5, ia dapat mengekstrak niat sepenuhnya dari satu deskripsi. Mengulang sinonim hanya akan:

  1. Mengencerkan perhatian
  2. Menghabiskan anggaran token
  3. Membuat seluruh petunjuk terlihat tidak profesional

Prinsip: Satu konsep hanya diekspresikan sekali, gunakan kata yang paling akurat.

3.7 Prinsip Tujuh: Tulis Ulang Instruksi Negatif Menjadi Positif

Dalam petunjuk berlebihan, sering terdapat instruksi negatif seperti "tanpa rendering berlebihan, tanpa kesan AI, tanpa distorsi, tanpa deformasi". Panduan resmi Google Gemini 3 memperingatkan dengan jelas:

"Overly broad negative instructions may cause the model to over-index on that instruction and fail to perform basic logic… replace blanket negatives with explicit positive direction."

Singkatnya: Daripada memberi tahu model "apa yang tidak boleh dilakukan", lebih baik beri tahu model "apa yang harus dilakukan".

❌ Instruksi Negatif ✅ Penulisan Ulang Positif
Tanpa rendering berlebihan Gaya fotografi alami dan realistis
Tanpa kesan AI Tekstur fotografi nyata, pertahankan ketidaksempurnaan alami
Tanpa distorsi Proporsi akurat, struktur jari alami
Tanpa teks Visual murni, tanpa elemen teks
Jangan kartun Gaya fotografi realistis

stop-hyperbolic-prompts-nano-banana-2-gpt-image-2-guide-id 图示


IV. Praktik Perampingan Petunjuk (Prompt) Nano Banana 2 vs gpt-image-2

4.1 Skenario 1: Fotografi Ruang Interior

Versi Berlebihan (115 kata):

极致写实的室内空间,大师级光影美学,自然光透过大幅落地窗温柔洒入,
柔和的明暗对比,细腻的光影层次,丁达尔光效,真实物理光影渲染,
全局光照,软阴影,高细节质感,8K 超高清,电影级画质,
逼真材质纹理,干净通透的空间氛围,专业室内摄影,
佳能 5D Mark IV 拍摄,f/1.8 光圈,真实质感,无过度渲染,
高级简约,舒适温馨,细节丰富。

Versi Ramping (58 kata):

Ruang tamu gaya minimalis, jendela besar dari lantai ke langit-langit, 
cahaya alami masuk menyamping, sofa linen abu-abu muda, lantai kayu, 
tanaman hijau di sudut ruangan. Kedalaman bidang dangkal (shallow depth of field), 
subjek tajam, latar belakang blur lembut.

Performa petunjuk yang dirampingkan pada gemini-3-pro-image-preview menunjukkan hasil yang lebih unggul di berbagai metrik:

Dimensi Versi Berlebihan Versi Ramping
Jumlah Token ~180 ~65
Kejelasan Subjek Sedang Tinggi
Kealamian Cahaya Sedang (terasa seperti render) Tinggi
Konsistensi Gaya Rendah (konflik gaya) Tinggi
Stabilitas Output Rendah Tinggi

4.2 Skenario 2: Fotografi Potret

Versi Berlebihan:

超写实,8K 高清,大师级人像摄影,电影级画质,
佳能 EOS R5 拍摄,85mm f/1.2 定焦镜头,柔光箱打光,
全局光照,软阴影,逼真皮肤质感,细节丰富,
专业修图,杂志封面级别,极致写实,真实摄影
一位年轻女性...

(Subjek terdorong hingga setelah 50 kata)

Versi Ramping:

Seorang wanita berusia 25 tahun, rambut hitam lurus sebahu, mata cokelat tua, 
mengenakan sweter rajut putih gading, duduk menyamping di samping meja kayu kafe, 
kedua tangan memegang latte panas, tersenyum menatap ke luar jendela. 
Cahaya jendela menyinari wajah dari sisi kiri secara lembut, kedalaman bidang dangkal, 
latar belakang lampu kafe yang hangat tampak blur.

Subjek, tindakan, pencahayaan, dan komposisi—semua sinyal penting berada dalam 50 kata pertama.

4.3 Skenario 3: Gambar Produk E-commerce

Versi Berlebihan:

8K 超高清产品摄影,大师级工业设计美学,完美光影,
电影级画质,极致写实,高级质感,专业商业摄影,
哈苏中画幅相机拍摄,一瓶香水...

Versi Ramping:

Satu botol parfum kaca transparan, bentuk botol persegi, tutup semprot emas, 
label hitam dengan tulisan emas "AURA" pada badan botol. 
Latar belakang putih mulus tanpa sambungan, cahaya lembut dari atas, 
pantulan cahaya di sisi botol terlihat jelas. Komposisi produk di tengah, 
mengisi 60% bingkai gambar.

Perhatikan bahwa versi ramping menggunakan tanda kutip pada "AURA" — ini adalah teknik pemicu untuk rendering teks fidelitas tinggi pada Nano Banana 2, jauh lebih efektif daripada sekadar menulis "ada logo merek".

💡 Saran Teknis: Dalam lingkungan produksi, disarankan untuk menyebarkan "middleware peramping petunjuk" melalui APIYI (apiyi.com). Gunakan Gemini 3 Pro atau Claude 4 untuk mengidentifikasi dan memadatkan kata-kata berlebihan secara otomatis sebelum diteruskan ke model gambar. Ini menjaga kompatibilitas antarmuka bisnis sekaligus meningkatkan kualitas output secara seragam.


V. Batasan Teknis Perampingan Petunjuk Nano Banana 2 dan gpt-image-2

Meskipun prinsip perampingan efektif, ada batasan yang perlu diperhatikan. Berikut adalah pengecualiannya.

5.1 Kapan "Kata Kunci Gaya" Tetap Boleh Digunakan

Tidak semua kata sifat adalah kebisingan. Pertahankan kata kunci gaya yang memiliki distribusi visual yang jelas:

✅ Kata Gaya yang Dipertahankan Alasan
Gaya Art Deco Memiliki kosakata visual yang jelas
Gaya Animasi Ghibli Model telah mempelajari distribusi ini
Tekstur film 1980-an Dapat memicu gaya warna tertentu
Estetika Vaporwave Memiliki definisi gaya yang terlihat
Chiaroscuro Teknik seni yang spesifik

Perbedaannya adalah: kata-kata ini merujuk pada aliran seni atau teknik spesifik yang dapat divisualisasikan, bukan evaluasi kosong seperti "kelas master".

5.2 Kapan Harus Menulis Secara Detail

Skenario berikut memang memerlukan petunjuk yang lebih panjang, namun panjang tidak sama dengan berlebihan:

  • Pembuatan Infografis: Perlu mendeskripsikan posisi setiap modul, konten teks, dan warna.
  • Konsistensi Multi-Karakter: Perlu mendeskripsikan detail penampilan setiap karakter.
  • Komposisi Kompleks: Apa yang ada di latar depan/tengah/belakang.
  • Materi Merek: Memerlukan posisi logo, konten teks, dan skema warna yang presisi.

Bahkan dalam skenario ini, instruksi spesifik tetap lebih baik daripada tumpukan kata sifat.

5.3 Contoh Pemanggilan API: Menggunakan Petunjuk Ramping untuk Nano Banana 2

Berikut adalah contoh kode minimal untuk memanggil Nano Banana 2 melalui APIYI (apiyi.com):

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"
)

# Petunjuk yang sudah dirampingkan
prompt = """Seorang wanita berusia 25 tahun, rambut hitam lurus sebahu, mata cokelat tua, 
mengenakan sweter rajut putih gading, duduk menyamping di samping meja kayu kafe, 
kedua tangan memegang latte panas, tersenyum menatap ke luar jendela. 
Cahaya jendela menyinari wajah dari sisi kiri secara lembut, kedalaman bidang dangkal, 
latar belakang lampu kafe yang hangat tampak blur."""

response = client.chat.completions.create(
    model="gemini-3-pro-image-preview",
    messages=[{"role": "user", "content": prompt}]
)

Gunakan base_url di https://api.apiyi.com/v1, dan ID model tetap sama dengan versi resmi. Koneksi langsung yang transparan memastikan Anda mendapatkan performa asli dari antarmuka resmi—petunjuk ramping efektif di API resmi, dan juga efektif di APIYI.

5.4 Perbandingan Sensitivitas Model terhadap Kata Berlebihan

Model Paradigma Pelatihan Sensitivitas terhadap Kata Berlebihan Gaya Petunjuk yang Disarankan
Stable Diffusion 1.5 Tag Danbooru Rendah (bahkan bermanfaat) Tumpukan Tag
Stable Diffusion XL Campuran Sedang Campuran
Stable Diffusion 3.5 Caption bahasa alami Cukup tinggi Bahasa alami
DALL-E 3 Caption GPT Tinggi Deskripsi naratif
gpt-image-2 LLM Multimodal Tinggi Narasi + Instruksi spesifik
Nano Banana 2 Gemini 3.1 Flash Tinggi Narasi + 5 elemen adegan
Nano Banana Pro Gemini 3 Pro Tertinggi Narasi yang ringkas & presisi

Kesimpulan: Semakin modern modelnya, semakin tidak menyukai gaya berlebihan.

VI. FAQ: Pertanyaan Umum Seputar Petunjuk Nano Banana 2 dan gpt-image-2

Q1: Petunjuk SD 1.5 saya sebelumnya tidak bekerja dengan baik di Nano Banana 2, bagaimana cara migrasinya dengan cepat?

Cara termudah: Ubah semua tag yang dipisahkan koma menjadi paragraf bahasa alami, hapus semua kata sifat kualitas (8K/masterpiece/best quality), dan sederhanakan parameter kamera menjadi niat komposisi (misalnya, f/1.8 diubah menjadi "depth of field dangkal"). Melalui APIYI apiyi.com, Anda dapat menggunakan kode yang sama untuk memanggil SD dan Nano Banana 2 secara bersamaan guna perbandingan dan verifikasi migrasi.

Q2: Apakah menulis "8K" benar-benar tidak ada gunanya?

Resolusi Nano Banana 2 ditentukan oleh parameter API (512/1K/2K/4K). "8K" dalam petunjuk tidak dapat meningkatkan resolusi aktual dan tidak memiliki distribusi pelatihan yang sesuai. Disarankan untuk menghapusnya sepenuhnya dan menentukan 2K atau 4K secara eksplisit di tingkat parameter API.

Q3: Apakah merek kamera seperti Canon 5D atau Hasselblad perlu ditulis?

Boleh sesekali, tapi secukupnya. Menulis "Hasselblad" akan membuat model cenderung ke gaya komersial/fashion, sedangkan "GoPro" akan membuat model cenderung ke sudut lebar yang dinamis—ini adalah sugesti gaya, bukan simulasi fisik. Pilih 1 sugesti kamera yang paling relevan untuk setiap gambar, jangan menumpuknya.

Q4: Saat saya menggunakan gpt-image-2 untuk membuat gambar produk, kata "premium, mewah, pengerjaan luar biasa" hasilnya biasa saja, apa yang harus dilakukan?

Ganti kata sifat abstrak dengan instruksi visual yang konkret. "Mewah" → "latar belakang tekstur marmer gelap, pantulan logam emas"; "Premium" → "komposisi minimalis, latar belakang bersih, cahaya lembut dari atas"; "Pengerjaan luar biasa" → "permukaan tanpa cacat, garis tepi tajam, sambungan rata". Melalui akses gpt-image-2 di APIYI apiyi.com, Anda dapat dengan cepat melakukan iterasi dan menguji perbedaan efek dari berbagai instruksi konkret.

Q5: Token jadi hemat setelah petunjuk diperpendek, tapi apakah itu memengaruhi stabilitas?

Justru sebaliknya, stabilitas akan meningkat. Karena dalam petunjuk singkat, setiap kata memiliki instruksi semantik yang jelas, sehingga perhatian model lebih terfokus. Petunjuk yang berlebihan sering kali menyebabkan ketidakstabilan karena pengulangan sinonim dan konflik gaya yang membuat model harus melakukan kompromi di setiap pembuatan gambar.

Q6: Apakah ada alat untuk secara otomatis mengubah petunjuk yang berlebihan menjadi versi ramping?

Anda bisa menggunakan Gemini 3 Pro atau Claude 4 Sonnet untuk membuat Prompt Refiner Agent. Atur petunjuk sistem menjadi: "Identifikasi dan hapus semua kata kualitas yang kosong secara semantik, sinonim yang berulang, dan istilah rendering lintas paradigma; pertahankan deskripsi subjek, tindakan, adegan, dan pencahayaan yang spesifik." Di APIYI apiyi.com, Anda dapat memanggil LLM ini dengan satu klik untuk pra-pemrosesan petunjuk.


VII. Kesimpulan: Konsensus Baru Petunjuk di Era Nano Banana 2

Kembali ke petunjuk berlebihan sepanjang 115 kata di awal artikel ini, sekarang kita tahu bahwa masalahnya bukan "terlalu detail", melainkan salah menempatkan jumlah kata:

  • Berlebihan ≠ Detail: Deskripsi detail yang sesungguhnya merujuk pada elemen visual yang konkret, bukan tumpukan kata sifat kualitas.
  • Nano Banana 2 tidak butuh 8K: Resolusi ditentukan oleh parameter API, menumpuk "8K, 4K, ultra-HD" dalam petunjuk tidak ada gunanya.
  • Parameter kamera adalah sugesti, bukan simulasi: Menulis "f/1.8" tidak akan benar-benar mensimulasikan karakteristik optik f/1.8, menulis "depth of field dangkal" jauh lebih efisien.
  • Pengulangan sinonim adalah kebisingan: Ucapkan satu konsep dengan kata yang paling tepat satu kali saja.
  • Ubah instruksi negatif menjadi positif: "Jangan X" ganti menjadi "Harus Y".
  • Letakkan inti di 50 kata pertama: gpt-image-2 memberikan bobot lebih tinggi pada bagian awal.
  • Hapus istilah rendering 3D: Adegan fotografi tidak memerlukan pencahayaan global atau ray tracing.

AI image generation tahun 2026 telah memasuki era "bahasa alami = petunjuk". Model modern seperti Nano Banana 2, gpt-image-2, dan Nano Banana Pro memberikan penghargaan pada deskripsi adegan yang jelas, bukan kumpulan kata sifat yang megah.

Kami menyarankan mulai hari ini, setiap kali menulis petunjuk, lakukan "pemeriksaan perampingan": Hapus semua kata yang jika dihapus tidak memengaruhi pemahaman visual. Apa yang tersisa adalah sinyal yang benar-benar dapat mengarahkan model. Dengan dukungan kemampuan akses terpadu untuk model gambar utama seperti Nano Banana 2, gpt-image-2, dan Nano Banana Pro yang disediakan oleh APIYI apiyi.com, Anda dapat melakukan pengujian A/B pada berbagai versi petunjuk ramping dengan biaya rendah dan dengan cepat membangun aset petunjuk Anda sendiri.


Tentang Penulis: Tim teknis APIYI, fokus menyediakan layanan akses API model bahasa besar AI yang stabil, transparan, dan mencakup segalanya bagi pengembang. Kunjungi situs resmi APIYI di apiyi.com untuk mempelajari solusi akses terbaru dan praktik terbaik petunjuk untuk model gambar utama seperti Nano Banana 2, gpt-image-2, Gemini 3 Pro, dan lainnya.

Similar Posts