Catatan Penulis: Analisis mendalam tentang batasan teknis dan solusi praktis untuk konsistensi wajah pada Nano Banana Pro, mencakup strategi gambar referensi, templat petunjuk, alur kerja pengeditan multi-putaran, serta metode iterasi frekuensi tinggi dengan biaya rendah $0,05/generasi melalui APIYI.
Saat menggunakan Nano Banana Pro untuk menghasilkan gambar model, keluhan yang paling umum adalah: "Wajahnya sering terdistorsi", "Tampak gemuk tanpa alasan", atau "Ganti latar belakang, orangnya jadi tidak terlihat seperti orang yang sama". Masalah-masalah ini ada solusinya, tetapi Anda perlu memahami satu premis penting terlebih dahulu: Nano Banana Pro saat ini tidak dapat mencapai konsistensi wajah 100% antar-generasi—setiap kali gambar dihasilkan, fitur wajah akan diparsing ulang. Ini adalah batasan pada level arsitektur model, bukan karena petunjuk yang ditulis dengan buruk.
Nilai Inti: Setelah membaca artikel ini, Anda akan memahami akar penyebab masalah konsistensi wajah, menguasai praktik terbaik tiga-dalam-satu yang menggabungkan strategi gambar referensi + kombinasi petunjuk + iterasi multi-putaran, serta cara menggunakan APIYI dengan biaya rendah $0,05/generasi untuk pengujian berulang demi menemukan solusi optimal.

4 Tips Perbaikan Inti
Tip 1: Strategi Gambar Referensi (Paling Penting)
Kualitas gambar referensi adalah faktor penentu konsistensi wajah, jauh lebih penting daripada petunjuk (prompt).
| Elemen Gambar Referensi | Standar Rekomendasi | Hindari |
|---|---|---|
| Resolusi | Di atas 1024×1024 | Gambar buram di bawah 512px |
| Pencahayaan | Cahaya depan yang merata, tanpa bayangan samping yang kuat | Cahaya latar (backlight), bayangan kuat di satu sisi |
| Sudut (Angle) | Satu foto tampak depan + satu foto samping 45° | Hanya menggunakan satu sudut saja |
| Halangan | Wajah terlihat sepenuhnya, tanpa kacamata/topi | Tangan menutupi wajah, rambut menutupi mata |
| Ekspresi | Ekspresi netral yang alami | Ekspresi berlebihan (mempengaruhi persepsi struktur wajah) |
Membangun pustaka gambar referensi 360° (Direkomendasikan untuk skenario model e-commerce):
Struktur folder gambar referensi:
model_ref/
├── front_neutral.jpg # Tampak depan, ekspresi netral
├── front_smile.jpg # Tampak depan, tersenyum
├── side_left_45.jpg # Sisi kiri 45°
├── side_right_45.jpg # Sisi kanan 45°
└── three_quarter.jpg # Sisi 3/4 (komposisi yang paling sering digunakan)
Setiap kali melakukan pembuatan (generate), unggah 2-3 gambar referensi (tampak depan + sudut yang paling mendekati komposisi target), dan jangan mengubah kombinasi gambar referensi setiap saat.
Tip 2: Optimasi Struktur Petunjuk
Menambahkan instruksi retensi wajah yang jelas adalah cara paling langsung untuk meningkatkan hasil melalui petunjuk:
❌ Cara penulisan yang salah (tanpa instruksi retensi):
"A young Asian woman wearing a red dress, studio lighting, 4K"
✅ Cara penulisan yang benar (dengan instruksi retensi lengkap):
"A young Asian woman wearing a red dress, studio lighting, 4K.
Preserve exact facial structure, eye shape, jawline, and skin texture
from reference image. Realistic skin with visible pores and texture,
not smooth or plastic. Natural face proportions, slim face shape.
Sharp eyes with natural highlights."
Petunjuk khusus untuk masalah "wajah tampak gemuk":
Tambahkan pada petunjuk positif:
"slim face, defined jawline, natural facial proportions,
realistic bone structure, angular cheekbones"
Konsep negatif (jelaskan efek yang ingin dihindari di akhir petunjuk):
Avoid: "fat face, round puffy cheeks, bloated face,
overly smooth skin, plastic skin, waxy appearance,
airbrushed, over-retouched, flat eyes, doll-like"
Kunci sudut komposisi (sangat krusial): Gunakan deskripsi sudut pandang fotografi yang sama setiap kali generate. Perubahan sudut adalah salah satu penyebab utama pemicu analisis ulang wajah:
Kalimat tetap yang direkomendasikan:
"3/4 portrait shot, eye-level camera angle,
medium close-up, [focal length: 85mm portrait lens equivalent]"
Tip 3: Alur Kerja Pengeditan Multi-tahap (Image-to-Image)
Jangan mencoba mendapatkan hasil sempurna dalam sekali jalan. Alur kerja profesional adalah "global dulu, baru lokal":
Ronde 1: Komposisi Global
→ Unggah gambar referensi + petunjuk lengkap
→ Hasilkan 3-5 variasi, pilih yang proporsi wajahnya paling mendekati
Ronde 2: Penyempurnaan Wajah (Image-to-Image)
→ Gunakan hasil terbaik dari ronde sebelumnya sebagai input gambar baru
→ Petunjuk fokus pada wajah: "Refine face detail,
sharpen eyes, maintain exact facial structure,
improve skin texture realism. Keep everything
else unchanged."
Ronde 3: Perbaikan Lokal (Jika perlu)
→ Perbaiki detail seperti tangan, helai rambut secara terpisah
→ Petunjuk: "Fix hands to have 5 fingers,
natural hand pose. Keep face and body unchanged."
🚀 Iterasi Biaya Rendah: Alur kerja multi-tahap berarti satu set gambar mungkin memerlukan 5-15 pemanggilan API. Melalui akses APIYI apiyi.com, setiap kali hanya $0,05. Total biaya untuk menghasilkan satu set foto model lengkap dapat dikontrol antara $0,25 – $0,75, jauh lebih hemat dibandingkan harga resmi yang mencapai $1,20 – $3,60 (hemat lebih dari 79%).
Tip 4: Parameter Generasi Tetap (Level Pemanggilan API)
Saat melakukan iterasi batch melalui API, menjaga konsistensi parameter berikut akan membantu mengurangi pergeseran acak:
import google.generativeai as genai
import base64
genai.configure(
api_key="YOUR_APIYI_KEY",
# Endpoint APIYI, $0,05/kali
client_options={"api_endpoint": "vip.apiyi.com"}
)
model = genai.GenerativeModel("gemini-3-pro-image-preview")
# Templat petunjuk konsistensi wajah yang tetap
FACE_CONSISTENCY_PROMPT = """
Fashion model in {outfit}, {scene}.
Preserve exact facial structure, eye shape, jawline, and skin texture
from reference image. Natural slim face proportions, defined cheekbones.
Realistic skin with visible pores, not airbrushed or plastic.
Sharp clear eyes with natural highlights. 3/4 portrait shot,
eye-level, 85mm portrait lens equivalent.
Avoid: fat face, puffy cheeks, overly smooth skin, flat eyes.
4K resolution, {aspect_ratio} aspect ratio.
"""
def generate_with_face_ref(
reference_image_path: str,
outfit: str,
scene: str,
output_path: str,
aspect_ratio: str = "2:3"
):
"""
Menggunakan gambar referensi untuk menghasilkan foto model dengan konsistensi wajah
Dipanggil melalui APIYI apiyi.com, $0,05/kali
"""
# Membaca gambar referensi
with open(reference_image_path, "rb") as f:
ref_data = base64.b64encode(f.read()).decode()
prompt = FACE_CONSISTENCY_PROMPT.format(
outfit=outfit, scene=scene, aspect_ratio=aspect_ratio
)
response = model.generate_content(
[
{
"inline_data": {
"mime_type": "image/jpeg",
"data": ref_data
}
},
prompt
],
generation_config=genai.GenerationConfig(
response_modalities=["IMAGE"],
resolution="4K",
aspect_ratio=aspect_ratio
)
)
for part in response.candidates[0].content.parts:
if part.inline_data and part.inline_data.mime_type.startswith("image/"):
with open(output_path, "wb") as f:
f.write(base64.b64decode(part.inline_data.data))
return output_path
return None
# Menghasilkan foto model di berbagai skenario secara batch (menggunakan referensi yang sama)
scenes = [
{"outfit": "white linen blazer", "scene": "minimalist studio, white background", "output": "model_studio.png"},
{"outfit": "casual denim jacket", "scene": "urban street, natural daylight", "output": "model_street.png"},
{"outfit": "elegant evening gown", "scene": "hotel lobby, warm ambient light", "output": "model_evening.png"},
]
for s in scenes:
result = generate_with_face_ref(
reference_image_path="model_ref/front_neutral.jpg",
outfit=s["outfit"],
scene=s["scene"],
output_path=s["output"]
)
print(f"{'✓' if result else '✗'} {s['output']}")
# 3 gambar, total biaya APIYI $0,15
Catatan:
vip.apiyi.comdalam kode adalah endpoint akses dari APIYI apiyi.com, yang sepenuhnya kompatibel dengan format asli Google Gemini tanpa perlu konversi format apa pun.
Pustaka Templat Petunjuk Lengkap
Berikut adalah templat petunjuk lengkap yang disusun untuk berbagai gaya pemotretan, yang dapat langsung Anda salin dan gunakan:
Templat A: Model Pakaian E-commerce (Latar Belakang Putih/Polos)
[Reference image: front-facing portrait of model]
Fashion model wearing {deskripsi_pakaian}, posed naturally against a clean
white studio background. Professional e-commerce product photography.
FACE PRESERVATION (critical):
- Preserve exact facial structure, bone geometry, and proportions
from reference image
- Maintain original eye shape, eyelid fold, and iris color
- Keep original jawline definition and chin shape
- Realistic skin texture with visible pores, natural micro-details
- Slim natural face shape matching reference — avoid any widening
PHOTOGRAPHY SETTINGS:
- 3/4 portrait shot, eye-level camera angle
- 85mm portrait lens equivalent, shallow depth of field
- Soft diffused studio lighting, Rembrandt lighting setup
- Model facing slightly left, engaging with camera
AVOID: fat face, puffy cheeks, bloated jaw, plastic skin,
airbrushed appearance, flat emotionless eyes, wax figure look.
Resolution: 4K, aspect ratio: 2:3
Templat B: Adegan Gaya Hidup/Model Luar Ruangan
[Reference image: front-facing portrait of model]
Young woman in {deskripsi_adegan}, wearing {deskripsi_pakaian}.
Lifestyle photography style, candid natural pose.
IDENTITY LOCK:
- This is the SAME person as in the reference image
- Preserve all facial features: eye shape, nose bridge width,
lip shape, jawline, cheekbone height
- Do not alter face geometry in any way
- Natural skin tone and texture, no over-smoothing
ENVIRONMENT: {detail_adegan}, natural daylight, golden hour lighting
POSE: {deskripsi_pose}, natural relaxed posture
QUALITY: editorial fashion photography, shot on full-frame camera,
natural color grading.
NEGATIVE: overweight appearance, fat face, double chin,
plastic surgery look, uncanny valley, distorted anatomy.
Resolution: 4K, aspect ratio: 4:5
Templat C: Penyempurnaan Multi-tahap (Image-to-Image)
[Input: previous generation result that needs face refinement]
Refine and improve the face in this image ONLY.
Do not change: background, clothing, body position, lighting.
FACE IMPROVEMENTS NEEDED:
1. Slim the face shape slightly, reduce cheek width by 10-15%
2. Sharpen the jawline definition
3. Add more realistic skin texture (visible pores, subtle imperfections)
4. Improve eye clarity — add natural catch lights, deepen iris color
5. Soften any plastic or over-retouched appearance
Keep all other elements 100% identical to the input image.
This is a targeted face-only refinement pass.
Resolution: 4K, same aspect ratio as input.
Daftar Periksa Mandiri Kualitas Gambar Referensi
Sebelum mengunggah gambar referensi, gunakan daftar ini untuk mengevaluasi apakah gambar tersebut memenuhi syarat:
| Item Pemeriksaan | Standar | Cara Penilaian Cepat |
|---|---|---|
| Resolusi | ≥ 1024×1024 px | Cek properti file |
| Proporsi Wajah | Wajah mencakup lebih dari 1/3 area gambar | Penilaian visual, gambar yang terlalu kecil hasilnya buruk |
| Pencahayaan Merata | Tidak ada cahaya samping yang kuat, kedua mata terlihat jelas | Cek apakah salah satu sisi wajah terlalu gelap |
| Sudut | Tampak depan atau maksimal samping 45° | Sudut samping lebih dari 60° menurunkan kualitas secara drastis |
| Halangan | Tidak ada rambut, kacamata, atau topi yang menutupi area kunci wajah | Pastikan mata, hidung, dan mulut semua terlihat |
| Ekspresi | Alami netral atau tersenyum | Hindari ekspresi berlebihan (tertawa sampai gusi terlihat, mengernyit, dll.) |
| Latar Belakang | Sederhana, kontras jelas dengan wajah | Latar belakang warna solid adalah yang terbaik |
| Kejelasan | Detail wajah (bulu mata, alis) terlihat jelas | Perbesar hingga 200% untuk mengecek |
Standar Penilaian:
- 8 poin terpenuhi → Kualitas gambar referensi sangat baik, konsistensi wajah maksimal
- 5-7 poin terpenuhi → Bisa digunakan, tapi hasilnya mungkin mengalami sedikit pergeseran (drift)
- Kurang dari 5 poin → Disarankan ganti gambar referensi, karena petunjuk terbaik pun akan memberikan hasil yang terbatas
💡 Saran Praktis: Disarankan untuk menghasilkan 3-5 gambar uji menggunakan satu gambar referensi sebelum mulai produksi massal secara resmi. Evaluasi secara manual apakah konsistensinya memenuhi kebutuhan bisnis sebelum memutuskan untuk lanjut ke produksi skala besar. Melalui tahap pengujian APIYI apiyi.com, total biayanya hanya sekitar $0.15-0.25, risiko sangat rendah.
Perbandingan Horizontal Konsistensi Wajah Berbagai Alat AI
| Alat | Konsistensi Wajah | Realisme | Kesulitan Kustomisasi | Skenario yang Cocok |
|---|---|---|---|---|
| Nano Banana Pro | ★★★☆☆ (Dibantu gambar referensi) | ★★★★★ | Rendah (Dukungan bawaan) | E-commerce/Fashion, toleransi sedikit pergeseran |
| Midjourney V7 | ★★☆☆☆ | ★★★★☆ | Sedang (Perlu trik khusus) | Kreasi artistik, tidak cocok untuk konsistensi ketat |
| Flux (Dev/Pro) | ★★★★☆ | ★★★★★ | Sedang | Potret realistis, kebutuhan konsistensi tinggi |
| Stable Diffusion + LoRA | ★★★★★ | ★★★☆☆ | Tinggi (Perlu pelatihan) | Konsistensi sangat tinggi, karakter spesifik tetap |
| InstantID / IP-Adapter | ★★★★★ | ★★★★☆ | Tinggi (Perlu deployment) | Penguncian wajah profesional, tingkat verifikasi ID |
| DALL-E 3 | ★★★☆☆ | ★★★★☆ | Rendah | Eksekusi petunjuk yang presisi, konsistensi standar |
💡 Saran Pemilihan: Jika skenario bisnis Anda mengizinkan pergeseran wajah 5-15% (seperti mengganti pakaian model e-commerce), Nano Banana Pro dengan teknik dalam artikel ini adalah solusi dengan rasio performa-harga terbaik. Jika butuh konsistensi sangat tinggi (karakter yang sama persis di 100 gambar), disarankan menggunakan alat khusus seperti Stable Diffusion + LoRA atau InstantID, yang bisa diuji dengan mudah melalui antarmuka multi-model APIYI apiyi.com.
Alur Kerja Lengkap untuk Model E-commerce
Kekhasan skenario e-commerce terletak pada: perlunya menjaga konsistensi model yang sama di berbagai set pakaian × berbagai latar belakang, sambil menghasilkan gambar secara massal dengan cepat.
Rekomendasi Alur Kerja
Tahap 1: Membangun Galeri Referensi (Pekerjaan sekali jalan)
1. Ambil atau siapkan 3-5 foto referensi model berkualitas tinggi
- Ekspresi netral tampak depan, resolusi 1024×1024 ke atas
- Samping 45° (kiri dan kanan)
- Samping 3/4 (paling sering digunakan untuk tampilan pakaian)
2. Beri nama yang seragam, simpan dalam folder tetap
3. Gunakan set foto referensi yang sama secara konsisten untuk setiap panggilan API
Tahap 2: Membuat Templat (Finalisasi Pertama)
1. Unggah 2 foto referensi (depan + samping 3/4)
2. Gunakan petunjuk yang dipertahankan sepenuhnya + deskripsi pakaian target
3. Hasilkan 5-10 variasi
4. Pilih secara manual 1-2 foto yang paling mendekati standar
5. Gunakan foto yang lolos sebagai "referensi final" untuk putaran berikutnya
Tahap 3: Ganti Pakaian Massal (Skalabilitas)
# Pembuatan massal berdasarkan referensi final, APIYI hanya $0.05 per gambar
outfits = ["Cheongsam Merah", "Setelan Putih", "Denim Kasual", "Gaun Malam"]
for outfit in outfits:
generate_with_face_ref(
reference_image_path="approved_ref.png", # Referensi final
outfit=outfit,
...
)
Tahap 4: Kontrol Kualitas dan Penyaringan
Lakukan pemeriksaan berikut setelah setiap batch output:
□ Apakah bentuk wajah mendekati foto referensi (fokus pada tulang pipi dan garis rahang)
□ Apakah mata terlihat hidup, pantulan cahaya (high-light) tampak alami
□ Apakah tekstur kulit terlihat nyata (bukan seperti patung lilin)
□ Apakah tangan normal (5 jari, pose alami)
□ Yang tidak lolos diperbaiki secara terpisah melalui Image-to-Image putaran kedua
🎯 Estimasi Biaya: 100 foto model e-commerce (termasuk 20% pengerjaan ulang yang tidak lolos), total biaya melalui APIYI apiyi.com sekitar $6, dibandingkan dengan situs resmi $28.8, hemat 79%.

Kontrol Biaya API untuk Iterasi Batch
Dalam produksi foto model, iterasi adalah hal yang tidak terhindarkan. Berikut adalah perbandingan estimasi biaya berdasarkan berbagai skala produksi:
| Skala Produksi | Total Panggilan (Termasuk Iterasi) | Biaya APIYI | Biaya Resmi Google | Hemat |
|---|---|---|---|---|
| Tes Skala Kecil (10 gambar) | ~30 kali | $1.50 | $7.20 | $5.70 |
| Proyek Menengah (50 gambar) | ~150 kali | $7.50 | $36.00 | $28.50 |
| E-commerce Besar (200 gambar) | ~600 kali | $30.00 | $144.00 | $114.00 |
| Pemeliharaan Bulanan (Iterasi Berkelanjutan) | ~2000 kali | $100.00 | $480.00 | $380.00 |
Tips Kontrol Biaya:
- Tes dengan resolusi 2K terlebih dahulu: Pastikan proporsi wajah sudah memuaskan sebelum pindah ke 4K untuk menghemat biaya iterasi (di APIYI, resolusi 1K/2K/4K semuanya dipatok $0.05).
- Panggilan konkuren batch: Gunakan
asynciountuk menjalankan 5-10 permintaan secara bersamaan guna mempercepat waktu produksi gambar massal. - Cache hasil pemrosesan gambar referensi secara lokal: Hindari membaca dan melakukan encoding ulang pada gambar referensi di setiap permintaan.
import asyncio
import google.generativeai as genai
import base64
genai.configure(
api_key="YOUR_APIYI_KEY",
client_options={"api_endpoint": "vip.apiyi.com"} # APIYI, $0.05/kali
)
model = genai.GenerativeModel("gemini-3-pro-image-preview")
# Encode gambar referensi terlebih dahulu (menghindari I/O berulang)
with open("model_ref/front_neutral.jpg", "rb") as f:
REF_IMAGE_DATA = base64.b64encode(f.read()).decode()
async def generate_one(prompt: str, output_path: str) -> bool:
"""Generasi asinkron tunggal"""
try:
loop = asyncio.get_event_loop()
response = await loop.run_in_executor(
None,
lambda: model.generate_content(
[
{"inline_data": {"mime_type": "image/jpeg", "data": REF_IMAGE_DATA}},
prompt
],
generation_config=genai.GenerationConfig(
response_modalities=["IMAGE"],
resolution="4K",
aspect_ratio="2:3"
)
)
)
for part in response.candidates[0].content.parts:
if part.inline_data and part.inline_data.mime_type.startswith("image/"):
with open(output_path, "wb") as f:
f.write(base64.b64decode(part.inline_data.data))
return True
except Exception as e:
print(f" Error: {e}")
return False
async def batch_generate(tasks: list) -> None:
"""Generasi batch konkuren, membatasi jumlah konkuren menjadi 5"""
sem = asyncio.Semaphore(5)
async def with_sem(t):
async with sem:
ok = await generate_one(t["prompt"], t["output"])
print(f"{'✓' if ok else '✗'} {t['output']}")
await asyncio.gather(*[with_sem(t) for t in tasks])
# Contoh penggunaan
tasks = [
{"prompt": "Model in red dress, white background... [petunjuk lengkap tetap dipertahankan]", "output": f"out_{i:03d}.png"}
for i in range(20)
]
asyncio.run(batch_generate(tasks))
# Generasi 20 gambar secara konkuren, total biaya APIYI $1.00
💰 Ringkasan Biaya: Melalui akses APIYI apiyi.com, meskipun melakukan banyak iterasi, biaya untuk satu set foto model tetap bisa ditekan di bawah $1. Ini jauh lebih murah dibandingkan menyewa fotografer atau berlangganan alat AI profesional lainnya.
Pertanyaan Umum (FAQ)
Q1: Petunjuk saya sudah sangat detail, kenapa wajahnya masih berubah-ubah atau distorsi?
Petunjuk hanyalah sebagian dari solusi. Tidak adanya gambar referensi adalah penyebab utamanya. Tanpa gambar referensi, Nano Banana Pro akan "menciptakan dari nol" sebuah wajah di setiap sesi, sehingga fitur wajah menjadi acak. Ini bukan masalah petunjuknya.
Langkah solusi:
- Siapkan 1-2 gambar referensi berkualitas tinggi (tampak depan, 1024px+, pencahayaan merata).
- Unggah gambar referensi bersamaan dengan petunjuk melalui interface image-to-image.
- Tambahkan kalimat ini secara eksplisit dalam petunjuk: "Preserve exact facial structure from reference image".
Melalui interface image-to-image di APIYI apiyi.com, cara mengunggah dan memanggil gambar referensi sama persis dengan kode yang ada di artikel ini.
Q2: Sudah pakai gambar referensi tapi wajahnya masih kelihatan gemuk, ada petunjuk negatif spesifik yang bisa dipakai?
Masalah "wajah gemuk" biasanya terjadi karena model terlalu melebarkan area pipi saat rendering. Gunakan kombinasi petunjuk negatif khusus berikut:
Tambahkan di akhir petunjuk (mendeskripsikan efek yang ingin dihindari):
Avoid generating: fat face, round puffy cheeks, bloated facial features,
chubby chin, double chin, wide jaw, swollen face appearance.
Maintain: slim face shape, defined angular jawline, high cheekbones,
natural facial bone structure matching reference image.
Selain itu, periksa gambar referensi Anda: Jika sudut pengambilan gambar referensi agak mendongak (low angle), model cenderung memperbesar area rahang. Gunakan gambar referensi dengan sudut pandang sejajar mata (eye level) untuk hasil yang lebih baik.
Q3: Antara Nano Banana Pro dan Stable Diffusion, mana yang lebih cocok untuk produksi massal foto model?
Keduanya cocok untuk kebutuhan yang berbeda:
| Dimensi | Nano Banana Pro + APIYI | Stable Diffusion + LoRA |
|---|---|---|
| Konsistensi Wajah | Dibantu gambar referensi, ada sedikit variasi | Sangat tinggi, hampir terkunci total |
| Tingkat Kesulitan | Sangat rendah, langsung panggil API | Tinggi, perlu melatih model LoRA |
| Biaya per Gambar | $0.05 (APIYI) | Perlu GPU sendiri atau platform berbayar |
| Kualitas Gambar | Native 4K, kualitas papan atas | Tergantung pada base model dan kualitas LoRA |
| Kecepatan Batch | Berbasis cloud, siap pakai kapan saja | Terbatas pada kemampuan GPU lokal |
| Skenario Cocok | Iterasi cepat, syarat konsistensi menengah | Karakter tetap, syarat konsistensi sangat tinggi |
Kesimpulan: Untuk memulai dengan cepat dan kebutuhan konsistensi menengah, pilih Nano Banana Pro + APIYI apiyi.com. Jika karakter sudah tetap dan butuh konsistensi yang sangat tinggi, pilih Stable Diffusion + LoRA.
Ringkasan
Poin-poin inti mengenai masalah konsistensi wajah pada Nano Banana Pro:
- Pahami batasan: Nano Banana Pro tidak bisa mencapai konsistensi wajah 100% di berbagai hasil generasi. Ini adalah batasan arsitektur, bukan masalah petunjuk (prompt).
- Prioritaskan gambar referensi: Gambar referensi berkualitas tinggi (1024px+, pencahayaan merata, berbagai sudut) adalah cara paling efektif untuk melakukan perbaikan, jauh lebih krusial daripada petunjuk.
- Penguatan petunjuk: Tambahkan instruksi retensi yang jelas (
Preserve facial structure) dan deskripsi negatif (Avoid fat face, plastic skin). - Iterasi multi-tahap: Mulai dari global lalu ke lokal, gunakan hasil terbaik dari tahap sebelumnya sebagai gambar referensi untuk tahap berikutnya guna mencapai hasil yang konsisten secara bertahap.
Saat ini belum ada solusi yang sempurna, namun kombinasi gambar referensi + petunjuk + iterasi multi-tahap dapat meningkatkan konsistensi dari "tidak dapat diterima" menjadi "layak untuk komersial". Direkomendasikan untuk mengakses melalui APIYI apiyi.com dengan biaya $0,05/kali, memungkinkan iterasi frekuensi tinggi dengan biaya rendah untuk menemukan kombinasi petunjuk yang optimal.
Referensi
-
Panduan Lengkap Konsistensi Karakter Nano Banana Pro
- Tautan:
wavespeed.ai/blog/posts/google-nano-banana-pro-complete-guide-2026 - Keterangan: Termasuk batasan jumlah gambar referensi dan penjelasan detail fitur Face Lock.
- Tautan:
-
Memperbaiki Masalah Wajah Lembek/Distorsi pada Nano Banana Pro
- Tautan:
skywork.ai/blog/how-to-fix-nano-banana-faces-softness-hands-eyes-guide-2025 - Keterangan: Pustaka petunjuk negatif dan praktik perbaikan multi-tahap.
- Tautan:
-
Generasi Gambar Fashion E-commerce Nano Banana Pro
- Tautan:
glbgpt.com/hub/how-to-create-ai-generated-fashion-images-for-ecommerce-using-nano-banana-pro - Keterangan: Alur kerja lengkap untuk pembuatan gambar model e-commerce secara massal.
- Tautan:
-
Dokumen Akses Platform APIYI
- Tautan:
docs.apiyi.com - Keterangan: Metode akses format asli Gemini, instruksi penggunaan API image-to-image.
- Tautan:
Penulis: Tim Teknis
Diskusi Teknis: Silakan bagikan pengalaman Anda dalam menyesuaikan konsistensi wajah di kolom komentar. Untuk tips pembuatan gambar AI lainnya, kunjungi komunitas teknis APIYI apiyi.com.
