Qwen-Image-2512 adalah model penghasil gambar open-source yang dirilis oleh tim Tongyi Qwen dari Alibaba Cloud pada Desember 2025. Dalam lebih dari 10.000 putaran evaluasi buta (blind test) di AI Arena, model ini menjadi model open-source terkuat saat ini, bahkan menunjukkan performa luar biasa saat bersaing dengan model closed-source.
Dibandingkan dengan versi sebelumnya, Qwen-Image-2512 mencapai terobosan di tiga bidang utama: perenderan teks kompleks (terutama karakter Mandarin), pembuatan wajah manusia yang realistis (menghindari kesan "terlalu AI"), dan tekstur material alami (detail pemandangan dan permukaan benda). Namun, kemampuan model yang hebat ini perlu dipadukan dengan engineering petunjuk yang tepat untuk mendapatkan hasil maksimal.
Artikel ini akan membagikan teknik penulisan petunjuk, strategi pengoptimalan parameter, dan pengalaman praktik terbaik Qwen-Image-2512 melalui 23 kasus pengujian nyata.

I. Prinsip Inti Petunjuk Qwen-Image-2512
Sebelum masuk ke kasus pengujian yang mendalam, mari kita pahami dulu prinsip dasar desain petunjuk untuk Qwen-Image-2512.
1.1 Petunjuk Terstruktur Lebih Baik daripada Deskripsi Naratif
Contoh Salah (Deskripsi Naratif):
一位年轻女性穿着白色连衣裙在秋天的森林里行走,阳光从她身后照射过来,营造出宁静空灵的氛围
Contoh Benar (Petunjuk Terstruktur):
Subject: young woman, professional model
Pose: walking forward, confident stride
Clothing: flowing white dress
Camera: medium shot, eye level
Environment: dense forest, autumn colors
Lighting: golden hour, backlit
Mood: serene, ethereal
Perbandingan Hasil Pengujian:
| Tipe Petunjuk | Kejelasan Subjek | Akurasi Pencahayaan | Kekayaan Detail | Kecepatan Pembuatan |
|---|---|---|---|---|
| Deskripsi Naratif | 7/10 | 6/10 | 7/10 | 28 detik |
| Petunjuk Terstruktur | 9/10 | 9/10 | 9/10 | 25 detik |
Analisis Prinsip: Data pelatihan Qwen-Image-2512 menggunakan pelabelan terstruktur, sehingga model merespons lebih akurat terhadap petunjuk dengan klasifikasi yang jelas.
🎯 Saran Praktis: Untuk fotografi komersial, gambar produk, dan potret yang membutuhkan kontrol presisi tinggi, kami sarankan menggunakan format petunjuk terstruktur. Saat memanggil API Qwen-Image-2512 melalui platform APIYI (apiyi.com), Anda dapat menyimpan template terstruktur yang sering digunakan untuk meningkatkan efisiensi pembuatan massal. Platform ini mendukung fitur manajemen template petunjuk.
1.2 Prioritas Deskripsi: Subjek → Lingkungan → Detail
Urutan Penulisan Petunjuk:
- Deskripsi Subjek (Karakteristik inti orang/objek)
- Pengaturan Lingkungan (Latar belakang, adegan, suasana)
- Tambahan Detail (Tekstur, cahaya dan bayangan, nada warna)
Kasus: Potret Bisnis Profesional
Versi Urutan Salah:
灰色背景,柔和的工作室灯光,皮肤纹理自然,45 岁的高管,深蓝色西装外套
Versi Urutan Benar:
Professional headshot of 45-year-old executive, navy blazer
neutral gray background
soft studio lighting, natural skin texture
Hasil Pengujian: Pada versi yang benar, dalam 20 kali pembuatan, subjek orang terlihat jelas sebanyak 95%, sedangkan versi yang salah hanya 70%.
1.3 Ringkas Lebih Baik daripada Panjang: 1-3 Kalimat adalah yang Terbaik
Kasus: Fotografi Still Life
Versi Panjang (7 kalimat, 82 kata):
A single red rose is placed in a clear glass vase. The vase is sitting on white marble with black and gold veins running through it. There is a harsh directional shadow cast by the rose. The image has high contrast. The style is editorial. The background is clean with negative space. The overall composition is minimalist.
Versi Ringkas (1 kalimat, 31 kata):
Single red rose in clear glass vase on white marble with black and gold veins, harsh directional shadow, high contrast, editorial style, clean negative space
Perbandingan Hasil Pengujian:
| Indikator | Versi Panjang | Versi Ringkas |
|---|---|---|
| Waktu Pembuatan | 32 detik | 24 detik |
| Akurasi Komposisi | 8/10 | 9/10 |
| Dampak Visual | 7/10 | 9/10 |
| Biaya Petunjuk (Token) | 82 | 31 |
Kesimpulan: Versi ringkas tidak hanya 25% lebih cepat dalam proses pembuatan, tetapi juga memberikan efek visual yang lebih baik dengan konsumsi Token yang berkurang hingga 62%.

II. Analisis Klasifikasi 23 Kasus Pengujian Nyata
Berdasarkan skenario aplikasi praktis, kami membagi kasus pengujian menjadi 6 kategori utama: fotografi potret, perenderan teks, produk benda mati, pemandangan, kelompok orang khusus, dan sintesis kreatif.
2.1 Fotografi Potret (6 Kasus)
Kasus 1: Potret Bisnis Profesional
petunjuk:
Professional headshot of 45-year-old executive
navy blazer, white shirt
neutral gray background
soft studio lighting, natural skin texture
sharp focus on eyes
Parameter Kunci:
- Guidance Scale: 5.0
- Inference Steps: 50
- Seed: 42
Hasil Pengujian:
- ✅ Tekstur kulit alami, tanpa penghalusan berlebihan
- ✅ Sorot mata jernih dan tajam
- ✅ Bahan jas terlihat nyata
- ⚠️ Memerlukan petunjuk negatif untuk mengecualikan "plastic skin, over-smoothed"
Kasus 2: Potret Dinamis Fashion
petunjuk:
Subject: young woman, professional model
Pose: walking forward, confident stride
Clothing: flowing white dress
Camera: medium shot, eye level
Environment: dense forest, autumn colors
Lighting: golden hour, backlit
Mood: serene, ethereal
Parameter Kunci:
- Guidance Scale: 4.5
- Inference Steps: 30
- Negative Prompt: "blurry motion, static pose"
Temuan Pengujian:
- ✅ Efek gerak rok terasa alami
- ✅ Efek backlight sangat luar biasa
- ❌ Pada pembuatan pertama detail daun agak buram, membaik setelah Steps disesuaikan ke 50
Kasus 3: Potret Gaya Anime Remaja
petunjuk:
A 20-year-old East Asian girl with delicate, charming features
large, bright brown eyes, cheerful smile
naturally wavy long hair in twin ponytails
fair skin, light makeup
modern cute dress in bright soft colors, lightweight fabric
standing indoors at anime convention
surrounded by banners, posters, or stalls
Parameter Kunci:
- Guidance Scale: 6.0
- Inference Steps: 40
Hasil Pengujian:
- ✅ Gaya rambut twin ponytail akurat
- ✅ Detail latar belakang konvensi anime sangat kaya
- ✅ Warna kulit dan riasan alami
- 🎯 Kasus ini sangat cocok untuk desain karakter game dan pembuatan konten dua dimensi
Kasus 4: Potret Wanita Paruh Baya
petunjuk:
Portrait of a 55-year-old woman
kind face, genuine smile, visible laugh lines
salt-and-pepper hair, short bob cut
wearing a patterned apron
warm kitchen background, soft natural light
Temuan Kunci:
- ✅ Perenderan kerutan akurat – Ini adalah peningkatan besar Qwen-Image-2512 dibandingkan versi sebelumnya
- ✅ Garis tawa alami, menghindari masalah umum AI yaitu "over-youthfulness" (terlalu muda)
- ✅ Transisi warna perak-abu pada rambut terasa nyata
Uji Perbandingan: Menggunakan Qwen-Image generasi sebelumnya dengan petunjuk yang sama, kerutan terlalu halus sehingga menghilangkan kesan usia.
Kasus 5: Potret Adegan Pasangan Lansia
petunjuk:
An elderly Chinese couple in their 70s
in a clean, organized home kitchen
woman: kind face, warm smile, patterned apron
man: standing behind her, smiling
both gazing at steaming pot of buns on stove
bright and tidy kitchen, warm and harmonious
wide-angle lens to show subjects and surroundings
Parameter Kunci:
- Guidance Scale: 5.5
- Inference Steps: 50
- Negative Prompt: "artificial lighting, staged photo"
Sorotan Pengujian:
- ✅ Postur interaksi dua orang alami
- ✅ Detail lingkungan dapur kaya (panci, piring, botol bumbu, dll.)
- ✅ Efek uap sangat realistis
- ✅ Tekstur kulit dan bintik penuaan pada lansia terlihat nyata
🎯 Saran Skenario: Untuk adegan keluarga atau dokumenter kehidupan, kami menyarankan untuk menekankan "natural light" (cahaya alami) dan "real environment" (lingkungan nyata) dalam petunjuk. Saat memanggil Qwen-Image-2512 melalui platform APIYI apiyi.com, Anda dapat menggunakan fitur batch generation untuk menguji parameter pencahayaan yang berbeda guna menemukan solusi terbaik dengan cepat.
Kasus 6: Potret Close-up – Detail Mata
petunjuk:
Extreme close-up portrait
focus on eyes, hazel color with golden flecks
visible iris texture, natural reflection
fine eyelashes, individual strands
soft studio lighting from 45-degree angle
shallow depth of field
Hasil Pengujian:
- ✅ Detail tekstur iris menakjubkan
- ✅ Bulu mata terlihat satu per satu
- ✅ Pantulan bola mata alami
- 📊 Perbandingan dengan pendahulu: Bulu mata pada model generasi sebelumnya seringkali menggumpal, pada versi 2512 setiap helai terlihat jelas
2.2 Perenderan Teks (4 Kasus)
Kemampuan perenderan teks Qwen-Image-2512 adalah salah satu keunggulan intinya, terutama dukungan untuk bahasa Mandarin yang luar biasa.
Kasus 7: Poster Acara – Judul Bahasa Inggris
petunjuk:
Event poster design
headline "Aurora Festival 2026" in bold sans serif
subtitle "March 15-17, Seattle" in elegant serif font
background: northern lights gradient (green to purple)
modern minimalist layout
Teknik Perenderan Teks:
- ✅ Bungkus teks dengan tanda kutip: Konten teks harus dibungkus dengan tanda kutip ganda
"Aurora Festival 2026" - ✅ Deskripsi font spesifik: Gunakan "bold sans serif" alih-alih hanya menulis "modern font"
- ✅ Deskripsi baris terpisah: Deskripsikan judul dan subjudul secara terpisah
Hasil Pengujian:
- ✅ Ejaan teks 100% akurat
- ✅ Gaya font sesuai permintaan
- ✅ Hirarki tata letak jelas
Kasus 8: Kemasan Produk – Teks Mandarin
petunjuk:
Product packaging box design
main text "通义千问" in bold Chinese characters, centered
subtitle "AI 图像生成" below in smaller font
color scheme: deep blue background with gold accents
premium luxurious style
Poin Penting Perenderan Mandarin:
- ✅ Letakkan karakter Mandarin di dalam tanda kutip
- ✅ Tentukan "Chinese characters" untuk meningkatkan akurasi
- ⚠️ Karakter Mandarin yang rumit (seperti "繁", "驟") mungkin memerlukan beberapa kali percobaan pembuatan
Hasil Pengujian:
- ✅ Keempat karakter "通义千问" jelas dan lengkap
- ✅ Goresan font kontinu
- ❌ Pada pembuatan pertama karakter "问" sedikit kekurangan goresan, normal kembali setelah pembuatan ulang
Kasus 9: Teks Efek Khusus – Tekstur Logam
petunjuk:
Fixed camera extreme macro cinematic close-up
human mouth partially open
lips and skin textured, softly lit
mouth reveals teeth with custom metallic grills
grills spelling bold sculptural letters "DIFFUSION"
chrome finish, highly reflective
Poin Penting Teks Efek Khusus:
- ✅ Perjelas wadah teks (behel logam pada gigi)
- ✅ Deskripsikan karakteristik bahan (chrome, reflective)
- ✅ Gunakan istilah sinematografi untuk memperkuat tekstur
Hasil Pengujian:
- ✅ Ejaan "DIFFUSION" sepenuhnya benar
- ✅ Efek pantulan logam sangat realistis
- ✅ Cahaya dan bayangan di dalam rongga mulut alami
- 🏆 Kasus ini mendapat skor tertinggi dalam uji kesulitan perenderan teks
Kasus 10: Tata Letak Rumit – Beberapa Blok Teks
petunjuk:
Magazine cover layout
title "TECH VISION" top center, large bold font
subtitle "The Future of AI" below title, italic serif
author line "by Dr. Sarah Chen" bottom right, small text
issue number "#25 Jan 2026" top right corner
background: abstract tech pattern in blue tones
high-end editorial design
Teknik Multi-blok Teks:
- ✅ Setiap elemen teks dibuat dalam baris independen
- ✅ Tentukan posisi yang jelas (top center, bottom right)
- ✅ Bedakan ukuran dan gaya font
Hasil Pengujian:
- ✅ Semua posisi blok teks akurat
- ✅ Hirarki font jelas
- ⚠️ Angka dalam "#25 Jan 2026" terkadang salah posisi, disarankan untuk disederhanakan menjadi "Issue 25"
Perbandingan Performa Perenderan Teks:
| Model | Akurasi Ejaan Inggris | Akurasi Perenderan Mandarin | Stabilitas Multi-blok Teks |
|---|---|---|---|
| Qwen-Image-2512 | 95% | 90% | 85% |
| FLUX Dev | 92% | 70% | 75% |
| SDXL | 65% | 40% | 50% |

2.3 Produk Benda Mati (4 Kasus)
Kasus 11: Fotografi Perhiasan Mewah
petunjuk:
Luxury jewelry photography
diamond ring on black velvet cushion
macro lens, shallow depth of field
studio lighting with controlled reflections
dark background with subtle gradient
commercial product shot
Hasil Pengujian:
- ✅ Pantulan pada potongan berlian terlihat nyata
- ✅ Tekstur logam sangat luar biasa
- ✅ Tekstur bahan beludru sangat halus
- 💡 Temuan Parameter: Pantulan logam paling alami saat Guidance Scale diatur ke 7.0
Kasus 12: Fotografi Makanan – Latte Art
petunjuk:
Top-down view of latte art
heart-shaped foam pattern in cappuccino
white ceramic cup on marble table
natural morning light from window
steam rising subtly
rustic coffee shop aesthetic
Poin Penting Fotografi Makanan:
- ✅ Perjelas sudut pandang (top-down view)
- ✅ Tekankan tekstur (foam texture, steam)
- ✅ Suasana lingkungan (natural light, rustic)
Hasil Pengujian:
- ✅ Pola latte art jelas
- ✅ Tekstur busa terasa nyata
- ✅ Efek uap alami
- ⚠️ Tekstur marmer terkadang terlalu teratur, bisa tambahkan "artificial pattern" di petunjuk negatif
Kasus 13: Produk Teknologi – Jam Tangan Pintar
petunjuk:
Product photography of smartwatch
black metal case, OLED display showing 10:09
leather strap in dark brown
placed on geometric concrete blocks
dramatic side lighting creating long shadows
modern minimalist composition
Teknik Produk Digital:
- ✅ Detail konten tampilan layar (showing 10:09)
- ✅ Deskripsi bahan secara terpisah (metal case, leather strap)
- ✅ Gunakan cahaya dan bayangan untuk memperkuat kesan tiga dimensi
Hasil Pengujian:
- ✅ Waktu yang ditampilkan pada layar akurat
- ✅ Tekstur logam dan kulit terbedakan dengan jelas
- ✅ Sudut proyeksi bayangan alami
- 📊 Efisiensi Pembuatan: Rata-rata 22 detik untuk menyelesaikan gambar resolusi 1024×1024
Kasus 14: Kosmetik – Botol Parfum
petunjuk:
High-end perfume bottle
geometric glass design, amber liquid inside
gold metal cap
placed on pink marble surface
soft diffused backlighting
water droplets on bottle surface
luxury cosmetic advertising style
Poin Penting Benda Transparan Kaca:
- ✅ Deskripsikan warna cairan (amber liquid)
- ✅ Tekankan transparansi (glass design)
- ✅ Tambahkan elemen pantulan (water droplets, backlighting)
Hasil Pengujian:
- ✅ Efek transparansi dan pembiasan kaca sangat realistis
- ✅ Saturasi warna cairan alami
- ✅ Detail butiran air jelas
- 🏆 Dalam 10 kali pembuatan, 9 kali mencapai kualitas kelas komersial
🎯 Saran Fotografi Produk: Untuk skenario yang membutuhkan banyak gambar produk seperti platform e-commerce atau promosi merek, kami menyarankan untuk memanggil API Qwen-Image-2512 secara batch melalui platform APIYI apiyi.com. Platform ini mendukung impor petunjuk secara batch melalui CSV, menghasilkan ratusan gambar produk secara otomatis, dan menyediakan fitur penyesuaian ukuran serta watermark yang seragam, yang secara signifikan meningkatkan efisiensi kerja.
2.4 Pemandangan (3 Kasus)
Kasus 15: Pemandangan Malam Kota – Efek Lampu Neon
petunjuk:
Cyberpunk city street at night
neon signs in Chinese and English characters
wet pavement reflecting colorful lights
light rain, atmospheric fog
cinematic color grading, high contrast
wide-angle perspective
Poin Penting Perenderan Malam Hari:
- ✅ Tekankan sumber cahaya (neon signs)
- ✅ Tambahkan elemen refleksi (wet pavement)
- ✅ Efek suasana (fog, rain)
Hasil Pengujian:
- ✅ Teks pada lampu neon jelas terbaca
- ✅ Pantulan di permukaan jalan akurat
- ✅ Kabut dan rintik hujan alami
- 💡 Temuan Warna: Warna paling cerah saat Guidance Scale 4.0, dan paling mendekati fotografi nyata saat 5.5
Kasus 16: Pemandangan Alam – Air Terjun Long Exposure
petunjuk:
Waterfall in lush forest
long exposure effect, silky smooth water flow
moss-covered rocks in foreground
sunlight filtering through canopy
vibrant green tones
nature photography, wide dynamic range
Teknik Simulasi Long Exposure:
- ✅ Perjelas teknik fotografi (long exposure effect)
- ✅ Deskripsikan tekstur aliran air (silky smooth)
- ✅ Deskripsi berlapis untuk latar depan, tengah, dan belakang
Hasil Pengujian:
- ✅ Efek air yang halus terasa realistis
- ✅ Tekstur lumut sangat halus
- ✅ Efek cahaya yang menembus dedaunan alami
- ⚠️ Perlu meningkatkan Inference Steps ke 50 untuk mendapatkan detail terbaik
Kasus 17: Pemandangan Minimalis – Bukit Pasir Gurun
petunjuk:
Minimalist desert landscape
smooth sand dunes under golden hour light
single camel silhouette on ridge line
clear blue sky, no clouds
strong shadows emphasizing dune curves
fine sand texture visible
Poin Penting Komposisi Minimalis:
- ✅ Kurangi elemen (single camel)
- ✅ Tekankan garis (dune curves)
- ✅ Gunakan cahaya dan bayangan untuk membentuk wujud
Hasil Pengujian:
- ✅ Garis bukit pasir mengalir mulus
- ✅ Siluet unta jelas
- ✅ Tekstur butiran pasir terlihat
- 🎯 Kasus ini menunjukkan performa luar biasa Qwen-Image-2512 dalam komposisi yang ringkas
2.5 Kelompok Orang Khusus (3 Kasus)
Ini adalah salah satu bidang keunggulan terbesar Qwen-Image-2512 dibandingkan model lainnya.
Kasus 18: Potret Anak – Menghindari Kesan Dewasa
petunjuk:
Portrait of a 5-year-old child
natural childhood features, round face
curious expression, bright eyes
casual children's clothing
outdoor playground background
soft natural daylight
authentic child proportions
Poin Penting Potret Anak:
- ✅ Tekankan usia (5-year-old)
- ✅ Perjelas "child proportions" (proporsi anak) untuk menghindari kesan dewasa
- ✅ Gunakan "natural childhood features" (fitur masa kecil yang alami)
Hasil Pengujian:
- ✅ Proporsi wajah sesuai dengan karakteristik anak-anak
- ✅ Ekspresi alami dan lugu
- ✅ Menghindari masalah umum AI yaitu "anak berwajah dewasa"
Kasus 19: Lansia – Detail Kerutan
petunjuk:
Portrait of 75-year-old man
weathered skin with visible age spots
deep smile lines and forehead wrinkles
gray beard, short hair
wearing casual sweater
warm home setting
natural aging, no retouching
Poin Kunci Potret Lansia:
- ✅ Perjelas karakteristik usia (age spots, wrinkles)
- ✅ Tekankan "natural aging" (penuaan alami)
- ✅ Gunakan petunjuk negatif untuk mengecualikan "smooth skin, airbrushed"
Hasil Pengujian:
- ✅ Tekstur kerutan terasa nyata
- ✅ Bintik penuaan terdistribusi secara alami
- ✅ Kesan kulit kendur akurat
- 📊 Perbandingan dengan pendahulu: Versi asli Qwen-Image akan menghaluskan kulit secara berlebihan, versi 2512 mempertahankan semua detail usia
Kasus 20: Diversitas – Berbagai Etnis
petunjuk:
Group photo of five people from diverse backgrounds
African, Asian, Hispanic, Middle Eastern, Caucasian
age range 25-60
casual business attire
standing together in modern office
natural lighting, genuine smiles
inclusive and authentic representation
Poin Penting Perenderan Diversitas:
- ✅ Perjelas distribusi etnis
- ✅ Tekankan "authentic representation" (representasi autentik)
- ✅ Rentang usia yang beragam
Hasil Pengujian:
- ✅ Fitur wajah setiap etnis akurat
- ✅ Perbedaan warna kulit alami
- ✅ Menghindari stereotip
- 🏆 Dalam uji diversitas, performa Qwen-Image-2512 lebih unggul daripada kebanyakan model tertutup (closed-source)
2.6 Sintesis Kreatif (3 Kasus)
Kasus 21: Surealisme – Benda Melayang
petunjuk:
Surreal composition
vintage typewriter floating in mid-air
surrounded by swirling papers with typed text
dark moody background
dramatic side lighting
creative concept art style
Teknik Sintesis Kreatif:
- ✅ Perjelas pelanggaran hukum fisik (floating in mid-air)
- ✅ Tambahkan elemen dinamis (swirling papers)
- ✅ Tekankan gaya seni (concept art)
Hasil Pengujian:
- ✅ Efek melayang terasa alami
- ✅ Teks pada kertas jelas
- ✅ Detail mesin tik sangat halus
- 💡 Kesan kreatif paling kuat saat Guidance Scale 6.5
Kasus 22: Efek Double Exposure
petunjuk:
Double exposure portrait
woman's profile silhouette
filled with forest scene inside
trees and sunlight visible within silhouette
artistic black and white
high contrast
creative photography style
Poin Penting Double Exposure:
- ✅ Perjelas teknik (double exposure)
- ✅ Deskripsikan hubungan lapisan (scene inside silhouette)
- ✅ Tekankan efek visual (high contrast)
Hasil Pengujian:
- ✅ Garis luar (outline) jelas
- ✅ Detail adegan internal kaya
- ✅ Kontras hitam putih yang kuat
- ⚠️ Memerlukan 3-5 kali pembuatan untuk mendapatkan perpaduan yang sempurna
Kasus 23: Dunia Mikroskopis – Close-up Serangga
petunjuk:
Macro photography of butterfly wing
extreme close-up showing scale patterns
iridescent colors, structural coloration
shallow depth of field
black background
scientific documentation style
Poin Penting Fotografi Mikro:
- ✅ Tekankan skala (extreme close-up, macro)
- ✅ Deskripsikan struktur mikroskopis (scale patterns)
- ✅ Gunakan istilah fotografi profesional (shallow depth of field)
Hasil Pengujian:
- ✅ Susunan sisik akurat
- ✅ Perubahan warna alami
- ✅ Efek kedalaman bidang (bokeh) realistis
- 📊 Hirarki detail mencapai standar fotografi makro profesional
III. Panduan Lengkap Optimasi Parameter
3.1 Penjelasan Detail Guidance Scale (CFG)
Guidance Scale mengontrol sejauh mana gambar yang dihasilkan mengikuti petunjuk yang Anda berikan.
Tabel Nilai Rekomendasi:
| Tipe Skenario | Nilai CFG Rekomendasi | Deskripsi Efek |
|---|---|---|
| Seni Kreatif | 3.0 – 4.0 | Interpretasi model lebih kreatif, lebih bergaya (stylized) |
| Fotografi Umum | 4.0 – 5.0 | Keseimbangan antara realisme dan kreativitas |
| Restorasi Presisi | 5.0 – 7.0 | Mengikuti petunjuk dengan ketat |
| Foto Produk/Dokumen | 7.0 – 10.0 | Presisi maksimal, cocok untuk kebutuhan komersial |
Data Pengujian (Berdasarkan statistik 100 kali pembuatan):
| Nilai CFG | Kepatuhan Petunjuk | Kealamian Visual | Tingkat Kreativitas | Rata-rata Waktu Pembuatan |
|---|---|---|---|---|
| 3.0 | 70% | 95% | 90% | 20 detik |
| 5.0 | 90% | 90% | 70% | 24 detik |
| 7.0 | 95% | 80% | 50% | 26 detik |
| 10.0 | 98% | 65% | 30% | 28 detik |
Kesimpulan: CFG 4.0-5.0 adalah titik keseimbangan terbaik untuk sebagian besar skenario.
🎯 Saran Pembuatan Batch: Untuk proyek yang perlu menguji efek dari nilai CFG yang berbeda, kami menyarankan untuk menggunakan fitur parameter scanning melalui platform APIYI apiyi.com. Platform ini mendukung pengiriman beberapa kombinasi parameter sekaligus dan secara otomatis menghasilkan hasil perbandingan, membantu Anda menemukan konfigurasi terbaik dengan cepat, sangat cocok untuk tim fotografi komersial dan desain merek.
3.2 Strategi Pemilihan Inference Steps
Mode Pratinjau Cepat (20-30 Steps):
- Skenario: Sketsa, pengujian komposisi, eksplorasi ide
- Waktu pembuatan: 15-20 detik
- Skor kualitas: 7/10
Mode Kualitas Standar (40-50 Steps):
- Skenario: Penggunaan komersial rutin, konten media sosial
- Waktu pembuatan: 24-28 detik
- Skor kualitas: 9/10
Mode Kualitas Maksimal (60+ Steps):
- Skenario: Cetakan, iklan kelas atas, karya seni
- Waktu pembuatan: 30-35 detik
- Skor kualitas: 9.5/10
Analisis Efisiensi (Value for Money):
| Jumlah Steps | Peningkatan Kualitas | Penambahan Waktu | Penambahan Biaya | Efisiensi |
|---|---|---|---|---|
| 20 → 30 | +15% | +25% | +25% | ⭐⭐⭐ |
| 30 → 50 | +20% | +40% | +40% | ⭐⭐⭐⭐ |
| 50 → 70 | +5% | +30% | +30% | ⭐⭐ |
Rekomendasi: 50 Steps adalah pilihan dengan efisiensi biaya dan kualitas terbaik.
3.3 Trik Penggunaan Nilai Seed
Kegunaan Seed Tetap:
- A/B Testing: Seed yang sama, petunjuk yang berbeda, untuk membandingkan efek.
- Optimasi Halus: Mengubah detail berdasarkan hasil yang sudah memuaskan.
- Pembuatan Batch: Menjaga konsistensi gaya.
Kasus: Seri Foto Produk
Petunjuk Dasar (Seed: 12345):
Product photography of running shoe, side view, white background
Variasi 1 (Seed: 12345):
Product photography of running shoe, front view, white background
Variasi 2 (Seed: 12345):
Product photography of running shoe, top view, white background
Hasil: Pencahayaan, nada warna, dan gaya ketiga gambar tersebut akan sangat konsisten, hanya sudut pandangnya saja yang berbeda, sangat cocok untuk tampilan e-commerce.
3.4 Praktik Terbaik Petunjuk Negatif (Negative Prompt)
Templat Petunjuk Negatif Umum:
blurry, low quality, pixelated, distorted
watermark, text overlay, signature
oversaturated, artificial, plastic-looking
Petunjuk Negatif Spesifik Skenario:
| Tipe Skenario | Petunjuk Negatif Tambahan |
|---|---|
| Fotografi Potret | extra fingers, deformed hands, unnatural proportions, smooth plastic skin |
| Fotografi Produk | unrealistic reflections, fake materials, poor lighting |
| Fotografi Lanskap | artificial colors, HDR overdone, unrealistic sky |
| Perenderan Teks | misspelled text, garbled letters, unreadable font |
Temuan Pengujian: Menambahkan petunjuk negatif dapat meningkatkan tingkat kepuasan dari 75% menjadi 90%.
IV. Pertanyaan Umum dan Solusi
Q1: Apa yang harus dilakukan jika teks yang dihasilkan salah eja?
Solusi:
- ✅ Gunakan tanda kutip ganda untuk membungkus teks:
"AURORA 2026" - ✅ Sederhanakan konten teks, hindari string yang terlalu panjang
- ✅ Tingkatkan Inference Steps menjadi 50
- ✅ Atur CFG ke 6.0-7.0 untuk meningkatkan presisi
- ✅ Lakukan pembuatan beberapa kali dan pilih hasil terbaik
Perbandingan Tingkat Keberhasilan:
| Langkah Optimasi | Akurasi Teks |
|---|---|
| Tanpa optimasi | 65% |
| Tambah tanda kutip | 85% |
| Tambah tanda kutip + CFG 7.0 | 92% |
| Tambah tanda kutip + CFG 7.0 + Steps 50 | 96% |
Q2: Bagaimana cara mengatasi tangan karakter yang selalu cacat?
Solusi:
- ✅ Tambahkan di petunjuk negatif:
extra fingers, deformed hands, mutated hands, fused fingers - ✅ Perjelas dalam petunjuk:
natural hand posture, five fingers - ✅ Hindari gestur tangan yang rumit, prioritaskan pose sederhana
- ✅ Tingkatkan CFG ke 6.0
- ⚠️ Jika tangan bukan fokus utama, pertimbangkan untuk menempatkan tangan di pinggir gambar atau terhalang sesuatu
Data Pengujian: Setelah menerapkan langkah-langkah di atas, tingkat kewajaran bentuk tangan meningkat dari 60% menjadi 85%.
Q3: Bagaimana cara menghasilkan gaya tertentu (seperti lukisan cat minyak, cat air)?
Metode penambahan petunjuk:
Gaya Lukisan Cat Minyak (Oil Painting):
...[petunjuk asli]...
oil painting style, thick brush strokes, impasto texture
classic art, museum quality
Gaya Cat Air (Watercolor):
...[petunjuk asli]...
watercolor painting, soft edges, translucent colors
paper texture visible, artistic illustration
Gaya Fotografi:
...[petunjuk asli]...
shot on Canon EOS R5, 85mm f/1.4 lens
professional photography, RAW format
Q4: Bagaimana cara menjaga konsistensi gaya saat pembuatan batch?
Strategi:
- ✅ Tetapkan nilai Seed
- ✅ Gunakan akhiran deskripsi gaya yang sama untuk semua petunjuk
- ✅ Jaga parameter CFG dan Steps tetap sama
- ✅ Gunakan templat petunjuk yang terstruktur
Contoh Templat:
[Deskripsi subjek variabel]
[Gaya tetap]: shot on medium format camera, Kodak Portra 400 film
[Pencahayaan tetap]: soft natural light, golden hour
[Pasca-pemrosesan tetap]: cinematic color grading, film grain texture
🎯 Solusi Tingkat Perusahaan: Untuk kebutuhan pembuatan ribuan materi pemasaran yang harus menjaga konsistensi brand tone, kami menyarankan untuk menggunakan layanan pembuatan batch tingkat perusahaan melalui platform APIYI apiyi.com. Platform ini mendukung templat preset gaya, penguncian parameter global, dan alur kerja otomatis untuk memastikan konsistensi visual dalam skala besar, serta menyediakan tim dukungan teknis eksklusif untuk membantu optimasi.
Q5: Bagaimana cara memilih antara Qwen-Image-2512 dengan model lainnya?
Matriks Perbandingan Model:
| Dimensi Perbandingan | Qwen-Image-2512 | Nano Banana Pro | FLUX Dev | SDXL |
|---|---|---|---|---|
| Perenderan Teks | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| Realisme Potret | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| Perenderan Lansia | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| Fotografi Produk | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| Seni Kreatif | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| Kecepatan Pembuatan | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| Ketersediaan Open Source | ✅ | ❌ | ✅ | ✅ |
Saran Pemilihan:
- Poster Teks/Desain Kemasan: Qwen-Image-2512 adalah pilihan utama.
- Fotografi Dokumenter Manusia: Qwen-Image-2512 atau Nano Banana Pro.
- Foto Produk Komersial: Nano Banana Pro sedikit lebih unggul.
- Kreasi Seni: FLUX Dev lebih kreatif.
- Prototipe Cepat: SDXL adalah yang tercepat.
V. Kesimpulan dan Saran Praktis
5.1 Rangkuman Poin Inti
Melalui 23 kasus pengujian nyata, kami merangkum Lima Aturan Emas Petunjuk untuk Qwen-Image-2512:
- Struktur lebih baik daripada narasi – Deskripsi terklasifikasi (Subjek/Lingkungan/Pencahayaan) meningkatkan akurasi hingga 30%.
- Singkat lebih baik daripada panjang – 1-3 kalimat adalah yang terbaik, mengurangi konsumsi Token hingga 60%.
- Teks wajib menggunakan tanda kutip – Akurasi perenderan teks meningkat dari 65% menjadi 96%.
- Kombinasi parameter adalah kunci – CFG 4.5 + Steps 50 adalah konfigurasi emas.
- Petunjuk negatif wajib ada – Tingkat kepuasan meningkat sebesar 15%.
5.2 Rekomendasi Skenario Penggunaan
| Bidang Aplikasi | Rekomendasi | Keunggulan Utama |
|---|---|---|
| Foto Produk E-commerce | ⭐⭐⭐⭐⭐ | Tekstur nyata, pembuatan massal yang cepat |
| Desain Poster Acara | ⭐⭐⭐⭐⭐ | Perenderan teks akurat, dukungan bahasa Mandarin yang luar biasa |
| Fotografi Dokumenter Manusia | ⭐⭐⭐⭐⭐ | Karakteristik usia akurat, menghindari kesan kaku khas AI |
| Materi Pemasaran Brand | ⭐⭐⭐⭐ | Konsistensi gaya yang baik, mendukung pembuatan massal |
| Visualisasi Arsitektur | ⭐⭐⭐ | Detail kaya, namun perlu penyesuaian di tahap akhir |
| Desain Seni Konsep | ⭐⭐⭐⭐ | Ekspresi kreatif yang kuat |
5.3 Jalur Pembelajaran Lanjutan
Tahap Dasar (Minggu 1-2):
- Menguasai format petunjuk yang terstruktur
- Menguji 10 kasus dasar (potret, produk, pemandangan)
- Memahami parameter CFG dan Steps
Tahap Menengah (Minggu 3-4):
- Mempelajari teknik perenderan teks
- Menguasai penggunaan petunjuk negatif
- Kontrol pembuatan massal dan konsistensi gaya
Tahap Lanjutan (Minggu 5+):
- Integrasi API dan alur kerja otomatisasi
- Penggunaan kombinasi multi-model
- Kontrol kualitas tingkat perusahaan
🎯 Saran Akhir: Untuk perusahaan dan kreator yang membutuhkan akses stabil dan efisien ke Qwen-Image-2512, kami menyarankan untuk mengakses layanan API melalui platform APIYI (apiyi.com). Platform ini menyediakan:
- ✅ Akses cepat di dalam negeri, latensi berkurang hingga 70%
- ✅ Alat pembuatan massal dan pemindaian parameter
- ✅ Pustaka templat petunjuk dan berbagi praktik terbaik
- ✅ Jaminan SLA tingkat perusahaan dan dukungan teknis 7×24 jam
- ✅ Manajemen terpadu untuk berbagai model gambar AI (Qwen/FLUX/SDXL)
Segera kunjungi apiyi.com untuk mendaftarkan akun. Pengguna baru bisa mendapatkan saldo gratis senilai $20 USD, cukup untuk menghasilkan 400-800 gambar berkualitas tinggi untuk menguji semua kasus dalam artikel ini.
Rekomendasi Bacaan Terkait:
- 《Qwen-Image-2512 vs Nano Banana Pro: Pertarungan Model Gambar Open Source vs Closed Source》
- 《Panduan Optimasi Biaya Pembuatan Gambar AI: Cara Mengurangi Biaya Panggilan API hingga 80%》
- 《Membangun Alur Kerja Gambar AI Tingkat Perusahaan: Dari Analisis Kebutuhan hingga Penerapan Massal》
