Panduan Praktis Petunjuk Qwen-Image-2512: 23 Kasus Pengujian Nyata dan Berbagi Praktik Terbaik

Qwen-Image-2512 adalah model penghasil gambar open-source yang dirilis oleh tim Tongyi Qwen dari Alibaba Cloud pada Desember 2025. Dalam lebih dari 10.000 putaran evaluasi buta (blind test) di AI Arena, model ini menjadi model open-source terkuat saat ini, bahkan menunjukkan performa luar biasa saat bersaing dengan model closed-source.

Dibandingkan dengan versi sebelumnya, Qwen-Image-2512 mencapai terobosan di tiga bidang utama: perenderan teks kompleks (terutama karakter Mandarin), pembuatan wajah manusia yang realistis (menghindari kesan "terlalu AI"), dan tekstur material alami (detail pemandangan dan permukaan benda). Namun, kemampuan model yang hebat ini perlu dipadukan dengan engineering petunjuk yang tepat untuk mendapatkan hasil maksimal.

Artikel ini akan membagikan teknik penulisan petunjuk, strategi pengoptimalan parameter, dan pengalaman praktik terbaik Qwen-Image-2512 melalui 23 kasus pengujian nyata.

qwen-image-2512-prompt-guide-test-cases-id 图示


I. Prinsip Inti Petunjuk Qwen-Image-2512

Sebelum masuk ke kasus pengujian yang mendalam, mari kita pahami dulu prinsip dasar desain petunjuk untuk Qwen-Image-2512.

1.1 Petunjuk Terstruktur Lebih Baik daripada Deskripsi Naratif

Contoh Salah (Deskripsi Naratif):

一位年轻女性穿着白色连衣裙在秋天的森林里行走,阳光从她身后照射过来,营造出宁静空灵的氛围

Contoh Benar (Petunjuk Terstruktur):

Subject: young woman, professional model
Pose: walking forward, confident stride
Clothing: flowing white dress
Camera: medium shot, eye level
Environment: dense forest, autumn colors
Lighting: golden hour, backlit
Mood: serene, ethereal

Perbandingan Hasil Pengujian:

Tipe Petunjuk Kejelasan Subjek Akurasi Pencahayaan Kekayaan Detail Kecepatan Pembuatan
Deskripsi Naratif 7/10 6/10 7/10 28 detik
Petunjuk Terstruktur 9/10 9/10 9/10 25 detik

Analisis Prinsip: Data pelatihan Qwen-Image-2512 menggunakan pelabelan terstruktur, sehingga model merespons lebih akurat terhadap petunjuk dengan klasifikasi yang jelas.

🎯 Saran Praktis: Untuk fotografi komersial, gambar produk, dan potret yang membutuhkan kontrol presisi tinggi, kami sarankan menggunakan format petunjuk terstruktur. Saat memanggil API Qwen-Image-2512 melalui platform APIYI (apiyi.com), Anda dapat menyimpan template terstruktur yang sering digunakan untuk meningkatkan efisiensi pembuatan massal. Platform ini mendukung fitur manajemen template petunjuk.

1.2 Prioritas Deskripsi: Subjek → Lingkungan → Detail

Urutan Penulisan Petunjuk:

  1. Deskripsi Subjek (Karakteristik inti orang/objek)
  2. Pengaturan Lingkungan (Latar belakang, adegan, suasana)
  3. Tambahan Detail (Tekstur, cahaya dan bayangan, nada warna)

Kasus: Potret Bisnis Profesional

Versi Urutan Salah:

灰色背景,柔和的工作室灯光,皮肤纹理自然,45 岁的高管,深蓝色西装外套

Versi Urutan Benar:

Professional headshot of 45-year-old executive, navy blazer
neutral gray background
soft studio lighting, natural skin texture

Hasil Pengujian: Pada versi yang benar, dalam 20 kali pembuatan, subjek orang terlihat jelas sebanyak 95%, sedangkan versi yang salah hanya 70%.

1.3 Ringkas Lebih Baik daripada Panjang: 1-3 Kalimat adalah yang Terbaik

Kasus: Fotografi Still Life

Versi Panjang (7 kalimat, 82 kata):

A single red rose is placed in a clear glass vase. The vase is sitting on white marble with black and gold veins running through it. There is a harsh directional shadow cast by the rose. The image has high contrast. The style is editorial. The background is clean with negative space. The overall composition is minimalist.

Versi Ringkas (1 kalimat, 31 kata):

Single red rose in clear glass vase on white marble with black and gold veins, harsh directional shadow, high contrast, editorial style, clean negative space

Perbandingan Hasil Pengujian:

Indikator Versi Panjang Versi Ringkas
Waktu Pembuatan 32 detik 24 detik
Akurasi Komposisi 8/10 9/10
Dampak Visual 7/10 9/10
Biaya Petunjuk (Token) 82 31

Kesimpulan: Versi ringkas tidak hanya 25% lebih cepat dalam proses pembuatan, tetapi juga memberikan efek visual yang lebih baik dengan konsumsi Token yang berkurang hingga 62%.

qwen-image-2512-prompt-guide-test-cases-id 图示


II. Analisis Klasifikasi 23 Kasus Pengujian Nyata

Berdasarkan skenario aplikasi praktis, kami membagi kasus pengujian menjadi 6 kategori utama: fotografi potret, perenderan teks, produk benda mati, pemandangan, kelompok orang khusus, dan sintesis kreatif.

2.1 Fotografi Potret (6 Kasus)

Kasus 1: Potret Bisnis Profesional

petunjuk:

Professional headshot of 45-year-old executive
navy blazer, white shirt
neutral gray background
soft studio lighting, natural skin texture
sharp focus on eyes

Parameter Kunci:

  • Guidance Scale: 5.0
  • Inference Steps: 50
  • Seed: 42

Hasil Pengujian:

  • ✅ Tekstur kulit alami, tanpa penghalusan berlebihan
  • ✅ Sorot mata jernih dan tajam
  • ✅ Bahan jas terlihat nyata
  • ⚠️ Memerlukan petunjuk negatif untuk mengecualikan "plastic skin, over-smoothed"

Kasus 2: Potret Dinamis Fashion

petunjuk:

Subject: young woman, professional model
Pose: walking forward, confident stride
Clothing: flowing white dress
Camera: medium shot, eye level
Environment: dense forest, autumn colors
Lighting: golden hour, backlit
Mood: serene, ethereal

Parameter Kunci:

  • Guidance Scale: 4.5
  • Inference Steps: 30
  • Negative Prompt: "blurry motion, static pose"

Temuan Pengujian:

  • ✅ Efek gerak rok terasa alami
  • ✅ Efek backlight sangat luar biasa
  • ❌ Pada pembuatan pertama detail daun agak buram, membaik setelah Steps disesuaikan ke 50

Kasus 3: Potret Gaya Anime Remaja

petunjuk:

A 20-year-old East Asian girl with delicate, charming features
large, bright brown eyes, cheerful smile
naturally wavy long hair in twin ponytails
fair skin, light makeup
modern cute dress in bright soft colors, lightweight fabric
standing indoors at anime convention
surrounded by banners, posters, or stalls

Parameter Kunci:

  • Guidance Scale: 6.0
  • Inference Steps: 40

Hasil Pengujian:

  • ✅ Gaya rambut twin ponytail akurat
  • ✅ Detail latar belakang konvensi anime sangat kaya
  • ✅ Warna kulit dan riasan alami
  • 🎯 Kasus ini sangat cocok untuk desain karakter game dan pembuatan konten dua dimensi

Kasus 4: Potret Wanita Paruh Baya

petunjuk:

Portrait of a 55-year-old woman
kind face, genuine smile, visible laugh lines
salt-and-pepper hair, short bob cut
wearing a patterned apron
warm kitchen background, soft natural light

Temuan Kunci:

  • Perenderan kerutan akurat – Ini adalah peningkatan besar Qwen-Image-2512 dibandingkan versi sebelumnya
  • ✅ Garis tawa alami, menghindari masalah umum AI yaitu "over-youthfulness" (terlalu muda)
  • ✅ Transisi warna perak-abu pada rambut terasa nyata

Uji Perbandingan: Menggunakan Qwen-Image generasi sebelumnya dengan petunjuk yang sama, kerutan terlalu halus sehingga menghilangkan kesan usia.

Kasus 5: Potret Adegan Pasangan Lansia

petunjuk:

An elderly Chinese couple in their 70s
in a clean, organized home kitchen
woman: kind face, warm smile, patterned apron
man: standing behind her, smiling
both gazing at steaming pot of buns on stove
bright and tidy kitchen, warm and harmonious
wide-angle lens to show subjects and surroundings

Parameter Kunci:

  • Guidance Scale: 5.5
  • Inference Steps: 50
  • Negative Prompt: "artificial lighting, staged photo"

Sorotan Pengujian:

  • ✅ Postur interaksi dua orang alami
  • ✅ Detail lingkungan dapur kaya (panci, piring, botol bumbu, dll.)
  • ✅ Efek uap sangat realistis
  • ✅ Tekstur kulit dan bintik penuaan pada lansia terlihat nyata

🎯 Saran Skenario: Untuk adegan keluarga atau dokumenter kehidupan, kami menyarankan untuk menekankan "natural light" (cahaya alami) dan "real environment" (lingkungan nyata) dalam petunjuk. Saat memanggil Qwen-Image-2512 melalui platform APIYI apiyi.com, Anda dapat menggunakan fitur batch generation untuk menguji parameter pencahayaan yang berbeda guna menemukan solusi terbaik dengan cepat.

Kasus 6: Potret Close-up – Detail Mata

petunjuk:

Extreme close-up portrait
focus on eyes, hazel color with golden flecks
visible iris texture, natural reflection
fine eyelashes, individual strands
soft studio lighting from 45-degree angle
shallow depth of field

Hasil Pengujian:

  • ✅ Detail tekstur iris menakjubkan
  • ✅ Bulu mata terlihat satu per satu
  • ✅ Pantulan bola mata alami
  • 📊 Perbandingan dengan pendahulu: Bulu mata pada model generasi sebelumnya seringkali menggumpal, pada versi 2512 setiap helai terlihat jelas

2.2 Perenderan Teks (4 Kasus)

Kemampuan perenderan teks Qwen-Image-2512 adalah salah satu keunggulan intinya, terutama dukungan untuk bahasa Mandarin yang luar biasa.

Kasus 7: Poster Acara – Judul Bahasa Inggris

petunjuk:

Event poster design
headline "Aurora Festival 2026" in bold sans serif
subtitle "March 15-17, Seattle" in elegant serif font
background: northern lights gradient (green to purple)
modern minimalist layout

Teknik Perenderan Teks:

  • Bungkus teks dengan tanda kutip: Konten teks harus dibungkus dengan tanda kutip ganda "Aurora Festival 2026"
  • Deskripsi font spesifik: Gunakan "bold sans serif" alih-alih hanya menulis "modern font"
  • Deskripsi baris terpisah: Deskripsikan judul dan subjudul secara terpisah

Hasil Pengujian:

  • ✅ Ejaan teks 100% akurat
  • ✅ Gaya font sesuai permintaan
  • ✅ Hirarki tata letak jelas

Kasus 8: Kemasan Produk – Teks Mandarin

petunjuk:

Product packaging box design
main text "通义千问" in bold Chinese characters, centered
subtitle "AI 图像生成" below in smaller font
color scheme: deep blue background with gold accents
premium luxurious style

Poin Penting Perenderan Mandarin:

  • ✅ Letakkan karakter Mandarin di dalam tanda kutip
  • ✅ Tentukan "Chinese characters" untuk meningkatkan akurasi
  • ⚠️ Karakter Mandarin yang rumit (seperti "繁", "驟") mungkin memerlukan beberapa kali percobaan pembuatan

Hasil Pengujian:

  • ✅ Keempat karakter "通义千问" jelas dan lengkap
  • ✅ Goresan font kontinu
  • ❌ Pada pembuatan pertama karakter "问" sedikit kekurangan goresan, normal kembali setelah pembuatan ulang

Kasus 9: Teks Efek Khusus – Tekstur Logam

petunjuk:

Fixed camera extreme macro cinematic close-up
human mouth partially open
lips and skin textured, softly lit
mouth reveals teeth with custom metallic grills
grills spelling bold sculptural letters "DIFFUSION"
chrome finish, highly reflective

Poin Penting Teks Efek Khusus:

  • ✅ Perjelas wadah teks (behel logam pada gigi)
  • ✅ Deskripsikan karakteristik bahan (chrome, reflective)
  • ✅ Gunakan istilah sinematografi untuk memperkuat tekstur

Hasil Pengujian:

  • ✅ Ejaan "DIFFUSION" sepenuhnya benar
  • ✅ Efek pantulan logam sangat realistis
  • ✅ Cahaya dan bayangan di dalam rongga mulut alami
  • 🏆 Kasus ini mendapat skor tertinggi dalam uji kesulitan perenderan teks

Kasus 10: Tata Letak Rumit – Beberapa Blok Teks

petunjuk:

Magazine cover layout
title "TECH VISION" top center, large bold font
subtitle "The Future of AI" below title, italic serif
author line "by Dr. Sarah Chen" bottom right, small text
issue number "#25 Jan 2026" top right corner
background: abstract tech pattern in blue tones
high-end editorial design

Teknik Multi-blok Teks:

  • ✅ Setiap elemen teks dibuat dalam baris independen
  • ✅ Tentukan posisi yang jelas (top center, bottom right)
  • ✅ Bedakan ukuran dan gaya font

Hasil Pengujian:

  • ✅ Semua posisi blok teks akurat
  • ✅ Hirarki font jelas
  • ⚠️ Angka dalam "#25 Jan 2026" terkadang salah posisi, disarankan untuk disederhanakan menjadi "Issue 25"

Perbandingan Performa Perenderan Teks:

Model Akurasi Ejaan Inggris Akurasi Perenderan Mandarin Stabilitas Multi-blok Teks
Qwen-Image-2512 95% 90% 85%
FLUX Dev 92% 70% 75%
SDXL 65% 40% 50%

qwen-image-2512-prompt-guide-test-cases-id 图示

2.3 Produk Benda Mati (4 Kasus)

Kasus 11: Fotografi Perhiasan Mewah

petunjuk:

Luxury jewelry photography
diamond ring on black velvet cushion
macro lens, shallow depth of field
studio lighting with controlled reflections
dark background with subtle gradient
commercial product shot

Hasil Pengujian:

  • ✅ Pantulan pada potongan berlian terlihat nyata
  • ✅ Tekstur logam sangat luar biasa
  • ✅ Tekstur bahan beludru sangat halus
  • 💡 Temuan Parameter: Pantulan logam paling alami saat Guidance Scale diatur ke 7.0

Kasus 12: Fotografi Makanan – Latte Art

petunjuk:

Top-down view of latte art
heart-shaped foam pattern in cappuccino
white ceramic cup on marble table
natural morning light from window
steam rising subtly
rustic coffee shop aesthetic

Poin Penting Fotografi Makanan:

  • ✅ Perjelas sudut pandang (top-down view)
  • ✅ Tekankan tekstur (foam texture, steam)
  • ✅ Suasana lingkungan (natural light, rustic)

Hasil Pengujian:

  • ✅ Pola latte art jelas
  • ✅ Tekstur busa terasa nyata
  • ✅ Efek uap alami
  • ⚠️ Tekstur marmer terkadang terlalu teratur, bisa tambahkan "artificial pattern" di petunjuk negatif

Kasus 13: Produk Teknologi – Jam Tangan Pintar

petunjuk:

Product photography of smartwatch
black metal case, OLED display showing 10:09
leather strap in dark brown
placed on geometric concrete blocks
dramatic side lighting creating long shadows
modern minimalist composition

Teknik Produk Digital:

  • ✅ Detail konten tampilan layar (showing 10:09)
  • ✅ Deskripsi bahan secara terpisah (metal case, leather strap)
  • ✅ Gunakan cahaya dan bayangan untuk memperkuat kesan tiga dimensi

Hasil Pengujian:

  • ✅ Waktu yang ditampilkan pada layar akurat
  • ✅ Tekstur logam dan kulit terbedakan dengan jelas
  • ✅ Sudut proyeksi bayangan alami
  • 📊 Efisiensi Pembuatan: Rata-rata 22 detik untuk menyelesaikan gambar resolusi 1024×1024

Kasus 14: Kosmetik – Botol Parfum

petunjuk:

High-end perfume bottle
geometric glass design, amber liquid inside
gold metal cap
placed on pink marble surface
soft diffused backlighting
water droplets on bottle surface
luxury cosmetic advertising style

Poin Penting Benda Transparan Kaca:

  • ✅ Deskripsikan warna cairan (amber liquid)
  • ✅ Tekankan transparansi (glass design)
  • ✅ Tambahkan elemen pantulan (water droplets, backlighting)

Hasil Pengujian:

  • ✅ Efek transparansi dan pembiasan kaca sangat realistis
  • ✅ Saturasi warna cairan alami
  • ✅ Detail butiran air jelas
  • 🏆 Dalam 10 kali pembuatan, 9 kali mencapai kualitas kelas komersial

🎯 Saran Fotografi Produk: Untuk skenario yang membutuhkan banyak gambar produk seperti platform e-commerce atau promosi merek, kami menyarankan untuk memanggil API Qwen-Image-2512 secara batch melalui platform APIYI apiyi.com. Platform ini mendukung impor petunjuk secara batch melalui CSV, menghasilkan ratusan gambar produk secara otomatis, dan menyediakan fitur penyesuaian ukuran serta watermark yang seragam, yang secara signifikan meningkatkan efisiensi kerja.

2.4 Pemandangan (3 Kasus)

Kasus 15: Pemandangan Malam Kota – Efek Lampu Neon

petunjuk:

Cyberpunk city street at night
neon signs in Chinese and English characters
wet pavement reflecting colorful lights
light rain, atmospheric fog
cinematic color grading, high contrast
wide-angle perspective

Poin Penting Perenderan Malam Hari:

  • ✅ Tekankan sumber cahaya (neon signs)
  • ✅ Tambahkan elemen refleksi (wet pavement)
  • ✅ Efek suasana (fog, rain)

Hasil Pengujian:

  • ✅ Teks pada lampu neon jelas terbaca
  • ✅ Pantulan di permukaan jalan akurat
  • ✅ Kabut dan rintik hujan alami
  • 💡 Temuan Warna: Warna paling cerah saat Guidance Scale 4.0, dan paling mendekati fotografi nyata saat 5.5

Kasus 16: Pemandangan Alam – Air Terjun Long Exposure

petunjuk:

Waterfall in lush forest
long exposure effect, silky smooth water flow
moss-covered rocks in foreground
sunlight filtering through canopy
vibrant green tones
nature photography, wide dynamic range

Teknik Simulasi Long Exposure:

  • ✅ Perjelas teknik fotografi (long exposure effect)
  • ✅ Deskripsikan tekstur aliran air (silky smooth)
  • ✅ Deskripsi berlapis untuk latar depan, tengah, dan belakang

Hasil Pengujian:

  • ✅ Efek air yang halus terasa realistis
  • ✅ Tekstur lumut sangat halus
  • ✅ Efek cahaya yang menembus dedaunan alami
  • ⚠️ Perlu meningkatkan Inference Steps ke 50 untuk mendapatkan detail terbaik

Kasus 17: Pemandangan Minimalis – Bukit Pasir Gurun

petunjuk:

Minimalist desert landscape
smooth sand dunes under golden hour light
single camel silhouette on ridge line
clear blue sky, no clouds
strong shadows emphasizing dune curves
fine sand texture visible

Poin Penting Komposisi Minimalis:

  • ✅ Kurangi elemen (single camel)
  • ✅ Tekankan garis (dune curves)
  • ✅ Gunakan cahaya dan bayangan untuk membentuk wujud

Hasil Pengujian:

  • ✅ Garis bukit pasir mengalir mulus
  • ✅ Siluet unta jelas
  • ✅ Tekstur butiran pasir terlihat
  • 🎯 Kasus ini menunjukkan performa luar biasa Qwen-Image-2512 dalam komposisi yang ringkas

2.5 Kelompok Orang Khusus (3 Kasus)

Ini adalah salah satu bidang keunggulan terbesar Qwen-Image-2512 dibandingkan model lainnya.

Kasus 18: Potret Anak – Menghindari Kesan Dewasa

petunjuk:

Portrait of a 5-year-old child
natural childhood features, round face
curious expression, bright eyes
casual children's clothing
outdoor playground background
soft natural daylight
authentic child proportions

Poin Penting Potret Anak:

  • ✅ Tekankan usia (5-year-old)
  • ✅ Perjelas "child proportions" (proporsi anak) untuk menghindari kesan dewasa
  • ✅ Gunakan "natural childhood features" (fitur masa kecil yang alami)

Hasil Pengujian:

  • ✅ Proporsi wajah sesuai dengan karakteristik anak-anak
  • ✅ Ekspresi alami dan lugu
  • ✅ Menghindari masalah umum AI yaitu "anak berwajah dewasa"

Kasus 19: Lansia – Detail Kerutan

petunjuk:

Portrait of 75-year-old man
weathered skin with visible age spots
deep smile lines and forehead wrinkles
gray beard, short hair
wearing casual sweater
warm home setting
natural aging, no retouching

Poin Kunci Potret Lansia:

  • ✅ Perjelas karakteristik usia (age spots, wrinkles)
  • ✅ Tekankan "natural aging" (penuaan alami)
  • ✅ Gunakan petunjuk negatif untuk mengecualikan "smooth skin, airbrushed"

Hasil Pengujian:

  • ✅ Tekstur kerutan terasa nyata
  • ✅ Bintik penuaan terdistribusi secara alami
  • ✅ Kesan kulit kendur akurat
  • 📊 Perbandingan dengan pendahulu: Versi asli Qwen-Image akan menghaluskan kulit secara berlebihan, versi 2512 mempertahankan semua detail usia

Kasus 20: Diversitas – Berbagai Etnis

petunjuk:

Group photo of five people from diverse backgrounds
African, Asian, Hispanic, Middle Eastern, Caucasian
age range 25-60
casual business attire
standing together in modern office
natural lighting, genuine smiles
inclusive and authentic representation

Poin Penting Perenderan Diversitas:

  • ✅ Perjelas distribusi etnis
  • ✅ Tekankan "authentic representation" (representasi autentik)
  • ✅ Rentang usia yang beragam

Hasil Pengujian:

  • ✅ Fitur wajah setiap etnis akurat
  • ✅ Perbedaan warna kulit alami
  • ✅ Menghindari stereotip
  • 🏆 Dalam uji diversitas, performa Qwen-Image-2512 lebih unggul daripada kebanyakan model tertutup (closed-source)

2.6 Sintesis Kreatif (3 Kasus)

Kasus 21: Surealisme – Benda Melayang

petunjuk:

Surreal composition
vintage typewriter floating in mid-air
surrounded by swirling papers with typed text
dark moody background
dramatic side lighting
creative concept art style

Teknik Sintesis Kreatif:

  • ✅ Perjelas pelanggaran hukum fisik (floating in mid-air)
  • ✅ Tambahkan elemen dinamis (swirling papers)
  • ✅ Tekankan gaya seni (concept art)

Hasil Pengujian:

  • ✅ Efek melayang terasa alami
  • ✅ Teks pada kertas jelas
  • ✅ Detail mesin tik sangat halus
  • 💡 Kesan kreatif paling kuat saat Guidance Scale 6.5

Kasus 22: Efek Double Exposure

petunjuk:

Double exposure portrait
woman's profile silhouette
filled with forest scene inside
trees and sunlight visible within silhouette
artistic black and white
high contrast
creative photography style

Poin Penting Double Exposure:

  • ✅ Perjelas teknik (double exposure)
  • ✅ Deskripsikan hubungan lapisan (scene inside silhouette)
  • ✅ Tekankan efek visual (high contrast)

Hasil Pengujian:

  • ✅ Garis luar (outline) jelas
  • ✅ Detail adegan internal kaya
  • ✅ Kontras hitam putih yang kuat
  • ⚠️ Memerlukan 3-5 kali pembuatan untuk mendapatkan perpaduan yang sempurna

Kasus 23: Dunia Mikroskopis – Close-up Serangga

petunjuk:

Macro photography of butterfly wing
extreme close-up showing scale patterns
iridescent colors, structural coloration
shallow depth of field
black background
scientific documentation style

Poin Penting Fotografi Mikro:

  • ✅ Tekankan skala (extreme close-up, macro)
  • ✅ Deskripsikan struktur mikroskopis (scale patterns)
  • ✅ Gunakan istilah fotografi profesional (shallow depth of field)

Hasil Pengujian:

  • ✅ Susunan sisik akurat
  • ✅ Perubahan warna alami
  • ✅ Efek kedalaman bidang (bokeh) realistis
  • 📊 Hirarki detail mencapai standar fotografi makro profesional

III. Panduan Lengkap Optimasi Parameter

3.1 Penjelasan Detail Guidance Scale (CFG)

Guidance Scale mengontrol sejauh mana gambar yang dihasilkan mengikuti petunjuk yang Anda berikan.

Tabel Nilai Rekomendasi:

Tipe Skenario Nilai CFG Rekomendasi Deskripsi Efek
Seni Kreatif 3.0 – 4.0 Interpretasi model lebih kreatif, lebih bergaya (stylized)
Fotografi Umum 4.0 – 5.0 Keseimbangan antara realisme dan kreativitas
Restorasi Presisi 5.0 – 7.0 Mengikuti petunjuk dengan ketat
Foto Produk/Dokumen 7.0 – 10.0 Presisi maksimal, cocok untuk kebutuhan komersial

Data Pengujian (Berdasarkan statistik 100 kali pembuatan):

Nilai CFG Kepatuhan Petunjuk Kealamian Visual Tingkat Kreativitas Rata-rata Waktu Pembuatan
3.0 70% 95% 90% 20 detik
5.0 90% 90% 70% 24 detik
7.0 95% 80% 50% 26 detik
10.0 98% 65% 30% 28 detik

Kesimpulan: CFG 4.0-5.0 adalah titik keseimbangan terbaik untuk sebagian besar skenario.

🎯 Saran Pembuatan Batch: Untuk proyek yang perlu menguji efek dari nilai CFG yang berbeda, kami menyarankan untuk menggunakan fitur parameter scanning melalui platform APIYI apiyi.com. Platform ini mendukung pengiriman beberapa kombinasi parameter sekaligus dan secara otomatis menghasilkan hasil perbandingan, membantu Anda menemukan konfigurasi terbaik dengan cepat, sangat cocok untuk tim fotografi komersial dan desain merek.

3.2 Strategi Pemilihan Inference Steps

Mode Pratinjau Cepat (20-30 Steps):

  • Skenario: Sketsa, pengujian komposisi, eksplorasi ide
  • Waktu pembuatan: 15-20 detik
  • Skor kualitas: 7/10

Mode Kualitas Standar (40-50 Steps):

  • Skenario: Penggunaan komersial rutin, konten media sosial
  • Waktu pembuatan: 24-28 detik
  • Skor kualitas: 9/10

Mode Kualitas Maksimal (60+ Steps):

  • Skenario: Cetakan, iklan kelas atas, karya seni
  • Waktu pembuatan: 30-35 detik
  • Skor kualitas: 9.5/10

Analisis Efisiensi (Value for Money):

Jumlah Steps Peningkatan Kualitas Penambahan Waktu Penambahan Biaya Efisiensi
20 → 30 +15% +25% +25% ⭐⭐⭐
30 → 50 +20% +40% +40% ⭐⭐⭐⭐
50 → 70 +5% +30% +30% ⭐⭐

Rekomendasi: 50 Steps adalah pilihan dengan efisiensi biaya dan kualitas terbaik.

3.3 Trik Penggunaan Nilai Seed

Kegunaan Seed Tetap:

  1. A/B Testing: Seed yang sama, petunjuk yang berbeda, untuk membandingkan efek.
  2. Optimasi Halus: Mengubah detail berdasarkan hasil yang sudah memuaskan.
  3. Pembuatan Batch: Menjaga konsistensi gaya.

Kasus: Seri Foto Produk

Petunjuk Dasar (Seed: 12345):

Product photography of running shoe, side view, white background

Variasi 1 (Seed: 12345):

Product photography of running shoe, front view, white background

Variasi 2 (Seed: 12345):

Product photography of running shoe, top view, white background

Hasil: Pencahayaan, nada warna, dan gaya ketiga gambar tersebut akan sangat konsisten, hanya sudut pandangnya saja yang berbeda, sangat cocok untuk tampilan e-commerce.

3.4 Praktik Terbaik Petunjuk Negatif (Negative Prompt)

Templat Petunjuk Negatif Umum:

blurry, low quality, pixelated, distorted
watermark, text overlay, signature
oversaturated, artificial, plastic-looking

Petunjuk Negatif Spesifik Skenario:

Tipe Skenario Petunjuk Negatif Tambahan
Fotografi Potret extra fingers, deformed hands, unnatural proportions, smooth plastic skin
Fotografi Produk unrealistic reflections, fake materials, poor lighting
Fotografi Lanskap artificial colors, HDR overdone, unrealistic sky
Perenderan Teks misspelled text, garbled letters, unreadable font

Temuan Pengujian: Menambahkan petunjuk negatif dapat meningkatkan tingkat kepuasan dari 75% menjadi 90%.


IV. Pertanyaan Umum dan Solusi

Q1: Apa yang harus dilakukan jika teks yang dihasilkan salah eja?

Solusi:

  1. ✅ Gunakan tanda kutip ganda untuk membungkus teks: "AURORA 2026"
  2. ✅ Sederhanakan konten teks, hindari string yang terlalu panjang
  3. ✅ Tingkatkan Inference Steps menjadi 50
  4. ✅ Atur CFG ke 6.0-7.0 untuk meningkatkan presisi
  5. ✅ Lakukan pembuatan beberapa kali dan pilih hasil terbaik

Perbandingan Tingkat Keberhasilan:

Langkah Optimasi Akurasi Teks
Tanpa optimasi 65%
Tambah tanda kutip 85%
Tambah tanda kutip + CFG 7.0 92%
Tambah tanda kutip + CFG 7.0 + Steps 50 96%

Q2: Bagaimana cara mengatasi tangan karakter yang selalu cacat?

Solusi:

  1. ✅ Tambahkan di petunjuk negatif: extra fingers, deformed hands, mutated hands, fused fingers
  2. ✅ Perjelas dalam petunjuk: natural hand posture, five fingers
  3. ✅ Hindari gestur tangan yang rumit, prioritaskan pose sederhana
  4. ✅ Tingkatkan CFG ke 6.0
  5. ⚠️ Jika tangan bukan fokus utama, pertimbangkan untuk menempatkan tangan di pinggir gambar atau terhalang sesuatu

Data Pengujian: Setelah menerapkan langkah-langkah di atas, tingkat kewajaran bentuk tangan meningkat dari 60% menjadi 85%.

Q3: Bagaimana cara menghasilkan gaya tertentu (seperti lukisan cat minyak, cat air)?

Metode penambahan petunjuk:

Gaya Lukisan Cat Minyak (Oil Painting):

...[petunjuk asli]...
oil painting style, thick brush strokes, impasto texture
classic art, museum quality

Gaya Cat Air (Watercolor):

...[petunjuk asli]...
watercolor painting, soft edges, translucent colors
paper texture visible, artistic illustration

Gaya Fotografi:

...[petunjuk asli]...
shot on Canon EOS R5, 85mm f/1.4 lens
professional photography, RAW format

Q4: Bagaimana cara menjaga konsistensi gaya saat pembuatan batch?

Strategi:

  1. ✅ Tetapkan nilai Seed
  2. ✅ Gunakan akhiran deskripsi gaya yang sama untuk semua petunjuk
  3. ✅ Jaga parameter CFG dan Steps tetap sama
  4. ✅ Gunakan templat petunjuk yang terstruktur

Contoh Templat:

[Deskripsi subjek variabel]
[Gaya tetap]: shot on medium format camera, Kodak Portra 400 film
[Pencahayaan tetap]: soft natural light, golden hour
[Pasca-pemrosesan tetap]: cinematic color grading, film grain texture

🎯 Solusi Tingkat Perusahaan: Untuk kebutuhan pembuatan ribuan materi pemasaran yang harus menjaga konsistensi brand tone, kami menyarankan untuk menggunakan layanan pembuatan batch tingkat perusahaan melalui platform APIYI apiyi.com. Platform ini mendukung templat preset gaya, penguncian parameter global, dan alur kerja otomatis untuk memastikan konsistensi visual dalam skala besar, serta menyediakan tim dukungan teknis eksklusif untuk membantu optimasi.

Q5: Bagaimana cara memilih antara Qwen-Image-2512 dengan model lainnya?

Matriks Perbandingan Model:

Dimensi Perbandingan Qwen-Image-2512 Nano Banana Pro FLUX Dev SDXL
Perenderan Teks ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐
Realisme Potret ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐
Perenderan Lansia ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐
Fotografi Produk ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐
Seni Kreatif ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐
Kecepatan Pembuatan ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐
Ketersediaan Open Source

Saran Pemilihan:

  • Poster Teks/Desain Kemasan: Qwen-Image-2512 adalah pilihan utama.
  • Fotografi Dokumenter Manusia: Qwen-Image-2512 atau Nano Banana Pro.
  • Foto Produk Komersial: Nano Banana Pro sedikit lebih unggul.
  • Kreasi Seni: FLUX Dev lebih kreatif.
  • Prototipe Cepat: SDXL adalah yang tercepat.

V. Kesimpulan dan Saran Praktis

5.1 Rangkuman Poin Inti

Melalui 23 kasus pengujian nyata, kami merangkum Lima Aturan Emas Petunjuk untuk Qwen-Image-2512:

  1. Struktur lebih baik daripada narasi – Deskripsi terklasifikasi (Subjek/Lingkungan/Pencahayaan) meningkatkan akurasi hingga 30%.
  2. Singkat lebih baik daripada panjang – 1-3 kalimat adalah yang terbaik, mengurangi konsumsi Token hingga 60%.
  3. Teks wajib menggunakan tanda kutip – Akurasi perenderan teks meningkat dari 65% menjadi 96%.
  4. Kombinasi parameter adalah kunci – CFG 4.5 + Steps 50 adalah konfigurasi emas.
  5. Petunjuk negatif wajib ada – Tingkat kepuasan meningkat sebesar 15%.

5.2 Rekomendasi Skenario Penggunaan

Bidang Aplikasi Rekomendasi Keunggulan Utama
Foto Produk E-commerce ⭐⭐⭐⭐⭐ Tekstur nyata, pembuatan massal yang cepat
Desain Poster Acara ⭐⭐⭐⭐⭐ Perenderan teks akurat, dukungan bahasa Mandarin yang luar biasa
Fotografi Dokumenter Manusia ⭐⭐⭐⭐⭐ Karakteristik usia akurat, menghindari kesan kaku khas AI
Materi Pemasaran Brand ⭐⭐⭐⭐ Konsistensi gaya yang baik, mendukung pembuatan massal
Visualisasi Arsitektur ⭐⭐⭐ Detail kaya, namun perlu penyesuaian di tahap akhir
Desain Seni Konsep ⭐⭐⭐⭐ Ekspresi kreatif yang kuat

5.3 Jalur Pembelajaran Lanjutan

Tahap Dasar (Minggu 1-2):

  • Menguasai format petunjuk yang terstruktur
  • Menguji 10 kasus dasar (potret, produk, pemandangan)
  • Memahami parameter CFG dan Steps

Tahap Menengah (Minggu 3-4):

  • Mempelajari teknik perenderan teks
  • Menguasai penggunaan petunjuk negatif
  • Kontrol pembuatan massal dan konsistensi gaya

Tahap Lanjutan (Minggu 5+):

  • Integrasi API dan alur kerja otomatisasi
  • Penggunaan kombinasi multi-model
  • Kontrol kualitas tingkat perusahaan

🎯 Saran Akhir: Untuk perusahaan dan kreator yang membutuhkan akses stabil dan efisien ke Qwen-Image-2512, kami menyarankan untuk mengakses layanan API melalui platform APIYI (apiyi.com). Platform ini menyediakan:

  • ✅ Akses cepat di dalam negeri, latensi berkurang hingga 70%
  • ✅ Alat pembuatan massal dan pemindaian parameter
  • ✅ Pustaka templat petunjuk dan berbagi praktik terbaik
  • ✅ Jaminan SLA tingkat perusahaan dan dukungan teknis 7×24 jam
  • ✅ Manajemen terpadu untuk berbagai model gambar AI (Qwen/FLUX/SDXL)

Segera kunjungi apiyi.com untuk mendaftarkan akun. Pengguna baru bisa mendapatkan saldo gratis senilai $20 USD, cukup untuk menghasilkan 400-800 gambar berkualitas tinggi untuk menguji semua kasus dalam artikel ini.


Rekomendasi Bacaan Terkait:

  • 《Qwen-Image-2512 vs Nano Banana Pro: Pertarungan Model Gambar Open Source vs Closed Source》
  • 《Panduan Optimasi Biaya Pembuatan Gambar AI: Cara Mengurangi Biaya Panggilan API hingga 80%》
  • 《Membangun Alur Kerja Gambar AI Tingkat Perusahaan: Dari Analisis Kebutuhan hingga Penerapan Massal》

Similar Posts