Catatan Penulis: Analisis mendalam tentang perbedaan konsumsi Token saat mengatur response_modalities Nano Banana 2 ke IMAGE (hanya mengembalikan gambar). Memecah aturan penagihan untuk tiga jenis Token (gambar/teks/pemikiran) dan memberikan konfigurasi optimal untuk menghemat biaya.

Saat memanggil Nano Banana 2 untuk membuat gambar, parameter response_modalities memiliki dua cara pengaturan: ["Text", "Image"] (default) dan ["Image"] (hanya gambar). Pertanyaan yang wajar muncul: Berapa banyak Token dan biaya yang bisa dihemat dengan mengatur hanya mengembalikan gambar?
Nilai Inti: Setelah membaca artikel ini, Anda akan sepenuhnya memahami aturan penagihan untuk tiga jenis Token output Nano Banana 2 (gambar/teks/pemikiran), mengetahui dengan pasti berapa banyak response_modalities=["Image"] benar-benar menghemat biaya, serta strategi penghematan yang benar-benar efektif.
Aturan Penagihan Tiga Jenis Token Output Nano Banana 2
Penagihan output Nano Banana 2 tidak sederhana "satu harga", melainkan dibagi menjadi tiga jenis token yang ditagih secara independen:
| Jenis Token | Harga per Unit | Keterangan | Dapat Dihilangkan dengan Parameter? |
|---|---|---|---|
| Token Output Gambar | $60.00 / M Tokens | Token yang dikonsumsi untuk membuat gambar, menyumbang >95% dari total biaya | ❌ Tidak bisa (output inti) |
| Token Output Teks | $3.00 / M Tokens | Deskripsi/penjelasan teks yang menyertai gambar | ✅ Bisa, dengan setel ["Image"] |
| Token Berpikir (Thinking) | $3.00 / M Tokens | Dikonsumsi selama proses penalaran internal model | ❌ Selalu dihasilkan, tidak bisa dimatikan |
| Token Input | $0.50 / M Tokens | Teks petunjuk dan gambar referensi Anda | ⚠️ Dapat dioptimalkan dengan memperpendek panjang petunjuk |
Token Gambar Nano Banana 2 adalah Penyumbang Biaya Terbesar
Angka kunci: Harga per unit token output gambar adalah $60/M, sedangkan harga token teks dan berpikir hanya $3/M—Token gambar 20 kali lebih mahal.
| Resolusi | Token Output Gambar | Biaya Gambar | Proporsi dari Total Biaya Output |
|---|---|---|---|
| 512px | ~747 | ~$0.045 | ~95% |
| 1K (default) | ~1,120 | ~$0.067 | ~96% |
| 2K | ~1,680 | ~$0.101 | ~97% |
| 4K | ~2,520 | ~$0.151 | ~97% |
🔑 Kesimpulan Inti: Token gambar menyumbang 95-97% dari total biaya output. Token teks dan berpikir digabungkan hanya menyumbang 3-5%. Jadi, bahkan jika output teks dihilangkan sepenuhnya, penghematan biayanya sangat terbatas.
Perbandingan Token untuk Dua Pengaturan response_modalities

Pengaturan ["Text", "Image"] — Mode Default
Secara default, Nano Banana 2 mengembalikan gambar + deskripsi teks. Model akan "berpikir" (Thinking) terlebih dahulu, lalu mengeluarkan deskripsi teks dan gambar.
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="Buat kucing dengan baju astronot",
config=types.GenerateContentConfig(
response_modalities=["Text", "Image"], # Default: teks+gambar
)
)
Konten Output: Satu deskripsi teks (misalnya "Ini adalah kucing oranye dengan baju astronot…") + 1 gambar
Komposisi Konsumsi Token (contoh resolusi 1K):
- Token Berpikir: ~200-800 (tergantung kompleksitas petunjuk)
- Token Output Teks: ~50-200
- Token Output Gambar: ~1,120
Pengaturan ["Image"] — Mode Hanya Gambar
Diatur untuk hanya mengembalikan gambar, tanpa deskripsi teks.
response = client.models.generate_content(
model="gemini-3.1-flash-image-preview",
contents="Buat kucing dengan baju astronot",
config=types.GenerateContentConfig(
response_modalities=["Image"], # Hanya gambar, tidak mengembalikan teks
)
)
Konten Output: Hanya 1 gambar, tanpa deskripsi teks
Komposisi Konsumsi Token (contoh resolusi 1K):
- Token Berpikir: ~200-800 (masih dihasilkan, masih ditagih)
- Token Output Teks: 0 (dihilangkan ✅)
- Token Output Gambar: ~1,120 (tidak berubah)
Perbandingan Biaya Dua Mode Nano Banana 2
| Item Perbandingan | ["Text", "Image"] Default | ["Image"] Hanya Gambar | Perbedaan |
|---|---|---|---|
| Token Gambar (~1,120) | $0.0672 | $0.0672 | 0 (tidak berubah) |
| Token Berpikir (~500) | $0.0015 | $0.0015 | 0 (tidak berubah) |
| Token Teks (~100) | $0.0003 | $0 | Hemat $0.0003 |
| Total Biaya per Gambar (1K) | ~$0.069 | ~$0.069 | Hemat ~0.4% |
⚠️ Kesimpulan:
response_modalities=["Image"]memang dapat menghilangkan token output teks, tetapi karena harga per unit token teks hanya $3/M dan jumlahnya sedikit (sekitar 50-200 token), pada kenyataannya hanya menghemat sekitar $0.0001-$0.0006 per gambar, hampir dapat diabaikan.
Mengapa Thinking Token pada Nano Banana 2 Tidak Bisa Dihilangkan?
Ini adalah poin yang paling sering terlewat dalam perhitungan biaya Nano Banana 2: Thinking Token selalu dihasilkan, dan selalu dikenakan biaya, terlepas dari apakah Anda melihat proses berpikirnya atau tidak.
Dokumentasi resmi Google dengan jelas menyatakan:
Thinking tokens dikenakan biaya terlepas dari apakah
includeThoughtsdiatur ketrueataufalse, karena proses berpikir selalu terjadi secara default.
Artinya:
includeThoughts=True: Anda bisa melihat proses berpikir, dikenakan biayaincludeThoughts=False: Anda tidak bisa melihat proses berpikir, tetap dikenakan biaya- Tarif biaya Thinking Token: $3/M (sama dengan keluaran teks)
Nano Banana 2 mendukung dua tingkat Thinking:
| Tingkat Thinking | Cara Pengaturan | Konsumsi Thinking Token | Kualitas Gambar | Skenario yang Direkomendasikan |
|---|---|---|---|---|
| minimal | Default | ~200-500 | Cukup untuk sebagian besar skenario | Pembuatan gambar sehari-hari |
| high | thinking_level="high" |
~500-2000 | Lebih baik untuk skenario kompleks | Multi-karakter/komposisi yang presisi |
💡 Saran Optimasi: Jika tidak membutuhkan kualitas gambar yang ekstrem, pertahankan tingkat thinking default
minimal. Tingkathighakan menambah ratusan hingga ribuan thinking token. Meskipun harganya per unit tidak tinggi ($3/M), dalam skenario batch, ini tetap menjadi pengeluaran tambahan.
Strategi Penghematan Biaya yang Benar-Benar Efektif untuk Nano Banana 2
Jika response_modalities=["Image"] tidak menghemat banyak, strategi mana yang benar-benar efektif?

| Strategi Penghematan | Rasio Penghematan | Tindakan Spesifik | Rekomendasi |
|---|---|---|---|
| Pilih Resolusi yang Sesuai | Hingga 70% | 4K→512px biaya turun dari $0.151 ke $0.045 | ⭐⭐⭐⭐⭐ |
| Gunakan APIYI Per Sesi | Hingga 70% | $0.045/gambar (termasuk 4K), tidak membedakan resolusi | ⭐⭐⭐⭐⭐ |
| Gunakan APIYI Per Volume | Hingga 63% | Resolusi rendah hanya $0.018/gambar (512px) | ⭐⭐⭐⭐⭐ |
| Google Batch API | 50% | Pemrosesan batch offline, token gambar setengah harga | ⭐⭐⭐⭐ |
| Thinking minimal | 2-5% | Pertahankan tingkat thinking default | ⭐⭐⭐ |
| response_modalities=["Image"] | ~0.4% | Hapus keluaran teks | ⭐ |
Perbandingan Harga Nano Banana 2 di Berbagai Platform untuk Resolusi Berbeda
| Resolusi | Google Resmi | APIYI Per Sesi | APIYI Per Volume | Penghematan Maksimum |
|---|---|---|---|---|
| 512px | $0.045 | $0.045 | $0.018 | 60% |
| 1K | $0.067 | $0.045 | $0.025 | 63% |
| 2K | $0.101 | $0.045 | $0.03 | 70% |
| 4K | $0.151 | $0.045 | $0.045 | 70% |
🎯 Praktik Terbaik: Jika bisnis Anda mengizinkan penggunaan 1K daripada 4K, Anda langsung menghemat 55%. Ditambah dengan penggunaan APIYI apiyi.com dengan skema per volume, resolusi 1K hanya $0.025/gambar, menghemat 83% dibandingkan harga resmi 4K sebesar $0.151. Platform ini juga menyediakan alat uji coba pembuatan gambar gratis AI 图片大师: imagen.apiyi.com, yang memungkinkan Anda memverifikasi efek berbagai resolusi dengan cepat tanpa perlu menulis kode.
Konfigurasi Optimal untuk Memanggil Nano Banana 2 melalui APIYI
Berdasarkan analisis di atas, berikut adalah konfigurasi optimal yang direkomendasikan:
import requests
import base64
API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"
headers = {
"Content-Type": "application/json",
"x-goog-api-key": API_KEY
}
payload = {
"contents": [{"parts": [{"text": "Seekor kucing mengenakan baju astronot, gaya seni digital"}]}],
"generationConfig": {
"responseModalities": ["IMAGE"], # Hanya gambar, menghemat token teks
"imageConfig": {
"aspectRatio": "1:1",
"imageSize": "1K" # Pilih resolusi sesuai kebutuhan, inilah kunci penghematan biaya
}
}
}
response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()
image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
f.write(base64.b64decode(image_data))
Saran: Gunakan APIYI di apiyi.com untuk memanggil Nano Banana 2. Biaya per panggilan adalah $0.045/gambar tanpa memandang resolusi, sedangkan biaya berdasarkan volume bisa serendah $0.018/gambar. Mendukung pemanggilan dengan format asli Google, sehingga migrasi tanpa biaya.
Pertanyaan Umum
Q1: Apakah token pemikiran (Thinking) masih akan dihasilkan setelah mengatur response_modalities=[“Image”]?
Ya. Proses pemikiran (Thinking) pada Nano Banana 2 diaktifkan secara default dan tidak dapat dimatikan. Baik Anda mengatur response_modalities menjadi ["Image"] atau ["Text", "Image"], dan terlepas dari apakah includeThoughts diatur ke true atau false, token pemikiran akan tetap dihasilkan dan dikenakan biaya. Kabar baiknya adalah token pemikiran dikenakan tarif teks sebesar $3/M, yang jauh lebih murah daripada token gambar sebesar $60/M.
Q2: Lalu apa gunanya mengatur [“Image”]?
Ada dua nilai utama: pertama, mengurangi volume transfer jaringan, karena tidak mengembalikan konten teks berarti parsing respons lebih cepat; kedua, menyederhanakan logika kode, tidak perlu menangani bagian teks tambahan. Meskipun penghematan biayanya kurang dari 1%, dalam skenario yang membutuhkan output gambar murni (seperti produksi materi batch), langsung mendapatkan gambar lebih mudah.
Q3: Mana yang lebih hemat, menggunakan APIYI dengan biaya per panggilan atau biaya berdasarkan volume?
Tergantung pada resolusi yang biasa Anda gunakan. Biaya per panggilan sebesar $0.045/gambar tidak membedakan resolusi, cocok untuk skenario yang sering menghasilkan gambar besar 2K/4K. Biaya berdasarkan volume dihitung secara fleksibel berdasarkan konsumsi token, resolusi rendah (512px) hanya $0.018/gambar, cocok untuk skenario yang menghasilkan gambar resolusi rendah dalam jumlah besar. Daftar di APIYI apiyi.com untuk menggunakan kedua mode penagihan ini.
Ringkasan
Analisis inti penagihan response_modalities untuk Nano Banana 2:
- Token Gambar adalah komponen terbesar: Harga $60/M untuk token gambar menyumbang 95-97% dari total biaya output, token teks dan pemikiran gabungan hanya 3-5%
- Mengatur
["Image"]tidak menghemat banyak: Hanya menghilangkan token output teks, menghemat sekitar $0.0003 per gambar (kurang dari 0.5%) - Token Pemikiran tidak dapat dihilangkan: Selalu dihasilkan dan ditagih, tarif $3/M, tidak terkait dengan pengaturan
response_modalities - Penghematan nyata bergantung pada resolusi dan platform: Memilih resolusi yang tepat dapat menghemat 70%, menggunakan APIYI dapat menghemat tambahan 63%
Direkomendasikan untuk memanggil Nano Banana 2 melalui APIYI apiyi.com, dengan harga per panggilan $0.045/gambar untuk 4K tanpa batasan resolusi, atau harga volume serendah $0.018/gambar. Platform tidak membatasi konkurensi, mendukung pemanggilan dalam format asli Google, dilengkapi dengan alat pembuatan gambar gratis: imagen.apiyi.com.
📚 Referensi
-
Halaman Harga Google Gemini API: Daftar harga token resmi Nano Banana 2
- Tautan:
ai.google.dev/gemini-api/docs/pricing - Penjelasan: Lihat harga terbaru untuk tiga jenis token: gambar/teks/pemikiran
- Tautan:
-
Dokumentasi Pembuatan Gambar Google AI: Penjelasan parameter
response_modalities- Tautan:
ai.google.dev/gemini-api/docs/image-generation - Penjelasan: Dokumentasi resmi menjelaskan cara konfigurasi dua mode:
["Image"]dan["Text","Image"]
- Tautan:
-
Dokumentasi Penghitungan Token Google AI: Memahami komposisi dan penagihan token
- Tautan:
ai.google.dev/gemini-api/docs/tokens - Penjelasan: Pahami hubungan antara jumlah token output gambar dan resolusi
- Tautan:
-
Dokumentasi APIYI Nano Banana 2: Detail dua mode penagihan: per-panggilan dan volume
- Tautan:
docs.apiyi.com/en/api-capabilities/nano-banana-2-image - Penjelasan: Penjelasan skema penagihan dan metode pemanggilan di platform APIYI
- Tautan:
Penulis: Tim Teknis APIYI
Diskusi Teknis: Selamat berdiskusi di bagian komentar, untuk materi lebih lanjut kunjungi pusat dokumentasi APIYI docs.apiyi.com
