|

Nano Banana 2 Pengaturan response_modalities=IMAGE Hanya Mengembalikan Gambar Dapat Menghemat Berapa Token? Analisis Pengukuran Biaya

Catatan Penulis: Analisis mendalam tentang perbedaan konsumsi Token saat mengatur response_modalities Nano Banana 2 ke IMAGE (hanya mengembalikan gambar). Memecah aturan penagihan untuk tiga jenis Token (gambar/teks/pemikiran) dan memberikan konfigurasi optimal untuk menghemat biaya.

nano-banana-2-response-modalities-image-only-token-cost-guide-id 图示

Saat memanggil Nano Banana 2 untuk membuat gambar, parameter response_modalities memiliki dua cara pengaturan: ["Text", "Image"] (default) dan ["Image"] (hanya gambar). Pertanyaan yang wajar muncul: Berapa banyak Token dan biaya yang bisa dihemat dengan mengatur hanya mengembalikan gambar?

Nilai Inti: Setelah membaca artikel ini, Anda akan sepenuhnya memahami aturan penagihan untuk tiga jenis Token output Nano Banana 2 (gambar/teks/pemikiran), mengetahui dengan pasti berapa banyak response_modalities=["Image"] benar-benar menghemat biaya, serta strategi penghematan yang benar-benar efektif.


Aturan Penagihan Tiga Jenis Token Output Nano Banana 2

Penagihan output Nano Banana 2 tidak sederhana "satu harga", melainkan dibagi menjadi tiga jenis token yang ditagih secara independen:

Jenis Token Harga per Unit Keterangan Dapat Dihilangkan dengan Parameter?
Token Output Gambar $60.00 / M Tokens Token yang dikonsumsi untuk membuat gambar, menyumbang >95% dari total biaya ❌ Tidak bisa (output inti)
Token Output Teks $3.00 / M Tokens Deskripsi/penjelasan teks yang menyertai gambar ✅ Bisa, dengan setel ["Image"]
Token Berpikir (Thinking) $3.00 / M Tokens Dikonsumsi selama proses penalaran internal model ❌ Selalu dihasilkan, tidak bisa dimatikan
Token Input $0.50 / M Tokens Teks petunjuk dan gambar referensi Anda ⚠️ Dapat dioptimalkan dengan memperpendek panjang petunjuk

Token Gambar Nano Banana 2 adalah Penyumbang Biaya Terbesar

Angka kunci: Harga per unit token output gambar adalah $60/M, sedangkan harga token teks dan berpikir hanya $3/M—Token gambar 20 kali lebih mahal.

Resolusi Token Output Gambar Biaya Gambar Proporsi dari Total Biaya Output
512px ~747 ~$0.045 ~95%
1K (default) ~1,120 ~$0.067 ~96%
2K ~1,680 ~$0.101 ~97%
4K ~2,520 ~$0.151 ~97%

🔑 Kesimpulan Inti: Token gambar menyumbang 95-97% dari total biaya output. Token teks dan berpikir digabungkan hanya menyumbang 3-5%. Jadi, bahkan jika output teks dihilangkan sepenuhnya, penghematan biayanya sangat terbatas.


Perbandingan Token untuk Dua Pengaturan response_modalities

nano-banana-2-response-modalities-image-only-token-cost-guide-id 图示

Pengaturan ["Text", "Image"] — Mode Default

Secara default, Nano Banana 2 mengembalikan gambar + deskripsi teks. Model akan "berpikir" (Thinking) terlebih dahulu, lalu mengeluarkan deskripsi teks dan gambar.

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Buat kucing dengan baju astronot",
    config=types.GenerateContentConfig(
        response_modalities=["Text", "Image"],  # Default: teks+gambar
    )
)

Konten Output: Satu deskripsi teks (misalnya "Ini adalah kucing oranye dengan baju astronot…") + 1 gambar

Komposisi Konsumsi Token (contoh resolusi 1K):

  • Token Berpikir: ~200-800 (tergantung kompleksitas petunjuk)
  • Token Output Teks: ~50-200
  • Token Output Gambar: ~1,120

Pengaturan ["Image"] — Mode Hanya Gambar

Diatur untuk hanya mengembalikan gambar, tanpa deskripsi teks.

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Buat kucing dengan baju astronot",
    config=types.GenerateContentConfig(
        response_modalities=["Image"],  # Hanya gambar, tidak mengembalikan teks
    )
)

Konten Output: Hanya 1 gambar, tanpa deskripsi teks

Komposisi Konsumsi Token (contoh resolusi 1K):

  • Token Berpikir: ~200-800 (masih dihasilkan, masih ditagih)
  • Token Output Teks: 0 (dihilangkan ✅)
  • Token Output Gambar: ~1,120 (tidak berubah)

Perbandingan Biaya Dua Mode Nano Banana 2

Item Perbandingan ["Text", "Image"] Default ["Image"] Hanya Gambar Perbedaan
Token Gambar (~1,120) $0.0672 $0.0672 0 (tidak berubah)
Token Berpikir (~500) $0.0015 $0.0015 0 (tidak berubah)
Token Teks (~100) $0.0003 $0 Hemat $0.0003
Total Biaya per Gambar (1K) ~$0.069 ~$0.069 Hemat ~0.4%

⚠️ Kesimpulan: response_modalities=["Image"] memang dapat menghilangkan token output teks, tetapi karena harga per unit token teks hanya $3/M dan jumlahnya sedikit (sekitar 50-200 token), pada kenyataannya hanya menghemat sekitar $0.0001-$0.0006 per gambar, hampir dapat diabaikan.

Mengapa Thinking Token pada Nano Banana 2 Tidak Bisa Dihilangkan?

Ini adalah poin yang paling sering terlewat dalam perhitungan biaya Nano Banana 2: Thinking Token selalu dihasilkan, dan selalu dikenakan biaya, terlepas dari apakah Anda melihat proses berpikirnya atau tidak.

Dokumentasi resmi Google dengan jelas menyatakan:

Thinking tokens dikenakan biaya terlepas dari apakah includeThoughts diatur ke true atau false, karena proses berpikir selalu terjadi secara default.

Artinya:

  • includeThoughts=True: Anda bisa melihat proses berpikir, dikenakan biaya
  • includeThoughts=False: Anda tidak bisa melihat proses berpikir, tetap dikenakan biaya
  • Tarif biaya Thinking Token: $3/M (sama dengan keluaran teks)

Nano Banana 2 mendukung dua tingkat Thinking:

Tingkat Thinking Cara Pengaturan Konsumsi Thinking Token Kualitas Gambar Skenario yang Direkomendasikan
minimal Default ~200-500 Cukup untuk sebagian besar skenario Pembuatan gambar sehari-hari
high thinking_level="high" ~500-2000 Lebih baik untuk skenario kompleks Multi-karakter/komposisi yang presisi

💡 Saran Optimasi: Jika tidak membutuhkan kualitas gambar yang ekstrem, pertahankan tingkat thinking default minimal. Tingkat high akan menambah ratusan hingga ribuan thinking token. Meskipun harganya per unit tidak tinggi ($3/M), dalam skenario batch, ini tetap menjadi pengeluaran tambahan.


Strategi Penghematan Biaya yang Benar-Benar Efektif untuk Nano Banana 2

Jika response_modalities=["Image"] tidak menghemat banyak, strategi mana yang benar-benar efektif?

nano-banana-2-response-modalities-image-only-token-cost-guide-id 图示

Strategi Penghematan Rasio Penghematan Tindakan Spesifik Rekomendasi
Pilih Resolusi yang Sesuai Hingga 70% 4K→512px biaya turun dari $0.151 ke $0.045 ⭐⭐⭐⭐⭐
Gunakan APIYI Per Sesi Hingga 70% $0.045/gambar (termasuk 4K), tidak membedakan resolusi ⭐⭐⭐⭐⭐
Gunakan APIYI Per Volume Hingga 63% Resolusi rendah hanya $0.018/gambar (512px) ⭐⭐⭐⭐⭐
Google Batch API 50% Pemrosesan batch offline, token gambar setengah harga ⭐⭐⭐⭐
Thinking minimal 2-5% Pertahankan tingkat thinking default ⭐⭐⭐
response_modalities=["Image"] ~0.4% Hapus keluaran teks

Perbandingan Harga Nano Banana 2 di Berbagai Platform untuk Resolusi Berbeda

Resolusi Google Resmi APIYI Per Sesi APIYI Per Volume Penghematan Maksimum
512px $0.045 $0.045 $0.018 60%
1K $0.067 $0.045 $0.025 63%
2K $0.101 $0.045 $0.03 70%
4K $0.151 $0.045 $0.045 70%

🎯 Praktik Terbaik: Jika bisnis Anda mengizinkan penggunaan 1K daripada 4K, Anda langsung menghemat 55%. Ditambah dengan penggunaan APIYI apiyi.com dengan skema per volume, resolusi 1K hanya $0.025/gambar, menghemat 83% dibandingkan harga resmi 4K sebesar $0.151. Platform ini juga menyediakan alat uji coba pembuatan gambar gratis AI 图片大师: imagen.apiyi.com, yang memungkinkan Anda memverifikasi efek berbagai resolusi dengan cepat tanpa perlu menulis kode.


Konfigurasi Optimal untuk Memanggil Nano Banana 2 melalui APIYI

Berdasarkan analisis di atas, berikut adalah konfigurasi optimal yang direkomendasikan:

import requests
import base64

API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"

headers = {
    "Content-Type": "application/json",
    "x-goog-api-key": API_KEY
}

payload = {
    "contents": [{"parts": [{"text": "Seekor kucing mengenakan baju astronot, gaya seni digital"}]}],
    "generationConfig": {
        "responseModalities": ["IMAGE"],  # Hanya gambar, menghemat token teks
        "imageConfig": {
            "aspectRatio": "1:1",
            "imageSize": "1K"  # Pilih resolusi sesuai kebutuhan, inilah kunci penghematan biaya
        }
    }
}

response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()

image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
    f.write(base64.b64decode(image_data))

Saran: Gunakan APIYI di apiyi.com untuk memanggil Nano Banana 2. Biaya per panggilan adalah $0.045/gambar tanpa memandang resolusi, sedangkan biaya berdasarkan volume bisa serendah $0.018/gambar. Mendukung pemanggilan dengan format asli Google, sehingga migrasi tanpa biaya.


Pertanyaan Umum

Q1: Apakah token pemikiran (Thinking) masih akan dihasilkan setelah mengatur response_modalities=[“Image”]?

Ya. Proses pemikiran (Thinking) pada Nano Banana 2 diaktifkan secara default dan tidak dapat dimatikan. Baik Anda mengatur response_modalities menjadi ["Image"] atau ["Text", "Image"], dan terlepas dari apakah includeThoughts diatur ke true atau false, token pemikiran akan tetap dihasilkan dan dikenakan biaya. Kabar baiknya adalah token pemikiran dikenakan tarif teks sebesar $3/M, yang jauh lebih murah daripada token gambar sebesar $60/M.

Q2: Lalu apa gunanya mengatur [“Image”]?

Ada dua nilai utama: pertama, mengurangi volume transfer jaringan, karena tidak mengembalikan konten teks berarti parsing respons lebih cepat; kedua, menyederhanakan logika kode, tidak perlu menangani bagian teks tambahan. Meskipun penghematan biayanya kurang dari 1%, dalam skenario yang membutuhkan output gambar murni (seperti produksi materi batch), langsung mendapatkan gambar lebih mudah.

Q3: Mana yang lebih hemat, menggunakan APIYI dengan biaya per panggilan atau biaya berdasarkan volume?

Tergantung pada resolusi yang biasa Anda gunakan. Biaya per panggilan sebesar $0.045/gambar tidak membedakan resolusi, cocok untuk skenario yang sering menghasilkan gambar besar 2K/4K. Biaya berdasarkan volume dihitung secara fleksibel berdasarkan konsumsi token, resolusi rendah (512px) hanya $0.018/gambar, cocok untuk skenario yang menghasilkan gambar resolusi rendah dalam jumlah besar. Daftar di APIYI apiyi.com untuk menggunakan kedua mode penagihan ini.


Ringkasan

Analisis inti penagihan response_modalities untuk Nano Banana 2:

  1. Token Gambar adalah komponen terbesar: Harga $60/M untuk token gambar menyumbang 95-97% dari total biaya output, token teks dan pemikiran gabungan hanya 3-5%
  2. Mengatur ["Image"] tidak menghemat banyak: Hanya menghilangkan token output teks, menghemat sekitar $0.0003 per gambar (kurang dari 0.5%)
  3. Token Pemikiran tidak dapat dihilangkan: Selalu dihasilkan dan ditagih, tarif $3/M, tidak terkait dengan pengaturan response_modalities
  4. Penghematan nyata bergantung pada resolusi dan platform: Memilih resolusi yang tepat dapat menghemat 70%, menggunakan APIYI dapat menghemat tambahan 63%

Direkomendasikan untuk memanggil Nano Banana 2 melalui APIYI apiyi.com, dengan harga per panggilan $0.045/gambar untuk 4K tanpa batasan resolusi, atau harga volume serendah $0.018/gambar. Platform tidak membatasi konkurensi, mendukung pemanggilan dalam format asli Google, dilengkapi dengan alat pembuatan gambar gratis: imagen.apiyi.com.


📚 Referensi

  1. Halaman Harga Google Gemini API: Daftar harga token resmi Nano Banana 2

    • Tautan: ai.google.dev/gemini-api/docs/pricing
    • Penjelasan: Lihat harga terbaru untuk tiga jenis token: gambar/teks/pemikiran
  2. Dokumentasi Pembuatan Gambar Google AI: Penjelasan parameter response_modalities

    • Tautan: ai.google.dev/gemini-api/docs/image-generation
    • Penjelasan: Dokumentasi resmi menjelaskan cara konfigurasi dua mode: ["Image"] dan ["Text","Image"]
  3. Dokumentasi Penghitungan Token Google AI: Memahami komposisi dan penagihan token

    • Tautan: ai.google.dev/gemini-api/docs/tokens
    • Penjelasan: Pahami hubungan antara jumlah token output gambar dan resolusi
  4. Dokumentasi APIYI Nano Banana 2: Detail dua mode penagihan: per-panggilan dan volume

    • Tautan: docs.apiyi.com/en/api-capabilities/nano-banana-2-image
    • Penjelasan: Penjelasan skema penagihan dan metode pemanggilan di platform APIYI

Penulis: Tim Teknis APIYI
Diskusi Teknis: Selamat berdiskusi di bagian komentar, untuk materi lebih lanjut kunjungi pusat dokumentasi APIYI docs.apiyi.com

Similar Posts