Catatan Penulis: Analisis mendalam mengapa API pembuatan gambar seperti Nano Banana Pro dan Nano Banana 2 menggunakan RPM sebagai metrik pembatasan laju (rate limit) alih-alih QPS. Kita akan membedah karakteristik pemblokiran pada pemanggilan sinkron Gemini untuk memahami perbedaan skenario penggunaan kedua metrik ini.
Jika Anda pernah menggunakan API Model Bahasa Besar berbasis teks, Anda mungkin terbiasa dengan metrik QPS (Queries Per Second/Permintaan per Detik). Namun, saat beralih ke API pembuatan gambar seperti Nano Banana Pro dan Nano Banana 2, dokumentasi resmi justru hanya membahas RPM (Requests Per Minute/Permintaan per Menit) — mengapa API pembuatan gambar tidak menggunakan QPS? Ini bukan sekadar masalah preferensi penamaan, melainkan karena pola pemanggilan sinkron yang memblokir (synchronous blocking call) pada pembuatan gambar membuat QPS menjadi tidak relevan dalam skenario ini. Artikel ini akan menjelaskan perbedaan tersebut dari sisi teknis.
Nilai Utama: Setelah membaca artikel ini, Anda akan memahami perbedaan mendasar antara RPM dan QPS dalam berbagai skenario API, serta mengapa pola pemanggilan sinkron pada API gambar Gemini membuat QPS menjadi metrik yang tidak tepat.
Poin Utama RPM vs QPS
Langsung saja ke jawabannya: API pembuatan gambar menggunakan RPM, bukan QPS, karena waktu pemblokiran (blocking time) pada pemanggilan sinkron terlalu lama, sehingga QPS tidak memiliki makna praktis.
| Konsep | Definisi | Skenario Penggunaan | Cocok untuk API Gambar? |
|---|---|---|---|
| QPS | Queries Per Second (Kueri per Detik) | Layanan frekuensi tinggi dengan respons milidetik | Tidak cocok |
| RPS | Requests Per Second (Permintaan per Detik) | Setara dengan QPS | Tidak cocok |
| RPM | Requests Per Minute (Permintaan per Menit) | Layanan lambat dengan respons detik-menit | Cocok |
| IPM | Images Per Minute (Gambar per Menit) | Khusus untuk pembuatan gambar | Paling cocok |
| RPD | Requests Per Day (Permintaan per Hari) | Manajemen kuota | Cocok |
Mengapa QPS pada API Pembuatan Gambar adalah Konsep yang Keliru
Kunci untuk memahami masalah ini terletak pada karakteristik pemanggilan sinkron dari API pembuatan gambar Gemini.
Saat Anda memanggil Nano Banana 2 untuk membuat gambar, API tersebut bersifat sinkron dan memblokir (synchronous blocking)—setelah Anda mengirim permintaan, koneksi HTTP tetap terbuka dan klien terus menunggu hingga gambar selesai dibuat (13-170 detik) sebelum respons dikembalikan. Selama durasi tersebut, koneksi ini tidak melakukan apa pun selain menunggu.
Mari kita bandingkan:
- API Claude (teks): Token pertama dikembalikan dalam 50-200ms, transmisi streaming, hasil yang berguna bisa didapatkan dalam waktu kurang dari 1 detik.
- Nano Banana 2 (gambar 1K): Butuh setidaknya 13 detik untuk memberikan respons, koneksi terblokir selama proses berlangsung.
Jadi, bagi API pembuatan gambar, pertanyaan "berapa banyak permintaan yang bisa diproses per detik" (QPS) tidak relevan—karena satu permintaan saja bisa memakan waktu lebih dari 13 detik. Menggunakan RPM adalah satuan ukuran yang jauh lebih masuk akal.
🎯 Analogi: QPS ibarat mengukur berapa banyak makanan cepat saji yang bisa disajikan restoran per detik. RPM ibarat mengukur berapa banyak meja yang bisa dilayani restoran formal per jam. Anda tidak akan menggunakan "jumlah hidangan per detik" untuk mengukur efisiensi restoran mewah, karena satu hidangan saja membutuhkan waktu 30 menit untuk dimasak.
Melalui APIYI apiyi.com, Anda dapat memanggil Nano Banana 2 tanpa batasan RPM resmi, sehingga memungkinkan lebih banyak permintaan konkuren.
Detail Teknis Pemanggilan Sinkron API Pembuatan Gambar Gemini
Ini adalah dasar penting untuk memahami RPM vs QPS.
Proses Pemblokiran Pemanggilan Sinkron Nano Banana 2
Klien mengirim permintaan
│
▼
Koneksi TCP dibuat ───────────────────────────────┐
│ │
▼ │
Server menerima petunjuk │ Koneksi tetap terbuka
│ │ Klien menunggu (blocking)
▼ │
Inferensi model difusi (13-170 detik) │
│ │
▼ │
Gambar dikodekan ke base64 │
│ │
▼ │
Mengembalikan respons (berisi data gambar) ───────┘
│
▼
Klien menerima gambar
Dalam proses ini, thread/proses klien sepenuhnya terpakai. Jika Anda menggunakan pemanggilan sinkron satu thread, dalam 1 menit Anda hanya bisa mengirim 60 / waktu pembuatan permintaan—untuk gambar 1K yang memakan waktu 13 detik, QPS satu thread hanya sekitar 0,077 (0,077 permintaan per detik), yang jika dikonversi ke RPM hanya 4,6.
Waktu Pemblokiran Nano Banana 2 untuk Berbagai Resolusi
| Resolusi | Waktu Pembuatan Tipikal | Batas RPM Satu Thread | "QPS" Satu Thread |
|---|---|---|---|
| 0.5K | ~8 detik | ~7,5 RPM | 0,125 |
| 1K | ~13 detik | ~4,6 RPM | 0,077 |
| 2K | ~30 detik | ~2 RPM | 0,033 |
| 4K | ~90-170 detik | ~0,4-0,7 RPM | 0,006-0,011 |
Lihat perbedaannya? Pada resolusi 4K, "QPS" satu thread hanya 0,006—artinya rata-rata dibutuhkan 170 detik untuk menyelesaikan 1 permintaan. Pada skala ini, membahas QPS sama sekali tidak ada gunanya, RPM adalah ukuran yang jauh lebih efektif.
Kapan Sebaiknya Menggunakan RPM dan QPS?
Skenario Penggunaan QPS
QPS (Queries Per Second) menjadi metrik laju yang bermakna hanya jika: waktu respons untuk satu permintaan jauh lebih kecil dari 1 detik.
| Tipe Layanan | Waktu Respons Tipikal | Apakah QPS Bermakna? | Alasan |
|---|---|---|---|
| CDN / Cache | 1-10ms | Sangat bermakna | Dapat memproses ribuan permintaan per detik |
| Query Database | 5-50ms | Bermakna | Dapat memproses ratusan permintaan per detik |
| Token Pertama LLM Teks | 50-200ms | Bermakna | Dapat memulai 5-20 permintaan per detik |
| API Pencarian | 100-500ms | Bermakna | Dapat menyelesaikan 2-10 permintaan per detik |
Skenario Penggunaan RPM
RPM (Requests Per Minute) adalah metrik laju yang lebih masuk akal jika: waktu respons untuk satu permintaan berada dalam skala detik hingga menit.
| Tipe Layanan | Waktu Respons Tipikal | Mengapa Menggunakan RPM | Batasan Resmi Gemini |
|---|---|---|---|
| Pembuatan Gambar | 8-170 detik | Tidak bisa menyelesaikan 1 permintaan dalam 1 detik | RPM + IPM |
| Pembuatan Video | 30-300 detik | Satu permintaan memakan waktu menit | RPM |
| Pemrosesan Data Batch | Skala menit | Granularitas tugas lebih besar dari detik | RPM + RPD |
| Konversi File | 5-60 detik | Waktu pemrosesan per permintaan lama | RPM |
Empat Dimensi Batasan Laju API Pembuatan Gambar Gemini
Google merancang empat dimensi batasan laju untuk API pembuatan gambar Gemini. Jika salah satu terlampaui, Anda akan terkena pembatasan laju (rate limit):
| Dimensi | Arti | Tingkat Gratis | Tier 1 (Berbayar) |
|---|---|---|---|
| RPM | Permintaan per menit | 5-15 | 150-300 |
| TPM | Token per menit | Terbatas | Lebih tinggi |
| RPD | Permintaan per hari | 20-100 | 1.000+ |
| IPM | Gambar per menit | Terbatas | Lebih tinggi |
Perhatikan IPM (Gambar per menit)—ini adalah metrik yang dirancang khusus untuk pembuatan gambar. Karena satu permintaan bisa menghasilkan banyak gambar, hubungan antara RPM dan IPM tidaklah sesederhana satu banding satu.

Cara Meningkatkan Throughput Aktual API Pembuatan Gambar
Setelah memahami esensi dari RPM (Requests Per Minute), pertanyaan berikutnya adalah: bagaimana cara memaksimalkan efisiensi pembuatan gambar di bawah batasan RPM tersebut.
Perhitungan Multithreading + Batas RPM
Misalkan Anda perlu menghasilkan 20 gambar 1K per menit:
RPM single-thread = 60 detik / 13 detik ≈ 4,6 gambar/menit
Jumlah thread yang dibutuhkan = 20 / 4,6 ≈ 5 thread konkuren
Namun, Anda juga harus memastikan total RPM dari 5 thread konkuren tersebut (sekitar 23 RPM) tidak melebihi kuota RPM akun Anda. Tingkat gratis hanya memiliki 5-15 RPM, sedangkan Tier 1 berbayar memiliki 150-300 RPM.
Saran Optimasi Konkurensi API Pembuatan Gambar
| Strategi Optimasi | Efek | Skenario yang Sesuai |
|---|---|---|
| Multithreading/Coroutine | Peningkatan linear (terbatas RPM) | Skenario pembuatan gambar real-time |
| Batch API Asinkron | Tidak memblokir + diskon 50% | Skenario batch yang toleran terhadap latensi |
| Kurangi Resolusi | Waktu per gambar berkurang → RPM naik | Gambar pratinjau, thumbnail |
| Layanan Proksi APIYI | Menembus batas RPM resmi | Lingkungan produksi dengan konkurensi tinggi |
| Pengaturan Timeout Klien | Menghindari penantian sia-sia | Semua skenario (1K disarankan 300s, 4K 600s) |
🎯 Saran Praktis: Jika Anda membutuhkan pembuatan gambar dengan konkurensi tinggi, menggunakan Nano Banana 2 melalui APIYI (apiyi.com) adalah solusi termudah—tidak terikat batasan RPM resmi, harga diskon 28%, dan harga tetap 4K hanya $0,045.
Pertanyaan Umum (FAQ)
Q1: Jika saya mengirim 10 permintaan dengan konkurensi asinkron, berapa RPM yang dihitung?
Dihitung 10. RPM menghitung jumlah permintaan yang Anda kirim dalam 1 menit, terlepas dari apakah permintaan tersebut sudah kembali atau belum. Meskipun Anda mengirim 10 permintaan secara bersamaan dengan konkurensi asinkron, masing-masing akan memblokir selama 13 detik sebelum kembali, dan ke-10 permintaan tersebut tetap dihitung dalam RPM menit yang sama. Jadi, multithreading dapat meningkatkan throughput, tetapi tidak bisa melewati kuota RPM.
Q2: Apakah Gemini Batch API bersifat asinkron? Bisakah melewati batasan RPM?
Ya. Gemini Batch API menggunakan mode asinkron—Anda mengirim sekumpulan permintaan dan langsung mendapatkan ID tugas tanpa memblokir klien. Tugas diproses di latar belakang, dan setelah selesai, Anda akan diberitahu untuk mengambil hasilnya. Batch API memiliki kuota terpisah (dihitung berdasarkan Token), tidak memakan kuota RPM real-time, dan harganya 50% lebih murah. Kekurangannya adalah tidak menjamin real-time, sehingga cocok untuk skenario batch yang "tidak mendesak".
Q3: Apakah chatgpt-image-latest dari OpenAI juga memblokir secara sinkron?
Ya. chatgpt-image-latest juga merupakan pemanggilan sinkron dengan waktu respons sekitar 44-60 detik. Komunitas pengembang melaporkan masalah timeout yang sering terjadi pada gpt-image-1, disarankan untuk mengatur timeout setidaknya 300 detik. Jadi, API gambar OpenAI juga menggunakan RPM sebagai indikator pembatasan kecepatan, logikanya sama dengan Gemini—karena waktu respons pemblokiran sinkron terlalu lama, QPS tidak relevan.
Q4: Bagaimana APIYI menembus batasan RPM resmi?
APIYI mencapainya melalui mekanisme polling kumpulan multi-akun—platform mengelola banyak akun API Gemini, dan permintaan klien didistribusikan secara otomatis ke akun yang berbeda, di mana setiap akun memiliki kuota RPM-nya sendiri. Bagi pengembang, ini setara dengan peningkatan RPM yang signifikan tanpa perlu mengelola banyak kunci API sendiri. Anda juga menikmati diskon 28% dan keuntungan harga tetap 4K sebesar $0,045.

Ringkasan
Alasan utama mengapa API pembuatan gambar Nano Banana menggunakan RPM (Requests Per Minute) alih-alih QPS (Queries Per Second):
- Pemblokiran sinkron menentukan satuan pengukuran: API pembuatan gambar Gemini bersifat sinkron, di mana 1 permintaan memblokir proses selama 13-170 detik. Karena satu permintaan saja tidak selesai dalam 1 detik, metrik QPS menjadi tidak relevan. RPM (per menit) adalah satuan yang jauh lebih masuk akal.
- RPM cocok untuk layanan lambat, QPS untuk layanan cepat: Aturan praktisnya sederhana—jika respons tunggal < 1 detik, gunakan QPS; jika > 1 detik, gunakan RPM. Pembuatan gambar, video, dan konversi file semuanya termasuk dalam skenario RPM.
- Kunci untuk meningkatkan throughput adalah konkurensi + kuota: Konkurensi multi-thread dapat meningkatkan throughput secara linear, namun dibatasi oleh kuota RPM. Anda dapat melampaui batas RPM satu akun dengan menggunakan rotasi kumpulan multi-akun melalui APIYI.
Kami merekomendasikan penggunaan Nano Banana 2 melalui APIYI di apiyi.com—bebas dari batasan RPM resmi, diskon harga 28%, dan harga tetap 4K sebesar $0,045.
📚 Referensi
-
Batas Kecepatan API Gemini: Dokumentasi resmi mengenai batas kecepatan
- Tautan:
ai.google.dev/gemini-api/docs/rate-limits - Penjelasan: Berisi penjelasan lengkap mengenai batasan empat dimensi: RPM, TPM, RPD, dan IPM.
- Tautan:
-
Perbandingan API Sinkron vs Asinkron Nano Banana Pro: Perbedaan teknis antara dua mode pemanggilan
- Tautan:
help.apiyi.com/en/nano-banana-pro-sync-async-api-comparison-en.html - Penjelasan: Mencakup waktu pemblokiran, pengaturan timeout, dan perhitungan throughput.
- Tautan:
-
Batas Kecepatan OpenAI: Dokumentasi batas kecepatan OpenAI (sistem RPM)
- Tautan:
developers.openai.com/api/docs/guides/rate-limits - Penjelasan: Perbandingan desain batas kecepatan antara Gemini dan OpenAI.
- Tautan:
-
Pusat Dokumentasi APIYI: Akses API pembuatan gambar untuk menembus batas RPM
- Tautan:
docs.apiyi.com - Penjelasan: Akses konkurensi tinggi untuk Nano Banana 2 dan informasi harga diskon.
- Tautan:
Penulis: Tim Teknis APIYI
Diskusi Teknis: Mari berdiskusi di kolom komentar. Untuk informasi lebih lanjut, silakan kunjungi pusat dokumentasi APIYI di docs.apiyi.com.
