title: "Почему API для генерации изображений используют RPM вместо QPS?"
description: "Разбираемся, почему для API вроде Nano Banana Pro и Nano Banana 2 критически важен RPM, и как синхронная природа генерации изображений делает QPS бесполезным показателем."
Авторская заметка: Глубокий разбор того, почему API для генерации изображений, такие как Nano Banana Pro и Nano Banana 2, используют RPM (запросов в минуту) вместо QPS (запросов в секунду) в качестве лимитов. Разбираем это на примере блокирующего характера синхронных вызовов Gemini, чтобы понять разницу в применимости этих метрик.
Если вы работали с API текстовых больших языковых моделей, то наверняка привыкли к метрике QPS (запросов в секунду). Но когда дело доходит до API для генерации изображений, таких как Nano Banana Pro и Nano Banana 2, в официальной документации речь идет исключительно об RPM (запросов в минуту) — почему API для генерации изображений не используют QPS? Это не вопрос предпочтений в нейминге, а следствие того, что синхронная блокирующая модель вызова делает QPS практически бессмысленным в данном контексте. В этой статье мы разберем техническую разницу между ними.
Ключевая ценность: Прочитав эту статью, вы поймете фундаментальные различия между RPM и QPS в разных сценариях API, а также то, почему синхронная модель вызова Gemini превращает QPS в фикцию.

Основные различия между RPM и QPS
Ответим сразу: для API генерации изображений используется RPM, а не QPS, потому что время блокировки при синхронных вызовах слишком велико, и QPS теряет всякий смысл.
| Понятие | Определение | Сценарии использования | Подходит для API генерации? |
|---|---|---|---|
| QPS | Запросов в секунду (Queries Per Second) | Высокочастотные сервисы с откликом в мс | Не подходит |
| RPS | Запросов в секунду (Requests Per Second) | Эквивалентно QPS | Не подходит |
| RPM | Запросов в минуту (Requests Per Minute) | Медленные сервисы с откликом в сек-мин | Подходит |
| IPM | Изображений в минуту (Images Per Minute) | Специально для генерации изображений | Наиболее подходит |
| RPD | Запросов в день (Requests Per Day) | Управление квотами | Подходит |
Почему QPS для API генерации изображений — это ложная метрика
Ключ к пониманию проблемы кроется в синхронном характере вызовов API генерации Gemini.
Когда вы отправляете запрос на генерацию изображения через Nano Banana 2, API работает в режиме синхронной блокировки: вы отправляете запрос, HTTP-соединение остается открытым, и клиент ждет, пока изображение не будет полностью готово (от 13 до 170 секунд). Все это время соединение просто «висит» в ожидании.
Сравните:
- Claude API (текст): первый токен возвращается через 50–200 мс, потоковая передача, полезный результат доступен уже в течение секунды.
- Nano Banana 2 (изображение 1K): минимум 13 секунд ожидания, соединение заблокировано на всем протяжении.
Поэтому для API генерации вопрос «сколько запросов в секунду (QPS) можно обработать» лишен смысла — ведь один запрос может занимать 13 и более секунд. RPM — это единственный адекватный способ измерения.
🎯 Аналогия: QPS — это как измерять, сколько порций фастфуда выдает закусочная в секунду. RPM — это как оценивать, сколько столиков может обслужить ресторан высокой кухни за час. Вы же не будете измерять эффективность ресторана «количеством блюд в секунду», потому что приготовление одного блюда занимает 30 минут.
Через APIYI (apiyi.com) при вызове Nano Banana 2 лимиты RPM не такие жесткие, как у официальных провайдеров, что позволяет выполнять больше параллельных запросов.
Технические детали синхронных вызовов API генерации Gemini
Это фундамент для понимания разницы между RPM и QPS.
Процесс блокировки при синхронном вызове Nano Banana 2
Клиент отправляет запрос
│
▼
Установка TCP-соединения ──────────────────────────────┐
│ │
▼ │
Сервер получает промпт │ Соединение открыто
│ │ Клиент заблокирован
▼ │
Инференс диффузионной модели (13-170 сек) │
│ │
▼ │
Кодирование изображения в base64 │
│ │
▼ │
Ответ (с данными изображения) ─────────────────────────┘
│
▼
Клиент получает изображение
В этом процессе поток/процесс клиента полностью занят. Если вы используете однопоточный синхронный вызов, то за 1 минуту вы сможете отправить максимум 60 / время_генерации запросов. Для изображения 1K (13 секунд) однопоточный QPS составит около 0,077 (0,077 запроса в секунду), что в пересчете на RPM дает всего 4,6.
Время блокировки Nano Banana 2 для разных разрешений
| Разрешение | Типичное время генерации | Лимит RPM (один поток) | Однопоточный "QPS" |
|---|---|---|---|
| 0.5K | ~8 сек | ~7.5 RPM | 0.125 |
| 1K | ~13 сек | ~4.6 RPM | 0.077 |
| 2K | ~30 сек | ~2 RPM | 0.033 |
| 4K | ~90-170 сек | ~0.4-0.7 RPM | 0.006-0.011 |
Видите? При разрешении 4K однопоточный «QPS» составляет всего 0,006 — то есть в среднем один запрос выполняется 170 секунд. Обсуждать QPS в таких масштабах бессмысленно, RPM — единственный эффективный показатель.
В каких сценариях лучше использовать RPM, а в каких — QPS
Сценарии использования QPS
QPS (запросов в секунду) имеет смысл как показатель скорости только в том случае, если время отклика на один запрос значительно меньше 1 секунды.
| Тип сервиса | Типичное время отклика | Имеет ли смысл QPS | Причина |
|---|---|---|---|
| CDN / Кэш | 1-10 мс | Очень важно | Тысячи запросов в секунду |
| Запросы к БД | 5-50 мс | Важно | Сотни запросов в секунду |
| Первый токен LLM | 50-200 мс | Важно | 5-20 запусков в секунду |
| API поиска | 100-500 мс | Важно | 2-10 завершенных запросов в секунду |
Сценарии использования RPM
RPM (запросов в минуту) — более адекватный показатель для сценариев, где время отклика на один запрос составляет от нескольких секунд до минут.
| Тип сервиса | Типичное время отклика | Почему лучше RPM | Ограничения Gemini |
|---|---|---|---|
| Генерация изображений | 8-170 сек | Невозможно уложиться в 1 сек | RPM + IPM |
| Генерация видео | 30-300 сек | Запрос занимает минуты | RPM |
| Пакетная обработка | Минуты | Задачи дольше секунды | RPM + RPD |
| Конвертация файлов | 5-60 сек | Долгая обработка | RPM |
Четырехмерные лимиты скорости API генерации изображений Gemini
Google установила четыре измерения для ограничения скорости API генерации изображений Gemini. Превышение любого из них приведет к ограничению скорости:
| Измерение | Значение | Бесплатный уровень | Tier 1 (платный) |
|---|---|---|---|
| RPM | Запросов в минуту | 5-15 | 150-300 |
| TPM | Токенов в минуту | Ограничено | Высокое |
| RPD | Запросов в день | 20-100 | 1,000+ |
| IPM | Изображений в минуту | Ограничено | Высокое |
Обратите внимание на IPM (изображений в минуту) — это показатель, специально разработанный для генерации изображений. Поскольку один запрос может генерировать несколько картинок, связь между RPM и IPM не является простой зависимостью «один к одному».

Как повысить реальную пропускную способность API для генерации изображений
Разобравшись с тем, что такое RPM (запросов в минуту), переходим к следующему вопросу: как выжать максимум из лимитов RPM и повысить эффективность генерации.
Многопоточность + расчет лимитов RPM
Допустим, вам нужно генерировать 20 изображений в формате 1K в минуту:
RPM одного потока = 60 секунд / 13 секунд ≈ 4,6 изобр./мин
Необходимое количество потоков = 20 / 4,6 ≈ 5 параллельных потоков
При этом важно убедиться, что суммарный RPM этих 5 потоков (около 23 RPM) не превышает лимит вашего аккаунта. На бесплатном тарифе доступно всего 5–15 RPM, на платном Tier 1 — 150–300 RPM.
Рекомендации по оптимизации параллельных вызовов API
| Стратегия оптимизации | Эффект | Сценарий использования |
|---|---|---|
| Многопоточность/корутины | Линейный рост (ограничен RPM) | Генерация в реальном времени |
| Batch API (асинхронно) | Нет блокировки + скидка 50% | Массовые задачи, где допустима задержка |
| Снижение разрешения | Время на одно фото меньше → RPM выше | Превью, эскизы |
| Сервис-прокси APIYI | Обход официальных лимитов RPM | Высоконагруженная продакшн-среда |
| Тайм-ауты клиента | Избежание пустых ожиданий | Все сценарии (для 1K — 300с, для 4K — 600с) |
🎯 Совет из практики: Если вам нужна высокая скорость генерации, использование Nano Banana 2 через APIYI (apiyi.com) — самый простой путь. Вы не ограничены официальными лимитами RPM, получаете скидку 28%, а фиксированная цена за 4K составляет всего $0,045.
Часто задаваемые вопросы
Q1: Если я отправлю 10 запросов асинхронно, сколько это будет в RPM?
Будет 10. RPM считает количество запросов, которые вы отправили в течение одной минуты, независимо от того, вернулись ли они. Даже если вы отправите 10 запросов одновременно, и каждый из них будет обрабатываться 13 секунд, все они попадут в лимит RPM одной минуты. Поэтому многопоточность помогает повысить пропускную способность, но не позволяет обойти квоту RPM.
Q2: Является ли Gemini Batch API асинхронным? Можно ли через него обойти RPM?
Да. Gemini Batch API работает в асинхронном режиме: вы отправляете пачку запросов и сразу получаете ID задачи, не блокируя клиент. Задача обрабатывается в фоновом режиме, и по завершении вы забираете результат. У Batch API свои квоты (по токенам), они не занимают лимиты реального времени (RPM), а цена ниже на 50%. Минус в том, что нет гарантии мгновенного ответа, поэтому это подходит для задач, которые "не горят".
Q3: Является ли chatgpt-image-latest от OpenAI тоже синхронным и блокирующим?
Да. chatgpt-image-latest — это тоже синхронный вызов, время ответа составляет около 44–60 секунд. В сообществе разработчиков часто жалуются на проблемы с тайм-аутами у gpt-image-1, поэтому рекомендуется устанавливать тайм-аут не менее 300 секунд. API изображений OpenAI также использует RPM как показатель ограничения скорости, логика та же, что и у Gemini: из-за долгого времени ответа при синхронной блокировке показатель QPS (запросов в секунду) теряет смысл.
Q4: Как APIYI обходит официальные лимиты RPM?
APIYI использует механизм ротации пула аккаунтов: платформа поддерживает множество аккаунтов Gemini API, и запросы клиентов автоматически распределяются между ними. У каждого аккаунта своя квота RPM. Для разработчика это выглядит как значительное увеличение лимита без необходимости управлять десятками API-ключей вручную. В придачу вы получаете скидку 28% и фиксированную цену $0,045 за 4K.

Резюме
Основная причина, по которой API для генерации изображений Nano Banana использует RPM (запросов в минуту), а не QPS (запросов в секунду):
- Синхронная блокировка определяет единицу измерения: API генерации изображений Gemini работает в синхронном режиме. Один запрос блокирует поток на 13–170 секунд, поэтому за одну секунду невозможно завершить даже один запрос. Метрика QPS здесь просто не имеет смысла, а RPM — это вполне логичный показатель.
- RPM для медленных сервисов, QPS для быстрых: Простой критерий: если время отклика меньше 1 секунды — используем QPS, если больше 1 секунды — RPM. Генерация изображений, видео и конвертация файлов относятся к сценариям RPM.
- Ключ к увеличению пропускной способности — параллелизм и квоты: Многопоточность позволяет линейно повышать пропускную способность, но она ограничена квотой RPM. Использование пула аккаунтов через APIYI позволяет обойти лимиты RPM для одного аккаунта.
Рекомендуем вызывать Nano Banana 2 через APIYI (apiyi.com) — это позволяет избежать официальных ограничений RPM, получить скидку 28% и фиксированную цену $0.045 за 4K.
📚 Справочные материалы
-
Gemini API Rate Limits: Официальная документация по лимитам скорости.
- Ссылка:
ai.google.dev/gemini-api/docs/rate-limits - Описание: Полное руководство по ограничениям RPM, TPM, RPD и IPM.
- Ссылка:
-
Сравнение синхронного и асинхронного API Nano Banana Pro: Технические различия режимов вызова.
- Ссылка:
help.apiyi.com/en/nano-banana-pro-sync-async-api-comparison-en.html - Описание: Информация о времени блокировки, настройках тайм-аута и расчете пропускной способности.
- Ссылка:
-
OpenAI Rate Limits: Документация по лимитам скорости OpenAI (система RPM).
- Ссылка:
developers.openai.com/api/docs/guides/rate-limits - Описание: Сравнение подходов к проектированию лимитов скорости у Gemini и OpenAI.
- Ссылка:
-
Центр документации APIYI: Подключение API для генерации изображений с обходом лимитов RPM.
- Ссылка:
docs.apiyi.com - Описание: Высокопроизводительное подключение к Nano Banana 2 и информация о скидках.
- Ссылка:
Автор: Техническая команда APIYI
Техническое обсуждение: Приглашаем к дискуссии в комментариях, дополнительные материалы доступны в центре документации APIYI по адресу docs.apiyi.com.
