Почему API генерации изображений Nano Banana использует RPM, а не QPS? Анализ ограничений скорости в режиме синхронного вызова модели

ОтAPIYI - Stable and affordable AI API 2026年 3月 25日

title: "Почему API для генерации изображений используют RPM вместо QPS?"
description: "Разбираемся, почему для API вроде Nano Banana Pro и Nano Banana 2 критически важен RPM, и как синхронная природа генерации изображений делает QPS бесполезным показателем."

Авторская заметка: Глубокий разбор того, почему API для генерации изображений, такие как Nano Banana Pro и Nano Banana 2, используют RPM (запросов в минуту) вместо QPS (запросов в секунду) в качестве лимитов. Разбираем это на примере блокирующего характера синхронных вызовов Gemini, чтобы понять разницу в применимости этих метрик.

Если вы работали с API текстовых больших языковых моделей, то наверняка привыкли к метрике QPS (запросов в секунду). Но когда дело доходит до API для генерации изображений, таких как Nano Banana Pro и Nano Banana 2, в официальной документации речь идет исключительно об RPM (запросов в минуту) — почему API для генерации изображений не используют QPS? Это не вопрос предпочтений в нейминге, а следствие того, что синхронная блокирующая модель вызова делает QPS практически бессмысленным в данном контексте. В этой статье мы разберем техническую разницу между ними.

Ключевая ценность: Прочитав эту статью, вы поймете фундаментальные различия между RPM и QPS в разных сценариях API, а также то, почему синхронная модель вызова Gemini превращает QPS в фикцию.

Основные различия между RPM и QPS

Ответим сразу: для API генерации изображений используется RPM, а не QPS, потому что время блокировки при синхронных вызовах слишком велико, и QPS теряет всякий смысл.

Понятие	Определение	Сценарии использования	Подходит для API генерации?
QPS	Запросов в секунду (Queries Per Second)	Высокочастотные сервисы с откликом в мс	Не подходит
RPS	Запросов в секунду (Requests Per Second)	Эквивалентно QPS	Не подходит
RPM	Запросов в минуту (Requests Per Minute)	Медленные сервисы с откликом в сек-мин	Подходит
IPM	Изображений в минуту (Images Per Minute)	Специально для генерации изображений	Наиболее подходит
RPD	Запросов в день (Requests Per Day)	Управление квотами	Подходит

Почему QPS для API генерации изображений — это ложная метрика

Ключ к пониманию проблемы кроется в синхронном характере вызовов API генерации Gemini.

Когда вы отправляете запрос на генерацию изображения через Nano Banana 2, API работает в режиме синхронной блокировки: вы отправляете запрос, HTTP-соединение остается открытым, и клиент ждет, пока изображение не будет полностью готово (от 13 до 170 секунд). Все это время соединение просто «висит» в ожидании.

Сравните:

Claude API (текст): первый токен возвращается через 50–200 мс, потоковая передача, полезный результат доступен уже в течение секунды.
Nano Banana 2 (изображение 1K): минимум 13 секунд ожидания, соединение заблокировано на всем протяжении.

Поэтому для API генерации вопрос «сколько запросов в секунду (QPS) можно обработать» лишен смысла — ведь один запрос может занимать 13 и более секунд. RPM — это единственный адекватный способ измерения.

🎯 Аналогия: QPS — это как измерять, сколько порций фастфуда выдает закусочная в секунду. RPM — это как оценивать, сколько столиков может обслужить ресторан высокой кухни за час. Вы же не будете измерять эффективность ресторана «количеством блюд в секунду», потому что приготовление одного блюда занимает 30 минут.
Через APIYI (apiyi.com) при вызове Nano Banana 2 лимиты RPM не такие жесткие, как у официальных провайдеров, что позволяет выполнять больше параллельных запросов.

Технические детали синхронных вызовов API генерации Gemini

Это фундамент для понимания разницы между RPM и QPS.

Процесс блокировки при синхронном вызове Nano Banana 2

Клиент отправляет запрос
    │
    ▼
Установка TCP-соединения ──────────────────────────────┐
    │                                                  │
    ▼                                                  │
Сервер получает промпт                                 │ Соединение открыто
    │                                                  │ Клиент заблокирован
    ▼                                                  │
Инференс диффузионной модели (13-170 сек)              │
    │                                                  │
    ▼                                                  │
Кодирование изображения в base64                       │
    │                                                  │
    ▼                                                  │
Ответ (с данными изображения) ─────────────────────────┘
    │
    ▼
Клиент получает изображение

В этом процессе поток/процесс клиента полностью занят. Если вы используете однопоточный синхронный вызов, то за 1 минуту вы сможете отправить максимум 60 / время_генерации запросов. Для изображения 1K (13 секунд) однопоточный QPS составит около 0,077 (0,077 запроса в секунду), что в пересчете на RPM дает всего 4,6.

Время блокировки Nano Banana 2 для разных разрешений

Разрешение	Типичное время генерации	Лимит RPM (один поток)	Однопоточный "QPS"
0.5K	~8 сек	~7.5 RPM	0.125
1K	~13 сек	~4.6 RPM	0.077
2K	~30 сек	~2 RPM	0.033
4K	~90-170 сек	~0.4-0.7 RPM	0.006-0.011

Видите? При разрешении 4K однопоточный «QPS» составляет всего 0,006 — то есть в среднем один запрос выполняется 170 секунд. Обсуждать QPS в таких масштабах бессмысленно, RPM — единственный эффективный показатель.

В каких сценариях лучше использовать RPM, а в каких — QPS

Сценарии использования QPS

QPS (запросов в секунду) имеет смысл как показатель скорости только в том случае, если время отклика на один запрос значительно меньше 1 секунды.

Тип сервиса	Типичное время отклика	Имеет ли смысл QPS	Причина
CDN / Кэш	1-10 мс	Очень важно	Тысячи запросов в секунду
Запросы к БД	5-50 мс	Важно	Сотни запросов в секунду
Первый токен LLM	50-200 мс	Важно	5-20 запусков в секунду
API поиска	100-500 мс	Важно	2-10 завершенных запросов в секунду

Сценарии использования RPM

RPM (запросов в минуту) — более адекватный показатель для сценариев, где время отклика на один запрос составляет от нескольких секунд до минут.

Тип сервиса	Типичное время отклика	Почему лучше RPM	Ограничения Gemini
Генерация изображений	8-170 сек	Невозможно уложиться в 1 сек	RPM + IPM
Генерация видео	30-300 сек	Запрос занимает минуты	RPM
Пакетная обработка	Минуты	Задачи дольше секунды	RPM + RPD
Конвертация файлов	5-60 сек	Долгая обработка	RPM

Четырехмерные лимиты скорости API генерации изображений Gemini

Google установила четыре измерения для ограничения скорости API генерации изображений Gemini. Превышение любого из них приведет к ограничению скорости:

Измерение	Значение	Бесплатный уровень	Tier 1 (платный)
RPM	Запросов в минуту	5-15	150-300
TPM	Токенов в минуту	Ограничено	Высокое
RPD	Запросов в день	20-100	1,000+
IPM	Изображений в минуту	Ограничено	Высокое

Обратите внимание на IPM (изображений в минуту) — это показатель, специально разработанный для генерации изображений. Поскольку один запрос может генерировать несколько картинок, связь между RPM и IPM не является простой зависимостью «один к одному».

Как повысить реальную пропускную способность API для генерации изображений

Разобравшись с тем, что такое RPM (запросов в минуту), переходим к следующему вопросу: как выжать максимум из лимитов RPM и повысить эффективность генерации.

Многопоточность + расчет лимитов RPM

Допустим, вам нужно генерировать 20 изображений в формате 1K в минуту:

RPM одного потока = 60 секунд / 13 секунд ≈ 4,6 изобр./мин
Необходимое количество потоков = 20 / 4,6 ≈ 5 параллельных потоков

При этом важно убедиться, что суммарный RPM этих 5 потоков (около 23 RPM) не превышает лимит вашего аккаунта. На бесплатном тарифе доступно всего 5–15 RPM, на платном Tier 1 — 150–300 RPM.

Стратегия оптимизации	Эффект	Сценарий использования
Многопоточность/корутины	Линейный рост (ограничен RPM)	Генерация в реальном времени
Batch API (асинхронно)	Нет блокировки + скидка 50%	Массовые задачи, где допустима задержка
Снижение разрешения	Время на одно фото меньше → RPM выше	Превью, эскизы
Сервис-прокси APIYI	Обход официальных лимитов RPM	Высоконагруженная продакшн-среда
Тайм-ауты клиента	Избежание пустых ожиданий	Все сценарии (для 1K — 300с, для 4K — 600с)

Часто задаваемые вопросы

Q1: Если я отправлю 10 запросов асинхронно, сколько это будет в RPM?

Будет 10. RPM считает количество запросов, которые вы отправили в течение одной минуты, независимо от того, вернулись ли они. Даже если вы отправите 10 запросов одновременно, и каждый из них будет обрабатываться 13 секунд, все они попадут в лимит RPM одной минуты. Поэтому многопоточность помогает повысить пропускную способность, но не позволяет обойти квоту RPM.

Q2: Является ли Gemini Batch API асинхронным? Можно ли через него обойти RPM?

Да. Gemini Batch API работает в асинхронном режиме: вы отправляете пачку запросов и сразу получаете ID задачи, не блокируя клиент. Задача обрабатывается в фоновом режиме, и по завершении вы забираете результат. У Batch API свои квоты (по токенам), они не занимают лимиты реального времени (RPM), а цена ниже на 50%. Минус в том, что нет гарантии мгновенного ответа, поэтому это подходит для задач, которые "не горят".

Q3: Является ли chatgpt-image-latest от OpenAI тоже синхронным и блокирующим?

Да. chatgpt-image-latest — это тоже синхронный вызов, время ответа составляет около 44–60 секунд. В сообществе разработчиков часто жалуются на проблемы с тайм-аутами у gpt-image-1, поэтому рекомендуется устанавливать тайм-аут не менее 300 секунд. API изображений OpenAI также использует RPM как показатель ограничения скорости, логика та же, что и у Gemini: из-за долгого времени ответа при синхронной блокировке показатель QPS (запросов в секунду) теряет смысл.

Q4: Как APIYI обходит официальные лимиты RPM?

APIYI использует механизм ротации пула аккаунтов: платформа поддерживает множество аккаунтов Gemini API, и запросы клиентов автоматически распределяются между ними. У каждого аккаунта своя квота RPM. Для разработчика это выглядит как значительное увеличение лимита без необходимости управлять десятками API-ключей вручную. В придачу вы получаете скидку 28% и фиксированную цену $0,045 за 4K.

Резюме

Основная причина, по которой API для генерации изображений Nano Banana использует RPM (запросов в минуту), а не QPS (запросов в секунду):

Синхронная блокировка определяет единицу измерения: API генерации изображений Gemini работает в синхронном режиме. Один запрос блокирует поток на 13–170 секунд, поэтому за одну секунду невозможно завершить даже один запрос. Метрика QPS здесь просто не имеет смысла, а RPM — это вполне логичный показатель.
RPM для медленных сервисов, QPS для быстрых: Простой критерий: если время отклика меньше 1 секунды — используем QPS, если больше 1 секунды — RPM. Генерация изображений, видео и конвертация файлов относятся к сценариям RPM.
Ключ к увеличению пропускной способности — параллелизм и квоты: Многопоточность позволяет линейно повышать пропускную способность, но она ограничена квотой RPM. Использование пула аккаунтов через APIYI позволяет обойти лимиты RPM для одного аккаунта.

Рекомендуем вызывать Nano Banana 2 через APIYI (apiyi.com) — это позволяет избежать официальных ограничений RPM, получить скидку 28% и фиксированную цену $0.045 за 4K.

📚 Справочные материалы

Gemini API Rate Limits: Официальная документация по лимитам скорости.
- Ссылка: ai.google.dev/gemini-api/docs/rate-limits
- Описание: Полное руководство по ограничениям RPM, TPM, RPD и IPM.
Сравнение синхронного и асинхронного API Nano Banana Pro: Технические различия режимов вызова.
- Ссылка: help.apiyi.com/en/nano-banana-pro-sync-async-api-comparison-en.html
- Описание: Информация о времени блокировки, настройках тайм-аута и расчете пропускной способности.
OpenAI Rate Limits: Документация по лимитам скорости OpenAI (система RPM).
- Ссылка: developers.openai.com/api/docs/guides/rate-limits
- Описание: Сравнение подходов к проектированию лимитов скорости у Gemini и OpenAI.
Центр документации APIYI: Подключение API для генерации изображений с обходом лимитов RPM.
- Ссылка: docs.apiyi.com
- Описание: Высокопроизводительное подключение к Nano Banana 2 и информация о скидках.

Автор: Техническая команда APIYI
Техническое обсуждение: Приглашаем к дискуссии в комментариях, дополнительные материалы доступны в центре документации APIYI по адресу docs.apiyi.com.

APIYI - Stable and affordable AI API

Try AI Large Model https://api.apiyi.com for free
Stable and reliable AI LM API aggregation service, Get 300 Millions Tokens for Free~

Gemini API | Выбор и сравнение моделей

GPT-5.4 против Claude Opus 4.6: глубокое сравнение флагманских ИИ-моделей 2026 года с данными реальных тестов агентов OpenClaw
ОтAPIYI - Stable and affordable AI API 2026年 3月 14日

Примечание автора: GPT-5.4 или Claude Opus 4.6? В 2026 году две главные флагманские ИИ-модели сошлись в лобовом столкновении. В этой статье мы собрали свежие данные тестов Chatbot Arena, SWE-bench, ARC-AGI-2 и OpenClaw PinchBench, чтобы сравнить их возможности в деле: от написания кода и логики до работы агентов и стоимости токенов. В конце — четкие рекомендации,…

Читайте далее GPT-5.4 против Claude Opus 4.6: глубокое сравнение флагманских ИИ-моделей 2026 года с данными реальных тестов агентов OpenClaw
API генерации изображений | Новости API больших моделей

Почему GPT-image-2 стал намного популярнее, чем 1.5? Точность воспроизведения иероглифов — главный барьер для распространения в китайскоязычном сегменте (наблюдение за апрель 2026 года)
ОтAPIYI - Stable and affordable AI API 2026年 4月 26日

Примечание автора: Глубокий анализ того, почему популярность GPT-image-2 в китайском сегменте интернета значительно превзошла версию 1.5. Решающим фактором стал качественный скачок в отрисовке иероглифов — с 95% до 99%, что стало катализатором массового распространения среди китайских пользователей. После того как 21 апреля 2026 года OpenAI представила GPT-image-2, в китайском сообществе поднялась волна хайпа, которая далеко…

Читайте далее Почему GPT-image-2 стал намного популярнее, чем 1.5? Точность воспроизведения иероглифов — главный барьер для распространения в китайскоязычном сегменте (наблюдение за апрель 2026 года)
API генерации изображений | Лучшие практики API

Nano Banana Pro не поддерживает параметр Seed? 5 альтернатив для массового воспроизведения стиля
ОтAPIYI - Stable and affordable AI API 2026年 2月 21日

От автора: Глубокий разбор технических причин, по которым Nano Banana Pro не поддерживает параметр seed, а также практические альтернативы для тех случаев, когда вы довольны результатом генерации и хотите массово его повторить. Реальный отзыв пользователя: «Я отредактировал изображение, и результат мне очень понравился. Теперь я хочу пакетно обработать еще несколько картинок с точно таким же…

Читайте далее Nano Banana Pro не поддерживает параметр Seed? 5 альтернатив для массового воспроизведения стиля
API генерации изображений | Сценарии использования API

Освойте 8 наборов шаблонов промптов для коммерческих наборов изображений и используйте Nano Banana для пакетной генерации профессиональных продуктовых фотографий
ОтAPIYI - Stable and affordable AI API 2026年 3月 10日

Примечание автора: делюсь 8 готовыми шаблонами промптов для комплектов изображений в электронной коммерции, охватывающими основные потребности, такие как основное изображение на белом фоне, сцены, детали и т.д. Подходят для моделей генерации изображений Nano Banana 2 и Nano Banana Pro. В электронной коммерции визуальная согласованность изображений продукта напрямую влияет на конверсию. Самая большая проблема, с которой…

Читайте далее Освойте 8 наборов шаблонов промптов для коммерческих наборов изображений и используйте Nano Banana для пакетной генерации профессиональных продуктовых фотографий
API генерации изображений | OpenAI API

Разбор 6 ключевых преимуществ официального сервиса-прокси API APIYI GPT-image-2
ОтAPIYI - Stable and affordable AI API 2026年 4月 23日

После официального релиза gpt-image-2 от OpenAI в апреле 2026 года, эта модель для генерации изображений с поддержкой 2K-разрешения, сверхширокого формата и мультимодального редактирования быстро стала основным выбором для продуктовых команд, создающих маркетинговые материалы, изображения для электронной коммерции и инфографику. Однако, когда команды начали внедрять gpt-image-2 API в производственную среду, возникли проблемы: система уровней (Tier) OpenAI…

Читайте далее Разбор 6 ключевых преимуществ официального сервиса-прокси API APIYI GPT-image-2
API генерации изображений | Сценарии использования API

В чем сила GPT-image-2? Глубокий анализ 8 ключевых особенностей + коммерческий обзор генерации изображений для плакатов и карточек товаров
ОтAPIYI - Stable and affordable AI API 2026年 4月 25日

Примечание автора: глубокий обзор 8 ключевых особенностей GPT-image-2 с количественным анализом эффективности и возможности замены дизайнера в коммерческих сценариях (рекламные постеры и карточки товаров). С момента выпуска 21 апреля 2026 года модель GPT-image-2 набрала +242 балла Elo в рейтинге LM Arena для задач «текст-в-изображение», и внутри OpenAI её называют «первой массовой графической моделью с нативными…

Читайте далее В чем сила GPT-image-2? Глубокий анализ 8 ключевых особенностей + коммерческий обзор генерации изображений для плакатов и карточек товаров