|

Nano Banana 2 настройка response_modalities=IMAGE возвращает только изображения, сколько токенов можно сэкономить? Практический анализ тарификации

Примечание автора: Глубокий анализ различий в потреблении токенов при установке response_modalities в IMAGE (только изображение) в Nano Banana 2. Разбор правил тарификации для трех типов токенов (изображение/текст/мышление) и рекомендации по оптимальной конфигурации для экономии.

nano-banana-2-response-modalities-image-only-token-cost-guide-ru 图示

При генерации изображений с помощью Nano Banana 2 параметр response_modalities можно настроить двумя способами: ["Text", "Image"] (по умолчанию) и ["Image"] (только изображение). Возникает закономерный вопрос: Сколько токенов и денег можно сэкономить, установив режим "только изображение"?

Ключевая ценность: Прочитав эту статью, вы полностью поймете правила тарификации трех типов выходных токенов Nano Banana 2 (изображение/текст/мышление), точно узнаете, сколько денег экономит response_modalities=["Image"], и получите действительно эффективные стратегии экономии.


Правила тарификации трёх типов выходных токенов Nano Banana 2

Тарификация выходных данных Nano Banana 2 — это не просто «одна цена», а три независимо оцениваемых типа токенов:

Тип токена Стоимость за 1 млн токенов Описание Можно ли исключить параметром
Выходные токены изображения $60.00 / M Tokens Токены, расходуемые на генерацию картинки, составляют 95%+ от общей стоимости ❌ Нет (основной результат)
Выходные текстовые токены $3.00 / M Tokens Текстовое описание/пояснение к изображению ✅ Да, установкой ["Image"]
Токены размышления (Thinking) $3.00 / M Tokens Потребляются в процессе внутренних рассуждений модели ❌ Генерируются всегда, отключить нельзя
Входные токены $0.50 / M Tokens Текст вашего промпта и эталонные изображения ⚠️ Можно оптимизировать длину промпта

Токены изображения — абсолютно основная статья расходов в Nano Banana 2

Ключевой факт: стоимость выходных токенов изображения составляет $60/M, в то время как текстовые токены и токены размышления стоят всего $3/M — токены изображения дороже в 20 раз.

Разрешение Выходные токены изображения Стоимость изображения Доля от общих выходных затрат
512px ~747 ~$0.045 ~95%
1K (по умолчанию) ~1,120 ~$0.067 ~96%
2K ~1,680 ~$0.101 ~97%
4K ~2,520 ~$0.151 ~97%

🔑 Ключевой вывод: Токены изображения составляют 95-97% от стоимости вывода. Текстовые токены и токены размышления вместе занимают всего 3-5%. Поэтому даже полное исключение текстового вывода сэкономит очень ограниченную сумму.


Сравнение потребления токенов для двух настроек response_modalities

nano-banana-2-response-modalities-image-only-token-cost-guide-ru 图示

Настройка ["Text", "Image"] — режим по умолчанию

По умолчанию Nano Banana 2 возвращает картинку + текстовое описание. Модель сначала «размышляет» (Thinking), а затем выводит текстовое описание и изображение.

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Сгенерируй кота в скафандре",
    config=types.GenerateContentConfig(
        response_modalities=["Text", "Image"],  # По умолчанию: текст + изображение
    )
)

Содержимое вывода: текстовое описание (например, «Это рыжий кот в скафандре…») + 1 изображение

Структура потребления токенов (на примере разрешения 1K):

  • Токены размышления: ~200-800 (зависит от сложности промпта)
  • Выходные текстовые токены: ~50-200
  • Выходные токены изображения: ~1,120

Настройка ["Image"] — режим «только изображение»

Настройка для возврата только изображения, без текстового описания.

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="Сгенерируй кота в скафандре",
    config=types.GenerateContentConfig(
        response_modalities=["Image"],  # Только изображение, без текста
    )
)

Содержимое вывода: только 1 изображение, без текстового описания

Структура потребления токенов (на примере разрешения 1K):

  • Токены размышления: ~200-800 (всё равно генерируются, всё равно тарифицируются)
  • Выходные текстовые токены: 0 (исключены ✅)
  • Выходные токены изображения: ~1,120 (без изменений)

Сравнение стоимости двух режимов Nano Banana 2

Параметр сравнения ["Text", "Image"] (по умолчанию) ["Image"] (только изображение) Разница
Токены изображения (~1,120) $0.0672 $0.0672 0 (без изменений)
Токены размышления (~500) $0.0015 $0.0015 0 (без изменений)
Текстовые токены (~100) $0.0003 $0 Экономия $0.0003
Общая стоимость за изображение (1K) ~$0.069 ~$0.069 Экономия ~0.4%

⚠️ Вывод: response_modalities=["Image"] действительно позволяет сэкономить на выходных текстовых токенах. Однако, поскольку стоимость текстовых токенов составляет всего $3/M, а их количество невелико (примерно 50-200), фактическая экономия на одно изображение составляет всего около $0.0001-$0.0006, чем можно пренебречь.

Почему в Nano Banana 2 нельзя отключить Thinking Token?

Это самый часто упускаемый из виду момент в тарификации Nano Banana 2: Thinking Token всегда генерируются и всегда тарифицируются, независимо от того, просматриваете ли вы процесс размышлений.

Официальная документация Google прямо говорит:

Thinking tokens тарифицируются независимо от того, установлен ли параметр includeThoughts в значение true или false, так как процесс размышлений по умолчанию всегда происходит.

Другими словами:

  • includeThoughts=True: вы видите процесс размышлений, тарифицируется
  • includeThoughts=False: вы не видите процесс размышлений, всё равно тарифицируется
  • Тариф на Thinking Token: $3/M (такой же, как и для текстового вывода)

Nano Banana 2 поддерживает два уровня Thinking:

Уровень Thinking Способ настройки Расход Thinking Token Качество изображения Рекомендуемый сценарий
minimal По умолчанию ~200-500 Достаточно для большинства сценариев Повседневная генерация изображений
high thinking_level="high" ~500-2000 Лучше для сложных сцен Мультиперсонажные/точные композиции

💡 Рекомендация по оптимизации: Если не требуется максимальное качество изображения, оставьте уровень minimal по умолчанию. Уровень high увеличит количество Thinking Token на сотни или тысячи, и хотя цена за токен невысока ($3/M), в сценариях пакетной обработки это может стать заметной статьёй расходов.


Действительно эффективные стратегии экономии для Nano Banana 2

Раз response_modalities=["Image"] экономит не так много, какие стратегии действительно работают?

nano-banana-2-response-modalities-image-only-token-cost-guide-ru 图示

Стратегия экономии Экономия Конкретные действия Рекомендация
Выбор подходящего разрешения До 70% 4K→512px: стоимость снижается с $0.151 до $0.045 ⭐⭐⭐⭐⭐
Использование APIYI с поштучной оплатой До 70% $0.045/изображение (включая 4K), без разделения по разрешению ⭐⭐⭐⭐⭐
Использование APIYI с оплатой по объёму До 63% Низкое разрешение всего $0.018/изображение (512px) ⭐⭐⭐⭐⭐
Google Batch API 50% Офлайн-пакетная обработка, токены изображений в два раза дешевле ⭐⭐⭐⭐
Thinking minimal 2-5% Оставить уровень размышлений по умолчанию ⭐⭐⭐
response_modalities=["Image"] ~0.4% Убрать текстовый вывод

Сравнение цен Nano Banana 2 для разных разрешений на разных платформах

Разрешение Google официально APIYI по запросу APIYI по объёму Максимальная экономия
512px $0.045 $0.045 $0.018 60%
1K $0.067 $0.045 $0.025 63%
2K $0.101 $0.045 $0.03 70%
4K $0.151 $0.045 $0.045 70%

🎯 Лучшие практики: Если вашему бизнесу подходит разрешение 1K вместо 4K, вы сразу экономите 55%. В сочетании с оплатой по объёму на APIYI apiyi.com, разрешение 1K стоит всего $0.025 за изображение, что на 83% дешевле официальной цены $0.151 за 4K. Платформа также предоставляет бесплатный инструмент для тестирования генерации изображений AI 图片大师: imagen.apiyi.com, который позволяет быстро проверить эффект разных разрешений без написания кода.

Оптимальная конфигурация для вызова Nano Banana 2 через APIYI

Основываясь на проведенном анализе, вот рекомендуемая оптимальная конфигурация:

import requests
import base64

API_KEY = "your-apiyi-api-key"
ENDPOINT = "https://api.apiyi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"

headers = {
    "Content-Type": "application/json",
    "x-goog-api-key": API_KEY
}

payload = {
    "contents": [{"parts": [{"text": "Кот в скафандре, цифровой арт"}]}],
    "generationConfig": {
        "responseModalities": ["IMAGE"],  # Только изображение, экономит текстовые токены
        "imageConfig": {
            "aspectRatio": "1:1",
            "imageSize": "1K"  # Выбирайте разрешение по необходимости — это ключ к экономии
        }
    }
}

response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()

image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
    f.write(base64.b64decode(image_data))

Рекомендация: Используя APIYI (apiyi.com) для вызова Nano Banana 2, вы платите $0.045 за изображение при поштучной оплате (независимо от разрешения) или от $0.018 за изображение при объемной оплате. Поддерживается нативный формат вызовов Google, что обеспечивает нулевые затраты на миграцию.


Часто задаваемые вопросы

Вопрос 1: Будут ли генерироваться токены «мышления», если установить response_modalities=[«Image»]?

Да. Процесс "мышления" (Thinking) в Nano Banana 2 включен по умолчанию и не может быть отключен. Независимо от того, установите ли вы response_modalities как ["Image"] или ["Text", "Image"], и независимо от значения includeThoughts (true или false), токены "мышления" будут генерироваться и учитываться в стоимости. Хорошая новость в том, что эти токены тарифицируются по текстовому тарифу $3 за миллион, что значительно дешевле, чем $60 за миллион для токенов изображений.

Вопрос 2: В чем тогда смысл установки [«Image»]?

Есть две основные причины: 1) Сокращение объема передаваемых данных — отсутствие текстового ответа означает более быстрый парсинг; 2) Упрощение логики кода — не нужно обрабатывать текстовую часть. Хотя экономия на стоимости составляет менее 1%, в сценариях, требующих только изображений (например, массовая генерация контента), получение сразу изображения гораздо удобнее.

Вопрос 3: Что выгоднее: поштучная или объемная оплата через APIYI?

Это зависит от вашего типичного разрешения. Поштучная оплата ($0.045 за изображение, независимо от разрешения) выгодна, если вы часто генерируете изображения высокого разрешения (2K/4K). Объемная оплата, где стоимость зависит от потребленных токенов, более гибкая: изображения низкого разрешения (512px) обойдутся всего в $0.018 за штуку, что идеально для пакетной генерации. Оба режима оплаты доступны после регистрации на apiyi.com.


Итоги

Ключевые моменты анализа тарификации response_modalities для Nano Banana 2:

  1. Токены изображений — абсолютный лидер по стоимости: Цена в $60 за миллион составляет 95-97% от общей стоимости вывода, тогда как текстовые и "мыслительные" токены вместе занимают лишь 3-5%.
  2. Установка ["Image"] не даёт значительной экономии: Устраняет только токены текстового вывода, экономя около $0.0003 на изображение (менее 0.5%).
  3. "Мыслительные" токены невозможно исключить: Они генерируются и тарифицируются всегда, по ставке $3 за миллион, независимо от настройки response_modalities.
  4. Реальная экономия достигается за счёт разрешения и платформы: Выбор подходящего разрешения может сэкономить до 70%, а использование APIYI — дополнительно 63%.

Рекомендуем вызывать Nano Banana 2 через APIYI apiyi.com: стоимость за вызов составляет $0.045 за изображение с 4K (без ограничений по разрешению), а при объёмном тарифе цена снижается до $0.018 за изображение. Платформа не ограничивает количество одновременных запросов, поддерживает вызов в нативном формате Google и предоставляет бесплатный инструмент для генерации изображений: imagen.apiyi.com.


📚 Ссылки на источники

  1. Страница тарификации Google Gemini API: Официальная таблица цен на токены для Nano Banana 2

    • Ссылка: ai.google.dev/gemini-api/docs/pricing
    • Описание: Актуальные цены на три типа токенов: для изображений, текста и "мыслительных".
  2. Документация Google AI по генерации изображений: Описание параметра response_modalities

    • Ссылка: ai.google.dev/gemini-api/docs/image-generation
    • Описание: Официальная документация по настройке двух режимов: ["Image"] и ["Text","Image"].
  3. Документация Google AI по подсчёту токенов: Понимание структуры и тарификации токенов

    • Ссылка: ai.google.dev/gemini-api/docs/tokens
    • Описание: Узнайте, как количество токенов вывода изображения связано с разрешением.
  4. Документация APIYI по Nano Banana 2: Подробности о двух режимах тарификации: за вызов и по объёму

    • Ссылка: docs.apiyi.com/en/api-capabilities/nano-banana-2-image
    • Описание: Описание схемы тарификации и способов вызова на платформе APIYI.

Автор: Техническая команда APIYI
Технические обсуждения: Добро пожаловать в комментарии. Больше материалов доступно в центре документации APIYI: docs.apiyi.com

Похожие записи