При использовании API Nano Banana Pro для рендеринга архитектурных объектов, создания изображений товаров или подготовки материалов для e-commerce вы могли столкнуться с обескураживающей ситуацией: вы загружаете два эталонных изображения, пишете четкий промпт, а в ответ получаете «копию» одного из исходников. Модель просто игнорирует инструкции по редактированию. После запуска Gemini 3.1 Flash Image в феврале 2026 года этот феномен стал встречаться чаще, а дискуссии на Google AI Developers Forum подтвердили, что модель Pro демонстрирует «высокую нестабильность» в сценариях с несколькими эталонными изображениями.
В этой статье мы разберем механизм вызова API, проанализируем реальный кейс рендеринга «каркас здания + готовый проект» и детально рассмотрим 5 условий, при которых Nano Banana Pro возвращает исходное изображение, а также предложим 8 готовых решений. Все примеры вызовов основаны на платформе APIYI (apiyi.com), которая уже внедрила улучшения стабильности для серии моделей Gemini 3 Pro Image, поэтому вы можете смело использовать предложенные промпты для тестов.
{Проблема с возвратом исходного изображения в Nano Banana Pro}
{Изображение-в-изображение не отредактировано согласно промпту · Прямая генерация по нескольким эталонным изображениям}
{Рис. 1 · Вайрфрейм}
{Незавершено · 4.9 МБ}
{Рис. 2 · Рендеринг готового продукта}
{Построено · 13.8 МБ}
{Nano Banana Pro}
{вывод ≈ репродукция исходного изображения на рис. 2}
{Должно было быть преобразовано}
{только для справки по стилю}
{5 причин диагностики + 8 практических решений по исправлению · APIYI apiyi.com}
1. Типичные проявления проблемы «возврата исходного изображения» в Nano Banana Pro
Давайте рассмотрим реальный пример: пользователь занимается рендерингом архитектурного дизайна и загружает два эталонных изображения. Изображение №1 — это каркас недостроенного здания (бетонная конструкция, 4,9 МБ), а изображение №2 — готовый проект (стеклянный фасад, озеленение, закатное освещение, 13,8 МБ). Промпт на китайском языке: «Отрендери изображение №1, опираясь на изображение №2. Цветовая гамма: холодные премиальные тона… Стиль: типичный коммерческий фотореалистичный рендеринг…». Цель — использовать стиль и материалы из второго изображения, чтобы превратить каркас из первого в готовый объект. В итоге модель возвращает картинку, почти идентичную второму изображению, а структурная информация из первого практически исчезает.
Это не единичный случай. На форуме Google AI Developers разработчики сообщают, что «модель слишком агрессивно выполняет даунсэмплинг эталонных изображений, из-за чего теряются детали», и отмечают, что проблема усугубилась после выхода Gemini 3.1 Flash Image. Документация по устранению неполадок на сторонних платформах, таких как Replicate, Atlas Cloud и AI Free API, также содержит подобные примеры «прямого вывода эталонного изображения», хотя условия их возникновения немного различаются.
1.1 Частота возникновения и область влияния
В таблице ниже приведена относительная вероятность возникновения феномена «отсутствия изменений изображения» в Nano Banana Pro для различных сценариев использования, основанная на отзывах сообщества и выборках мониторинга платформы.
| Сценарий использования | Вероятность срабатывания | Степень влияния |
|---|---|---|
| Редактирование с одним эталонным изображением | Низкая | Лишь незначительное смещение деталей |
| Использование двух изображений (перенос стиля) | Средне-высокая | Вывод близок к одному из исходников |
| Синтез нескольких изображений (более 3) | Высокая | Модель отдает предпочтение последнему изображению |
| Вызовы в часы пик (США/Европа) | Заметно выше | Снижение общего качества деталей |
| Сценарии с чувствительным контентом (лица/бренды) | Редко | Отказ в редактировании или откат к оригиналу |
🎯 Совет по диагностике: Если вы занимаетесь e-commerce, архитектурным рендерингом или созданием изображений товаров и сталкиваетесь с «возвратом оригинала» чаще чем в 10% случаев, причина обычно кроется не в чем-то одном, а в сочетании промпта, параметров и инфраструктуры. Рекомендуем использовать унифицированный интерфейс платформы APIYI (apiyi.com), чтобы сравнить вывод Nano Banana Pro и Nano Banana 2 при одинаковом промпте — это позволит быстро понять, на каком уровне проблема: модели или промпта.
2.1 原因一: Путаница в промптах заставляет модель копировать «Изображение 2»
Самая частая причина, по которой Nano Banana Pro возвращает исходное изображение, заключается в том, что модель интерпретирует ссылки вроде «см. Изображение 2» как команду «вывести копию Изображения 2». Согласно официальному руководству Google DeepMind по промптам, при работе с несколькими изображениями рекомендуется использовать семантические названия (например, «каркас», «отрендеренное здание»), а не просто указывать позицию вроде «Изображение 2».
Фраза «отрендерить Изображение 1 в стиле Изображения 2» в английской семантике близка к «render image 1 in the style of image 2», однако при декодировании модель отдает приоритет наиболее проработанному визуальному сигналу — то есть уже готовому Изображению 2. Если в конце промпта вы даете подробное описание тонов или материалов Изображения 2, модель легко воспринимает его как «целевой результат», а не как референс для стиля.
2.2 原因二: Отсутствие глаголов действия заставляет модель идти по пути «реконструкции»
Механизм работы Gemini 2.5 и Gemini 3 Pro Image основан на трансформации изображений через понимание естественного языка. Если в промпте нет четких глаголов действия (transform, render, apply, replace, composite и т. д.), модель при подаче нескольких изображений склонна выбирать путь «реконструкции». Она просто воссоздает похожее изображение на основе референса с самым сильным сигналом, вместо того чтобы выполнять реальное «редактирование».
Официальные шаблоны промптов от DataCamp и Google Developers Blog рекомендуют использовать конструкции типа Take the [element from image 1] and place it with/on the [element from image 2] или Using the provided image of [subject], please [add/remove/modify] [element]. Эти шаблоны четко закрепляют, какой объект является целью для изменений, а какой — референсом стиля. Именно этого чаще всего не хватает в промптах на китайском языке.
2.3 原因三: Конфликт соотношения сторон, доминирование последнего изображения
У серии Nano Banana есть не самое очевидное правило: при загрузке нескольких изображений модель по умолчанию использует соотношение сторон последнего референса. Об этом упоминается в руководствах DataCamp и блоге Google Developers, но разработчики часто упускают это из виду.
Вернемся к примеру пользователя: Изображение 2 (готовый рендер) имеет формат 16:9, а Изображение 1 (линейный чертеж) — близко к 4:3 и имеет меньший размер. Когда модель применяет соотношение сторон Изображения 2, ей геометрически проще развернуть композицию Изображения 2, чем перегенерировать что-то на основе Изображения 1. Этот фактор часто накладывается на «Причину №1», что и приводит к прямому выводу Изображения 2.
2.4 原因四: Деградация инфраструктуры и «тихие» откаты в часы пик
С февраля 2026 года Google сделала Nano Banana 2 стандартным входом в приложении Gemini, а модель Pro переместила в меню «три точки → Regenerate». В этот же период на стороне API наблюдались «тихие» откаты в часы пик. На форуме Google AI Developers 18 мая (за день до Google I/O) пользователи прямо указывали, что «качество генерации изображений заметно падает до и после крупных релизов».
На практике это выглядит так: модель возвращает код состояния 200, но на внутреннем уровне она может переключаться на более легкую подмодель или пропускать часть постобработки, что ведет к потере деталей и снижению точности следования промпту. В таких условиях вероятность того, что генерация изображения в Nano Banana Pro завершится неудачей, значительно возрастает, и чаще всего это проявляется именно как «возврат исходного изображения».
2.5 原因五: Слишком большие референсы вызывают агрессивную субдискретизацию
На том же форуме Google AI Developers отмечается: «Модель выполняет субдискретизацию (downsampling) референсов настолько агрессивно, что теряется возможность распознать или воспроизвести детали». Когда размер референса приближается к 13 МБ или превышает его, модель при предварительной обработке может сильно сжимать изображение, из-за чего ключевые структурные элементы (балки зданий, этикетки товаров, мимика) превращаются в «кашу».
Если после сжатия детали Изображения 1 становятся неразличимыми, модель при синтезе естественным образом полагается на другой, более «четкий» референс, что приводит к копированию Изображения 2. Именно поэтому один и тот же промпт дает разный процент ошибок при разном разрешении референсов — многие разработчики грешат на промпт, хотя на самом деле модель просто «не видит» исходный файл.
III. 8 практических решений: как заставить Nano Banana Pro «редактировать по образцу»

Основная идея исправления проблемы, когда Nano Banana Pro возвращает исходное изображение, заключается в следующем: не надейтесь, что модель сама угадает ваши намерения. Четко пропишите, какое изображение является базовым, какое — эталонным, и какие именно преобразования нужно выполнить. Также используйте параметры вызова для подстраховки. Ниже приведены 8 готовых решений, разделенных на уровень промптов и уровень параметров.
3.1 Пять ключевых моментов для исправления промптов
| № | Что исправить | Неправильно | Рекомендуемый вариант |
|---|---|---|---|
| 1 | Добавить глагол действия | "Отрендери изображение 1 по изображению 2" | "Transform image 1 using image 2 as reference" |
| 2 | Использовать семантические имена | "Изображение 1, изображение 2" | "the wireframe / the finished rendering" |
| 3 | Четко распределить роли | (нет пояснений) | "use the first as structure base, the second as style reference" |
| 4 | Описать цель в позитивном ключе | "Не делай как на изображении 2" | "preserve the original building outline from the first image" |
| 5 | Уточнить требования к материалам | "Используй холодные тона" | "apply the cool-toned glass facade and warm interior glow from image 2 onto the structure from image 1" |
💡 Шаблон промпта: Для задач с двумя изображениями (например, «структура + стиль» в архитектурном рендеринге) рекомендуется использовать следующую структуру:
[Глагол действия] + [структурный эталон из изображения A] + [эталон стиля/материала из изображения B] + [явные ограничения]. На платформе APIYI (apiyi.com) вы можете сохранить этот шаблон как системный промпт и проводить A/B-тестирование между Nano Banana Pro и Nano Banana 2 с минимальными затратами.
3.2 Три ключевых момента для исправления параметров вызова
| № | Что исправить | Пояснение |
|---|---|---|
| 6 | Контроль порядка загрузки | Помещайте «редактируемый объект» последним, чтобы модель использовала его соотношение сторон |
| 7 | Ограничение размера эталонного изображения | Сжимайте изображения до 2–5 МБ, чтобы избежать агрессивной субдискретизации |
| 8 | Явное указание image_size | Например, 1024×1024 или 1536×1024, чтобы снизить риск конфликта соотношений сторон |
Стоит добавить, что в некоторых версиях Gemini 3 Pro Image действительно наблюдается игнорирование параметра imageSize (см. кейс 110458 на форуме Google AI Developers), поэтому пункты 6 и 8 лучше использовать в связке. Это гарантирует, что итоговое соотношение сторон будет соответствовать ожиданиям. Если вы задали image_size, но не изменили порядок загрузки, в некоторых версиях модели соотношение сторон все равно будет перезаписано последним изображением.
IV. Полный пример вызова API Nano Banana Pro для режима «изображение-в-изображение»
4.1 Ошибочный пример: как спровоцировать Nano Banana Pro вернуть исходное изображение
Ниже приведен пример вызова, который воспроизводит неудачный сценарий пользователя: путаница в ссылках в промпте, отсутствие глаголов действия, отсутствие контроля соотношения сторон и отсутствие сжатия эталонных изображений.
import openai
client = openai.OpenAI(
api_key="your-apiyi-key",
base_url="https://api.apiyi.com/v1"
)
response = client.images.edit(
model="gemini-3-pro-image-preview",
image=[
open("wireframe.jpg", "rb"), # 4.9 МБ
open("rendered.jpg", "rb"), # 13.8 МБ, загружено последним
],
prompt="参照图2渲染图1。色彩: 采用清冷的高级色调。",
size="auto",
n=1,
)
При таком подходе в сценарии с несколькими изображениями модель с высокой вероятностью воспримет rendered.jpg как основной сигнал и выдаст результат, близкий к копии второго изображения. Три основные проблемы: китайское «参照图2» (ссылка на рис. 2) интерпретируется как целевой результат, отсутствуют глаголы трансформации, а при установке size="auto" соотношение сторон диктуется самым большим файлом.
4.2 Исправленный пример: как заставить Nano Banana Pro редактировать изображение правильно
import openai
client = openai.OpenAI(
api_key="your-apiyi-key",
base_url="https://api.apiyi.com/v1"
)
prompt = (
"Transform the unfinished concrete wireframe structure in the first image "
"into a fully rendered architectural visualization. "
"Use the second image STRICTLY as a STYLE and MATERIAL reference: "
"apply its cool-toned glass facade, warm interior glow, surrounding greenery "
"and dusk lighting onto the structure from the first image. "
"Preserve the building outline, floor count and balcony arrangement "
"exactly as shown in the first image. "
"Do NOT replace the geometry with the second image."
)
response = client.images.edit(
model="gemini-3-pro-image-preview",
image=[
open("rendered_compressed.jpg", "rb"), # Стилевой эталон, сжат до ~3 МБ
open("wireframe_compressed.jpg", "rb"), # Объект редактирования ставим последним
],
prompt=prompt,
size="1536x1024",
n=1,
)
Здесь внесены четыре ключевых изменения: четко прописана роль «transform A using B as reference» на английском языке; изменен порядок загрузки, чтобы wireframe (объект редактирования) стал «последним изображением» и задал соотношение сторон; явно указан size, чтобы избежать наследования высокого разрешения от эталона; оба изображения сжаты до 5 МБ, чтобы избежать агрессивной субдискретизации.
🚀 Совет для быстрого старта: Разработчики, желающие проверить результат, могут вызвать Nano Banana Pro и Nano Banana 2 с одним и тем же промптом прямо на APIYI (apiyi.com). Платформа предоставляет унифицированный интерфейс, совместимый с OpenAI, поэтому вам не нужно писать отдельный код для каждой модели — результаты A/B тестирования будут готовы уже через 5 минут.
V. Часто задаваемые вопросы по Nano Banana Pro (изображение-в-изображение)
Q1: Почему при использовании промпта на китайском модель возвращает оригинал, а на английском — работает нормально?
Семейство Gemini более стабильно работает с семантическим анализом английского языка. Китайские глаголы и ссылки на порядковые номера («参照图X») при токенизации часто воспринимаются как «инструкция по выводу целевого объекта». Рекомендуется писать ключевые команды редактирования (transform / preserve / apply) на английском, а описание сцены — на смеси языков. Это сохранит точность описания и предотвратит неверное толкование глаголов.
Q2: Решит ли проблему сжатие всех эталонных изображений до 2 МБ?
Сжатие изображений лишь частично решает проблему (пять причин субдискретизации), но не устраняет конфликт промпта с соотношением сторон. Рекомендуется комплексный подход: сжатие + переписывание промпта + контроль порядка загрузки. При больших объемах данных можно проводить предварительную обработку: конвертировать эталоны в JPG и сжимать до 2–5 МБ перед вызовом модели.
Q3: Что лучше подходит для редактирования нескольких изображений: Nano Banana Pro или Nano Banana 2?
| Модель | Стабильность (несколько фото) | Сохранение деталей | Сценарии использования |
|---|---|---|---|
| Nano Banana Pro (Gemini 3 Pro Image) | Средняя (бывают колебания) | Высокое | Качественное редактирование, брендовый контент |
| Nano Banana 2 (Gemini 3.1 Flash Image) | Высокая | Среднее (легкий «пластиковый» эффект) | Массовая обработка, товары для e-commerce |
На практике, если требования к деталям критичны (архитектурная визуализация, высокоточные изображения товаров), можно сначала получить стабильный результат через Nano Banana 2, а затем доработать его с помощью Nano Banana Pro. Такой подход «черновик + доработка» позволяет соблюсти баланс между стабильностью и качеством.
Q4: Поможет ли повторный вызов, если модель выдает «оригинал без изменений»?
Если проблема вызвана временной деградацией инфраструктуры в часы пик, повторный вызов (1–3 раза) поможет. Однако, если проблема в промпте или параметрах, результат не изменится и после 100 попыток. Проверить просто: если один и тот же набор параметров дает сбой в разное время — проблема в промпте. Если же в часы низкой нагрузки все работает — это была временная деградация.
Q5: Применима ли эта схема к другим моделям (Flux Kontext, Seedream)?
Часть с промптом (семантическое именование, глаголы редактирования, распределение ролей, позитивное описание) применима ко всем популярным моделям. Однако правило «последнее изображение задает соотношение сторон» уникально для серии Nano Banana. У Flux и Seedream свои механизмы весов для эталонных изображений. Если вы работаете с разными моделями, платформа APIYI (apiyi.com) позволяет поддерживать один шаблон промпта, адаптируя параметры под каждую модель.
Итоги
Возврат к исходному изображению в Nano Banana Pro — это не просто баг, а результат сочетания «мультимодального ввода + размытого промпта + колебаний инфраструктуры» при стандартном поведении модели. Если понять, как модель отдает предпочтение «последнему изображению», насколько сильно она зависит от глаголов действия и как работает стратегия даунсэмплинга (снижения разрешения) для эталонного изображения, можно исправить 90% неудачных генераций, просто оптимизировав промпт на 80%.
Командам, работающим с рендерингом интерьеров, предметной съемкой или генерацией изображений для e-commerce на основе референсов, мы рекомендуем превратить предложенные 8 решений в готовые шаблоны промптов и стандарты вызовов API. Закрепление этих практик в производственной среде позволит значительно снизить затраты на повторные запуски и процент ручной доработки. Это поможет по-настоящему раскрыть потенциал высококачественной генерации Nano Banana Pro для ваших бизнес-задач.
Материал подготовлен командой APIYI. Мы специализируемся на практическом применении API больших языковых моделей. Чтобы ознакомиться с актуальными примерами вызовов Nano Banana Pro и данными по стабильности работы, посетите официальный сайт APIYI — apiyi.com.
