|

Устранение проблемы возврата исходного изображения в Nano Banana Pro: диагностика 5 основных причин и 8 практических решений

При использовании API Nano Banana Pro для рендеринга архитектурных объектов, создания изображений товаров или подготовки материалов для e-commerce вы могли столкнуться с обескураживающей ситуацией: вы загружаете два эталонных изображения, пишете четкий промпт, а в ответ получаете «копию» одного из исходников. Модель просто игнорирует инструкции по редактированию. После запуска Gemini 3.1 Flash Image в феврале 2026 года этот феномен стал встречаться чаще, а дискуссии на Google AI Developers Forum подтвердили, что модель Pro демонстрирует «высокую нестабильность» в сценариях с несколькими эталонными изображениями.

В этой статье мы разберем механизм вызова API, проанализируем реальный кейс рендеринга «каркас здания + готовый проект» и детально рассмотрим 5 условий, при которых Nano Banana Pro возвращает исходное изображение, а также предложим 8 готовых решений. Все примеры вызовов основаны на платформе APIYI (apiyi.com), которая уже внедрила улучшения стабильности для серии моделей Gemini 3 Pro Image, поэтому вы можете смело использовать предложенные промпты для тестов.

{Проблема с возвратом исходного изображения в Nano Banana Pro}
{Изображение-в-изображение не отредактировано согласно промпту · Прямая генерация по нескольким эталонным изображениям}

{Рис. 1 · Вайрфрейм}
{Незавершено · 4.9 МБ}

{Рис. 2 · Рендеринг готового продукта}
{Построено · 13.8 МБ}

{Nano Banana Pro}

{вывод ≈ репродукция исходного изображения на рис. 2}

{Должно было быть преобразовано}
{только для справки по стилю}

{5 причин диагностики + 8 практических решений по исправлению · APIYI apiyi.com}

1. Типичные проявления проблемы «возврата исходного изображения» в Nano Banana Pro

Давайте рассмотрим реальный пример: пользователь занимается рендерингом архитектурного дизайна и загружает два эталонных изображения. Изображение №1 — это каркас недостроенного здания (бетонная конструкция, 4,9 МБ), а изображение №2 — готовый проект (стеклянный фасад, озеленение, закатное освещение, 13,8 МБ). Промпт на китайском языке: «Отрендери изображение №1, опираясь на изображение №2. Цветовая гамма: холодные премиальные тона… Стиль: типичный коммерческий фотореалистичный рендеринг…». Цель — использовать стиль и материалы из второго изображения, чтобы превратить каркас из первого в готовый объект. В итоге модель возвращает картинку, почти идентичную второму изображению, а структурная информация из первого практически исчезает.

Это не единичный случай. На форуме Google AI Developers разработчики сообщают, что «модель слишком агрессивно выполняет даунсэмплинг эталонных изображений, из-за чего теряются детали», и отмечают, что проблема усугубилась после выхода Gemini 3.1 Flash Image. Документация по устранению неполадок на сторонних платформах, таких как Replicate, Atlas Cloud и AI Free API, также содержит подобные примеры «прямого вывода эталонного изображения», хотя условия их возникновения немного различаются.

1.1 Частота возникновения и область влияния

В таблице ниже приведена относительная вероятность возникновения феномена «отсутствия изменений изображения» в Nano Banana Pro для различных сценариев использования, основанная на отзывах сообщества и выборках мониторинга платформы.

Сценарий использования Вероятность срабатывания Степень влияния
Редактирование с одним эталонным изображением Низкая Лишь незначительное смещение деталей
Использование двух изображений (перенос стиля) Средне-высокая Вывод близок к одному из исходников
Синтез нескольких изображений (более 3) Высокая Модель отдает предпочтение последнему изображению
Вызовы в часы пик (США/Европа) Заметно выше Снижение общего качества деталей
Сценарии с чувствительным контентом (лица/бренды) Редко Отказ в редактировании или откат к оригиналу

🎯 Совет по диагностике: Если вы занимаетесь e-commerce, архитектурным рендерингом или созданием изображений товаров и сталкиваетесь с «возвратом оригинала» чаще чем в 10% случаев, причина обычно кроется не в чем-то одном, а в сочетании промпта, параметров и инфраструктуры. Рекомендуем использовать унифицированный интерфейс платформы APIYI (apiyi.com), чтобы сравнить вывод Nano Banana Pro и Nano Banana 2 при одинаковом промпте — это позволит быстро понять, на каком уровне проблема: модели или промпта.

2.1 原因一: Путаница в промптах заставляет модель копировать «Изображение 2»

Самая частая причина, по которой Nano Banana Pro возвращает исходное изображение, заключается в том, что модель интерпретирует ссылки вроде «см. Изображение 2» как команду «вывести копию Изображения 2». Согласно официальному руководству Google DeepMind по промптам, при работе с несколькими изображениями рекомендуется использовать семантические названия (например, «каркас», «отрендеренное здание»), а не просто указывать позицию вроде «Изображение 2».

Фраза «отрендерить Изображение 1 в стиле Изображения 2» в английской семантике близка к «render image 1 in the style of image 2», однако при декодировании модель отдает приоритет наиболее проработанному визуальному сигналу — то есть уже готовому Изображению 2. Если в конце промпта вы даете подробное описание тонов или материалов Изображения 2, модель легко воспринимает его как «целевой результат», а не как референс для стиля.

2.2 原因二: Отсутствие глаголов действия заставляет модель идти по пути «реконструкции»

Механизм работы Gemini 2.5 и Gemini 3 Pro Image основан на трансформации изображений через понимание естественного языка. Если в промпте нет четких глаголов действия (transform, render, apply, replace, composite и т. д.), модель при подаче нескольких изображений склонна выбирать путь «реконструкции». Она просто воссоздает похожее изображение на основе референса с самым сильным сигналом, вместо того чтобы выполнять реальное «редактирование».

Официальные шаблоны промптов от DataCamp и Google Developers Blog рекомендуют использовать конструкции типа Take the [element from image 1] and place it with/on the [element from image 2] или Using the provided image of [subject], please [add/remove/modify] [element]. Эти шаблоны четко закрепляют, какой объект является целью для изменений, а какой — референсом стиля. Именно этого чаще всего не хватает в промптах на китайском языке.

2.3 原因三: Конфликт соотношения сторон, доминирование последнего изображения

У серии Nano Banana есть не самое очевидное правило: при загрузке нескольких изображений модель по умолчанию использует соотношение сторон последнего референса. Об этом упоминается в руководствах DataCamp и блоге Google Developers, но разработчики часто упускают это из виду.

Вернемся к примеру пользователя: Изображение 2 (готовый рендер) имеет формат 16:9, а Изображение 1 (линейный чертеж) — близко к 4:3 и имеет меньший размер. Когда модель применяет соотношение сторон Изображения 2, ей геометрически проще развернуть композицию Изображения 2, чем перегенерировать что-то на основе Изображения 1. Этот фактор часто накладывается на «Причину №1», что и приводит к прямому выводу Изображения 2.

2.4 原因四: Деградация инфраструктуры и «тихие» откаты в часы пик

С февраля 2026 года Google сделала Nano Banana 2 стандартным входом в приложении Gemini, а модель Pro переместила в меню «три точки → Regenerate». В этот же период на стороне API наблюдались «тихие» откаты в часы пик. На форуме Google AI Developers 18 мая (за день до Google I/O) пользователи прямо указывали, что «качество генерации изображений заметно падает до и после крупных релизов».

На практике это выглядит так: модель возвращает код состояния 200, но на внутреннем уровне она может переключаться на более легкую подмодель или пропускать часть постобработки, что ведет к потере деталей и снижению точности следования промпту. В таких условиях вероятность того, что генерация изображения в Nano Banana Pro завершится неудачей, значительно возрастает, и чаще всего это проявляется именно как «возврат исходного изображения».

2.5 原因五: Слишком большие референсы вызывают агрессивную субдискретизацию

На том же форуме Google AI Developers отмечается: «Модель выполняет субдискретизацию (downsampling) референсов настолько агрессивно, что теряется возможность распознать или воспроизвести детали». Когда размер референса приближается к 13 МБ или превышает его, модель при предварительной обработке может сильно сжимать изображение, из-за чего ключевые структурные элементы (балки зданий, этикетки товаров, мимика) превращаются в «кашу».

Если после сжатия детали Изображения 1 становятся неразличимыми, модель при синтезе естественным образом полагается на другой, более «четкий» референс, что приводит к копированию Изображения 2. Именно поэтому один и тот же промпт дает разный процент ошибок при разном разрешении референсов — многие разработчики грешат на промпт, хотя на самом деле модель просто «не видит» исходный файл.

III. 8 практических решений: как заставить Nano Banana Pro «редактировать по образцу»

nano-banana-pro-returns-original-image-troubleshooting-ru 图示

Основная идея исправления проблемы, когда Nano Banana Pro возвращает исходное изображение, заключается в следующем: не надейтесь, что модель сама угадает ваши намерения. Четко пропишите, какое изображение является базовым, какое — эталонным, и какие именно преобразования нужно выполнить. Также используйте параметры вызова для подстраховки. Ниже приведены 8 готовых решений, разделенных на уровень промптов и уровень параметров.

3.1 Пять ключевых моментов для исправления промптов

Что исправить Неправильно Рекомендуемый вариант
1 Добавить глагол действия "Отрендери изображение 1 по изображению 2" "Transform image 1 using image 2 as reference"
2 Использовать семантические имена "Изображение 1, изображение 2" "the wireframe / the finished rendering"
3 Четко распределить роли (нет пояснений) "use the first as structure base, the second as style reference"
4 Описать цель в позитивном ключе "Не делай как на изображении 2" "preserve the original building outline from the first image"
5 Уточнить требования к материалам "Используй холодные тона" "apply the cool-toned glass facade and warm interior glow from image 2 onto the structure from image 1"

💡 Шаблон промпта: Для задач с двумя изображениями (например, «структура + стиль» в архитектурном рендеринге) рекомендуется использовать следующую структуру: [Глагол действия] + [структурный эталон из изображения A] + [эталон стиля/материала из изображения B] + [явные ограничения]. На платформе APIYI (apiyi.com) вы можете сохранить этот шаблон как системный промпт и проводить A/B-тестирование между Nano Banana Pro и Nano Banana 2 с минимальными затратами.

3.2 Три ключевых момента для исправления параметров вызова

Что исправить Пояснение
6 Контроль порядка загрузки Помещайте «редактируемый объект» последним, чтобы модель использовала его соотношение сторон
7 Ограничение размера эталонного изображения Сжимайте изображения до 2–5 МБ, чтобы избежать агрессивной субдискретизации
8 Явное указание image_size Например, 1024×1024 или 1536×1024, чтобы снизить риск конфликта соотношений сторон

Стоит добавить, что в некоторых версиях Gemini 3 Pro Image действительно наблюдается игнорирование параметра imageSize (см. кейс 110458 на форуме Google AI Developers), поэтому пункты 6 и 8 лучше использовать в связке. Это гарантирует, что итоговое соотношение сторон будет соответствовать ожиданиям. Если вы задали image_size, но не изменили порядок загрузки, в некоторых версиях модели соотношение сторон все равно будет перезаписано последним изображением.

IV. Полный пример вызова API Nano Banana Pro для режима «изображение-в-изображение»

4.1 Ошибочный пример: как спровоцировать Nano Banana Pro вернуть исходное изображение

Ниже приведен пример вызова, который воспроизводит неудачный сценарий пользователя: путаница в ссылках в промпте, отсутствие глаголов действия, отсутствие контроля соотношения сторон и отсутствие сжатия эталонных изображений.

import openai

client = openai.OpenAI(
    api_key="your-apiyi-key",
    base_url="https://api.apiyi.com/v1"
)

response = client.images.edit(
    model="gemini-3-pro-image-preview",
    image=[
        open("wireframe.jpg", "rb"),    # 4.9 МБ
        open("rendered.jpg", "rb"),     # 13.8 МБ, загружено последним
    ],
    prompt="参照图2渲染图1。色彩: 采用清冷的高级色调。",
    size="auto",
    n=1,
)

При таком подходе в сценарии с несколькими изображениями модель с высокой вероятностью воспримет rendered.jpg как основной сигнал и выдаст результат, близкий к копии второго изображения. Три основные проблемы: китайское «参照图2» (ссылка на рис. 2) интерпретируется как целевой результат, отсутствуют глаголы трансформации, а при установке size="auto" соотношение сторон диктуется самым большим файлом.

4.2 Исправленный пример: как заставить Nano Banana Pro редактировать изображение правильно

import openai

client = openai.OpenAI(
    api_key="your-apiyi-key",
    base_url="https://api.apiyi.com/v1"
)

prompt = (
    "Transform the unfinished concrete wireframe structure in the first image "
    "into a fully rendered architectural visualization. "
    "Use the second image STRICTLY as a STYLE and MATERIAL reference: "
    "apply its cool-toned glass facade, warm interior glow, surrounding greenery "
    "and dusk lighting onto the structure from the first image. "
    "Preserve the building outline, floor count and balcony arrangement "
    "exactly as shown in the first image. "
    "Do NOT replace the geometry with the second image."
)

response = client.images.edit(
    model="gemini-3-pro-image-preview",
    image=[
        open("rendered_compressed.jpg", "rb"),   # Стилевой эталон, сжат до ~3 МБ
        open("wireframe_compressed.jpg", "rb"),  # Объект редактирования ставим последним
    ],
    prompt=prompt,
    size="1536x1024",
    n=1,
)

Здесь внесены четыре ключевых изменения: четко прописана роль «transform A using B as reference» на английском языке; изменен порядок загрузки, чтобы wireframe (объект редактирования) стал «последним изображением» и задал соотношение сторон; явно указан size, чтобы избежать наследования высокого разрешения от эталона; оба изображения сжаты до 5 МБ, чтобы избежать агрессивной субдискретизации.

🚀 Совет для быстрого старта: Разработчики, желающие проверить результат, могут вызвать Nano Banana Pro и Nano Banana 2 с одним и тем же промптом прямо на APIYI (apiyi.com). Платформа предоставляет унифицированный интерфейс, совместимый с OpenAI, поэтому вам не нужно писать отдельный код для каждой модели — результаты A/B тестирования будут готовы уже через 5 минут.

V. Часто задаваемые вопросы по Nano Banana Pro (изображение-в-изображение)

Q1: Почему при использовании промпта на китайском модель возвращает оригинал, а на английском — работает нормально?

Семейство Gemini более стабильно работает с семантическим анализом английского языка. Китайские глаголы и ссылки на порядковые номера («参照图X») при токенизации часто воспринимаются как «инструкция по выводу целевого объекта». Рекомендуется писать ключевые команды редактирования (transform / preserve / apply) на английском, а описание сцены — на смеси языков. Это сохранит точность описания и предотвратит неверное толкование глаголов.

Q2: Решит ли проблему сжатие всех эталонных изображений до 2 МБ?

Сжатие изображений лишь частично решает проблему (пять причин субдискретизации), но не устраняет конфликт промпта с соотношением сторон. Рекомендуется комплексный подход: сжатие + переписывание промпта + контроль порядка загрузки. При больших объемах данных можно проводить предварительную обработку: конвертировать эталоны в JPG и сжимать до 2–5 МБ перед вызовом модели.

Q3: Что лучше подходит для редактирования нескольких изображений: Nano Banana Pro или Nano Banana 2?

Модель Стабильность (несколько фото) Сохранение деталей Сценарии использования
Nano Banana Pro (Gemini 3 Pro Image) Средняя (бывают колебания) Высокое Качественное редактирование, брендовый контент
Nano Banana 2 (Gemini 3.1 Flash Image) Высокая Среднее (легкий «пластиковый» эффект) Массовая обработка, товары для e-commerce

На практике, если требования к деталям критичны (архитектурная визуализация, высокоточные изображения товаров), можно сначала получить стабильный результат через Nano Banana 2, а затем доработать его с помощью Nano Banana Pro. Такой подход «черновик + доработка» позволяет соблюсти баланс между стабильностью и качеством.

Q4: Поможет ли повторный вызов, если модель выдает «оригинал без изменений»?

Если проблема вызвана временной деградацией инфраструктуры в часы пик, повторный вызов (1–3 раза) поможет. Однако, если проблема в промпте или параметрах, результат не изменится и после 100 попыток. Проверить просто: если один и тот же набор параметров дает сбой в разное время — проблема в промпте. Если же в часы низкой нагрузки все работает — это была временная деградация.

Q5: Применима ли эта схема к другим моделям (Flux Kontext, Seedream)?

Часть с промптом (семантическое именование, глаголы редактирования, распределение ролей, позитивное описание) применима ко всем популярным моделям. Однако правило «последнее изображение задает соотношение сторон» уникально для серии Nano Banana. У Flux и Seedream свои механизмы весов для эталонных изображений. Если вы работаете с разными моделями, платформа APIYI (apiyi.com) позволяет поддерживать один шаблон промпта, адаптируя параметры под каждую модель.

Итоги

Возврат к исходному изображению в Nano Banana Pro — это не просто баг, а результат сочетания «мультимодального ввода + размытого промпта + колебаний инфраструктуры» при стандартном поведении модели. Если понять, как модель отдает предпочтение «последнему изображению», насколько сильно она зависит от глаголов действия и как работает стратегия даунсэмплинга (снижения разрешения) для эталонного изображения, можно исправить 90% неудачных генераций, просто оптимизировав промпт на 80%.

Командам, работающим с рендерингом интерьеров, предметной съемкой или генерацией изображений для e-commerce на основе референсов, мы рекомендуем превратить предложенные 8 решений в готовые шаблоны промптов и стандарты вызовов API. Закрепление этих практик в производственной среде позволит значительно снизить затраты на повторные запуски и процент ручной доработки. Это поможет по-настоящему раскрыть потенциал высококачественной генерации Nano Banana Pro для ваших бизнес-задач.


Материал подготовлен командой APIYI. Мы специализируемся на практическом применении API больших языковых моделей. Чтобы ознакомиться с актуальными примерами вызовов Nano Banana Pro и данными по стабильности работы, посетите официальный сайт APIYI — apiyi.com.

Похожие записи