Недавно один из наших клиентов задал вопрос: при переходе в раздел Data Controls в панели управления OpenAI он увидел два переключателя — «Share evaluation and fine-tuning data with OpenAI» и «Share inputs and outputs with OpenAI». У каждого из них есть три режима: Disabled, Enabled for all projects и Enabled for selected projects. Первый переключатель помечен зеленой подсказкой «You're eligible for up to 7 free weekly evals», а второй — «You're enrolled for complimentary daily tokens». На первый взгляд кажется, что OpenAI просто раздает ресурсы, но клиент засомневался: стоит ли их включать и чем это грозит?
Суть этих переключателей — это двусторонняя сделка, где OpenAI обменивает «бесплатные лимиты» на ваши «данные для обучения и оценки». Цена активации вполне реальна: ваши данные для оценки и API-запросы (входные и выходные данные) будут использоваться OpenAI для улучшения будущих моделей. Среди клиентов APIYI (apiyi.com) мы встречали тех, кто полгода держал их включенными, не подозревая об утечке данных, и тех, кто полгода держал их выключенными, теряя миллионы бесплатных токенов ежедневно. В этой статье мы подробно разберем, что на самом деле делают эти переключатели, какие лимиты можно получить, как это влияет на конфиденциальность и какие настройки мы рекомендуем.

Основные определения двух настроек OpenAI Data Controls
Откройте страницу Settings → Data Controls → Sharing, и вы увидите два отдельных переключателя, которые часто путают. Они различаются по типу передаваемого контента, получаемым бонусам и уровню влияния на конфиденциальность. Понимание границ этих настроек — залог принятия верных решений.
| Настройка | Share evaluation and fine-tuning data | Share inputs and outputs |
|---|---|---|
| Что передается | Промпты для оценки + результаты + логика оценки + данные для дообучения | Все входные и выходные данные вызовов API |
| Бонус | До 7 бесплатных запусков оценки в неделю | Ежедневные субсидии в токенах (зависят от уровня и группы моделей) |
| Цель использования | Улучшение конвейера оценки + обучение будущих моделей | Прямое обучение / улучшение моделей |
| Состояние по умолчанию | Отключено (Disabled) | Отключено (Disabled) |
| Гранулярность | Три режима: Disabled / All / Selected | Три режима: Disabled / All / Selected |
| Права доступа | Только владелец организации (Org Owner) | Только владелец организации (Org Owner) |
| Область действия | Только данные, созданные после включения | Только трафик, созданный после включения |
| Сложность отключения | Можно переключить в любой момент | Можно переключить в любой момент |
🎯 Совет для быстрого понимания: Если вы хотите «безопасно получить бесплатные лимиты», установите переключатель в режим "Enabled for selected projects". Создайте отдельный тестовый проект для запуска dev-скриптов или внутренних задач, а трафик основного проекта и производственного API направляйте через сервис-прокси API APIYI (apiyi.com). Это поможет избежать передачи всех данных ваших проектов в конвейер обучения моделей.
Подробный разбор настройки Share evaluation and fine-tuning data
Название этого переключателя — «Обмен данными для оценки и дообучения» — звучит довольно просто, но на деле охватывает гораздо больше, чем кажется. При включении OpenAI получает не только ваши промпты для оценки (eval prompts) и ответы (completions), но и определенную вами логику оценки (grading logic), а также промпты и ответы из ваших датасетов для дообучения. Это означает, что OpenAI собирает данные о том, как вы оцениваете модель, что считаете «хорошим» ответом и какие отраслевые знания содержатся в ваших обучающих данных.
В качестве бонуса вы получаете до 7 бесплатных запусков оценки в неделю. В справочном центре OpenAI четко указано: «Evaluations you share with OpenAI are currently processed at no cost for up to 7 runs per week». При превышении лимита или использовании моделей, не участвующих в программе, оплата списывается по стандартным тарифам за токены. Цифра кажется небольшой, но для команд, которые часто сравнивают модели, это позволяет экономить от десятков до сотен долларов на стоимости оценки.
Важно помнить, что настройка действует только на данные, созданные после включения. Исторические данные не будут переданы задним числом, а отключение функции не «отзовет» уже отправленные данные. Поэтому решение должно основываться на том, сколько данных для оценки вы готовы передавать в ближайшие 6–12 месяцев, а не на том, что у вас есть сейчас.
| Аспект | Преимущества включения | Издержки включения |
|---|---|---|
| Прямая выгода | 7 бесплатных запусков оценки в неделю | / |
| Косвенная выгода | Оптимизация конвейера оценки со стороны OpenAI | / |
| Риск для данных | / | Сбор промптов, ответов и стандартов оценки |
| Риск для бизнеса | / | Утечка отраслевых ноу-хау через датасеты дообучения |
| Обратимость | Можно отключить в любой момент | Переданные данные отозвать нельзя |
🎯 Когда стоит включать обмен данными для Eval/FT: Если ваша оценка основана на публичных бенчмарках или нечувствительных тестовых наборах, включение функции практически безопасно. Если же промпты для оценки содержат реальные данные клиентов, внутренние бизнес-правила или проприетарную логику оценки, рекомендуем использовать режим Selected и включать его только для «песочниц» (sandbox-проектов).
Подробный разбор настроек «Share inputs and outputs»
Это одна из тех опций, где «больше риск — больше награда». Если вы активируете этот переключатель, все API-вызовы, проходящие через проект, будут собираться OpenAI: входные промпты и выходные completion-ответы будут использоваться для обучения или дообучения моделей. Это принципиально отличается от стандартного поведения API — напомним, что с марта 2023 года OpenAI официально не использует данные API для обучения моделей. Включение этой опции фактически отменяет данную защиту.
Ваша награда — ежедневные субсидированные токены (complimentary daily tokens), которые начисляются в зависимости от уровня (tier) вашего аккаунта и группы моделей. Это самая конкретная программа бесплатных лимитов от OpenAI, которая автоматически сбрасывается каждый день в 00:00 UTC.
| Группа моделей | Лимит Tier 1-2 (в день) | Лимит Tier 3-5 (в день) | Время сброса |
|---|---|---|---|
| Флагманские модели | 250 000 токенов | 1 000 000 токенов | 00:00 UTC |
| Легкие модели | 2 500 000 токенов | 10 000 000 токенов | 00:00 UTC |
Разделение на флагманские и легкие модели — это не просто оценка производительности, а конкретный список от OpenAI. Вызовы моделей, не входящих в этот список, не учитываются в рамках бесплатной квоты.
| Группа моделей | Входящие модели |
|---|---|
| Флагманские | gpt-5, gpt-5-codex, gpt-5-chat-latest, gpt-4.5-preview, gpt-4.1, gpt-4o, o1, o3, o1-preview |
| Легкие | gpt-5-mini, gpt-5-nano, gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o4-mini, codex-mini-latest |

🎯 Реальная ценность токенов: Если считать по ценам gpt-4o-mini ($0.15/млн вход, $0.60/млн выход), то 2.5 млн токенов для легких моделей в день (Tier 1-2) — это примерно $1-2 экономии в день, или $30-60 в месяц. На уровнях Tier 3-5 лимит возрастает до 10 млн токенов, что дает $120-240 экономии. Если ваша цель — только получение этих бонусов, включать эту опцию для всей организации невыгодно. Лучше создать отдельный тестовый проект и активировать режим «Selected» только для него.
Разница между настройками приватности API по умолчанию и при включенном обмене данными
Многие команды до конца не понимают, используются ли их данные для обучения при использовании API по умолчанию. Реальная политика OpenAI такова: данные API по умолчанию не используются для обучения, но хранятся 30 дней для мониторинга злоупотреблений (abuse monitoring). Zero Data Retention (ZDR — нулевое удержание данных) — это совсем другая история: корпоративным клиентам нужно отдельно запрашивать её у отдела продаж OpenAI, это не просто переключатель в личном кабинете.
Разобравшись с этой базой, становится понятно влияние двух переключателей: активация Inputs/Outputs означает «добровольный отказ от защиты данных, действовавшей с 2023 года», а активация Eval/FT — «дополнительный вклад в методологию оценки моделей». Оба переключателя не отменяют 30-дневное хранение для мониторинга и не суммируются с ZDR.
| Параметр | API по умолчанию (оба выкл.) | Вкл. Inputs/Outputs | Вкл. Eval/FT Data |
|---|---|---|---|
| Используется для обучения | ❌ Нет | ✅ Да | ✅ Да + для оценки |
| Хранение для мониторинга | 30 дней | 30 дней | 30 дней |
| Можно ли отозвать данные | / | ❌ Нельзя | ❌ Нельзя |
| Совместимость с ZDR | ✅ Можно запросить | ❌ Несовместимо | ❌ Несовместимо |
| Сценарии использования | Продакшн / Compliance / PII | Разработка / Тесты / Публичные данные | Публичные бенчмарки |
🎯 Рекомендация по приватности: Если ваш бизнес имеет строгие требования к безопасности данных (GDPR, HIPAA, корпоративные NDA, клиентские PII и т.д.), оба переключателя должны быть выключены (Disabled). Для высокочувствительного трафика используйте шлюз APIYI (apiyi.com) или запрашивайте ZDR. Если же это личный проект, внутренний инструмент или демо для хакатона, можно смело включать (Enabled for all projects).
Фреймворк из 4 критериев для принятия решения о настройках OpenAI Data Controls
Давать однозначный ответ «включать или нет» было бы неправильно. Давайте разберем матрицу из 4 типичных бизнес-сценариев, где для каждого есть свои настройки. Ключевые факторы принятия решения — это чувствительность данных (содержат ли они приватную информацию или коммерческую тайну) и масштаб вызовов (насколько велик профит от бесплатных лимитов).
| Тип бизнеса | Чувствительность данных | Рекомендация Inputs/Outputs | Рекомендация Eval/FT |
|---|---|---|---|
| Личная разработка / Хакатон | Низкая | Enabled for all | Enabled for all |
| Внутренние R&D / Выбор модели | Средняя | Enabled for selected | Enabled for selected |
| To-C приложения (с PII) | Высокая | Disabled или Selected (dev) | Disabled |
| Корпоративный сектор / Compliance | Очень высокая | Disabled + ZDR | Disabled |
Первая категория — это личные проекты или хакатоны. В таких случаях потребление токенов в основном идет на публичные промпты (например, задачи соревнований или демо-код). Включение обмена данными позволяет получать ежедневные бонусы, не подвергая риску чувствительную информацию. Вторая категория — внутренние R&D. Рекомендуем режим «Selected»: создайте отдельный проект «data-share-test» специально для экспериментов, где обмен данными допустим, а в основном проекте разработки оставьте всё выключенным.
Третья категория — To-C приложения, которые часто работают с пользовательским вводом, историей диалогов и персональными данными. Здесь оба переключателя лучше выключить: бесплатные лимиты не стоят риска того, что PII пользователей попадет в конвейер обучения. Четвертая категория — корпоративные или комплаенс-сценарии (медицина, финансы, госсектор). Здесь нужно сразу переходить на ZDR или использовать защищенный шлюз, такой как APIYI (apiyi.com), чтобы избежать даже 30-дневного мониторинга.

🎯 Как выбрать из трех вариантов: Если вы решили включить какой-либо переключатель, отдавайте предпочтение «Enabled for selected projects», а не «Enabled for all projects». Так вы сможете выделить отдельный проект «training-eligible» для разработки и тестов, в то время как продакшн-проекты останутся изолированными. Это минимизирует затраты на миграцию в будущем.
Часто задаваемые вопросы по настройкам данных OpenAI (Data Controls)
В1: Если я включу опции Inputs/Outputs, OpenAI сразу заберет все мои исторические данные?
Нет. В описании обоих переключателей четко указано: "Only traffic sent after turning this setting on will be shared" / "Only evaluation and fine-tuning data created after turning this setting on will be shared". Настройки применяются только к данным, созданным после их включения; исторические данные не будут передаваться задним числом.
В2: Бесплатные токены — это то же самое, что и Credit Grants?
Не совсем, но они связаны. Данные, полученные через обмен Inputs/Outputs, формируют "дневной пул токенов", который автоматически сбрасывается в 00:00 UTC. "Мелкие центы", которые вы видите в разделе Credit Grants в панели управления OpenAI — это последующий учет стоимости этого пула в долларах США в зависимости от объема использования. По сути, это два способа отображения одного и того же процесса.
В3: Если я включу режим Selected только для одного проекта, будет ли трафик основного проекта в безопасности?
Полностью. В настройках OpenAI можно точно выбрать, какие проекты участвуют в обмене данными. Трафик невыбранных проектов обрабатывается по стандартным правилам API: не используется для обучения и хранится 30 дней для мониторинга нарушений (abuse monitoring). Если у вас остаются опасения, вы можете дополнительно перенаправить трафик основного проекта через сервис-прокси API, например APIYI (apiyi.com), чтобы обеспечить полную архитектурную изоляцию.
В4: Как именно считаются "7 бесплатных еженедельных оценок" (7 free weekly evals) при обмене данными?
Счет идет по количеству запусков, а не по количеству токенов. Каждый запуск оценки (независимо от того, сколько примеров обрабатывается) считается за один раз, максимум 7 бесплатных запусков в неделю. После превышения лимита расчет идет по стандартным тарифам на токены для используемой модели. Некоторые модели не входят в список бесплатных, поэтому их запуск будет тарифицироваться в любом случае.
В5: Можно ли вернуть данные, которые уже были собраны до выключения переключателей Inputs/Outputs?
Нет. Политика OpenAI гласит, что уже переданные данные отозвать нельзя. Выключение переключателей лишь предотвращает попадание будущих данных в конвейер обучения. Именно поэтому мы всегда рекомендуем использовать для производственного трафика такие шлюзы, как APIYI (apiyi.com), для "жесткой изоляции": данные по умолчанию не попадают в конвейер обучения OpenAI, что гораздо надежнее, чем попытки "отключить все постфактум".
3 вывода о настройках данных OpenAI
Во-первых, эти переключатели — это честная "двусторонняя сделка": вы предоставляете реальные, поддающиеся количественной оценке данные (методологию оценки, входные и выходные данные API) в обмен на измеримые бесплатные лимиты (7 оценок в неделю, миллионы токенов в день). Понимание того, что это сделка, а не просто подарок, поможет принимать верные решения.
Во-вторых, стандартный API не использует данные для обучения, но мониторинг на предмет нарушений (abuse monitoring) в течение 30 дней сохраняется. Если ваш бизнес имеет строгие требования к конфиденциальности, оба переключателя должны быть отключены (Disabled), а для дополнительной защиты стоит подать заявку на ZDR или использовать защищенный шлюз, такой как APIYI (apiyi.com). Переключатели лишь определяют, "даете ли вы дополнительное разрешение на обучение", а не "будет ли трафик отслеживаться".
В-третьих, используйте режим Selected для "изоляции по проектам". Создайте отдельный проект специально для тестового трафика, где вы готовы делиться данными, и полностью изолируйте от него производственные проекты с чувствительной информацией. Это самый выгодный подход: вы получаете бесплатные лимиты, не допуская при этом утечки пользовательских данных в конвейеры обучения.
{Дерево принятия решений по рекомендуемой конфигурации Data Controls}
{От «Стоит ли мне включать общий доступ» до конкретной настройки: сделайте оптимальный выбор за 5 шагов}
{Хотите ли вы включить обмен данными?}
{Первый уровень: тип бизнеса?}
{Личный / R&D / To-C / Корпоративный}
{Личное / Хакатон}
{Является ли промпт публичным?}
{Внутренние R&D}
{Можно ли создать отдельный dev-проект?}
{Приложение для конечных пользователей (To-C)}
{Содержит ли PII / пользовательский контент?}
{Корпоративный / Соответствие требованиям}
{Уровень требований к комплаенсу?}
{✓ Включено для всех}
{Оба переключателя полностью включены}
{Доход: ежедневные токены + 7 evals}
{Риск: пренебрежимо мал}
{▲ Выбранный режим}
{индивидуальный проект разработчика}
{Преимущества: бесплатное использование + изоляция от основного проекта}
{Риск: необходимо создать еще один проект}
{✕ Отключено}
{Оба выключить}
{Преимущество: защита PII пользователя}
{Риск: отказ от бесплатного лимита}
{🛡️ Отключено + ZDR}
{Закрыть + подать заявку на ZDR}
{Преимущество: обход даже 30-дневного мониторинга}
{Риск: требуется обращение в отдел продаж OpenAI}
{При неуверенности по умолчанию выбираются два средних варианта · Режим Selected покрывает 80% сценариев разработчиков}
Если вы взвешиваете необходимость включения этих настроек, самый безопасный путь — распределить задачи по категориям (личные / внутренние / To-C / корпоративные), а затем создать отдельный проект для тестов в режиме Selected, чтобы использовать бесплатные лимиты. Основной производственный трафик при этом лучше пропускать через шлюз APIYI (apiyi.com) для архитектурной изоляции. Так вы сможете воспользоваться преимуществами бесплатной политики OpenAI, сохранив при этом конфиденциальность пользовательских данных и бизнес-ноу-хау.
📌 Автор: Техническая команда APIYI — мы постоянно отслеживаем изменения в политиках OpenAI (Data Controls, ZDR, стратегии тарификации) и предоставляем разработчикам единый API-шлюз с контролем конфиденциальности и прозрачной тарификацией. Узнайте больше на сайте APIYI apiyi.com.
