Рабочий процесс дизайна по модели BYOK: запускайте Claude, Codex или Qwen на собственном ключе
Большинство ИИ-инструментов для дизайна незаметно добавляют наценку к каждому потраченному вами токену. Open Design занимает противоположную позицию — используйте собственный ключ модели, платите провайдеру напрямую и сохраняйте полный контроль над тем, где выполняется инференс. Вот как на самом деле работает слой BYOK.
Если вы пользовались каким-либо облачным ИI-продуктом для дизайна в 2026 году, вы наверняка заметили, что счёт постепенно растёт. Подписка поверх платы за каждое рабочее место, а сверху ещё и наценка за инференс, которую никто не публикует. Расчёты непрозрачны намеренно.
Open Design не выполняет инференс. У нас нет наценки на токены. Весь рабочий процесс построен вокруг принципа bring-your-own-key (BYOK) — вы направляете daemon на любой совместимый с OpenAI эндпоинт, вставляете собственный API-ключ, и на этом всё.
В этой статье объясняется, почему мы сделали такой выбор, как это работает под капотом и что это на самом деле меняет в вашей повседневной работе. Если вас интересует более широкий философский аргумент, стоящий за этим, почему мы построили Open Design как слой навыков, а не как продукт — это сопутствующая статья, а эта — её практическая версия.
Что на самом деле здесь означает «BYOK»
В сфере ИИ-инструментов ходят два определения BYOK, и это не одно и то же:
- Поверхностный BYOK — инструмент позволяет вставить ключ, но по-прежнему маршрутизирует инференс через свои серверы, логирует ваши промпты и может применять ограничения по частоте запросов.
- Настоящий BYOK — инструмент обращается к провайдеру модели напрямую с вашей машины (или из вашей инфраструктуры). Ваши промпты никогда не попадают на серверы вендора. Вендор не берёт наценку.
Open Design относится ко второму типу. Daemon выполняет HTTP-вызовы к тому эндпоинту, который вы настроили, с вашим ключом, с вашей машины. Мы не проксируем. Мы не логируем. Мы не видим ваши промпты.
Куда на самом деле уходит вызов
Когда daemon берёт задачу в работу, он формирует промпт — подтягивая релевантные файлы SKILL.md и DESIGN.md для этой задачи — а затем выполняет единственный HTTP-запрос к заданному вами base URL. Ответ потоком возвращается на вашу машину, агент записывает артефакт на диск — и в этом весь цикл. На этом пути нет сервера Open Design. Тот же daemon, который обнаруживает ваши навыки, владеет и сетевым вызовом, поэтому вопрос «а где это выполняется?» — это настройка, а не разговор с отделом продаж.
Адаптер, совместимый с OpenAI
Большинство эндпоинтов ИИ-инференса в 2026 году говорят на языке OpenAI Chat Completions API. Мы используем его как протокол наименьшего общего знаменателя. Если ваш провайдер его поддерживает (а почти все поддерживают), вы поддерживаетесь по умолчанию — никаких плагинов, никакой интеграции под конкретного провайдера, которую нужно ждать.
Провайдеры, на которые можно его направить
| Провайдер | Типичный вид base URL | Подходит для |
|---|---|---|
| OpenAI | https://api.openai.com/v1 | gpt-image-2, gpt-5.x, самые сильные общие проходы |
| Anthropic | OpenAI compat shim или выделенный адаптер Claude | доработка, требующая вкуса, длинные брифы |
| DeepSeek | https://api.deepseek.com/v1 | экономичные черновики с длинным контекстом |
| Groq | base URL провайдера | циклы черновиков с низкой задержкой |
| OpenRouter | https://openrouter.ai/api/v1 | любая фронтирная модель, одни биллинговые отношения |
| Self-hosted vLLM / TGI / Ollama | ваш собственный хост, например http://localhost:11434/v1 | полностью локально, конфиденциальная клиентская работа |
| Qwen / Kimi / Hermes | base URL провайдера | региональные модели с OAI-совместимыми эндпоинтами |
Этот список не является жёстко заданным белым списком — это просто то, к чему обычно приходят люди. Работает всё, что отвечает в формате Chat Completions.
Два поля, затем перезапуск
Конфигурация — это два поля:
OPENAI_BASE_URL=https://api.deepseek.com/v1
OPENAI_API_KEY=sk-…
Поместите их в .env.local, перезапустите daemon — и вы уже на другой модели. Переключение на локальную машину с Ollama для чувствительного проекта — это те же две строки:
OPENAI_BASE_URL=http://localhost:11434/v1
OPENAI_API_KEY=ollama
Нет реестра моделей, который нужно обновлять, нет аккаунта, который нужно перепривязывать, нет миграции. Ключ и эндпоинт — это вся поверхность.
Почему это важно для работы дизайнера
У дизайнерских рабочих процессов есть специфическая структура затрат, с которой облачные продукты инференса справляются плохо:
- Итерация — это единица работы. Настоящий дизайнерский проход означает 30–50 циклов промптов, а не три. Облачные тарифы жёстко тормозят на отметке в 50 циклов.
- Длинный контекст — это норма. Серьёзный бриф включает брендовые документы, предыдущие работы, спецификации систем и референсные изображения. Этот контекст выходит далеко за пределы токеновых бюджетов в облачных интерфейсах.
- Выбор модели должен быть ситуативным. Для одних проходов нужна быстрая дешёвая модель. Для других — самая сильная из доступных. Для третьих — локальная модель для чувствительного контента. Облачный продукт выбирает одну за вас.
BYOK решает все три проблемы. Вы платите за токен, вы выбираете модель, вас не тормозят.
Итерации перестают нормироваться
Именно это незаметно меняет то, как вы работаете. Когда каждый лишний цикл засчитывается в счёт тарифа, вы начинаете заниматься самоцензурой — берёте третий черновик, потому что четвёртый кажется дорогим. На BYOK предельная стоимость ещё одного прохода — это несколько центов у провайдера модели, поэтому решение снова становится вопросом работы, а не счётчика. Третий черновик — это обычно то место, где дизайн становится хорошим; инструмент, который облагает итерации налогом, облагает налогом именно тот шаг, который важен.
А как насчёт стоимости?
Распространённое опасение: «Если я плачу напрямую, разве это не будет дороже?»
На практике — нет. Вот типичный день дизайнерской работы по нашему внутреннему опыту:
| Задача | Токены | Провайдер | Стоимость |
|---|---|---|---|
| Приём брифа (3 документа) | 30K на входе | Claude Sonnet | $0.09 |
| Первый черновой проход | 80K на входе + 20K на выходе | Claude Sonnet | $0.54 |
| 5 циклов итераций | 250K на входе + 80K на выходе | Claude Sonnet | $1.95 |
| Финальная шлифовка | 50K на входе + 30K на выходе | Claude Opus (один проход) | $1.35 |
| Итого за день | ~$3.93 |
Это презентация, два варианта лендинга и брендовое исследование. Облачный эквивалент — при условии тарифа «creator» за $30 в месяц с доплатами за превышение — обошёлся бы примерно в $50 за ту же работу, дал бы меньше итераций и привязал бы вас к одной модели.
Если хотите дешевле, замените Claude Sonnet на DeepSeek V3.2 — и день обойдётся меньше чем в $1. Дело не в том, что одна модель правильная, — а в том, что ручка регулировки цены/качества находится в ваших руках, а не зашита в уровень подписки.
Приватность и комплаенс
Есть и вторая причина, по которой BYOK важен: промпты содержат бренд вашего клиента.
Облачный инференс означает маршрутизацию брендовых документов, ещё не анонсированных названий продуктов, внутренних цен и креативов до запуска через серверы третьей стороны. У большинства компаний есть своё мнение об этом. У некоторых есть на этот счёт контракт.
При BYOK обмен данными по промпту происходит между вашим ноутбуком и провайдером модели, которого вы уже проверили (или развернули у себя). Open Design в этом не участвует. У нас нет лога, который можно затребовать по повестке, нет поверхности для утечки данных, нет аудиторского пробела, который пришлось бы объяснять.
Что на практике даёт «отсутствие логов»
Для агентской работы, регулируемых отраслей или чего угодно до запуска это единственная позиция, которая выдерживает критику. Если в ходе проверки безопасности спрашивают «куда уходят наши брендовые активы?», ответ — «провайдеру модели, указанному в нашем контракте, и больше никуда», а не «в дашборд вендора, который мы не контролируем». Самостоятельное размещение эндпоинта Ollama или vLLM усиливает это ещё больше: байты вообще не покидают вашу сеть. Это тот же компромисс, который рассматривается в честной проверке реальности BYOK, где откровенно говорится о том, где всё ещё есть шероховатости — локальные модели и фронтирные модели не взаимозаменяемы по вкусу, и поверхность для prompt-инъекций вы контролируете сами.
Как переключать провайдеров посреди проекта
Одно из недооценённых преимуществ BYOK — арбитраж провайдеров в ходе проекта:
- Черновики — используйте дешёвую модель (DeepSeek V3.2, Qwen 3) для формы вопросов и первой итерации
- Доработка — переключитесь на Claude Sonnet или GPT-5 для средних проходов, где важен вкус
- Чувствительный контент — перейдите на локальную модель Ollama для конфиденциальных клиентских промптов
- Финальная шлифовка — потратьте один проход на самую сильную доступную модель (Opus, GPT-5 Pro)
В Open Design переключение — это редактирование двух строк в .env.local. Нет миграции, нет повторного онбординга, нет апгрейда тарифа.
Готовая маршрутизация для одного брифа
Конкретно: один бриф на лендинг мог бы выполняться так:
# draft + first iterations — cheap and fast
OPENAI_BASE_URL=https://api.deepseek.com/v1
OPENAI_API_KEY=sk-…
# then, for the passes where taste decides the outcome:
OPENAI_BASE_URL=https://api.anthropic.com/v1 # via the compat shim
OPENAI_API_KEY=sk-ant-…
Те же навыки, та же дизайн-система на диске, те же артефакты — изменился лишь движок за рабочим процессом. Поскольку навыки и системы — это просто файлы (SKILL.md и DESIGN.md), ничто в вашей настройке не привязано к конкретной модели. Вот что на самом деле означает владеть рабочим процессом: инструмент уходит с пути, а модель — это параметр, который вы меняете по требованию брифа.
Попробуйте
Склонируйте репозиторий, задайте OPENAI_BASE_URL и OPENAI_API_KEY в .env.local, запустите pnpm tools-dev. Daemon будет использовать тот эндпоинт, на который вы его направите, с той моделью, за которую вы платите, по тому графику, который вам нужен.
Это вся история BYOK. Нет особого уровня, нет процесса апгрейда, нет биллинговых отношений с нами. Вы платите провайдеру модели, вы сохраняете свои ключи, вы сохраняете свои промпты. Мы предоставляем слой.
Дополнительное чтение
- Почему мы построили Open Design как слой навыков, а не как продукт — ставка, стоящая за решением выпустить тонкий слой вместо облачного приложения
- Проверка реальности BYOK: 5 вещей, которые ломаются — честные компромиссы и шероховатости использования собственного ключа
- 31 навык, 72 системы: как работает библиотека Open Design — файлы
SKILL.md/DESIGN.md, которые остаются неизменными независимо от того, какую модель вы запускаете