BYOK デザインワークフロー：自分のキーで Claude、Codex、Qwen を動かす

2026 年にホスト型の AI デザイン製品を使ったことがあるなら、請求額がじわじわ増えていることに気づいているはずです。シート単位の課金の上にサブスクリプションが乗り、さらにその上に誰も公表していない推論マークアップが重なる。この計算は意図的に不透明になっています。

Open Design は推論を実行しません。トークンにマージンを乗せることもありません。ワークフロー全体が bring-your-own-key（BYOK） を中心に構築されています。daemon を任意の OpenAI 互換エンドポイントに向け、自分の API キーを貼り付ければ、それで完了です。

この記事では、なぜその選択をしたのか、内部でどう動くのか、そして日々のワークフローで実際に何が変わるのかを説明します。その背景にあるより大きな哲学的な議論を知りたい方には、なぜ Open Design を製品ではなくスキルレイヤーとして作ったのかが対になる記事です。こちらは実践編になります。

ここでの「BYOK」が本当に意味するもの

AI ツールの分野には BYOK の定義が 2 つ出回っており、両者は同じものではありません。

表面的な BYOK — キーを貼り付けさせてはくれるが、依然として推論は自社サーバー経由でルーティングされ、プロンプトはログに記録され、レート制限がかかる場合もある。
本物の BYOK — ツールがあなたのマシン（またはあなたのインフラ）からモデルプロバイダーを直接呼び出す。プロンプトがベンダーのサーバーに触れることはない。ベンダーはマージンを取らない。

Open Design は後者です。daemon は、あなたが設定したエンドポイントに対して、あなたのキーで、あなたのマシンから HTTP 呼び出しを行います。プロキシしません。ログを取りません。あなたのプロンプトを見ません。

呼び出しが実際に向かう先

daemon がジョブを拾うと、プロンプトを構成します。タスクに関連する SKILL.md と DESIGN.md ファイルを取り込み、あなたが設定したベース URL に対して 1 回の HTTP リクエストを行います。レスポンスはあなたのマシンにストリーミングで返り、エージェントが成果物をディスクに書き込む。これがループの全体です。経路の中に Open Design のサーバーは存在しません。スキルを発見するのと同じ daemon がネットワーク呼び出しも担うため、「これはどこで動くのか？」は設定項目であって、営業との会話にはならないのです。

OpenAI 互換アダプター

2026 年のほとんどの AI 推論エンドポイントは OpenAI Chat Completions API を話します。私たちはこれを最小公倍数的なプロトコルとして使っています。あなたのプロバイダーがこれを話すなら（そしてほぼすべてが話します）、デフォルトでサポートされます。プラグインもなく、プロバイダーごとの統合を待つ必要もありません。

向けられるプロバイダー

プロバイダー	典型的なベース URL の形	得意なこと
OpenAI	`https://api.openai.com/v1`	`gpt-image-2`、`gpt-5.x`、最も強力な汎用パス
Anthropic	OpenAI 互換シム、または専用の Claude アダプター	センスが重要な仕上げ、長文ブリーフ
DeepSeek	`https://api.deepseek.com/v1`	コスト効率の高い長コンテキストのドラフト作成
Groq	プロバイダーのベース URL	低レイテンシのドラフトサイクル
OpenRouter	`https://openrouter.ai/api/v1`	あらゆるフロンティアモデルを 1 つの請求関係で
セルフホスト型 vLLM / TGI / Ollama	自前のホスト、例：`http://localhost:11434/v1`	完全ローカル、クライアント機密の作業
Qwen / Kimi / Hermes	プロバイダーのベース URL	OAI 互換エンドポイントを持つ地域モデル

このリストはハードコードされた許可リストではなく、人々がよく行き着く先にすぎません。Chat Completions の形に応答するものなら何でも動きます。

2 つのフィールド、そして再起動

設定は 2 つのフィールドです。

OPENAI_BASE_URL=https://api.deepseek.com/v1
OPENAI_API_KEY=sk-…

これらを .env.local に入れ、daemon を再起動すれば、別のモデルに切り替わります。機密性の高いプロジェクトのためにローカルの Ollama マシンへ切り替えるのも、同じ 2 行です。

OPENAI_BASE_URL=http://localhost:11434/v1
OPENAI_API_KEY=ollama

更新すべきモデルレジストリも、再リンクするアカウントも、マイグレーションもありません。キーとエンドポイントが接点のすべてです。

1 本のキーが、入れ替え可能な 3 つのモデルエンジンの列に配線され、真ん中のものが緑のフレームで選択されている、ほぼ白の編集的な地の上で — 1 つのキーで、あらゆるモデルを — アダプターが Claude、Codex、Qwen を同じワークフローの背後で入れ替え可能にします。

これがデザイン作業にとってなぜ重要なのか

デザインワークフローには、ホスト型推論製品が苦手とする特有のコスト構造があります。

反復こそが作業の単位である。本物のデザインパスは 3 回ではなく 30〜50 回のプロンプトサイクルを意味します。ホスト型プランは 50 サイクルあたりで激しくスロットルをかけてきます。
長コンテキストが当たり前。真剣なブリーフにはブランド文書、過去の作業、システム仕様、参照画像が関わります。そのコンテキストはホスト型 UI のトークン予算を軽々と超えていきます。
モデルの選択はその場で行えるべき。速くて安いモデルを使いたいパスもあれば、利用可能な最強のものを使いたいパスもある。機密コンテンツにはローカルモデルを使いたいパスもある。ホスト型製品はそれをあなたの代わりに 1 つに決めてしまいます。

BYOK はこの 3 つすべてを解決します。トークン単位で支払い、モデルを選び、スロットルされません。

反復が配給制でなくなる

これこそが、働き方を静かに変えるものです。すべての追加サイクルがプランに対して計量されていると、自己検閲が始まります。4 案目が高くつくように感じるから 3 案目で手を打つ、というように。BYOK では、もう 1 パスの限界費用はモデルプロバイダーでの数セントなので、判断が再びメーターではなく作業そのものについてのものに戻ります。デザインが良くなるのはたいてい 3 案目であり、反復に課税するツールは、まさに重要なステップに課税しているのです。

コストはどうなのか？

よくある懸念：「直接払うなら、かえって高くつくのでは？」

実際にはそうはなりません。私たちの社内利用における典型的な 1 日のデザイン作業はこうです。

タスク	トークン	プロバイダー	コスト
ブリーフの読み込み（3 文書）	30K 入力	Claude Sonnet	$0.09
初稿パス	80K 入力 + 20K 出力	Claude Sonnet	$0.54
5 回の反復サイクル	250K 入力 + 80K 出力	Claude Sonnet	$1.95
最終仕上げ	50K 入力 + 30K 出力	Claude Opus（1 パス）	$1.35
1 日の合計			〜$3.93

これでデッキ 1 つ、ランディングのバリアント 2 つ、ブランド探索 1 つが作れます。ホスト型で同等の作業をすると — 超過課金付きの月額 $30 の「クリエイター」プランを想定して — 同じ作業に約 $50 かかり、反復回数は少なく、1 つのモデルに縛られます。

もっと安くしたければ、Claude Sonnet を DeepSeek V3.2 に替えると 1 日が $1 を切ります。要点は、どれか 1 つのモデルが正解だということではなく、価格と品質のダイヤルがサブスクリプションの階層に焼き込まれているのではなく、あなたの手の中にあるということです。

プライバシーとコンプライアンス

BYOK が重要なもう 1 つの理由：プロンプトにはクライアントのブランドが含まれている。

ホスト型推論は、ブランド文書、未発表の製品名、社内価格、ローンチ前のクリエイティブを第三者のサーバー経由でルーティングすることを意味します。ほとんどの企業はそれについて意見を持っています。なかには契約上の規定を持つところもあります。

BYOK では、プロンプトの往復はあなたのノート PC と、すでに精査済み（あるいはセルフホスト）のモデルプロバイダーとの間で行われます。Open Design はその経路にいません。召喚状を出されるログもなく、漏洩する侵害面もなく、説明すべき監査の穴もありません。

「ログなし」が実際に何をもたらすか

エージェンシーの仕事、規制業界、あるいはローンチ前のあらゆるものにとって、これが唯一耐えうる立場です。セキュリティレビューで「我々のブランドアセットはどこへ行くのか？」と問われたら、答えは「契約しているモデルプロバイダーへ、そしてそれ以外のどこへも行かない」となります。「我々がコントロールできないベンダーのダッシュボードへ」ではありません。Ollama や vLLM のエンドポイントをセルフホストすれば、さらに締まります。バイトがネットワークの外に出ることが一切なくなるのです。これは BYOK の現実チェックで掘り下げているのと同じトレードオフであり、そこでは粗い部分がまだどこにあるかについて正直に書いています。ローカルモデルとフロンティアモデルはセンスの面で互換ではなく、プロンプトインジェクションの面はあなた自身が負うことになります。

プロジェクトの途中でプロバイダーを切り替える方法

BYOK の過小評価されている利点の 1 つが、プロジェクト進行中のプロバイダーアービトラージです。

ドラフト作成 — 質問フォームと最初の反復には安いモデル（DeepSeek V3.2、Qwen 3）を使う
仕上げ — センスが重要になる中盤のパスでは Claude Sonnet や GPT-5 に切り替える
機密コンテンツ — クライアント機密のプロンプトにはローカルの Ollama モデルに替える
最終仕上げ — 利用可能な最強のモデル（Opus、GPT-5 Pro）に 1 パスを投じる

Open Design では、切り替えは .env.local の 2 行を編集することです。マイグレーションも、再オンボーディングも、プランのアップグレードもありません。

1 つのブリーフに対する実際のルーティング例

具体的には、1 つのランディングページのブリーフはこんなふうに進められます。

# draft + first iterations — cheap and fast
OPENAI_BASE_URL=https://api.deepseek.com/v1
OPENAI_API_KEY=sk-…

# then, for the passes where taste decides the outcome:
OPENAI_BASE_URL=https://api.anthropic.com/v1   # via the compat shim
OPENAI_API_KEY=sk-ant-…

同じスキル、ディスク上の同じデザインシステム、同じ成果物 — 変わったのはワークフローの背後にあるエンジンだけです。スキルとシステムは単なるファイル（SKILL.md と DESIGN.md）なので、あなたのセットアップは特定のモデルに縛られません。これこそがワークフローを所有するということの本当の意味です。ツールが邪魔をせず退き、モデルはブリーフの求めに応じて変えるパラメータになるのです。

試してみる

リポジトリをクローンし、.env.local に OPENAI_BASE_URL と OPENAI_API_KEY を設定し、pnpm tools-dev を実行します。daemon は、あなたが向けたエンドポイントを、あなたが支払うモデルで、あなたの望むスケジュールで使います。

これが BYOK のすべてです。特別な階層も、アップグレードのフローも、私たちとの請求関係もありません。あなたはモデルプロバイダーに支払い、自分のキーを保持し、自分のプロンプトを保持します。私たちはレイヤーを提供するだけです。