|

Claude Adaptive Thinking 適応的思考モードの解説:Extended Thinking に取って代わる4つの主要なアップグレード

ClaudeのExtended Thinking(拡張思考)モードを使っていた方は注意してください——Claude 4.6では、この機能はDeprecated(まもなく廃止予定)とマークされています。代わりに導入されたのは、よりスマートなモード:**Adaptive Thinking(適応的思考)**です。

核心的な変化: 以前は手動で思考トークンの予算(budget_tokens)を設定する必要がありましたが、今はClaude自身が「思考が必要かどうか」「どれくらい深く考えるべきか」を判断します。簡単な質問には即座に回答し、複雑な問題には深く推論します——たった一つのパラメータで実現します。

本記事の価値: この記事を読み終えると、Adaptive ThinkingのAPI呼び出し方法、4つの主要なアップグレード詳細、effortパラメータの設定、そしてExtended Thinkingからの移行完全ガイドを理解できるようになります。

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-ja 图示

Adaptive Thinkingとは:一言で理解

Extended Thinking(旧モード): 開発者がClaudeに「10000トークンの予算で考えて」と指示すると、Claudeはその予算を使い切ります。

Adaptive Thinking(新モード): Claude自身が問題の複雑さを評価し、「思考が必要かどうか」および「どれくらい深く考えるべきか」を決定します。

# ❌ 旧モード (Extended Thinking) - まもなく廃止予定
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ 新モード (Adaptive Thinking) - 推奨
thinking={"type": "adaptive"}

核心情報クイックビュー

情報項目 詳細
機能名 Adaptive Thinking(適応的思考)
リリース日 2026年2月5日(Claude Opus 4.6と同時リリース)
対応モデル Claude Opus 4.6, Claude Sonnet 4.6
APIパラメータ thinking: {"type": "adaptive"}
制御方法 effort パラメータ(budget_tokensの代替)
ステータス 公式推奨方式(Extended ThinkingはDeprecated)
インターリーブ思考 自動有効化(betaヘッダー不要)
Claude Code ネイティブサポート、/effortコマンドで調整可能

🎯 移行アドバイス: 現在Extended Thinking(type: "enabled")を使用しているプロジェクトは、Adaptive Thinkingへの移行を推奨します。APIYI apiyi.comプラットフォーム経由でClaude Opus 4.6またはSonnet 4.6のAPIを呼び出す場合、1つのパラメータを変更するだけで移行が完了します。


Adaptive vs Extended Thinking:4つのコアアップグレード

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-ja 图示

アップグレード1:「固定予算」から「動的決定」へ

これは最も根本的な変化です。

旧モードの課題: budget_tokens の値を推測する必要がありました。低く設定すると複雑な問題の推論が不十分になり、高く設定すると簡単な問題でトークン(とお金)を無駄にします。

# 旧モード: この問題にどれだけの思考トークンが必要か推測しますか?
thinking={"type": "enabled", "budget_tokens": 10000}
# 問題: 簡単な問題でも大量の思考トークンを使用します

新モード: Claudeが各リクエストの複雑さに基づいて自動的に決定します。

# 新モード: Claudeが自分で判断します
thinking={"type": "adaptive"}
# 簡単な問題: 思考しないか軽度の思考のみ
# 複雑な問題: 深い推論を行います

実際の影響: 「時には簡単で時には複雑」という混合ワークロード(例えば、コードレビューシナリオ——単なるテキスト修正のPRもあれば、並行処理のリファクタリングを含むPRもある)では、Adaptive Thinkingの全体的なパフォーマンスとコスト効率が固定予算よりも優れています。

アップグレード2:自動インターリーブ思考 (Interleaved Thinking)

エージェント型(Agentic)ワークフローでは、Claudeは複数のツール呼び出しの間で思考する必要があります。

旧モード: インターリーブ思考には手動でbetaヘッダーを追加する必要があり、Opus 4.5では利用できませんでした。

新モード: Adaptive Thinkingを使用すると、インターリーブ思考は自動的に有効になり、追加設定は不要です。

ユーザーリクエスト → Claudeが思考 → ツールAを呼び出し → Claudeが再び思考 → ツールBを呼び出し → 最終回答

これはClaude Codeや他のエージェント型アプリケーションにとって特に重要です——AIは各ツール呼び出し後に「再考」できるため、エラーが大幅に減少します。

アップグレード3:より柔軟なマルチターン対話

旧モード: マルチターン対話では、前のターンのassistantメッセージは必ずthinking blockで始める必要があり、そうでないとエラーが発生しました。これにより対話管理が複雑になっていました。

新モード: この制限はありません。Adaptive Thinkingでは、一部のターンでClaudeが思考を選択しない可能性があるため、マルチターン対話がより柔軟になります。

アップグレード4:budget_tokensからeffortパラメータへ

effort行動シグナルであり、ハードリミットではないため、budget_tokens よりも実際のニーズに合っています。

Effort レベル 動作 適用シナリオ サポートモデル
max 常に深く思考し、制約なし 最高難度の推論 Opus 4.6のみ
high (デフォルト) ほぼ常に思考し、複雑な問題では深く推論 コードレビュー、アーキテクチャ設計 Opus 4.6, Sonnet 4.6
medium 中程度の思考、簡単な問題はスキップする可能性あり 日常開発、一般的なタスク Opus 4.6, Sonnet 4.6
low 思考を最小化し、速度を優先 簡単なQ&A、スタイルチェック Opus 4.6, Sonnet 4.6

重要: low effortであっても、問題が十分に複雑な場合、Claudeは依然として思考を選択する可能性があります。effortは提案であり、命令ではありません。

💡 Sonnet 4.6 推奨設定: Anthropic公式は、Sonnet 4.6ではデフォルトで medium effortを使用することを推奨しており、速度、コスト、品質のバランスが最適になります。APIYI apiyi.com 経由で呼び出す場合は、リクエストに output_config パラメータを追加するだけで設定できます。


API呼び出し完全ガイド

基本呼び出し:最もシンプルなAdaptive Thinking

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # APIYI統一インターフェース
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "PythonのGILがマルチスレッドに与える影響を説明してください"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

AnthropicネイティブSDKの使用

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # APIYI統一インターフェース
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "このコードの競合状態をレビューしてください..."}
    ]
)

# レスポンスの解析:thinkingブロックとtextブロックが含まれる場合があります
for block in response.content:
    if block.type == "thinking":
        print(f"[思考プロセス] {block.thinking}")
    elif block.type == "text":
        print(f"[回答] {block.text}")

effortパラメータによる詳細制御

# Anthropic SDKの例
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # 中程度の思考深度
    messages=[
        {"role": "user", "content": "このコードに何か問題はありますか?"}
    ]
)

思考内容を省略して遅延を削減

思考プロセスを確認する必要がない場合は、display: "omitted"を使用して転送遅延を削減できます:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # 思考テキストを返さない
    },
    messages=[...]
)
# 注意: 思考トークンは引き続き課金対象となります
完全なコードレビューワークフローの例を見る
import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """リスクレベルに応じてコードを適応的にレビュー"""

    # 高リスク: Opus + high effort
    # 低リスク: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""あなたは経験豊富なコードレビュー専門家です。
コード変更を分析し、重大度レベルで分類してください:
🔴 必須修正 (セキュリティ/ロジック)
🟡 推奨修正 (品質)
💡 改善提案""",
        messages=[
            {"role": "user", "content": f"レビュー:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 クイックスタート: APIYI apiyi.com を通じてClaude 4.6 APIを呼び出すには、リクエストに thinking: {"type": "adaptive"} を追加するだけで適応的思考を有効化できます。追加設定は不要で、1行のコードでAIの推論能力をアップグレードできます。


Effortパラメータ実践:異なるシナリオでの最適設定

シナリオ別設定ガイド

シナリオ 推奨モデル Effort 理由
簡単なQ&A/翻訳 Sonnet 4.6 low 深い推論は不要、速度を優先
コード補完/フォーマット Sonnet 4.6 low パターンマッチングタスク、思考は不要
日常的なPRレビュー Sonnet 4.6 medium 速度とレビュー深度のバランス
複雑なバグデバッグ Opus 4.6 high ファイルをまたぐ推論が必要
セキュリティ脆弱性監査 Opus 4.6 high 高リスク問題を見逃せない
数学/論理証明 Opus 4.6 max 究極の推論深度が必要
アーキテクチャ設計 Opus 4.6 max 包括的なトレードオフ考慮が必要

Claude Codeでのeffort使用

Claude Code 2026年3月更新後、/effortコマンドが追加されました:

# Claude Codeターミナルで直接設定
/effort medium    # 日常的なコーディング
/effort high      # コードレビュー
/effort max       # アーキテクチャ設計 (Opus 4.6のみ)

これにより、開発者はコードを変更することなく、現在のタスクに応じてClaudeの思考深度を柔軟に調整できます。

💰 コスト最適化: effortパラメータはトークン消費に直接影響します。日常的なコーディングタスクでは、Sonnet 4.6をmediumまたはlowに設定することでコストを大幅に削減できます。APIYI apiyi.comプラットフォームを通じて呼び出すと、公式よりもお得な価格で、effortパラメータとの組み合わせで二重の節約が可能です。

Extended Thinking から Adaptive Thinking への移行

移行対応表

旧形式 (Extended Thinking) 新形式 (Adaptive Thinking)
thinking: {"type": "enabled", "budget_tokens": 5000} thinking: {"type": "adaptive"}, output_config: {"effort": "low"}
thinking: {"type": "enabled", "budget_tokens": 10000} thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}
thinking: {"type": "enabled", "budget_tokens": 30000} thinking: {"type": "adaptive"}, output_config: {"effort": "high"}
thinking: {"type": "enabled", "budget_tokens": 100000} thinking: {"type": "adaptive"}, output_config: {"effort": "max"}
interleaved thinking beta header の手動追加 自動で有効化、header は不要

移行時の注意点

1. プロンプトキャッシュが中断される

enabled から adaptive モードに切り替えると、メッセージレベルのプロンプトキャッシュのブレークポイントが無効になります。システムプロンプトとツール定義のキャッシュは影響を受けません。

推奨: すべてのリクエストを一度に adaptive モードに移行し、混在使用は避けてください。

2. 思考内容はデフォルトで要約版

Claude 4.6 モデルはデフォルトで要約版の思考内容を返します。完全な思考テキストではありません。つまり、表示される thinking block は簡略化されたものです。

  • 要約版 (display: "summarized"): デフォルトの動作
  • 省略版 (display: "omitted"): 思考テキストを返さない
  • 完全版: Anthropic の営業チームに連絡して有効化が必要

3. 課金は完全な内部思考に基づく

表示されるのが要約版でも省略版でも、課金は完全な内部思考の token 量に基づいて行われます。表示されるテキストが少ないからといって、コストが少ないわけではありません。

4. Prefill はサポートされなくなった

Claude Opus 4.6 では、assistant メッセージの事前入力 (prefill) がサポートされなくなりました。事前入力メッセージを送信すると 400 エラーが返されます。出力形式を制御する必要がある場合は、system prompt または structured output を使用してください。

🎯 移行のアドバイス: テスト環境でまず移行効果を検証し、特に adaptive モードと以前の固定 budget_tokens の出力品質の違いを比較することをお勧めします。APIYI apiyi.com を利用すると、同じキーで異なる設定を呼び出す A/B テストが簡単に行えます。


claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-ja 图示

課金メカニズムの詳細解説

思考トークンの課金方法

コスト管理において、課金メカニズムを理解することは非常に重要です。

課金項目 説明
入力トークン 通常通り課金 ($5/MTok Opus, $3/MTok Sonnet)
思考トークン 出力トークン価格で課金 ($25/MTok Opus, $15/MTok Sonnet)
応答テキストトークン 出力トークン価格で課金
要約生成トークン 追加課金なし
display: "omitted" 思考トークンは依然として課金対象(転送されないだけ)

コスト最適化戦略

簡単な問題には low effort → 思考をスキップする可能性 → 大量の出力トークンを節約
                                                ↓
                                           コストを50-80%削減可能

実際の比較例: 同じコードスタイルチェックタスク

設定 思考トークン 応答トークン 総コスト (Sonnet)
effort: high ~3000 ~500 ~$0.053
effort: medium ~800 ~500 ~$0.020
effort: low 0 (思考スキップ) ~500 ~$0.009

簡単なタスクの場合、low effortはhigh effortに比べて約 83% 安くなります。

💰 節約のコツ: バッチ処理シナリオ(例:100個のファイルのスタイルチェック)では、effortをlowに設定することで大幅なコスト削減が可能です。APIYI apiyi.comを通じてClaude 4.6 APIを呼び出す際は、既存の割引価格に加えてeffortパラメータの最適化を行うことで、二重のコスト削減効果が得られます。


よくある質問

Q1: Adaptive ThinkingとExtended Thinkingは併用できますか?

可能ですが、推奨されません。Claude 4.6モデルでは、Extended Thinking (type: "enabled")は依然として使用可能ですが、Deprecated(非推奨)としてマークされており、将来のバージョンで削除される予定です。また、2つのモードを混在させると、プロンプトキャッシュのブレークポイントが無効になる可能性があります。Adaptive Thinkingへの統一的な移行を早期に行うことをお勧めします。APIYI apiyi.comを通じて呼び出す場合、パラメータ形式は完全に互換性があります。

Q2: Opus 4.5はAdaptive Thinkingをサポートしていますか?

サポートしていません。Adaptive ThinkingはClaude Opus 4.6とSonnet 4.6のみでサポートされています。Opus 4.5では引き続きtype: "enabled"モードを使用し、手動でbudget_tokensを設定する必要があります。Adaptive Thinkingを使用したい場合は、4.6シリーズモデルへのアップグレードをお勧めします。APIYI apiyi.comでは、4.5と4.6の全シリーズモデルのAPI接続を提供しています。

Q3: display: “omitted”は本当にコスト削減になりますか?

コスト削減にはなりません。display: "omitted"は、APIが思考テキストを返さないようにするだけで、ネットワーク転送の遅延を減らす効果があります。しかし、内部的な思考トークンは依然として生成され、課金対象となります。本当にコストを削減する方法は、effortレベルを下げることです。lowまたはmediumに設定すると、Claudeは簡単な問題に対して思考をスキップまたは削減します。

Q4: Claudeが特定のリクエストで思考を行ったかどうかを判断するには?

応答にthinkingタイプのcontent blockが含まれているかどうかを確認してください。Claudeが思考が必要ないと判断した場合、応答にはtext blockのみが含まれ、thinking blockは含まれません。Adaptiveモードでは、usageフィールドのトークンカウントから、思考にどれだけのトークンが消費されたかを判断するのに役立ちます。

Q5: Claude CodeでAdaptive Thinkingを使用するには?

Claude Codeは、Opus 4.6またはSonnet 4.6を使用する場合、デフォルトでAdaptive Thinkingが有効になっています。思考の深さは/effortコマンドで調整できます:/effort low(高速モード)、/effort medium(バランスモード)、/effort high(詳細モード)。2026年3月のアップデートでは、非標準のモデル文字列による「adaptive thinking is not supported」エラーも修正されました。


まとめ:Adaptive Thinking は Claude 4.6 のコアアップグレード

Adaptive Thinking は、AIの推論モードにおける重要な進化を表しています——「開発者がAIにどれだけ思考が必要かを推測する」から「AI自身が必要な思考量を判断する」へ。

4つのコアアップグレード:

  1. 動的意思決定: 簡単な質問には即座に回答、複雑な問題には深く推論
  2. 自動インターリーブ思考: エージェントワークフロー内でのツール呼び出し間の自動推論
  3. 柔軟なマルチターン対話: 強制的なthinking blockの開始は不要
  4. effortパラメータ: budget_tokensよりも直感的な制御方法

移行の提案: thinking: {"type": "enabled", "budget_tokens": N} から thinking: {"type": "adaptive"} に変更し、output_config: {"effort": "..."} で深さを制御します。

APIYI apiyi.com を通じて Claude Opus 4.6 と Sonnet 4.6 のAPIに素早くアクセスし、一行のパラメータ変更で Adaptive Thinking がもたらす知的推論とコスト最適化を享受することをお勧めします。


参考資料

  1. Claude API ドキュメント – Adaptive Thinking: 公式技術ガイド

    • リンク: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
  2. Claude API ドキュメント – Effort パラメータ: effort設定の詳細解説

    • リンク: platform.claude.com/docs/en/build-with-claude/effort
  3. Anthropic 公式 – Claude Opus 4.6: リリース発表

    • リンク: anthropic.com/news/claude-opus-4-6
  4. Claude API ドキュメント – Extended Thinking: 従来の拡張思考ガイド

    • リンク: platform.claude.com/docs/en/build-with-claude/extended-thinking

著者: APIYI Team | Claudeの最新API機能をマスターし、Claude 4.6全シリーズモデルのAPIインターフェースと技術サポートを入手するには、APIYI apiyi.com をご訪問ください。

類似投稿