|

Interpretation von Claude Adaptive Thinking Adaptiver Denkmodus: Die 4 großen Upgrades, die Extended Thinking ersetzen

Wenn Sie bisher den Extended Thinking (Erweitertes Denken)-Modus von Claude genutzt haben, Achtung – in Claude 4.6 wurde er als Deprecated (bald veraltet) markiert. Ersetzt wird er durch einen intelligenteren Modus: Adaptive Thinking (Adaptives Denken).

Die Kernänderung: Früher mussten Sie das Token-Budget für das Denken (budget_tokens) manuell festlegen. Jetzt entscheidet Claude selbst, ob und wie tief er denken muss. Einfache Fragen werden sofort beantwortet, komplexe Probleme werden tiefgründig durchdacht – mit nur einem Parameter.

Der Kernnutzen: Nach diesem Artikel kennen Sie die API-Aufrufmethode für Adaptive Thinking, die 4 wichtigsten Verbesserungen, die Konfiguration des effort-Parameters und eine vollständige Anleitung zur Migration von Extended Thinking.

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-de 图示

Was ist Adaptive Thinking: In einem Satz erklärt

Extended Thinking (Alter Modus): Der Entwickler sagt Claude "Du hast ein Budget von 10000 Token zum Denken", und Claude nutzt dieses Budget vollständig.

Adaptive Thinking (Neuer Modus): Claude bewertet selbst die Komplexität der Frage und entscheidet, "ob er denken muss" und "wie tief er denken muss".

# ❌ Alter Modus (Extended Thinking) - Bald veraltet
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ Neuer Modus (Adaptive Thinking) - Empfohlen
thinking={"type": "adaptive"}

Kerninformationen auf einen Blick

Information Details
Funktionsname Adaptive Thinking (Adaptives Denken)
Veröffentlichungsdatum 5. Februar 2026 (mit Claude Opus 4.6 veröffentlicht)
Unterstützte Modelle Claude Opus 4.6, Claude Sonnet 4.6
API-Parameter thinking: {"type": "adaptive"}
Steuerungsmethode effort-Parameter (ersetzt budget_tokens)
Status Offiziell empfohlene Methode (Extended Thinking ist Deprecated)
Interleaving Automatisch aktiviert (kein Beta-Header nötig)
Claude Code Nativ unterstützt, kann mit /effort-Befehl angepasst werden

🎯 Migrationsempfehlung: Wenn Ihr Projekt Extended Thinking (type: "enabled") verwendet, sollten Sie so bald wie möglich auf Adaptive Thinking migrieren. Über die APIYI apiyi.com Plattform für Claude Opus 4.6 oder Sonnet 4.6 API-Aufrufe können Sie die Migration mit nur einer Parameteränderung abschließen.


Adaptive vs Extended Thinking: 4 zentrale Verbesserungen

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-de 图示

Verbesserung 1: Von "festem Budget" zu "dynamischer Entscheidung"

Das ist die grundlegendste Veränderung.

Schmerzpunkt des alten Modells: Du musstest einen budget_tokens-Wert raten. Zu niedrig gesetzt, reichte die Denkleistung für komplexe Probleme nicht aus; zu hoch gesetzt, wurden bei einfachen Problemen Token (und Geld) verschwendet.

# Altes Modell: Du rätst, wie viele Denk-Token dieses Problem braucht?
thinking={"type": "enabled", "budget_tokens": 10000}
# Problem: Einfache Probleme verbrauchen auch viele Denk-Token

Neues Modell: Claude entscheidet automatisch basierend auf der Komplexität jeder Anfrage.

# Neues Modell: Claude entscheidet selbst
thinking={"type": "adaptive"}
# Einfaches Problem: Kein oder leichtes Denken
# Komplexes Problem: Tiefgehende Schlussfolgerung

Praktische Auswirkung: Für gemischte Arbeitslasten, die "manchmal einfach, manchmal komplex" sind (z.B. Code-Review-Szenarien – manche PRs ändern nur Text, andere betreffen Nebenläufigkeits-Refactoring), übertrifft Adaptive Thinking sowohl in der Gesamtleistung als auch in der Kosteneffizienz das feste Budget.

Verbesserung 2: Automatisches verschachteltes Denken (Interleaved Thinking)

In agentenbasierten (Agentic) Workflows muss Claude zwischen mehreren Werkzeugaufrufen denken.

Altes Modell: Verschachteltes Denken erforderte manuelles Hinzufügen eines Beta-Headers und war auf Opus 4.5 nicht verfügbar.

Neues Modell: Bei Verwendung von Adaptive Thinking ist verschachteltes Denken automatisch aktiviert, ohne zusätzliche Konfiguration.

Benutzeranfrage → Claude denkt → Ruft Werkzeug A auf → Claude denkt erneut → Ruft Werkzeug B auf → Endgültige Antwort

Dies ist besonders wichtig für Claude Code und andere agentenbasierte Anwendungen – die KI kann nach jedem Werkzeugaufruf "neu nachdenken", was Fehler deutlich reduziert.

Verbesserung 3: Flexiblere mehrteilige Gespräche

Altes Modell: In mehrteiligen Gesprächen musste die vorherige Assistant-Nachricht zwingend mit einem Thinking-Block beginnen, sonst gab es einen Fehler. Das machte die Gesprächsverwaltung komplex.

Neues Modell: Diese Einschränkung entfällt. Adaptive Thinking ist in mehrteiligen Gesprächen flexibler, da Claude in manchen Runden möglicherweise entscheidet, nicht zu denken.

Verbesserung 4: Der effort-Parameter ersetzt budget_tokens

effort ist ein Verhaltenssignal und keine harte Grenze, was den tatsächlichen Bedürfnissen besser entspricht als budget_tokens.

Effort-Stufe Verhalten Anwendungsfall Unterstützte Modelle
max Immer tiefgehendes Denken, keine Einschränkung Höchste Schwierigkeitsstufe bei Schlussfolgerungen Nur Opus 4.6
high (Standard) Denkt fast immer, tiefgehende Schlussfolgerung bei komplexen Problemen Code-Review, Architekturentwurf Opus 4.6, Sonnet 4.6
medium Mittleres Denken, einfache Probleme können übersprungen werden Tägliche Entwicklung, allgemeine Aufgaben Opus 4.6, Sonnet 4.6
low Minimiert Denken, priorisiert Geschwindigkeit Einfache Fragen, Stilprüfungen Opus 4.6, Sonnet 4.6

Wichtig: Selbst bei low effort wird Claude sich zum Denken entscheiden, wenn das Problem komplex genug ist. Effort ist eine Empfehlung, kein Befehl.

💡 Empfehlung für Sonnet 4.6: Anthropic empfiehlt offiziell, Sonnet 4.6 standardmäßig mit medium effort zu verwenden, um die beste Balance zwischen Geschwindigkeit, Kosten und Qualität zu erreichen. Bei Aufrufen über APIYI apiyi.com reicht es, den output_config-Parameter in der Anfrage hinzuzufügen.


Vollständige Anleitung zum API-Aufruf

Grundlegender Aufruf: Einfachstes Adaptive Thinking

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # APIYI einheitliche Schnittstelle
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "Erkläre den Einfluss von Pythons GIL auf Multithreading"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

Verwendung des nativen Anthropic SDK

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # APIYI einheitliche Schnittstelle
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Überprüfe diesen Code auf Race Conditions..."}
    ]
)

# Antwort analysieren: Kann thinking-Block und text-Block enthalten
for block in response.content:
    if block.type == "thinking":
        print(f"[Denkprozess] {block.thinking}")
    elif block.type == "text":
        print(f"[Antwort] {block.text}")

Feine Steuerung mit dem effort-Parameter

# Anthropic SDK Beispiel
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # Mittlere Denktiefe
    messages=[
        {"role": "user", "content": "Was ist das Problem mit diesem Code?"}
    ]
)

Denkprozess auslassen, um Latenz zu reduzieren

Wenn Sie den Denkprozess nicht sehen müssen, können Sie mit display: "omitted" die Übertragungslatenz reduzieren:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # Kein Denktext zurückgeben
    },
    messages=[...]
)
# Hinweis: Denk-Tokens werden trotzdem berechnet
Vollständiges Beispiel für einen Code-Review-Workflow anzeigen
import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """Code-Review adaptiv basierend auf Risikostufe"""

    # Hohes Risiko: Opus + high effort
    # Geringes Risiko: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""Du bist ein erfahrener Code-Review-Experte.
Analysiere die Code-Änderungen und kategorisiere sie nach Schweregrad:
🔴 Muss behoben werden (Sicherheit/Logik)
🟡 Empfohlen zu beheben (Qualität)
💡 Verbesserungsvorschlag""",
        messages=[
            {"role": "user", "content": f"Review:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 Schneller Start: Rufen Sie die Claude 4.6 API über APIYI apiyi.com auf, indem Sie einfach thinking: {"type": "adaptive"} in Ihre Anfrage einfügen. Keine zusätzliche Konfiguration nötig – verbessern Sie Ihre KI-Inferenzfähigkeiten mit einer Zeile Code.


Effort-Parameter in der Praxis: Optimale Konfiguration für verschiedene Szenarien

Leitfaden für szenariobasierte Konfiguration

Szenario Empfohlenes Modell Effort Begründung
Einfache Fragen/Antworten/Übersetzung Sonnet 4.6 low Keine tiefe Inferenz nötig, Geschwindigkeit priorisieren
Code-Vervollständigung/Formatierung Sonnet 4.6 low Mustererkennungsaufgabe, kein Denken erforderlich
Tägliches PR-Review Sonnet 4.6 medium Ausgewogenes Verhältnis von Geschwindigkeit und Review-Tiefe
Komplexes Debugging Opus 4.6 high Dateiübergreifende Inferenz erforderlich
Sicherheitslücken-Audit Opus 4.6 high Kritische Probleme dürfen nicht übersehen werden
Mathematische/Logische Beweise Opus 4.6 max Maximale Inferenztiefe erforderlich
Architekturentwurf Opus 4.6 max Umfassende Abwägungen notwendig

Verwendung von effort in Claude Code

Nach dem Update von Claude Code im März 2026 wurde der Befehl /effort hinzugefügt:

# Direkt im Claude Code Terminal setzen
/effort medium    # Tägliche Codierung
/effort high      # Code-Review
/effort max       # Architekturentwurf (nur Opus 4.6)

Dies ermöglicht es Entwicklern, die Denktiefe von Claude flexibel basierend auf der aktuellen Aufgabe anzupassen, ohne Code ändern zu müssen.

💰 Kostenoptimierung: Der effort-Parameter beeinflusst direkt den Token-Verbrauch. Für tägliche Codierungsaufgaben kann die Einstellung von Sonnet 4.6 auf medium oder low die Kosten erheblich senken. Der Aufruf über die APIYI apiyi.com-Plattform ist günstiger als der offizielle Preis, was zusammen mit dem effort-Parameter doppelt spart.

Migration von Extended Thinking zu Adaptive Thinking

Migrationsübersichtstabelle

Alte Schreibweise (Extended Thinking) Neue Schreibweise (Adaptive Thinking)
thinking: {"type": "enabled", "budget_tokens": 5000} thinking: {"type": "adaptive"}, output_config: {"effort": "low"}
thinking: {"type": "enabled", "budget_tokens": 10000} thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}
thinking: {"type": "enabled", "budget_tokens": 30000} thinking: {"type": "adaptive"}, output_config: {"effort": "high"}
thinking: {"type": "enabled", "budget_tokens": 100000} thinking: {"type": "adaptive"}, output_config: {"effort": "max"}
Manuelles Hinzufügen des interleaved thinking beta Headers Automatisch aktiviert, kein Header erforderlich

Wichtige Hinweise zur Migration

1. Prompt-Cache wird unterbrochen

Beim Wechsel vom enabled– in den adaptive-Modus werden die Cache-Breakpoints auf Nachrichtenebene ungültig. Der Cache für Systemprompts und Tool-Definitionen bleibt davon unberührt.

Empfehlung: Migrieren Sie alle Anfragen auf einmal zum adaptive-Modus, anstatt gemischt zu arbeiten.

2. Denkinhalte sind standardmäßig zusammengefasst

Das Claude 4.6-Modell gibt standardmäßig eine zusammengefasste Version der Denkinhalte zurück, nicht den vollständigen Denktext. Das bedeutet, der angezeigte thinking-Block ist eine vereinfachte Version.

  • Zusammenfassung (display: "summarized"): Standardverhalten
  • Ausgelassen (display: "omitted"): Kein Denktext wird zurückgegeben
  • Vollständige Version: Muss über das Anthropic-Vertriebsteam aktiviert werden

3. Abrechnung basiert auf vollständigem Denken

Egal, ob Sie eine Zusammenfassung sehen oder nichts – die Abrechnung erfolgt nach der Token-Anzahl des vollständigen internen Denkprozesses. Gehen Sie nicht davon aus, dass weniger angezeigter Text auch weniger kostet.

4. Prefill wird nicht mehr unterstützt

Claude Opus 4.6 unterstützt das Vorausfüllen (prefill) von Assistant-Nachrichten nicht mehr – das Senden eines Prefill führt zu einem 400-Fehler. Verwenden Sie für die Steuerung des Ausgabeformats Systemprompts oder structured output.

🎯 Migrationsempfehlung: Es wird empfohlen, die Migrationseffekte zunächst in einer Testumgebung zu validieren, insbesondere um die Ausgabequalität des adaptive-Modus mit der vorherigen festen budget_tokens-Einstellung zu vergleichen. Mit APIYI apiyi.com können Sie bequem A/B-Tests durchführen – ein einzelner Key ruft dabei verschiedene Konfigurationen auf.


Effort-Parameter und Denk-Token-Abrechnungsmechanismus Mit effort die Denktiefe steuern · Kosten verstehen, um unerwartete Ausgaben zu vermeiden

Effort-Level → Denktiefe

max Immer tiefes Denken · Keine Einschränkungen · Nur Opus 4.6 Mathematischer Beweis / Architekturdesign / Höchste Schwierigkeitsstufe bei logischem Denken

hoch Denken fast immer · Standardwert Code Review / Bug Debugging / Sicherheitsaudit

med Moderates Denken · Einfache Aufgaben können übersprungen werden Alltägliche Codierung / Allgemeine Aufgaben · Sonnet empfohlen als Standard

niedrig Minimales Denken Einfache Fragen & Antworten / Stilprüfung / Übersetzung · Geschwindigkeit priorisiert

Abrechnungsmechanismus (Achtung!)

⚠ Denken-Token = Ausgabe-Token-Preis

Opus 4.6: Eingabe $5 / Ausgabe $25 pro Million Token Sonnet 4.6: Eingabe $3 / Ausgabe $15 pro Million Token

Gesehenes ≠ Abgerechnetes • Standardmäßig wird eine Zusammenfassung des Denkprozesses zurückgegeben (nicht die vollständige Version). • Abrechnung basierend auf der vollen Anzahl interner Denk-Tokens • display:"omitted" nur Latenz reduzieren, nicht die Kosten

Echt sparen: Aufwand reduzieren! Low-Effort kann Denken überspringen → 0 Denk-Token Gleiche Aufgabe high→low spart ca. 83%

Einheitliche Code-Stil-Prüfaufgabe · Sonnet 4.6 Kostenvergleich

Aufwand: hoch $0.053

mittel $0.020

niedrig $0.009

Sparen Sie 83% Niedrig vs. hoch

Genießen Sie günstigere Preise mit APIYI apiyi.com + Doppelte Ersparnis durch den Effort-Parameter

Detaillierte Erklärung des Abrechnungsmechanismus

Wie Denk-Tokens abgerechnet werden

Das Verständnis des Abrechnungsmechanismus ist entscheidend für die Kostenkontrolle.

Abrechnungsposition Erklärung
Eingabe-Tokens Normale Abrechnung ($5/MTok Opus, $3/MTok Sonnet)
Denk-Tokens Zum Ausgabe-Token-Preis abgerechnet ($25/MTok Opus, $15/MTok Sonnet)
Antwort-Text-Tokens Zum Ausgabe-Token-Preis abgerechnet
Zusammenfassungs-Tokens Werden nicht zusätzlich berechnet
display: "omitted" Denk-Tokens werden trotzdem berechnet, sie werden nur nicht übertragen

Strategien zur Kostenoptimierung

Einfache Probleme mit low effort → Denkvorgang kann übersprungen werden → Spart viele Ausgabe-Tokens
                                                ↓
                                            Kosten können um 50-80% sinken

Praktisches Vergleichsbeispiel: Dieselbe Aufgabe zur Code-Stil-Prüfung

Konfiguration Denk-Tokens Antwort-Tokens Gesamtkosten (Sonnet)
effort: high ~3000 ~500 ~$0,053
effort: medium ~800 ~500 ~$0,020
effort: low 0 (Denkvorgang übersprungen) ~500 ~$0,009

Für einfache Aufgaben ist low effort etwa 83% günstiger als high effort.

💰 Geldspartipp: Für Batch-Verarbeitungsszenarien (z.B. Stilprüfung für 100 Dateien) kann das Setzen von effort auf low erhebliche Kosten sparen. Durch den Aufruf der Claude 4.6 API über APIYI apiyi.com, in Kombination mit bereits günstigen Preisen und der Optimierung des effort-Parameters, erreichen Sie eine doppelte Kostenreduktion.


Häufig gestellte Fragen

Q1: Können Adaptive Thinking und Extended Thinking gemischt verwendet werden?

Ja, aber es wird nicht empfohlen. Beim Claude 4.6 Modell ist Extended Thinking (type: "enabled") zwar noch verfügbar, aber als veraltet (Deprecated) markiert und wird in zukünftigen Versionen entfernt. Die gemischte Verwendung beider Modi führt außerdem dazu, dass die Prompt-Cache-Unterbrechungspunkte ungültig werden. Es wird empfohlen, so früh wie möglich auf Adaptive Thinking umzustellen. Bei Aufrufen über APIYI apiyi.com ist das Parameterformat vollständig kompatibel.

Q2: Unterstützt Opus 4.5 Adaptive Thinking?

Nein. Adaptive Thinking wird nur von Claude Opus 4.6 und Sonnet 4.6 unterstützt. Für Opus 4.5 muss weiterhin der Modus type: "enabled" verwendet und budget_tokens manuell gesetzt werden. Wenn Sie Adaptive Thinking nutzen möchten, wird ein Upgrade auf die 4.6-Modellreihe empfohlen. APIYI apiyi.com bietet API-Zugang zur gesamten 4.5- und 4.6-Modellreihe an.

Q3: Spart display: „omitted“ wirklich Geld?

Es spart kein Geld. display: "omitted" bewirkt nur, dass die API den Denktext nicht zurückgibt, was die Netzwerkübertragungslatenz reduziert. Intern werden die Denk-Tokens jedoch weiterhin generiert und berechnet. Die echte Kosteneinsparung wird durch die Senkung der effort-Stufe erreicht – low oder medium veranlassen Claude dazu, bei einfachen Problemen das Denken zu überspringen oder zu reduzieren.

Q4: Wie kann ich feststellen, ob Claude bei einer bestimmten Anfrage gedacht hat?

Überprüfen Sie, ob die Antwort einen Content-Block vom Typ thinking enthält. Wenn Claude entscheidet, dass kein Denken erforderlich ist, enthält die Antwort nur einen text-Block, keinen thinking-Block. Im Adaptive-Modus können Ihnen die Token-Zählungen im usage-Feld helfen zu beurteilen, wie viele Tokens für das Denken verbraucht wurden.

Q5: Wie wird Adaptive Thinking in Claude Code verwendet?

Claude Code aktiviert Adaptive Thinking standardmäßig, wenn Opus 4.6 oder Sonnet 4.6 verwendet wird. Sie können die Denktiefe mit dem Befehl /effort anpassen: /effort low (Schnellmodus), /effort medium (Ausgewogener Modus), /effort high (Tiefenmodus). Das Update vom März 2026 hat außerdem den Fehler "adaptive thinking is not supported" behoben, der durch nicht standardmäßige Modellzeichenfolgen verursacht wurde.


Zusammenfassung: Adaptive Thinking ist das Kern-Upgrade von Claude 4.6

Adaptive Thinking steht für einen wichtigen Entwicklungsschritt im KI-Denkmodus – weg von "Entwickler raten, wie viel die KI nachdenken muss" hin zu "die KI entscheidet selbst, wie viel sie nachdenken muss".

4 Kern-Upgrades:

  1. Dynamische Entscheidungsfindung: Einfache Fragen werden sofort beantwortet, komplexe Probleme werden tiefgründig durchdacht.
  2. Automatisches verschachteltes Denken: Automatische Schlussfolgerungen zwischen Tool-Aufrufen in agentenbasierten Workflows.
  3. Flexible mehrteilige Dialoge: Kein erzwungener thinking-Block am Anfang mehr nötig.
  4. Effort-Parameter: Eine intuitivere Steuerungsmethode als budget_tokens.

Migrationsempfehlung: Wechseln Sie von thinking: {"type": "enabled", "budget_tokens": N} zu thinking: {"type": "adaptive"} und steuern Sie die Tiefe mit output_config: {"effort": "..."}.

Wir empfehlen, über APIYI (apiyi.com) schnell Zugang zu den APIs von Claude Opus 4.6 und Sonnet 4.6 zu erhalten. Mit nur einer Parameteränderung können Sie die intelligenten Schlussfolgerungen und Kostenoptimierungen von Adaptive Thinking nutzen.


Referenzen

  1. Claude API-Dokumentation – Adaptive Thinking: Offizielle technische Anleitung

    • Link: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
  2. Claude API-Dokumentation – Effort-Parameter: Detaillierte Erklärung der Effort-Konfiguration

    • Link: platform.claude.com/docs/en/build-with-claude/effort
  3. Anthropic offiziell – Claude Opus 4.6: Veröffentlichungsankündigung

    • Link: anthropic.com/news/claude-opus-4-6
  4. Claude API-Dokumentation – Extended Thinking: Leitfaden zum ursprünglichen erweiterten Denken

    • Link: platform.claude.com/docs/en/build-with-claude/extended-thinking

Autor: APIYI Team | Bleiben Sie auf dem neuesten Stand der Claude-API-Fähigkeiten. Besuchen Sie APIYI (apiyi.com) für API-Schnittstellen und technischen Support der gesamten Claude-4.6-Modellreihe.

Ähnliche Beiträge