Wenn Sie bisher den Extended Thinking (Erweitertes Denken)-Modus von Claude genutzt haben, Achtung – in Claude 4.6 wurde er als Deprecated (bald veraltet) markiert. Ersetzt wird er durch einen intelligenteren Modus: Adaptive Thinking (Adaptives Denken).
Die Kernänderung: Früher mussten Sie das Token-Budget für das Denken (budget_tokens) manuell festlegen. Jetzt entscheidet Claude selbst, ob und wie tief er denken muss. Einfache Fragen werden sofort beantwortet, komplexe Probleme werden tiefgründig durchdacht – mit nur einem Parameter.
Der Kernnutzen: Nach diesem Artikel kennen Sie die API-Aufrufmethode für Adaptive Thinking, die 4 wichtigsten Verbesserungen, die Konfiguration des effort-Parameters und eine vollständige Anleitung zur Migration von Extended Thinking.

Was ist Adaptive Thinking: In einem Satz erklärt
Extended Thinking (Alter Modus): Der Entwickler sagt Claude "Du hast ein Budget von 10000 Token zum Denken", und Claude nutzt dieses Budget vollständig.
Adaptive Thinking (Neuer Modus): Claude bewertet selbst die Komplexität der Frage und entscheidet, "ob er denken muss" und "wie tief er denken muss".
# ❌ Alter Modus (Extended Thinking) - Bald veraltet
thinking={"type": "enabled", "budget_tokens": 10000}
# ✅ Neuer Modus (Adaptive Thinking) - Empfohlen
thinking={"type": "adaptive"}
Kerninformationen auf einen Blick
| Information | Details |
|---|---|
| Funktionsname | Adaptive Thinking (Adaptives Denken) |
| Veröffentlichungsdatum | 5. Februar 2026 (mit Claude Opus 4.6 veröffentlicht) |
| Unterstützte Modelle | Claude Opus 4.6, Claude Sonnet 4.6 |
| API-Parameter | thinking: {"type": "adaptive"} |
| Steuerungsmethode | effort-Parameter (ersetzt budget_tokens) |
| Status | Offiziell empfohlene Methode (Extended Thinking ist Deprecated) |
| Interleaving | Automatisch aktiviert (kein Beta-Header nötig) |
| Claude Code | Nativ unterstützt, kann mit /effort-Befehl angepasst werden |
🎯 Migrationsempfehlung: Wenn Ihr Projekt Extended Thinking (
type: "enabled") verwendet, sollten Sie so bald wie möglich auf Adaptive Thinking migrieren. Über die APIYI apiyi.com Plattform für Claude Opus 4.6 oder Sonnet 4.6 API-Aufrufe können Sie die Migration mit nur einer Parameteränderung abschließen.
Adaptive vs Extended Thinking: 4 zentrale Verbesserungen

Verbesserung 1: Von "festem Budget" zu "dynamischer Entscheidung"
Das ist die grundlegendste Veränderung.
Schmerzpunkt des alten Modells: Du musstest einen budget_tokens-Wert raten. Zu niedrig gesetzt, reichte die Denkleistung für komplexe Probleme nicht aus; zu hoch gesetzt, wurden bei einfachen Problemen Token (und Geld) verschwendet.
# Altes Modell: Du rätst, wie viele Denk-Token dieses Problem braucht?
thinking={"type": "enabled", "budget_tokens": 10000}
# Problem: Einfache Probleme verbrauchen auch viele Denk-Token
Neues Modell: Claude entscheidet automatisch basierend auf der Komplexität jeder Anfrage.
# Neues Modell: Claude entscheidet selbst
thinking={"type": "adaptive"}
# Einfaches Problem: Kein oder leichtes Denken
# Komplexes Problem: Tiefgehende Schlussfolgerung
Praktische Auswirkung: Für gemischte Arbeitslasten, die "manchmal einfach, manchmal komplex" sind (z.B. Code-Review-Szenarien – manche PRs ändern nur Text, andere betreffen Nebenläufigkeits-Refactoring), übertrifft Adaptive Thinking sowohl in der Gesamtleistung als auch in der Kosteneffizienz das feste Budget.
Verbesserung 2: Automatisches verschachteltes Denken (Interleaved Thinking)
In agentenbasierten (Agentic) Workflows muss Claude zwischen mehreren Werkzeugaufrufen denken.
Altes Modell: Verschachteltes Denken erforderte manuelles Hinzufügen eines Beta-Headers und war auf Opus 4.5 nicht verfügbar.
Neues Modell: Bei Verwendung von Adaptive Thinking ist verschachteltes Denken automatisch aktiviert, ohne zusätzliche Konfiguration.
Benutzeranfrage → Claude denkt → Ruft Werkzeug A auf → Claude denkt erneut → Ruft Werkzeug B auf → Endgültige Antwort
Dies ist besonders wichtig für Claude Code und andere agentenbasierte Anwendungen – die KI kann nach jedem Werkzeugaufruf "neu nachdenken", was Fehler deutlich reduziert.
Verbesserung 3: Flexiblere mehrteilige Gespräche
Altes Modell: In mehrteiligen Gesprächen musste die vorherige Assistant-Nachricht zwingend mit einem Thinking-Block beginnen, sonst gab es einen Fehler. Das machte die Gesprächsverwaltung komplex.
Neues Modell: Diese Einschränkung entfällt. Adaptive Thinking ist in mehrteiligen Gesprächen flexibler, da Claude in manchen Runden möglicherweise entscheidet, nicht zu denken.
Verbesserung 4: Der effort-Parameter ersetzt budget_tokens
effort ist ein Verhaltenssignal und keine harte Grenze, was den tatsächlichen Bedürfnissen besser entspricht als budget_tokens.
| Effort-Stufe | Verhalten | Anwendungsfall | Unterstützte Modelle |
|---|---|---|---|
max |
Immer tiefgehendes Denken, keine Einschränkung | Höchste Schwierigkeitsstufe bei Schlussfolgerungen | Nur Opus 4.6 |
high (Standard) |
Denkt fast immer, tiefgehende Schlussfolgerung bei komplexen Problemen | Code-Review, Architekturentwurf | Opus 4.6, Sonnet 4.6 |
medium |
Mittleres Denken, einfache Probleme können übersprungen werden | Tägliche Entwicklung, allgemeine Aufgaben | Opus 4.6, Sonnet 4.6 |
low |
Minimiert Denken, priorisiert Geschwindigkeit | Einfache Fragen, Stilprüfungen | Opus 4.6, Sonnet 4.6 |
Wichtig: Selbst bei low effort wird Claude sich zum Denken entscheiden, wenn das Problem komplex genug ist. Effort ist eine Empfehlung, kein Befehl.
💡 Empfehlung für Sonnet 4.6: Anthropic empfiehlt offiziell, Sonnet 4.6 standardmäßig mit
mediumeffort zu verwenden, um die beste Balance zwischen Geschwindigkeit, Kosten und Qualität zu erreichen. Bei Aufrufen über APIYI apiyi.com reicht es, denoutput_config-Parameter in der Anfrage hinzuzufügen.
Vollständige Anleitung zum API-Aufruf
Grundlegender Aufruf: Einfachstes Adaptive Thinking
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # APIYI einheitliche Schnittstelle
)
response = client.chat.completions.create(
model="claude-opus-4-6",
messages=[
{"role": "user", "content": "Erkläre den Einfluss von Pythons GIL auf Multithreading"}
],
max_tokens=16000,
extra_body={
"thinking": {"type": "adaptive"}
}
)
print(response.choices[0].message.content)
Verwendung des nativen Anthropic SDK
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com" # APIYI einheitliche Schnittstelle
)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[
{"role": "user", "content": "Überprüfe diesen Code auf Race Conditions..."}
]
)
# Antwort analysieren: Kann thinking-Block und text-Block enthalten
for block in response.content:
if block.type == "thinking":
print(f"[Denkprozess] {block.thinking}")
elif block.type == "text":
print(f"[Antwort] {block.text}")
Feine Steuerung mit dem effort-Parameter
# Anthropic SDK Beispiel
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"}, # Mittlere Denktiefe
messages=[
{"role": "user", "content": "Was ist das Problem mit diesem Code?"}
]
)
Denkprozess auslassen, um Latenz zu reduzieren
Wenn Sie den Denkprozess nicht sehen müssen, können Sie mit display: "omitted" die Übertragungslatenz reduzieren:
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={
"type": "adaptive",
"display": "omitted" # Kein Denktext zurückgeben
},
messages=[...]
)
# Hinweis: Denk-Tokens werden trotzdem berechnet
Vollständiges Beispiel für einen Code-Review-Workflow anzeigen
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com"
)
def review_pr(diff_content, risk_level="medium"):
"""Code-Review adaptiv basierend auf Risikostufe"""
# Hohes Risiko: Opus + high effort
# Geringes Risiko: Sonnet + medium effort
if risk_level == "high":
model = "claude-opus-4-6"
effort = "high"
else:
model = "claude-sonnet-4-6"
effort = "medium"
response = client.messages.create(
model=model,
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": effort},
system="""Du bist ein erfahrener Code-Review-Experte.
Analysiere die Code-Änderungen und kategorisiere sie nach Schweregrad:
🔴 Muss behoben werden (Sicherheit/Logik)
🟡 Empfohlen zu beheben (Qualität)
💡 Verbesserungsvorschlag""",
messages=[
{"role": "user", "content": f"Review:\n\n{diff_content}"}
]
)
thinking_text = ""
review_text = ""
for block in response.content:
if block.type == "thinking":
thinking_text = block.thinking
elif block.type == "text":
review_text = block.text
return {
"thinking": thinking_text,
"review": review_text,
"model": model,
"effort": effort,
"input_tokens": response.usage.input_tokens,
"output_tokens": response.usage.output_tokens
}
🚀 Schneller Start: Rufen Sie die Claude 4.6 API über APIYI apiyi.com auf, indem Sie einfach
thinking: {"type": "adaptive"}in Ihre Anfrage einfügen. Keine zusätzliche Konfiguration nötig – verbessern Sie Ihre KI-Inferenzfähigkeiten mit einer Zeile Code.
Effort-Parameter in der Praxis: Optimale Konfiguration für verschiedene Szenarien
Leitfaden für szenariobasierte Konfiguration
| Szenario | Empfohlenes Modell | Effort | Begründung |
|---|---|---|---|
| Einfache Fragen/Antworten/Übersetzung | Sonnet 4.6 | low |
Keine tiefe Inferenz nötig, Geschwindigkeit priorisieren |
| Code-Vervollständigung/Formatierung | Sonnet 4.6 | low |
Mustererkennungsaufgabe, kein Denken erforderlich |
| Tägliches PR-Review | Sonnet 4.6 | medium |
Ausgewogenes Verhältnis von Geschwindigkeit und Review-Tiefe |
| Komplexes Debugging | Opus 4.6 | high |
Dateiübergreifende Inferenz erforderlich |
| Sicherheitslücken-Audit | Opus 4.6 | high |
Kritische Probleme dürfen nicht übersehen werden |
| Mathematische/Logische Beweise | Opus 4.6 | max |
Maximale Inferenztiefe erforderlich |
| Architekturentwurf | Opus 4.6 | max |
Umfassende Abwägungen notwendig |
Verwendung von effort in Claude Code
Nach dem Update von Claude Code im März 2026 wurde der Befehl /effort hinzugefügt:
# Direkt im Claude Code Terminal setzen
/effort medium # Tägliche Codierung
/effort high # Code-Review
/effort max # Architekturentwurf (nur Opus 4.6)
Dies ermöglicht es Entwicklern, die Denktiefe von Claude flexibel basierend auf der aktuellen Aufgabe anzupassen, ohne Code ändern zu müssen.
💰 Kostenoptimierung: Der effort-Parameter beeinflusst direkt den Token-Verbrauch. Für tägliche Codierungsaufgaben kann die Einstellung von Sonnet 4.6 auf
mediumoderlowdie Kosten erheblich senken. Der Aufruf über die APIYI apiyi.com-Plattform ist günstiger als der offizielle Preis, was zusammen mit dem effort-Parameter doppelt spart.
Migration von Extended Thinking zu Adaptive Thinking
Migrationsübersichtstabelle
| Alte Schreibweise (Extended Thinking) | Neue Schreibweise (Adaptive Thinking) |
|---|---|
thinking: {"type": "enabled", "budget_tokens": 5000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "low"} |
thinking: {"type": "enabled", "budget_tokens": 10000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "medium"} |
thinking: {"type": "enabled", "budget_tokens": 30000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "high"} |
thinking: {"type": "enabled", "budget_tokens": 100000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "max"} |
| Manuelles Hinzufügen des interleaved thinking beta Headers | Automatisch aktiviert, kein Header erforderlich |
Wichtige Hinweise zur Migration
1. Prompt-Cache wird unterbrochen
Beim Wechsel vom enabled– in den adaptive-Modus werden die Cache-Breakpoints auf Nachrichtenebene ungültig. Der Cache für Systemprompts und Tool-Definitionen bleibt davon unberührt.
Empfehlung: Migrieren Sie alle Anfragen auf einmal zum adaptive-Modus, anstatt gemischt zu arbeiten.
2. Denkinhalte sind standardmäßig zusammengefasst
Das Claude 4.6-Modell gibt standardmäßig eine zusammengefasste Version der Denkinhalte zurück, nicht den vollständigen Denktext. Das bedeutet, der angezeigte thinking-Block ist eine vereinfachte Version.
- Zusammenfassung (
display: "summarized"): Standardverhalten - Ausgelassen (
display: "omitted"): Kein Denktext wird zurückgegeben - Vollständige Version: Muss über das Anthropic-Vertriebsteam aktiviert werden
3. Abrechnung basiert auf vollständigem Denken
Egal, ob Sie eine Zusammenfassung sehen oder nichts – die Abrechnung erfolgt nach der Token-Anzahl des vollständigen internen Denkprozesses. Gehen Sie nicht davon aus, dass weniger angezeigter Text auch weniger kostet.
4. Prefill wird nicht mehr unterstützt
Claude Opus 4.6 unterstützt das Vorausfüllen (prefill) von Assistant-Nachrichten nicht mehr – das Senden eines Prefill führt zu einem 400-Fehler. Verwenden Sie für die Steuerung des Ausgabeformats Systemprompts oder structured output.
🎯 Migrationsempfehlung: Es wird empfohlen, die Migrationseffekte zunächst in einer Testumgebung zu validieren, insbesondere um die Ausgabequalität des adaptive-Modus mit der vorherigen festen budget_tokens-Einstellung zu vergleichen. Mit APIYI apiyi.com können Sie bequem A/B-Tests durchführen – ein einzelner Key ruft dabei verschiedene Konfigurationen auf.
Detaillierte Erklärung des Abrechnungsmechanismus
Wie Denk-Tokens abgerechnet werden
Das Verständnis des Abrechnungsmechanismus ist entscheidend für die Kostenkontrolle.
| Abrechnungsposition | Erklärung |
|---|---|
| Eingabe-Tokens | Normale Abrechnung ($5/MTok Opus, $3/MTok Sonnet) |
| Denk-Tokens | Zum Ausgabe-Token-Preis abgerechnet ($25/MTok Opus, $15/MTok Sonnet) |
| Antwort-Text-Tokens | Zum Ausgabe-Token-Preis abgerechnet |
| Zusammenfassungs-Tokens | Werden nicht zusätzlich berechnet |
| display: "omitted" | Denk-Tokens werden trotzdem berechnet, sie werden nur nicht übertragen |
Strategien zur Kostenoptimierung
Einfache Probleme mit low effort → Denkvorgang kann übersprungen werden → Spart viele Ausgabe-Tokens
↓
Kosten können um 50-80% sinken
Praktisches Vergleichsbeispiel: Dieselbe Aufgabe zur Code-Stil-Prüfung
| Konfiguration | Denk-Tokens | Antwort-Tokens | Gesamtkosten (Sonnet) |
|---|---|---|---|
| effort: high | ~3000 | ~500 | ~$0,053 |
| effort: medium | ~800 | ~500 | ~$0,020 |
| effort: low | 0 (Denkvorgang übersprungen) | ~500 | ~$0,009 |
Für einfache Aufgaben ist low effort etwa 83% günstiger als high effort.
💰 Geldspartipp: Für Batch-Verarbeitungsszenarien (z.B. Stilprüfung für 100 Dateien) kann das Setzen von effort auf
lowerhebliche Kosten sparen. Durch den Aufruf der Claude 4.6 API über APIYI apiyi.com, in Kombination mit bereits günstigen Preisen und der Optimierung des effort-Parameters, erreichen Sie eine doppelte Kostenreduktion.
Häufig gestellte Fragen
Q1: Können Adaptive Thinking und Extended Thinking gemischt verwendet werden?
Ja, aber es wird nicht empfohlen. Beim Claude 4.6 Modell ist Extended Thinking (type: "enabled") zwar noch verfügbar, aber als veraltet (Deprecated) markiert und wird in zukünftigen Versionen entfernt. Die gemischte Verwendung beider Modi führt außerdem dazu, dass die Prompt-Cache-Unterbrechungspunkte ungültig werden. Es wird empfohlen, so früh wie möglich auf Adaptive Thinking umzustellen. Bei Aufrufen über APIYI apiyi.com ist das Parameterformat vollständig kompatibel.
Q2: Unterstützt Opus 4.5 Adaptive Thinking?
Nein. Adaptive Thinking wird nur von Claude Opus 4.6 und Sonnet 4.6 unterstützt. Für Opus 4.5 muss weiterhin der Modus type: "enabled" verwendet und budget_tokens manuell gesetzt werden. Wenn Sie Adaptive Thinking nutzen möchten, wird ein Upgrade auf die 4.6-Modellreihe empfohlen. APIYI apiyi.com bietet API-Zugang zur gesamten 4.5- und 4.6-Modellreihe an.
Q3: Spart display: „omitted“ wirklich Geld?
Es spart kein Geld. display: "omitted" bewirkt nur, dass die API den Denktext nicht zurückgibt, was die Netzwerkübertragungslatenz reduziert. Intern werden die Denk-Tokens jedoch weiterhin generiert und berechnet. Die echte Kosteneinsparung wird durch die Senkung der effort-Stufe erreicht – low oder medium veranlassen Claude dazu, bei einfachen Problemen das Denken zu überspringen oder zu reduzieren.
Q4: Wie kann ich feststellen, ob Claude bei einer bestimmten Anfrage gedacht hat?
Überprüfen Sie, ob die Antwort einen Content-Block vom Typ thinking enthält. Wenn Claude entscheidet, dass kein Denken erforderlich ist, enthält die Antwort nur einen text-Block, keinen thinking-Block. Im Adaptive-Modus können Ihnen die Token-Zählungen im usage-Feld helfen zu beurteilen, wie viele Tokens für das Denken verbraucht wurden.
Q5: Wie wird Adaptive Thinking in Claude Code verwendet?
Claude Code aktiviert Adaptive Thinking standardmäßig, wenn Opus 4.6 oder Sonnet 4.6 verwendet wird. Sie können die Denktiefe mit dem Befehl /effort anpassen: /effort low (Schnellmodus), /effort medium (Ausgewogener Modus), /effort high (Tiefenmodus). Das Update vom März 2026 hat außerdem den Fehler "adaptive thinking is not supported" behoben, der durch nicht standardmäßige Modellzeichenfolgen verursacht wurde.
Zusammenfassung: Adaptive Thinking ist das Kern-Upgrade von Claude 4.6
Adaptive Thinking steht für einen wichtigen Entwicklungsschritt im KI-Denkmodus – weg von "Entwickler raten, wie viel die KI nachdenken muss" hin zu "die KI entscheidet selbst, wie viel sie nachdenken muss".
4 Kern-Upgrades:
- Dynamische Entscheidungsfindung: Einfache Fragen werden sofort beantwortet, komplexe Probleme werden tiefgründig durchdacht.
- Automatisches verschachteltes Denken: Automatische Schlussfolgerungen zwischen Tool-Aufrufen in agentenbasierten Workflows.
- Flexible mehrteilige Dialoge: Kein erzwungener
thinking-Block am Anfang mehr nötig. - Effort-Parameter: Eine intuitivere Steuerungsmethode als
budget_tokens.
Migrationsempfehlung: Wechseln Sie von thinking: {"type": "enabled", "budget_tokens": N} zu thinking: {"type": "adaptive"} und steuern Sie die Tiefe mit output_config: {"effort": "..."}.
Wir empfehlen, über APIYI (apiyi.com) schnell Zugang zu den APIs von Claude Opus 4.6 und Sonnet 4.6 zu erhalten. Mit nur einer Parameteränderung können Sie die intelligenten Schlussfolgerungen und Kostenoptimierungen von Adaptive Thinking nutzen.
Referenzen
-
Claude API-Dokumentation – Adaptive Thinking: Offizielle technische Anleitung
- Link:
platform.claude.com/docs/en/build-with-claude/adaptive-thinking
- Link:
-
Claude API-Dokumentation – Effort-Parameter: Detaillierte Erklärung der Effort-Konfiguration
- Link:
platform.claude.com/docs/en/build-with-claude/effort
- Link:
-
Anthropic offiziell – Claude Opus 4.6: Veröffentlichungsankündigung
- Link:
anthropic.com/news/claude-opus-4-6
- Link:
-
Claude API-Dokumentation – Extended Thinking: Leitfaden zum ursprünglichen erweiterten Denken
- Link:
platform.claude.com/docs/en/build-with-claude/extended-thinking
- Link:
Autor: APIYI Team | Bleiben Sie auf dem neuesten Stand der Claude-API-Fähigkeiten. Besuchen Sie APIYI (apiyi.com) für API-Schnittstellen und technischen Support der gesamten Claude-4.6-Modellreihe.
