Jika Anda selama ini menggunakan mode Extended Thinking (Pemikiran Terperluas) dari Claude, perhatikan—mode tersebut telah ditandai sebagai Deprecated (akan dihentikan) di Claude 4.6. Sebagai gantinya, hadir mode yang lebih cerdas: Adaptive Thinking (Pemikiran Adaptif).
Perubahan intinya: Dulu Anda perlu mengatur anggaran token untuk berpikir (budget_tokens) secara manual, sekarang Claude sendiri yang memutuskan apakah perlu berpikir dan seberapa dalam. Pertanyaan sederhana dijawab cepat, masalah kompleks dianalisis mendalam—semuanya dengan satu parameter.
Nilai inti: Setelah membaca artikel ini, Anda akan menguasai metode pemanggilan API Adaptive Thinking, 4 detail peningkatan utama, konfigurasi parameter effort, serta panduan lengkap migrasi dari Extended Thinking.
Apa itu Adaptive Thinking: Pahami dalam Satu Kalimat
Extended Thinking (Mode Lama): Developer memberi tahu Claude "Kamu punya anggaran 10000 token untuk berpikir", dan Claude akan menghabiskan anggaran itu.
Adaptive Thinking (Mode Baru): Claude sendiri yang menilai kompleksitas masalah, lalu memutuskan "perlu berpikir atau tidak" dan "seberapa dalam berpikirnya".
# ❌ Mode Lama (Extended Thinking) - Akan dihentikan
thinking={"type": "enabled", "budget_tokens": 10000}
# ✅ Mode Baru (Adaptive Thinking) - Direkomendasikan
thinking={"type": "adaptive"}
Intisari Informasi
| Item Informasi | Detail |
|---|---|
| Nama Fitur | Adaptive Thinking (Pemikiran Adaptif) |
| Tanggal Rilis | 5 Februari 2026 (Dirilis bersama Claude Opus 4.6) |
| Model yang Didukung | Claude Opus 4.6, Claude Sonnet 4.6 |
| Parameter API | thinking: {"type": "adaptive"} |
| Cara Kontrol | Parameter effort (Menggantikan budget_tokens) |
| Status | Cara yang direkomendasikan secara resmi (Extended Thinking sudah Deprecated) |
| Pemikiran Bergantian | Diaktifkan otomatis (tidak perlu header beta) |
| Claude Code | Dukungan native, bisa atur dengan perintah /effort |
🎯 Saran Migrasi: Jika proyek Anda masih menggunakan Extended Thinking (
type: "enabled"), disarankan untuk segera bermigrasi ke Adaptive Thinking. Melalui platform APIYI apiyi.com untuk memanggil API Claude Opus 4.6 atau Sonnet 4.6, Anda hanya perlu mengubah satu parameter untuk menyelesaikan migrasi.
Adaptive vs Extended Thinking: 4 Peningkatan Inti Utama

Peningkatan Pertama: Dari "Anggaran Tetap" ke "Keputusan Dinamis"
Ini adalah perubahan yang paling mendasar.
Masalah dengan mode lama: Kamu harus menebak nilai budget_tokens. Kalau terlalu rendah, penalaran untuk masalah kompleks tidak cukup; kalau terlalu tinggi, masalah sederhana membuang token (dan uang).
# Mode lama: Kamu tebak masalah ini butuh berapa token untuk berpikir?
thinking={"type": "enabled", "budget_tokens": 10000}
# Masalah: Masalah sederhana juga akan menghabiskan banyak token berpikir
Mode baru: Claude memutuskan secara otomatis berdasarkan kompleksitas setiap permintaan.
# Mode baru: Claude yang menilai sendiri
thinking={"type": "adaptive"}
# Masalah sederhana: Tidak berpikir atau berpikir ringan
# Masalah kompleks: Penalaran mendalam
Dampak nyata: Untuk beban kerja campuran yang "kadang sederhana, kadang kompleks" (misalnya skenario review kode—ada PR yang hanya ubah teks, ada yang melibatkan refaktor konkurensi), Adaptive Thinking menunjukkan performa dan efisiensi biaya keseluruhan yang lebih baik dibanding anggaran tetap.
Peningkatan Kedua: Pemikiran Berselang Otomatis (Interleaved Thinking)
Dalam alur kerja berbasis agen (Agentic), Claude perlu berpikir di antara beberapa panggilan alat.
Mode lama: Pemikiran berselang memerlukan penambahan header beta secara manual, dan tidak tersedia di Opus 4.5.
Mode baru: Saat menggunakan Adaptive Thinking, pemikiran berselang diaktifkan otomatis, tanpa konfigurasi tambahan.
Permintaan pengguna → Claude berpikir → Panggil alat A → Claude berpikir lagi → Panggil alat B → Jawaban akhir
Ini sangat penting untuk Claude Code dan aplikasi berbasis agen lainnya—AI dapat "memikirkan ulang" setelah setiap panggilan alat, secara signifikan mengurangi kesalahan.
Peningkatan Ketiga: Percakapan Multi-Ronde yang Lebih Fleksibel
Mode lama: Dalam percakapan multi-ronde, pesan asisten dari ronde sebelumnya harus diawali dengan blok pemikiran, jika tidak akan error. Ini membuat manajemen percakapan menjadi rumit.
Mode baru: Tidak ada batasan ini. Adaptive Thinking lebih fleksibel dalam percakapan multi-ronde, karena di beberapa ronde Claude mungkin memilih untuk tidak berpikir.
Peningkatan Keempat: Parameter effort Menggantikan budget_tokens
effort adalah sinyal perilaku, bukan batasan keras, dan lebih sesuai dengan kebutuhan nyata dibanding budget_tokens.
| Level Effort | Perilaku | Skenario Penggunaan | Model yang Mendukung |
|---|---|---|---|
max |
Selalu berpikir mendalam, tanpa batasan | Penalaran dengan tingkat kesulitan tertinggi | Hanya Opus 4.6 |
high (default) |
Hampir selalu berpikir, penalaran mendalam untuk masalah kompleks | Review kode, desain arsitektur | Opus 4.6, Sonnet 4.6 |
medium |
Pemikiran sedang, masalah sederhana mungkin dilewati | Pengembangan sehari-hari, tugas umum | Opus 4.6, Sonnet 4.6 |
low |
Minimalkan pemikiran, utamakan kecepatan | Tanya jawab sederhana, pemeriksaan gaya | Opus 4.6, Sonnet 4.6 |
Penting: Bahkan pada effort low, jika masalahnya cukup kompleks, Claude tetap akan memilih untuk berpikir. Effort adalah saran, bukan perintah.
💡 Saran untuk Sonnet 4.6: Anthropic secara resmi merekomendasikan Sonnet 4.6 menggunakan effort
mediumsecara default, untuk mencapai keseimbangan terbaik antara kecepatan, biaya, dan kualitas. Saat memanggil melalui APIYI apiyi.com, cukup tambahkan parameteroutput_configdalam permintaan.
Panduan Lengkap Pemanggilan API
Pemanggilan Dasar: Adaptive Thinking Paling Sederhana
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # Endpoint terpadu APIYI
)
response = client.chat.completions.create(
model="claude-opus-4-6",
messages=[
{"role": "user", "content": "Jelaskan pengaruh GIL Python pada multithreading"}
],
max_tokens=16000,
extra_body={
"thinking": {"type": "adaptive"}
}
)
print(response.choices[0].message.content)
Menggunakan SDK Native Anthropic
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com" # Endpoint terpadu APIYI
)
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[
{"role": "user", "content": "Review kode ini untuk kondisi race..."}
]
)
# Parsing respons: mungkin berisi blok thinking dan text
for block in response.content:
if block.type == "thinking":
print(f"[Proses Berpikir] {block.thinking}")
elif block.type == "text":
print(f"[Jawaban] {block.text}")
Kontrol Halus dengan Parameter effort
# Contoh SDK Anthropic
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": "medium"}, # Kedalaman berpikir sedang
messages=[
{"role": "user", "content": "Apa masalah dengan kode ini?"}
]
)
Menghilangkan Konten Berpikir untuk Mengurangi Latensi
Jika kamu tidak perlu melihat proses berpikir, gunakan display: "omitted" untuk mengurangi latensi transmisi:
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={
"type": "adaptive",
"display": "omitted" # Tidak mengembalikan teks berpikir
},
messages=[...]
)
# Catatan: Token untuk berpikir tetap akan ditagih
Lihat Contoh Alur Kerja Review Kode Lengkap
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com"
)
def review_pr(diff_content, risk_level="medium"):
"""Review kode secara adaptif berdasarkan tingkat risiko"""
# Risiko tinggi: Opus + high effort
# Risiko rendah: Sonnet + medium effort
if risk_level == "high":
model = "claude-opus-4-6"
effort = "high"
else:
model = "claude-sonnet-4-6"
effort = "medium"
response = client.messages.create(
model=model,
max_tokens=16000,
thinking={"type": "adaptive"},
output_config={"effort": effort},
system="""Kamu adalah ahli review kode senior.
Analisis perubahan kode, klasifikasikan berdasarkan tingkat keparahan:
🔴 Harus diperbaiki (keamanan/logika)
🟡 Disarankan diperbaiki (kualitas)
💡 Saran perbaikan""",
messages=[
{"role": "user", "content": f"Review:\n\n{diff_content}"}
]
)
thinking_text = ""
review_text = ""
for block in response.content:
if block.type == "thinking":
thinking_text = block.thinking
elif block.type == "text":
review_text = block.text
return {
"thinking": thinking_text,
"review": review_text,
"model": model,
"effort": effort,
"input_tokens": response.usage.input_tokens,
"output_tokens": response.usage.output_tokens
}
🚀 Mulai Cepat: Untuk memanggil API Claude 4.6 melalui APIYI apiyi.com, cukup tambahkan
thinking: {"type": "adaptive"}ke dalam permintaan untuk mengaktifkan adaptive thinking. Tanpa konfigurasi tambahan, satu baris kode meningkatkan kemampuan penalaran AI-mu.
Parameter Effort dalam Praktik: Konfigurasi Optimal untuk Berbagai Skenario
Panduan Konfigurasi Berbasis Skenario
| Skenario | Model Rekomendasi | Effort | Alasan |
|---|---|---|---|
| Tanya Jawab/Translasi Sederhana | Sonnet 4.6 | low |
Tidak perlu penalaran mendalam, prioritas kecepatan |
| Pelengkapan/Formatting Kode | Sonnet 4.6 | low |
Tugas pencocokan pola, tidak perlu berpikir |
| Review PR Harian | Sonnet 4.6 | medium |
Menyeimbangkan kecepatan dan kedalaman review |
| Debug Bug Kompleks | Opus 4.6 | high |
Perlu penalaran lintas file |
| Audit Kerentanan Keamanan | Opus 4.6 | high |
Tidak boleh melewatkan masalah kritis |
| Pembuktian Matematika/Logika | Opus 4.6 | max |
Membutuhkan kedalaman penalaran maksimal |
| Desain Solusi Arsitektur | Opus 4.6 | max |
Perlu pertimbangan komprehensif dan trade-off |
Menggunakan effort di Claude Code
Setelah pembaruan Claude Code Maret 2026, perintah /effort ditambahkan:
# Atur langsung di terminal Claude Code
/effort medium # Pengkodean sehari-hari
/effort high # Review kode
/effort max # Desain arsitektur (hanya Opus 4.6)
Ini memungkinkan pengembang menyesuaikan kedalaman berpikir Claude secara fleksibel berdasarkan tugas saat ini, tanpa perlu mengubah kode.
💰 Optimasi Biaya: Parameter
effortsecara langsung memengaruhi konsumsi token. Untuk tugas pengkodean sehari-hari, mengatur Sonnet 4.6 kemediumataulowdapat menurunkan biaya secara signifikan. Dengan memanggil melalui platform APIYI apiyi.com, harganya lebih murah daripada resmi, dikombinasikan dengan parametereffortuntuk penghematan ganda.
Migrasi dari Extended Thinking ke Adaptive Thinking
Tabel Perbandingan Migrasi
| Penulisan Lama (Extended Thinking) | Penulisan Baru (Adaptive Thinking) |
|---|---|
thinking: {"type": "enabled", "budget_tokens": 5000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "low"} |
thinking: {"type": "enabled", "budget_tokens": 10000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "medium"} |
thinking: {"type": "enabled", "budget_tokens": 30000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "high"} |
thinking: {"type": "enabled", "budget_tokens": 100000} |
thinking: {"type": "adaptive"}, output_config: {"effort": "max"} |
| Menambahkan header interleaved thinking beta secara manual | Diaktifkan otomatis, tidak perlu header |
Hal-hal yang Perlu Diperhatikan Saat Migrasi
1. Cache Prompt akan Terputus
Saat beralih dari mode enabled ke adaptive, titik putus cache prompt di level pesan akan tidak berlaku lagi. Cache untuk petunjuk sistem dan definisi alat tidak terpengaruh.
Saran: Migrasikan semua permintaan ke mode adaptive sekaligus, jangan digunakan secara campuran.
2. Konten Pikirannya Defaultnya Ringkasan
Model Claude 4.6 secara default mengembalikan konten pemikiran dalam versi ringkasan, bukan teks pemikiran lengkap. Artinya, thinking block yang kamu lihat adalah versi yang disederhanakan.
- Versi ringkasan (
display: "summarized"): Perilaku default - Versi dihilangkan (
display: "omitted"): Tidak mengembalikan teks pemikiran - Versi lengkap: Perlu menghubungi tim penjualan Anthropic untuk mengaktifkannya
3. Penagihan Berdasarkan Pemikiran Lengkap
Tidak peduli apakah kamu melihat ringkasan atau tidak ada teks, penagihan tetap berdasarkan jumlah token pemikiran internal lengkap. Jangan mengira biayanya lebih sedikit hanya karena teks yang terlihat sedikit.
4. Prefill Tidak Lagi Didukung
Claude Opus 4.6 tidak lagi mendukung pengisian awal (prefill) pesan asisten—mengirim prefill akan mengembalikan error 400. Jika perlu mengontrol format output, gunakan petunjuk sistem atau structured output.
🎯 Saran Migrasi: Disarankan untuk memvalidasi efek migrasi terlebih dahulu di lingkungan pengujian, terutama membandingkan perbedaan kualitas output antara mode adaptive dengan budget_tokens tetap sebelumnya. Melalui APIYI apiyi.com, kamu dapat dengan mudah melakukan pengujian A/B—memanggil konfigurasi berbeda dengan Key yang sama.

Penjelasan Detail Mekanisme Penagihan
Memahami Cara Token Dikenakan Biaya
Memahami mekanisme penagihan sangat penting untuk mengontrol biaya.
| Item Penagihan | Penjelasan |
|---|---|
| Token input | Dikenakan biaya normal ($5/MTok Opus, $3/MTok Sonnet) |
| Token pemikiran | Dikenakan biaya sesuai harga token output ($25/MTok Opus, $15/MTok Sonnet) |
| Token teks respons | Dikenakan biaya sesuai harga token output |
| Token ringkasan | Tidak dikenakan biaya tambahan |
| display: "omitted" | Token pemikiran tetap dikenakan biaya, hanya tidak dikirimkan |
Strategi Optimasi Biaya
Pertanyaan sederhana gunakan low effort → mungkin melewati pemikiran → menghemat banyak token output
↓
Biaya bisa turun 50-80%
Contoh perbandingan nyata: Tugas pemeriksaan gaya kode yang sama
| Konfigurasi | Token pemikiran | Token respons | Total biaya (Sonnet) |
|---|---|---|---|
| effort: high | ~3000 | ~500 | ~$0.053 |
| effort: medium | ~800 | ~500 | ~$0.020 |
| effort: low | 0 (lewati pemikiran) | ~500 | ~$0.009 |
Untuk tugas sederhana, low effort sekitar 83% lebih murah dibandingkan high effort.
💰 Tips hemat uang: Untuk skenario pemrosesan batch (misalnya memeriksa gaya 100 file), atur effort ke
lowdapat menghemat banyak biaya. Dengan memanggil API Claude 4.6 melalui APIYI apiyi.com, Anda mendapatkan harga diskon plus optimasi parameter effort, penghematan biaya ganda.
Pertanyaan Umum
Q1: Apakah Adaptive Thinking dan Extended Thinking bisa digunakan bersamaan?
Bisa, tapi tidak disarankan. Pada model Claude 4.6, Extended Thinking (type: "enabled") masih tersedia tapi sudah ditandai sebagai Deprecated dan akan dihapus di versi mendatang. Menggunakan kedua mode bersamaan juga menyebabkan cache prompt tidak berfungsi. Disarankan untuk segera bermigrasi ke Adaptive Thinking. Saat memanggil melalui APIYI apiyi.com, format parameter sepenuhnya kompatibel.
Q2: Apakah Opus 4.5 mendukung Adaptive Thinking?
Tidak. Adaptive Thinking hanya didukung oleh Claude Opus 4.6 dan Sonnet 4.6. Opus 4.5 masih perlu menggunakan mode type: "enabled" dan mengatur budget_tokens secara manual. Jika ingin menggunakan Adaptive Thinking, disarankan untuk upgrade ke seri model 4.6. APIYI apiyi.com menyediakan akses API untuk seluruh seri model 4.5 dan 4.6.
Q3: Apakah display: “omitted” benar-benar menghemat uang?
Tidak menghemat uang. display: "omitted" hanya membuat API tidak mengembalikan teks pemikiran, mengurangi latensi transmisi jaringan. Tapi token pemikiran internal tetap akan dibuat dan dikenakan biaya. Cara benar untuk menghemat adalah dengan menurunkan level effort — low atau medium akan membuat Claude melewati atau mengurangi pemikiran pada masalah sederhana.
Q4: Bagaimana cara mengetahui apakah Claude melakukan pemikiran dalam suatu permintaan?
Periksa apakah respons berisi content block bertipe thinking. Jika Claude menilai tidak perlu berpikir, respons hanya akan berisi block text, tanpa block thinking. Dalam mode Adaptive, penghitungan token di field usage dapat membantu Anda menilai berapa banyak token yang digunakan untuk berpikir.
Q5: Bagaimana cara menggunakan Adaptive Thinking di Claude Code?
Claude Code secara default mengaktifkan Adaptive Thinking saat menggunakan Opus 4.6 atau Sonnet 4.6. Anda bisa menyesuaikan kedalaman pemikiran dengan perintah /effort: /effort low (mode cepat), /effort medium (mode seimbang), /effort high (mode mendalam). Pembaruan Maret 2026 juga memperbaiki error "adaptive thinking is not supported" yang disebabkan oleh string model non-standar.
Ringkasan: Adaptive Thinking adalah Peningkatan Inti Claude 4.6
Adaptive Thinking mewakili evolusi penting dalam mode penalaran AI—dari "pengembang menebak berapa banyak AI perlu berpikir" menjadi "AI sendiri yang menilai berapa banyak perlu berpikir".
4 peningkatan inti:
- Keputusan dinamis: Masalah sederhana dijawab seketika, masalah kompleks dianalisis mendalam
- Pemikiran berselang otomatis: Penalaran otomatis antar pemanggilan alat dalam alur kerja agen
- Percakapan multi-putaran fleksibel: Tidak perlu memulai dengan thinking block paksa
- Parameter effort: Cara kontrol yang lebih intuitif dibanding budget_tokens
Saran migrasi: Ubah dari thinking: {"type": "enabled", "budget_tokens": N} menjadi thinking: {"type": "adaptive"}, dikombinasikan dengan output_config: {"effort": "..."} untuk mengontrol kedalaman.
Direkomendasikan melalui APIYI apiyi.com untuk akses cepat ke API Claude Opus 4.6 dan Sonnet 4.6, cukup satu baris perubahan parameter untuk menikmati penalaran cerdas dan optimasi biaya yang dibawa oleh Adaptive Thinking.
Referensi
-
Dokumentasi Claude API – Adaptive Thinking: Panduan teknis resmi
- Tautan:
platform.claude.com/docs/en/build-with-claude/adaptive-thinking
- Tautan:
-
Dokumentasi Claude API – Parameter Effort: Penjelasan detail konfigurasi effort
- Tautan:
platform.claude.com/docs/en/build-with-claude/effort
- Tautan:
-
Anthropic resmi – Claude Opus 4.6: Pengumuman rilis
- Tautan:
anthropic.com/news/claude-opus-4-6
- Tautan:
-
Dokumentasi Claude API – Extended Thinking: Panduan pemikiran terperluas sebelumnya
- Tautan:
platform.claude.com/docs/en/build-with-claude/extended-thinking
- Tautan:
Penulis: Tim APIYI | Kuasai kemampuan API Claude terbaru, kunjungi APIYI apiyi.com untuk mendapatkan antarmuka API dan dukungan teknis untuk seluruh seri model Claude 4.6.
