|

Menguraikan Mode Pemikiran Adaptif Claude: 4 Peningkatan Utama yang Menggantikan Pemikiran Terperluas

Jika Anda selama ini menggunakan mode Extended Thinking (Pemikiran Terperluas) dari Claude, perhatikan—mode tersebut telah ditandai sebagai Deprecated (akan dihentikan) di Claude 4.6. Sebagai gantinya, hadir mode yang lebih cerdas: Adaptive Thinking (Pemikiran Adaptif).

Perubahan intinya: Dulu Anda perlu mengatur anggaran token untuk berpikir (budget_tokens) secara manual, sekarang Claude sendiri yang memutuskan apakah perlu berpikir dan seberapa dalam. Pertanyaan sederhana dijawab cepat, masalah kompleks dianalisis mendalam—semuanya dengan satu parameter.

Nilai inti: Setelah membaca artikel ini, Anda akan menguasai metode pemanggilan API Adaptive Thinking, 4 detail peningkatan utama, konfigurasi parameter effort, serta panduan lengkap migrasi dari Extended Thinking.

Pemikiran Adaptif vs. Pemikiran Terperluas Perbandingan mode pemikiran Claude 4.6

Pemikiran Terperluas

Usang

thinking: { type: “enabled”, budget_tokens: 10000

Kekurangan Utama • Anggaran tetap, tidak efisien • Perlu konfigurasi manual • Tidak fleksibel • Tidak ada penskalaan otomatis "Berapa pun kompleksitasnya, saya akan menggunakan 10k token."

Peningkatan ke 4.6

Pemikiran Adaptif

Direkomendasikan

thinking: type: “adaptive”

Keunggulan Utama • Penilaian kompleksitas otomatis • Alokasi token yang dinamis • Lebih cepat untuk tugas sederhana • Lebih mendalam untuk tugas kompleks • Parameter effort opsional "Saya akan menilai kompleksitas dan menyesuaikan kedalaman berpikir."

Claude Opus 4.6 Model paling canggih

Claude Sonnet 4.6 Keseimbangan kecepatan & kemampuan

Kedua model mendukung Pemikiran Adaptif Tersedia melalui APIYI (apiyi.com) dan platform lainnya

Apa itu Adaptive Thinking: Pahami dalam Satu Kalimat

Extended Thinking (Mode Lama): Developer memberi tahu Claude "Kamu punya anggaran 10000 token untuk berpikir", dan Claude akan menghabiskan anggaran itu.

Adaptive Thinking (Mode Baru): Claude sendiri yang menilai kompleksitas masalah, lalu memutuskan "perlu berpikir atau tidak" dan "seberapa dalam berpikirnya".

# ❌ Mode Lama (Extended Thinking) - Akan dihentikan
thinking={"type": "enabled", "budget_tokens": 10000}

# ✅ Mode Baru (Adaptive Thinking) - Direkomendasikan
thinking={"type": "adaptive"}

Intisari Informasi

Item Informasi Detail
Nama Fitur Adaptive Thinking (Pemikiran Adaptif)
Tanggal Rilis 5 Februari 2026 (Dirilis bersama Claude Opus 4.6)
Model yang Didukung Claude Opus 4.6, Claude Sonnet 4.6
Parameter API thinking: {"type": "adaptive"}
Cara Kontrol Parameter effort (Menggantikan budget_tokens)
Status Cara yang direkomendasikan secara resmi (Extended Thinking sudah Deprecated)
Pemikiran Bergantian Diaktifkan otomatis (tidak perlu header beta)
Claude Code Dukungan native, bisa atur dengan perintah /effort

🎯 Saran Migrasi: Jika proyek Anda masih menggunakan Extended Thinking (type: "enabled"), disarankan untuk segera bermigrasi ke Adaptive Thinking. Melalui platform APIYI apiyi.com untuk memanggil API Claude Opus 4.6 atau Sonnet 4.6, Anda hanya perlu mengubah satu parameter untuk menyelesaikan migrasi.

Adaptive vs Extended Thinking: 4 Peningkatan Inti Utama

claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-id 图示

Peningkatan Pertama: Dari "Anggaran Tetap" ke "Keputusan Dinamis"

Ini adalah perubahan yang paling mendasar.

Masalah dengan mode lama: Kamu harus menebak nilai budget_tokens. Kalau terlalu rendah, penalaran untuk masalah kompleks tidak cukup; kalau terlalu tinggi, masalah sederhana membuang token (dan uang).

# Mode lama: Kamu tebak masalah ini butuh berapa token untuk berpikir?
thinking={"type": "enabled", "budget_tokens": 10000}
# Masalah: Masalah sederhana juga akan menghabiskan banyak token berpikir

Mode baru: Claude memutuskan secara otomatis berdasarkan kompleksitas setiap permintaan.

# Mode baru: Claude yang menilai sendiri
thinking={"type": "adaptive"}
# Masalah sederhana: Tidak berpikir atau berpikir ringan
# Masalah kompleks: Penalaran mendalam

Dampak nyata: Untuk beban kerja campuran yang "kadang sederhana, kadang kompleks" (misalnya skenario review kode—ada PR yang hanya ubah teks, ada yang melibatkan refaktor konkurensi), Adaptive Thinking menunjukkan performa dan efisiensi biaya keseluruhan yang lebih baik dibanding anggaran tetap.

Peningkatan Kedua: Pemikiran Berselang Otomatis (Interleaved Thinking)

Dalam alur kerja berbasis agen (Agentic), Claude perlu berpikir di antara beberapa panggilan alat.

Mode lama: Pemikiran berselang memerlukan penambahan header beta secara manual, dan tidak tersedia di Opus 4.5.

Mode baru: Saat menggunakan Adaptive Thinking, pemikiran berselang diaktifkan otomatis, tanpa konfigurasi tambahan.

Permintaan pengguna → Claude berpikir → Panggil alat A → Claude berpikir lagi → Panggil alat B → Jawaban akhir

Ini sangat penting untuk Claude Code dan aplikasi berbasis agen lainnya—AI dapat "memikirkan ulang" setelah setiap panggilan alat, secara signifikan mengurangi kesalahan.

Peningkatan Ketiga: Percakapan Multi-Ronde yang Lebih Fleksibel

Mode lama: Dalam percakapan multi-ronde, pesan asisten dari ronde sebelumnya harus diawali dengan blok pemikiran, jika tidak akan error. Ini membuat manajemen percakapan menjadi rumit.

Mode baru: Tidak ada batasan ini. Adaptive Thinking lebih fleksibel dalam percakapan multi-ronde, karena di beberapa ronde Claude mungkin memilih untuk tidak berpikir.

Peningkatan Keempat: Parameter effort Menggantikan budget_tokens

effort adalah sinyal perilaku, bukan batasan keras, dan lebih sesuai dengan kebutuhan nyata dibanding budget_tokens.

Level Effort Perilaku Skenario Penggunaan Model yang Mendukung
max Selalu berpikir mendalam, tanpa batasan Penalaran dengan tingkat kesulitan tertinggi Hanya Opus 4.6
high (default) Hampir selalu berpikir, penalaran mendalam untuk masalah kompleks Review kode, desain arsitektur Opus 4.6, Sonnet 4.6
medium Pemikiran sedang, masalah sederhana mungkin dilewati Pengembangan sehari-hari, tugas umum Opus 4.6, Sonnet 4.6
low Minimalkan pemikiran, utamakan kecepatan Tanya jawab sederhana, pemeriksaan gaya Opus 4.6, Sonnet 4.6

Penting: Bahkan pada effort low, jika masalahnya cukup kompleks, Claude tetap akan memilih untuk berpikir. Effort adalah saran, bukan perintah.

💡 Saran untuk Sonnet 4.6: Anthropic secara resmi merekomendasikan Sonnet 4.6 menggunakan effort medium secara default, untuk mencapai keseimbangan terbaik antara kecepatan, biaya, dan kualitas. Saat memanggil melalui APIYI apiyi.com, cukup tambahkan parameter output_config dalam permintaan.


Panduan Lengkap Pemanggilan API

Pemanggilan Dasar: Adaptive Thinking Paling Sederhana

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Endpoint terpadu APIYI
)

response = client.chat.completions.create(
    model="claude-opus-4-6",
    messages=[
        {"role": "user", "content": "Jelaskan pengaruh GIL Python pada multithreading"}
    ],
    max_tokens=16000,
    extra_body={
        "thinking": {"type": "adaptive"}
    }
)
print(response.choices[0].message.content)

Menggunakan SDK Native Anthropic

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"  # Endpoint terpadu APIYI
)

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Review kode ini untuk kondisi race..."}
    ]
)

# Parsing respons: mungkin berisi blok thinking dan text
for block in response.content:
    if block.type == "thinking":
        print(f"[Proses Berpikir] {block.thinking}")
    elif block.type == "text":
        print(f"[Jawaban] {block.text}")

Kontrol Halus dengan Parameter effort

# Contoh SDK Anthropic
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},  # Kedalaman berpikir sedang
    messages=[
        {"role": "user", "content": "Apa masalah dengan kode ini?"}
    ]
)

Menghilangkan Konten Berpikir untuk Mengurangi Latensi

Jika kamu tidak perlu melihat proses berpikir, gunakan display: "omitted" untuk mengurangi latensi transmisi:

response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "display": "omitted"  # Tidak mengembalikan teks berpikir
    },
    messages=[...]
)
# Catatan: Token untuk berpikir tetap akan ditagih
Lihat Contoh Alur Kerja Review Kode Lengkap
import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com"
)

def review_pr(diff_content, risk_level="medium"):
    """Review kode secara adaptif berdasarkan tingkat risiko"""

    # Risiko tinggi: Opus + high effort
    # Risiko rendah: Sonnet + medium effort
    if risk_level == "high":
        model = "claude-opus-4-6"
        effort = "high"
    else:
        model = "claude-sonnet-4-6"
        effort = "medium"

    response = client.messages.create(
        model=model,
        max_tokens=16000,
        thinking={"type": "adaptive"},
        output_config={"effort": effort},
        system="""Kamu adalah ahli review kode senior.
Analisis perubahan kode, klasifikasikan berdasarkan tingkat keparahan:
🔴 Harus diperbaiki (keamanan/logika)
🟡 Disarankan diperbaiki (kualitas)
💡 Saran perbaikan""",
        messages=[
            {"role": "user", "content": f"Review:\n\n{diff_content}"}
        ]
    )

    thinking_text = ""
    review_text = ""
    for block in response.content:
        if block.type == "thinking":
            thinking_text = block.thinking
        elif block.type == "text":
            review_text = block.text

    return {
        "thinking": thinking_text,
        "review": review_text,
        "model": model,
        "effort": effort,
        "input_tokens": response.usage.input_tokens,
        "output_tokens": response.usage.output_tokens
    }

🚀 Mulai Cepat: Untuk memanggil API Claude 4.6 melalui APIYI apiyi.com, cukup tambahkan thinking: {"type": "adaptive"} ke dalam permintaan untuk mengaktifkan adaptive thinking. Tanpa konfigurasi tambahan, satu baris kode meningkatkan kemampuan penalaran AI-mu.


Parameter Effort dalam Praktik: Konfigurasi Optimal untuk Berbagai Skenario

Panduan Konfigurasi Berbasis Skenario

Skenario Model Rekomendasi Effort Alasan
Tanya Jawab/Translasi Sederhana Sonnet 4.6 low Tidak perlu penalaran mendalam, prioritas kecepatan
Pelengkapan/Formatting Kode Sonnet 4.6 low Tugas pencocokan pola, tidak perlu berpikir
Review PR Harian Sonnet 4.6 medium Menyeimbangkan kecepatan dan kedalaman review
Debug Bug Kompleks Opus 4.6 high Perlu penalaran lintas file
Audit Kerentanan Keamanan Opus 4.6 high Tidak boleh melewatkan masalah kritis
Pembuktian Matematika/Logika Opus 4.6 max Membutuhkan kedalaman penalaran maksimal
Desain Solusi Arsitektur Opus 4.6 max Perlu pertimbangan komprehensif dan trade-off

Menggunakan effort di Claude Code

Setelah pembaruan Claude Code Maret 2026, perintah /effort ditambahkan:

# Atur langsung di terminal Claude Code
/effort medium    # Pengkodean sehari-hari
/effort high      # Review kode
/effort max       # Desain arsitektur (hanya Opus 4.6)

Ini memungkinkan pengembang menyesuaikan kedalaman berpikir Claude secara fleksibel berdasarkan tugas saat ini, tanpa perlu mengubah kode.

💰 Optimasi Biaya: Parameter effort secara langsung memengaruhi konsumsi token. Untuk tugas pengkodean sehari-hari, mengatur Sonnet 4.6 ke medium atau low dapat menurunkan biaya secara signifikan. Dengan memanggil melalui platform APIYI apiyi.com, harganya lebih murah daripada resmi, dikombinasikan dengan parameter effort untuk penghematan ganda.

Migrasi dari Extended Thinking ke Adaptive Thinking

Tabel Perbandingan Migrasi

Penulisan Lama (Extended Thinking) Penulisan Baru (Adaptive Thinking)
thinking: {"type": "enabled", "budget_tokens": 5000} thinking: {"type": "adaptive"}, output_config: {"effort": "low"}
thinking: {"type": "enabled", "budget_tokens": 10000} thinking: {"type": "adaptive"}, output_config: {"effort": "medium"}
thinking: {"type": "enabled", "budget_tokens": 30000} thinking: {"type": "adaptive"}, output_config: {"effort": "high"}
thinking: {"type": "enabled", "budget_tokens": 100000} thinking: {"type": "adaptive"}, output_config: {"effort": "max"}
Menambahkan header interleaved thinking beta secara manual Diaktifkan otomatis, tidak perlu header

Hal-hal yang Perlu Diperhatikan Saat Migrasi

1. Cache Prompt akan Terputus

Saat beralih dari mode enabled ke adaptive, titik putus cache prompt di level pesan akan tidak berlaku lagi. Cache untuk petunjuk sistem dan definisi alat tidak terpengaruh.

Saran: Migrasikan semua permintaan ke mode adaptive sekaligus, jangan digunakan secara campuran.

2. Konten Pikirannya Defaultnya Ringkasan

Model Claude 4.6 secara default mengembalikan konten pemikiran dalam versi ringkasan, bukan teks pemikiran lengkap. Artinya, thinking block yang kamu lihat adalah versi yang disederhanakan.

  • Versi ringkasan (display: "summarized"): Perilaku default
  • Versi dihilangkan (display: "omitted"): Tidak mengembalikan teks pemikiran
  • Versi lengkap: Perlu menghubungi tim penjualan Anthropic untuk mengaktifkannya

3. Penagihan Berdasarkan Pemikiran Lengkap

Tidak peduli apakah kamu melihat ringkasan atau tidak ada teks, penagihan tetap berdasarkan jumlah token pemikiran internal lengkap. Jangan mengira biayanya lebih sedikit hanya karena teks yang terlihat sedikit.

4. Prefill Tidak Lagi Didukung

Claude Opus 4.6 tidak lagi mendukung pengisian awal (prefill) pesan asisten—mengirim prefill akan mengembalikan error 400. Jika perlu mengontrol format output, gunakan petunjuk sistem atau structured output.

🎯 Saran Migrasi: Disarankan untuk memvalidasi efek migrasi terlebih dahulu di lingkungan pengujian, terutama membandingkan perbedaan kualitas output antara mode adaptive dengan budget_tokens tetap sebelumnya. Melalui APIYI apiyi.com, kamu dapat dengan mudah melakukan pengujian A/B—memanggil konfigurasi berbeda dengan Key yang sama.


claude-adaptive-thinking-mode-api-guide-replace-extended-thinking-id 图示

Penjelasan Detail Mekanisme Penagihan

Memahami Cara Token Dikenakan Biaya

Memahami mekanisme penagihan sangat penting untuk mengontrol biaya.

Item Penagihan Penjelasan
Token input Dikenakan biaya normal ($5/MTok Opus, $3/MTok Sonnet)
Token pemikiran Dikenakan biaya sesuai harga token output ($25/MTok Opus, $15/MTok Sonnet)
Token teks respons Dikenakan biaya sesuai harga token output
Token ringkasan Tidak dikenakan biaya tambahan
display: "omitted" Token pemikiran tetap dikenakan biaya, hanya tidak dikirimkan

Strategi Optimasi Biaya

Pertanyaan sederhana gunakan low effort → mungkin melewati pemikiran → menghemat banyak token output
                                                ↓
                                           Biaya bisa turun 50-80%

Contoh perbandingan nyata: Tugas pemeriksaan gaya kode yang sama

Konfigurasi Token pemikiran Token respons Total biaya (Sonnet)
effort: high ~3000 ~500 ~$0.053
effort: medium ~800 ~500 ~$0.020
effort: low 0 (lewati pemikiran) ~500 ~$0.009

Untuk tugas sederhana, low effort sekitar 83% lebih murah dibandingkan high effort.

💰 Tips hemat uang: Untuk skenario pemrosesan batch (misalnya memeriksa gaya 100 file), atur effort ke low dapat menghemat banyak biaya. Dengan memanggil API Claude 4.6 melalui APIYI apiyi.com, Anda mendapatkan harga diskon plus optimasi parameter effort, penghematan biaya ganda.


Pertanyaan Umum

Q1: Apakah Adaptive Thinking dan Extended Thinking bisa digunakan bersamaan?

Bisa, tapi tidak disarankan. Pada model Claude 4.6, Extended Thinking (type: "enabled") masih tersedia tapi sudah ditandai sebagai Deprecated dan akan dihapus di versi mendatang. Menggunakan kedua mode bersamaan juga menyebabkan cache prompt tidak berfungsi. Disarankan untuk segera bermigrasi ke Adaptive Thinking. Saat memanggil melalui APIYI apiyi.com, format parameter sepenuhnya kompatibel.

Q2: Apakah Opus 4.5 mendukung Adaptive Thinking?

Tidak. Adaptive Thinking hanya didukung oleh Claude Opus 4.6 dan Sonnet 4.6. Opus 4.5 masih perlu menggunakan mode type: "enabled" dan mengatur budget_tokens secara manual. Jika ingin menggunakan Adaptive Thinking, disarankan untuk upgrade ke seri model 4.6. APIYI apiyi.com menyediakan akses API untuk seluruh seri model 4.5 dan 4.6.

Q3: Apakah display: “omitted” benar-benar menghemat uang?

Tidak menghemat uang. display: "omitted" hanya membuat API tidak mengembalikan teks pemikiran, mengurangi latensi transmisi jaringan. Tapi token pemikiran internal tetap akan dibuat dan dikenakan biaya. Cara benar untuk menghemat adalah dengan menurunkan level effort — low atau medium akan membuat Claude melewati atau mengurangi pemikiran pada masalah sederhana.

Q4: Bagaimana cara mengetahui apakah Claude melakukan pemikiran dalam suatu permintaan?

Periksa apakah respons berisi content block bertipe thinking. Jika Claude menilai tidak perlu berpikir, respons hanya akan berisi block text, tanpa block thinking. Dalam mode Adaptive, penghitungan token di field usage dapat membantu Anda menilai berapa banyak token yang digunakan untuk berpikir.

Q5: Bagaimana cara menggunakan Adaptive Thinking di Claude Code?

Claude Code secara default mengaktifkan Adaptive Thinking saat menggunakan Opus 4.6 atau Sonnet 4.6. Anda bisa menyesuaikan kedalaman pemikiran dengan perintah /effort: /effort low (mode cepat), /effort medium (mode seimbang), /effort high (mode mendalam). Pembaruan Maret 2026 juga memperbaiki error "adaptive thinking is not supported" yang disebabkan oleh string model non-standar.


Ringkasan: Adaptive Thinking adalah Peningkatan Inti Claude 4.6

Adaptive Thinking mewakili evolusi penting dalam mode penalaran AI—dari "pengembang menebak berapa banyak AI perlu berpikir" menjadi "AI sendiri yang menilai berapa banyak perlu berpikir".

4 peningkatan inti:

  1. Keputusan dinamis: Masalah sederhana dijawab seketika, masalah kompleks dianalisis mendalam
  2. Pemikiran berselang otomatis: Penalaran otomatis antar pemanggilan alat dalam alur kerja agen
  3. Percakapan multi-putaran fleksibel: Tidak perlu memulai dengan thinking block paksa
  4. Parameter effort: Cara kontrol yang lebih intuitif dibanding budget_tokens

Saran migrasi: Ubah dari thinking: {"type": "enabled", "budget_tokens": N} menjadi thinking: {"type": "adaptive"}, dikombinasikan dengan output_config: {"effort": "..."} untuk mengontrol kedalaman.

Direkomendasikan melalui APIYI apiyi.com untuk akses cepat ke API Claude Opus 4.6 dan Sonnet 4.6, cukup satu baris perubahan parameter untuk menikmati penalaran cerdas dan optimasi biaya yang dibawa oleh Adaptive Thinking.


Referensi

  1. Dokumentasi Claude API – Adaptive Thinking: Panduan teknis resmi

    • Tautan: platform.claude.com/docs/en/build-with-claude/adaptive-thinking
  2. Dokumentasi Claude API – Parameter Effort: Penjelasan detail konfigurasi effort

    • Tautan: platform.claude.com/docs/en/build-with-claude/effort
  3. Anthropic resmi – Claude Opus 4.6: Pengumuman rilis

    • Tautan: anthropic.com/news/claude-opus-4-6
  4. Dokumentasi Claude API – Extended Thinking: Panduan pemikiran terperluas sebelumnya

    • Tautan: platform.claude.com/docs/en/build-with-claude/extended-thinking

Penulis: Tim APIYI | Kuasai kemampuan API Claude terbaru, kunjungi APIYI apiyi.com untuk mendapatkan antarmuka API dan dukungan teknis untuk seluruh seri model Claude 4.6.

Similar Posts