|

Perbandingan Komprehensif Claude Opus 4.7 VS 4.6: Penjelasan 7 Peningkatan Utama, Harga Tetap Sama Namun Biaya Berubah, Panduan Menghindari Masalah Migrasi

Catatan penulis: Analisis mendalam mengenai 7 perbedaan utama antara Claude Opus 4.7 dan 4.6, termasuk peningkatan visual 3x lipat, lompatan kemampuan coding, level inferensi xhigh, fitur baru Task Budgets, serta analisis dampak biaya aktual akibat perubahan Tokenizer meskipun harganya tetap sama.

claude-opus-4-7-vs-4-6-comparison-upgrade-guide-id 图示

Claude Opus 4.7 resmi dirilis pada 16 April 2026. Sebagai penerus Opus 4.6, model ini membawa peningkatan besar seperti peningkatan resolusi visual 3x lipat, tolok ukur coding CursorBench naik 12 poin persentase, dan level inferensi xhigh yang benar-benar baru. Kabar baiknya, harga API sama persis dengan Opus 4.6—$5/juta token untuk input, dan $25/juta token untuk output.

Namun, ini tidak berarti biaya penggunaan aktual tetap sama. Tokenizer baru mungkin membuat konten yang sama mengonsumsi hingga 35% lebih banyak token.

Nilai Utama: Baca artikel ini dalam 5 menit, dan Anda akan memahami keunggulan 4.7 dibandingkan 4.6, apakah layak untuk upgrade, serta apa saja yang perlu diperhatikan saat melakukan upgrade.


Perbandingan Parameter Utama Claude Opus 4.7 vs 4.6

Dimensi Perbandingan Claude Opus 4.7 Claude Opus 4.6 Perubahan
ID Model claude-opus-4-7 claude-opus-4-6 Diperbarui
Harga API (Input) $5 / juta token $5 / juta token Tetap
Harga API (Output) $25 / juta token $25 / juta token Tetap
Jendela Konteks 1M token (~555.000 kata) 1M token (~750.000 kata) Tetap (tapi konsumsi token lebih tinggi dengan Tokenizer baru)
Output Maksimum 128K token 128K token Tetap
Resolusi Gambar Maks 2576px / 3.75MP 1568px / 1.15MP +226%
Token Maks per Gambar ~4784 token ~1600 token Sekitar 3x
Level Usaha Inferensi 5 level (xhigh baru) 4 level +1 level
Mode Berpikir Hanya Adaptive Thinking Extended + Adaptive Disederhanakan
Parameter Sampling Tidak didukung Didukung temperature/top_p/top_k Dihapus
Batas Pengetahuan Januari 2026 Mei 2025 +8 bulan
Batas Data Pelatihan Januari 2026 Agustus 2025 +5 bulan
CursorBench 70% 58% +12pp
Tokenizer Tokenizer baru Tokenizer lama Konten sama +0~35% token

🎯 Kesimpulan Utama: Label harga tetap sama, namun karena pengaruh Tokenizer baru, biaya penggunaan aktual bisa meningkat 0-35%. Namun, mengingat peningkatan kemampuan yang signifikan, efisiensi biaya sebenarnya meningkat. Gunakan Claude Opus 4.7 melalui APIYI apiyi.com untuk menikmati antarmuka terpadu dan penagihan yang fleksibel.


Peningkatan 1: Kemampuan Visual—Dari "Bisa Melihat" menjadi "Melihat dengan Jelas"

Ini adalah peningkatan paling intuitif pada Opus 4.7 dibandingkan dengan 4.6. Opus 4.7 adalah model Claude pertama yang mendukung gambar beresolusi tinggi.

Indikator Visual Opus 4.7 Opus 4.6 Peningkatan
Piksel Sisi Terpanjang Maks 2576px 1568px 1,64x
Total Piksel Maks ~3,75 juta ~1,15 juta 3,26x
Pemetaan Koordinat Korespondensi piksel 1:1 Perlu kalkulasi skala Sangat disederhanakan
Token Maks per Gambar ~4784 ~1600 ~3x
Persepsi Tingkat Rendah Ditingkatkan (menunjuk/mengukur/menghitung) Dasar Peningkatan
Lokalisasi Kotak Pembatas Ditingkatkan Dasar Peningkatan

Apa artinya ini?

Opus 4.6 saat melihat tangkapan layar, ibarat memakai kacamata buram—bisa mengenali konten secara garis besar, tetapi detailnya akan hilang.

Opus 4.7 ibarat mengganti lensa ke definisi tinggi (HD)—mampu membaca teks kecil pada UI dengan presisi, mengenali nilai spesifik dalam grafik, dan menentukan lokasi elemen tertentu dalam gambar secara akurat.

Perbedaan dalam skenario nyata:

  • Agen Computer Use: 4.7 dapat membaca tombol teks kecil dan item menu di layar dengan akurat, sementara 4.6 mungkin salah membacanya.
  • Pemahaman Dokumen: 4.7 dapat mengekstrak data tabel dari dokumen pindaian dengan tepat, sedangkan 4.6 memerlukan ukuran font yang lebih besar agar bisa dikenali dengan akurat.
  • Analisis Grafik: 4.7 dapat melakukan transkripsi data tingkat piksel, sementara 4.6 cenderung melakukan kesalahan pada grafik yang padat.

⚠️ Pengingat Biaya: Gambar beresolusi tinggi mengonsumsi token sekitar 3 kali lipat dari sebelumnya. Jika aplikasi Anda memproses banyak gambar, biaya pemrosesan gambar akan meningkat secara signifikan setelah peningkatan. Untuk skenario yang tidak memerlukan presisi tinggi, disarankan untuk melakukan downsampling gambar sebelum dikirim.

claude-opus-4-7-vs-4-6-comparison-upgrade-guide-id 图示


Peningkatan 2: Kemampuan Coding—Dari "Cukup" menjadi "Otonom"

Coding adalah salah satu bidang di mana Opus 4.7 mengalami peningkatan terbesar. Anthropic secara resmi menggunakan istilah "step-change improvement in agentic coding" untuk menggambarkan lompatan ini.

Perbandingan Benchmark

Benchmark Coding Opus 4.7 Opus 4.6 Perubahan
CursorBench 70% 58% +12 poin persentase
Rakuten-SWE-Bench 3x benchmark 1x benchmark Menyelesaikan 3x tugas produksi
Finance Agent SOTA Terbaik saat ini
GDPval-AA SOTA Terbaik untuk pekerjaan ekonomi

Perbedaan Perilaku Coding

Perilaku Coding Opus 4.7 Opus 4.6
Verifikasi Mandiri Memverifikasi output sendiri secara proaktif sebelum melapor Memerlukan panduan petunjuk
Perbaikan Kesalahan Menemukan dan memperbaiki secara otomatis saat coding Perlu ditunjukkan kesalahannya secara eksplisit
Kualitas Perencanaan Dapat mengidentifikasi celah logika pada tahap perencanaan Baru menyadari masalah saat tahap eksekusi
Tugas Jangka Panjang Menangani alur kerja asinkron dan CI/CD dengan andal Sering kehilangan konteks pada proses kompleks
Pemanggilan Alat Secara default lebih jarang memanggil, lebih banyak menalar Cenderung sering memanggil alat

🎯 Saran Praktis: Bagi tim pengembang yang perlu menangani basis kode kompleks, Opus 4.7 menyelesaikan 3 kali lipat tugas produksi nyata di Rakuten-SWE-Bench dibandingkan 4.6, yang merupakan alasan peningkatan paling meyakinkan. Melalui APIYI (apiyi.com), Anda dapat dengan cepat beralih ID model untuk melakukan pengujian perbandingan.

Peningkatan 3: Kontrol Penalaran—Menambahkan Level xhigh

Opus 4.7 kini menghadirkan level upaya penalaran xhigh yang ditempatkan di antara high dan max.

Level Opus 4.7 Opus 4.6 Skenario yang Disarankan
low Klasifikasi sederhana, konversi format
medium Tanya jawab harian, ringkasan
high Sebagian besar tugas cerdas (rekomendasi minimum)
xhigh ✅ Baru Pengodean dan tugas agen (direkomendasikan)
max Masalah penalaran yang sangat sulit

Anthropic menekankan secara khusus: parameter effort pada Opus 4.7 jauh lebih penting dibandingkan model Opus sebelumnya.

Perubahan utama:

  • 4.7 mematuhi batasan secara ketat pada level low dan medium, sehingga tidak akan bekerja "berlebihan"
  • 4.6 mungkin tetap melakukan penalaran ekstra meskipun pada level rendah
  • Jika tugas kompleks tidak berjalan baik pada level low, Anda harus meningkatkan level effort alih-alih mengubah petunjuk

Peningkatan 4: Task Budgets—Alat Kontrol Biaya Baru

Task Budgets adalah fitur baru (Beta) yang diperkenalkan pada Opus 4.7 dan sama sekali tidak tersedia di 4.6.

Konsep Inti

Fitur Task Budget max_tokens
Sifat Anggaran saran (dapat dirasakan model) Batas keras (tidak dirasakan model)
Cakupan Siklus agen penuh Permintaan tunggal
Perilaku Model Memprioritaskan pekerjaan dan menyelesaikannya dengan rapi Terpotong langsung jika melebihi batas
Nilai Minimum 20K token 1 token
Opus 4.6 ❌ Tidak didukung ✅ Didukung
Opus 4.7 ✅ Baru (Beta) ✅ Didukung

# Penggunaan Task Budgets pada Opus 4.7
response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort": "xhigh",
        "task_budget": {"type": "tokens", "total": 128000},
    },
    messages=[{"role": "user", "content": "Tinjau basis kode dan ajukan rencana refaktorisasi"}],
    betas=["task-budgets-2026-03-13"],
)

🎯 Saran Penggunaan: Jangan mengatur Task Budget untuk skenario yang mengutamakan kualitas. Gunakan hanya pada tugas massal di mana Anda perlu mengontrol pengeluaran token. Parameter ini juga didukung saat melakukan pemanggilan melalui APIYI apiyi.com.

Peningkatan 5: Pembaruan Pengetahuan——Tambahan Pengetahuan 8 Bulan

Dimensi Pengetahuan Opus 4.7 Opus 4.6 Selisih
Batas Pengetahuan Andal Januari 2026 Mei 2025 +8 bulan
Batas Data Pelatihan Januari 2026 Agustus 2025 +5 bulan

Ini berarti Opus 4.7 memahami semua peristiwa teknis besar yang terjadi dari paruh kedua tahun 2025 hingga awal 2026, termasuk versi kerangka kerja pemrograman terbaru, perubahan API, dinamika industri, dan banyak lagi. Untuk tugas yang memerlukan pengetahuan terkini, 4.7 jauh lebih unggul dibandingkan 4.6.


Peningkatan 6: Pola Perilaku——Lebih Presisi namun Perlu Adaptasi

Gaya perilaku Opus 4.7 memiliki perbedaan yang jelas dengan 4.6, ini bukan bug melainkan fitur:

Dimensi Perilaku Opus 4.7 Opus 4.6
Eksekusi Instruksi Lebih literal, tidak melakukan generalisasi otomatis Suka menyimpulkan dan memperluas instruksi
Panjang Respons Adaptif sesuai kompleksitas tugas Cenderung panjang tetap
Gaya Nada Lebih langsung, lebih tegas Lebih hangat, lebih banyak basa-basi
Penggunaan Emoji Lebih sedikit Cukup banyak
Pembaruan Progres Otomatis memberikan status berkualitas tinggi Perlu kode scaffolding paksaan
Sub-agen Secara default lebih sedikit dibuat Secara default lebih banyak dibuat
Pemanggilan Alat Lebih mengandalkan penalaran, lebih jarang memanggil alat Cenderung sering memanggil alat

Saran Adaptasi

Jika Anda menulis petunjuk pada 4.6 seperti ini:

Analisis kode ini, periksa semua file terkait.

4.6 mungkin akan secara otomatis memperluas cakupan untuk memeriksa file pengujian, file konfigurasi, dan lainnya yang terkait. Namun, 4.7 akan secara ketat hanya menganalisis kode yang Anda tentukan. Jika ingin memeriksa lebih banyak konten, Anda harus menyatakannya dengan jelas.

Ini adalah peningkatan presisi, bukan penurunan kemampuan.

claude-opus-4-7-vs-4-6-comparison-upgrade-guide-id 图示


Analisis Harga: Harga Tertera Sama, Biaya Aktual Berubah

Perbandingan Harga

Item Penagihan Opus 4.7 Opus 4.6 Perubahan
Harga Input $5 / MTok $5 / MTok Tetap
Harga Output $25 / MTok $25 / MTok Tetap
Premi Konteks Panjang Tidak ada Tidak ada Tetap
Diskon Batch Ada Ada Tetap
Cache Prompt Didukung Didukung Tetap

Namun Tokenizer Berubah

Opus 4.7 menggunakan tokenizer yang benar-benar baru, yang berarti:

  • Konten teks yang sama pada Opus 4.7 mungkin mengonsumsi 1,0x hingga 1,35x lebih banyak token
  • Peningkatan maksimum sekitar 35%, tergantung pada jenis konten
  • Jendela konteks 1M pada Opus 4.7 setara dengan sekitar 555.000 kata, sedangkan pada 4.6 setara dengan sekitar 750.000 kata

Estimasi Dampak Biaya Aktual

Skenario Penggunaan Konsumsi Bulanan 4.6 Estimasi Konsumsi 4.7 Perubahan Biaya
Percakapan Teks Murni 100M token 110-135M token +10~35%
Pembuatan Kode 100M token 105-120M token +5~20%
Analisis Gambar (HD) 100M token Sekitar 300M token (bagian gambar 3x) Meningkat signifikan
Analisis Gambar (Downsampling) 100M token 110-135M token +10~35%

🎯 Saran Optimasi Biaya:

  1. Gunakan endpoint /v1/messages/count_tokens untuk mengevaluasi kembali konsumsi token Anda
  2. Untuk skenario yang tidak memerlukan gambar resolusi tinggi, lakukan downsampling sebelum mengirim
  3. Manfaatkan Task Budgets untuk mengontrol pengeluaran token pada tugas panjang
  4. Melalui platform APIYI (apiyi.com), Anda dapat mengelola pemanggilan model secara fleksibel dan memilih model yang paling hemat biaya untuk tugas yang berbeda

Panduan Migrasi: 5 Perubahan Breaking Changes

Peningkatan dari 4.6 ke 4.7 bukanlah transisi yang mulus. Perubahan berikut akan menyebabkan kode lama Anda langsung error:

Breaking Change 1: Extended Thinking Dihapus

# ❌ Penulisan 4.6 (4.7 mengembalikan error 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# ✅ Penulisan 4.7 yang benar
thinking = {"type": "adaptive"}
output_config = {"effort": "xhigh"}

Breaking Change 2: Parameter Sampling Dihapus

# ❌ Penulisan 4.6 (4.7 mengembalikan error 400)
response = client.messages.create(
    model="claude-opus-4-7",
    temperature=0.7,  # Error!
    top_p=0.9,        # Error!
)

# ✅ Penulisan 4.7 yang benar: Hapus parameter tersebut
response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    messages=[...],
)

Breaking Change 3: Konten Berpikir Disembunyikan Secara Default

4.6 secara default mengembalikan ringkasan proses berpikir, sedangkan 4.7 tidak. Jika UI Anda menampilkan proses berpikir:

# ✅ Mengembalikan tampilan proses berpikir di 4.7
thinking = {"type": "adaptive", "display": "summarized"}

Breaking Change 4: Pembaruan Tokenizer

Anda perlu memperbarui max_tokens untuk menyediakan ruang lebih dan melakukan pengujian ulang pada penghitungan token.

Breaking Change 5: Prefill Dihapus

Pesan asisten yang diisi sebelumnya (prefill) akan mengembalikan error 400 pada 4.7. Gunakan output terstruktur atau petunjuk sistem sebagai gantinya.

Perintah Cepat Migrasi

Jika Anda menggunakan Claude Code, Anda dapat menyelesaikan migrasi dengan satu perintah:

/claude-api migrate this project to claude-opus-4-7

Pertanyaan Umum

Q1:Apakah Opus 4.7 lebih mahal daripada 4.6?

Harga yang tercantum sama persis: $5/juta token untuk input, dan $25/juta token untuk output. Namun, karena Tokenizer baru mungkin membuat konten yang sama mengonsumsi hingga 35% lebih banyak token, biaya aktual bisa meningkat. Disarankan untuk menggunakan antarmuka penghitung token untuk mengevaluasi kembali. Anda dapat mengelola anggaran secara fleksibel melalui layanan proksi API APIYI di apiyi.com.

Q2:Apakah saya harus mengubah kode jika upgrade dari 4.6 ke 4.7?

Kemungkinan besar perlu. Jika Anda menggunakan Extended Thinking Budgets, parameter sampling (temperature/top_p/top_k), pre-filling pesan asisten, atau bergantung pada output konten pemikiran default, hal-hal tersebut akan mengembalikan error 400 pada 4.7. Disarankan untuk memeriksa poin-poin tersebut berdasarkan daftar periksa migrasi.

Q3:Apakah ada situasi di mana saya tidak disarankan untuk upgrade?

Jika aplikasi Anda sangat bergantung pada penyesuaian parameter sampling (seperti kontrol temperature untuk kreativitas), atau banyak menggunakan gambar dan sensitif terhadap biaya, Anda perlu mengevaluasi dengan cermat sebelum melakukan upgrade. Selain itu, eksekusi instruksi yang lebih literal pada 4.7 mungkin memerlukan penyesuaian pada petunjuk yang sudah dioptimalkan, yang akan menambah beban kerja.


Kesimpulan

Perbedaan utama antara Claude Opus 4.7 dan 4.6:

  1. Peningkatan Visual 3x lipat: Resolusi meningkat dari 1568px menjadi 2576px, total piksel meningkat 3,26 kali lipat.
  2. Lompatan dalam Coding: CursorBench +12pp, menyelesaikan 3 kali lebih banyak tugas produksi di Rakuten-SWE-Bench.
  3. Level xhigh baru: Kontrol penalaran yang lebih presisi, effort menjadi lebih penting daripada Opus versi sebelumnya.
  4. Task Budgets: Mekanisme manajemen anggaran token yang benar-benar baru (Beta).
  5. Pembaruan Pengetahuan 8 bulan: Batas pengetahuan dari 2025.05 hingga 2026.01.
  6. Perilaku lebih presisi: Lebih literal, lebih langsung, dan lebih sedikit redundansi.
  7. Label harga tetap: $5/$25 per MTok, namun Tokenizer baru mungkin meningkatkan konsumsi aktual sebesar 0-35%.

Haruskah upgrade? Untuk sebagian besar skenario, jawabannya adalah harus upgrade. Peningkatan kemampuan jauh melampaui kenaikan biaya yang disebabkan oleh Tokenizer, terutama untuk skenario coding dan visual. Satu-satunya hal yang perlu diwaspadai adalah skenario dengan volume gambar tinggi yang sangat sensitif terhadap biaya.

Melalui APIYI di apiyi.com, Anda dapat dengan cepat mengganti ID model dari claude-opus-4-6 ke claude-opus-4-7 untuk membandingkan performa kedua versi tersebut dalam skenario bisnis nyata sebelum mengambil keputusan.

📚 Referensi

  1. Resmi Anthropic – Apa yang Baru di Opus 4.7: Dokumentasi lengkap mengenai pembaruan

    • Tautan: platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-6
    • Penjelasan: Dokumentasi teknis paling otoritatif yang mencakup semua fitur dan perubahan baru
  2. Dokumentasi API Claude – Panduan Migrasi: Panduan lengkap untuk migrasi dari 4.6 ke 4.7

    • Tautan: platform.claude.com/docs/en/about-claude/models/migration-guide
    • Penjelasan: Berisi perubahan yang memutus kompatibilitas (breaking changes), perubahan perilaku, dan daftar periksa migrasi
  3. Ikhtisar Model Claude: Perbandingan spesifikasi dan harga untuk semua model Claude

    • Tautan: platform.claude.com/docs/en/about-claude/models/overview
    • Penjelasan: Tabel spesifikasi model resmi, mencakup parameter detail dan informasi harga
  4. Pengumuman Resmi Anthropic – Claude Opus 4.7: Artikel peluncuran

    • Tautan: anthropic.com/news/claude-opus-4-7
    • Penjelasan: Pengumuman rilis resmi yang memuat data tolok ukur (benchmark) dan posisi produk

Penulis: Tim Teknis APIYI
Diskusi Teknis: Mari berdiskusi di kolom komentar, untuk materi lebih lanjut silakan kunjungi pusat dokumentasi APIYI di docs.apiyi.com

Similar Posts