|

Grok 4.3 meluncurkan API xAI: Panduan migrasi lengkap untuk 8 model lama yang akan dihentikan pada 15 Mei

Pada tanggal 6 Mei 2026, xAI mengirimkan email resmi kepada seluruh pengguna API dengan subjek "Grok 4.3 release and xAI API model retirement". Email ini menyampaikan dua kabar krusial bagi pengembang: Grok 4.3 telah resmi dirilis sepenuhnya di API, sementara 8 model lama termasuk grok-4-fast, grok-4-0709, grok-3, grok-code-fast-1, dan grok-imagine-image-pro akan dihentikan layanannya pada 15 Mei 2026 pukul 12:00 PT. Di balik email ini, terdapat pembaruan versi besar sekaligus hitung mundur migrasi yang harus diselesaikan dalam waktu 9 hari.

grok-4-3-release-xai-api-model-retirement-id 图示

Hal yang paling menarik dari rilis Grok 4.3 bukanlah perubahan namanya, melainkan jendela konteks 1M token, harga input/output $1,25/$2,50, serta kombinasi 3 tingkat intensitas penalaran yang dapat disesuaikan. Tingkat harga ini menempatkan Grok 4.3 langsung di segmen kompetisi model penalaran utama yang setara dengan Gemini 3.1 Pro dan GPT-5.4, namun tetap mempertahankan keunggulan kecepatan throughput token yang menjadi ciri khas xAI. Kami menyarankan tim yang bergantung pada seri Grok untuk segera melakukan pengujian integrasi melalui platform APIYI (apiyi.com); antarmuka yang kompatibel dengan OpenAI akan meminimalkan biaya migrasi saat berpindah antar model.

Ulasan Lengkap Spesifikasi dan Harga Inti Grok 4.3

Grok 4.3 adalah model unggulan generasi terbaru yang disebut xAI dalam emailnya sebagai "model tercepat dan paling cerdas yang pernah kami buat". Model ini menempati peringkat teratas dalam daftar agentic tool calling dan instruction following, dengan posisi sebagai model unggulan serbaguna untuk kode, agen, dan penalaran kompleks. Dari sisi spesifikasi, Grok 4.3 memperluas jendela konteks dari 256K di era Grok 4 menjadi 1M token, setara dengan Gemini 3 Pro dan Claude 4.7, yang berarti Anda dapat memasukkan basis kode lengkap atau dokumen teknis panjang dalam satu kali pemanggilan.

Tabel di bawah ini merangkum parameter inti Grok 4.3 pada API xAI, dengan data yang bersumber dari email resmi xAI dan halaman pengujian pihak ketiga Artificial Analysis.

Parameter Nilai Grok 4.3 Catatan
Jendela Konteks 1.000.000 token Input + Output gabungan
Harga Input $1,25 / 1M token 50% lebih murah dari GPT-5.4, setara Gemini 3.1 Pro
Harga Output $2,50 / 1M token Turun sekitar 83% dari $15 di era Grok 4
Intensitas Penalaran low / medium / high (3 tingkat) Mengontrol anggaran penalaran mendalam via parameter
Modalitas Input Teks + Gambar Mendukung pemahaman visual
Modalitas Output Teks Tidak menghasilkan gambar secara langsung
Pemanggilan Alat Function calling bawaan Mendukung output terstruktur dan pemanggilan paralel
Kecepatan Output Sekitar 207 token/detik Pengujian oleh Artificial Analysis

3 tingkat intensitas penalaran (reasoning effort) adalah fitur baru utama yang membedakan Grok 4.3 dari generasi sebelumnya. Fitur ini memungkinkan pengembang menyesuaikan kedalaman "berpikir" model berdasarkan kompleksitas tugas, yang secara langsung memengaruhi latensi dan biaya. Mekanisme ini mengadopsi desain reasoning_effort dari OpenAI, namun xAI membuat penalaran itu sendiri selalu aktif (always-on), hanya saja memberikan fleksibilitas untuk mengatur kedalamannya. Tabel berikut merangkum skenario penggunaan tipikal dan dampaknya untuk ketiga tingkat intensitas tersebut.

Intensitas Penalaran Skenario Tipikal Karakteristik Latensi Dampak Biaya
low Klasifikasi sederhana, ringkasan, ekstraksi aturan Mendekati model non-penalaran Jumlah token output minimal
medium Pemanggilan fungsi, analisis data, pelengkapan kode Keseimbangan latensi & kualitas Tingkat default yang direkomendasikan
high Agen multi-langkah, matematika kompleks, kode panjang Tahap thinking lebih lama Token output meningkat signifikan

🎯 Saran Integrasi: Bagi tim yang belum yakin memilih tingkat mana, kami sarankan untuk mencoba menjalankan serangkaian sampel bisnis nyata dengan tingkat medium di platform APIYI (apiyi.com), lalu putuskan apakah perlu ditingkatkan ke tingkat high berdasarkan akurasi dan efisiensi biaya. Antarmuka terpadu memungkinkan parameter reasoning_effort diubah dengan satu klik antar model tanpa perlu menulis ulang SDK.

grok-4-3-release-xai-api-model-retirement-id 图示

Performa Grok 4.3 di Papan Peringkat Agentic dan Instruction Following

Alasan mengapa xAI sangat menekankan "tops leaderboards in agentic tool calling and instruction following" dalam email mereka adalah karena data inti yang berasal dari papan peringkat pihak ketiga seperti Artificial Analysis, τ²-Bench, IFBench, dan GDPval-AA. Artificial Analysis Intelligence Index memberikan skor komprehensif sebesar 53,2, dengan total biaya untuk menjalankan seluruh rangkaian pengujian sekitar $395, yang berarti sekitar 20% lebih hemat dibandingkan Grok 4.20. Pada τ²-Bench Telecom (simulasi pemanggilan alat dua arah untuk layanan pelanggan telekomunikasi), yang merupakan papan peringkat paling mendekati skenario Agent nyata, Grok 4.3 meraih skor 98%, meningkat 5 poin persentase dibandingkan Grok 4.20 dan setara dengan GLM-5.1.

Bagi pengembang, yang lebih menarik perhatian adalah GDPval-AA, papan peringkat alur kerja yang mengukur nilai ekonomi nyata. Grok 4.3 meraih 1500 ELO di GDPval-AA, meningkat 321 poin dari 1179 ELO pada generasi sebelumnya, Grok 4.20 0309 v2, melampaui model seperti Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini (xhigh), dan Kimi K2.5. Dalam hal Instruction Following, Grok 4.3 mempertahankan skor 81% di IFBench, setara dengan Grok 4.20 0309 v2.

Benchmark Skor Grok 4.3 Referensi Kelas Serupa Kemampuan Utama
AA Intelligence Index 53.2 Lebih baik dari 98% model Kecerdasan Komprehensif
AA Coding Index 41.0 Lebih baik dari 89% model Pengodean & Refaktorisasi
τ²-Bench Telecom 98% Setara dengan GLM-5.1 Pemanggilan Alat + Kolaborasi Pengguna
IFBench 81% Setara dengan Grok 4.20 Instruksi Kompleks
GDPval-AA ELO 1500 Melampaui Gemini 3.1 Pro Preview Nilai Alur Kerja Nyata

Perlu dicatat bahwa keunggulan Grok 4.3 terletak pada alur kerja Agent dan pemanggilan alat, bukan pada kompetisi algoritma murni. Untuk aplikasi seperti Agent kode, Browser Agent, dan Bot layanan pelanggan yang membutuhkan output JSON stabil serta pemanggilan alat multi-putaran, keandalan Grok 4.3 akan meningkat secara signifikan dibandingkan generasi sebelumnya. Namun, jika skenario utama tim Anda adalah sintesis kode murni seperti SWE-bench, kami menyarankan untuk menguji Grok 4.3, Claude 4.7 Opus, dan GPT-5.4 dalam set pengujian yang sama di platform APIYI (apiyi.com), lalu tentukan model utama berdasarkan tingkat keberhasilannya.

Daftar Penghentian Model API xAI dan Saran Migrasi

Kali ini xAI menghentikan 8 model sekaligus, mencakup penalaran teks, model kode, dan pembuatan gambar, yang pada dasarnya membersihkan seluruh SKU era Grok 4. Bagi tim yang melakukan hard-code nama model langsung di dalam bisnis mereka, ini adalah tenggat waktu wajib untuk melakukan perombakan kode dalam waktu 9 hari. Tabel di bawah merangkum semua model yang terdampak dan jalur alternatif yang direkomendasikan secara resmi.

Model yang Akan Dihentikan Tipe Alternatif Resmi Catatan Migrasi
grok-4-1-fast-reasoning Penalaran grok-4.3 Kualitas penalaran naik, harga turun
grok-4-1-fast-non-reasoning Non-penalaran grok-4.20-non-reasoning Mempertahankan latensi rendah
grok-4-fast-reasoning Penalaran grok-4.3 Mendapatkan jendela konteks 1M
grok-4-fast-non-reasoning Non-penalaran grok-4.20-non-reasoning Kompatibilitas bentuk API terjaga
grok-4-0709 Penalaran grok-4.3 Penghentian snapshot awal Grok 4
grok-code-fast-1 Kode grok-4.3 Skenario kode disatukan ke 4.3
grok-3 Umum grok-4.3 Era Grok 3 resmi berakhir
grok-imagine-image-pro Pembuatan Gambar grok-imagine-image Penyederhanaan SKU gambar

Waktu penghentian adalah 15 Mei 2026 pukul 12:00 PT (16 Mei pukul 03:00 WIB). Setelah waktu tersebut, semua permintaan yang dikirim ke 8 ID model ini akan langsung menghasilkan error. Terhitung sejak email dikirim pada 6 Mei, jendela waktu bagi pengembang hanya tersisa 9 hari, yang merupakan jadwal sangat ketat untuk bisnis skala menengah hingga besar. Kami menyarankan untuk membagi pekerjaan migrasi menjadi 3 langkah: pertama, temukan semua ID model yang di-hard-code dalam kode; kedua, jalankan pengujian gray-scale di platform APIYI (apiyi.com); ketiga, alihkan bidang model aktual melalui variabel lingkungan alih-alih mengubah logika bisnis.

grok-4-3-release-xai-api-model-retirement-id 图示

Sebagai pengingat khusus, grok-code-fast-1 adalah model default untuk banyak proyek Agent kode selama setengah tahun terakhir. Penghentiannya berarti semua alat kelas Cursor, plugin IDE, dan CLI Agent yang bergantung pada ID ini perlu beralih ke grok-4.3. Dalam skenario kode, stabilitas pemanggilan alat Grok 4.3 lebih baik daripada grok-code-fast-1, namun biaya per token sedikit lebih tinggi, sehingga Anda perlu mengevaluasi kembali anggaran pemanggilan.

Perbandingan Lintas Model: Grok 4.3 vs GPT-5.4, Claude 4.7, dan Gemini 3.1 Pro

Pada kuartal kedua tahun 2026 saat Grok 4.3 dirilis, pasar Model Bahasa Besar sedang berada dalam periode persaingan paling sengit dalam sejarah. Claude Opus 4.7 memimpin dengan 87,6% pada SWE-bench Verified, Gemini 3.1 Pro mencapai 94,3% pada GPQA Diamond, dan GPT-5.4 tetap menjadi tolok ukur untuk stabilitas penalaran teks panjang. Posisi Grok 4.3 sendiri adalah "kecerdasan menengah + harga sangat rendah + rantai alat Agen yang kuat", yang menyasar skenario pemanggilan frekuensi tinggi yang sensitif terhadap biaya.

Tabel di bawah ini membandingkan data utama dari 4 model unggulan dalam dimensi yang umum, dengan satuan harga dalam dolar per satu juta token.

Model Harga Input Harga Output Jendela Konteks Skenario Keunggulan Utama
Grok 4.3 $1,25 $2,50 1M Rantai alat Agen, pemanggilan frekuensi tinggi, penalaran menengah
GPT-5.4 $2,50 $15,00 400K Konsistensi teks panjang, perencanaan kompleks
Claude 4.7 Opus $15,00 $75,00 1M Pengodean tingkat atas, penulisan dokumen, analisis mendalam
Gemini 3.1 Pro $2,00 $12,00 2M Multimodal, pemahaman video, dokumen super panjang

Dari tabel perbandingan ini, kita bisa melihat fakta secara langsung: harga token output Grok 4.3 30 kali lebih murah daripada Claude 4.7 Opus dan sekitar 4,8 kali lebih murah daripada Gemini 3.1 Pro. Untuk bisnis seperti Agen layanan pelanggan dengan frekuensi tinggi, Linter kode, atau pembersihan data massal, keunggulan biaya per unit Grok 4.3 akan berlipat ganda. Namun, untuk skenario yang membutuhkan kualitas pengodean ekstrem atau pemahaman multimodal, Claude 4.7 Opus dan Gemini 3.1 Pro tetap tidak tergantikan.

🎯 Saran Strategi Multi-Model: Kami menyarankan penggunaan Grok 4.3 sebagai lapisan umum frekuensi tinggi, Claude 4.7 Opus sebagai lapisan output kode dan dokumen yang kompleks, serta Gemini 3.1 Pro sebagai lapisan multimodal. Dengan menggunakan antarmuka terpadu APIYI apiyi.com pada lapisan perutean bisnis, Anda dapat menikmati keuntungan biaya rendah dari Grok 4.3 sekaligus menggunakan model yang lebih kuat pada titik-titik krusial.

Panduan Migrasi dan Contoh Kode Grok 4.3 API

Migrasi ke Grok 4.3 sangat mudah dari sisi teknis. xAI menyediakan antarmuka chat completions yang kompatibel dengan OpenAI, sehingga sebagian besar pekerjaan migrasi hanya perlu mengubah kolom base_url dan model. Untuk proyek yang sudah menggunakan SDK OpenAI, contoh Python minimalis berikut adalah kode akses yang lengkap.

from openai import OpenAI

# Inisialisasi klien dengan base_url APIYI
client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://vip.apiyi.com/v1",
)

resp = client.chat.completions.create(
    model="grok-4.3",
    messages=[
        {"role": "user", "content": "Jelaskan reasoning effort dalam satu kalimat"},
    ],
    extra_body={"reasoning_effort": "medium"},
)

print(resp.choices[0].message.content)

Setelah mengarahkan base_url ke platform APIYI apiyi.com, sisi bisnis Anda akan memiliki pintu masuk pemanggilan terpadu untuk Grok 4.3, Claude 4.7, GPT-5.4, dan Gemini 3.1 Pro. Selanjutnya, untuk berpindah model Anda hanya perlu mengubah parameter model tanpa perlu menulis ulang kode autentikasi dan perutean. Abstraksi terpadu ini dapat secara signifikan mengurangi risiko migrasi sebelum batas waktu penghentian pada 15 Mei.

Untuk migrasi model lama, kami telah menyusun perbandingan perubahan minimal dari ID model lama ke ID model baru yang bisa langsung Anda terapkan ke dalam kode.

Field model lama Field model baru Apakah perlu mengubah parameter lain?
grok-3 grok-4.3 Opsional, tambahkan reasoning_effort
grok-4-0709 grok-4.3 Opsional, tambahkan reasoning_effort
grok-4-fast-reasoning grok-4.3 Opsional, tambahkan reasoning_effort
grok-4-fast-non-reasoning grok-4.20-non-reasoning Tidak perlu mengubah parameter lain
grok-code-fast-1 grok-4.3 Disarankan reasoning_effort=high
grok-imagine-image-pro grok-imagine-image Endpoint API gambar tetap konsisten

FAQ Grok 4.3

Q1: Apakah Grok 4.3 benar-benar mendukung jendela konteks 1M? Apakah performa teks panjang akan menurun?

Ya, Grok 4.3 secara resmi menyediakan jendela konteks 1M token melalui API xAI, setara dengan Claude 4.7 Opus. Namun, seperti semua model dengan konteks panjang, pemahaman terhadap permintaan akan mengalami sedikit penurunan setelah melewati 600K token. Kami menyarankan agar informasi penting diletakkan di bagian awal dokumen. Anda bisa melakukan pengujian tingkat keberhasilan pengambilan (retrieval recall) dengan dokumen bisnis nyata melalui platform APIYI (apiyi.com) sebelum memutuskan untuk menjadikan Grok 4.3 sebagai model utama untuk teks panjang.

Q2: Bagaimana cara memilih intensitas penalaran (low / medium / high)?

Gunakan low untuk tugas berisiko rendah (klasifikasi, ringkasan, ekstraksi aturan), medium untuk tugas bisnis rutin (layanan pelanggan, pemanggilan fungsi, analisis data), dan high untuk penalaran kompleks (Agen multi-langkah, kode rantai panjang, matematika kompleks). Mode high akan meningkatkan jumlah token output dan latensi secara signifikan, jadi sebaiknya pertimbangkan berdasarkan anggaran dan SLA latensi Anda.

Q3: Setelah 15 Mei pukul 12:00 PT, apakah model lama masih bisa digunakan?

Tidak bisa. Email dari xAI menyatakan dengan jelas bahwa "Setelah 15 Mei 2026, permintaan ke model-model ini tidak akan berfungsi lagi", dan permintaan yang kedaluwarsa akan langsung mengembalikan pesan kesalahan. Semua kode yang menggunakan ID model lama secara hard-code harus segera dialihkan sebelum tenggat waktu tersebut.

Q4: Bagaimana cara meminimalkan biaya migrasi?

Cara paling aman adalah dengan mengabstraksi kolom model dalam bisnis Anda menjadi variabel lingkungan atau konfigurasi, alih-alih menulisnya secara permanen di dalam kode. Dengan memanfaatkan titik akses yang kompatibel dengan OpenAI dari APIYI (apiyi.com), migrasi hanya memerlukan satu perubahan konfigurasi dan satu kali pengujian regresi.

Q5: Apakah Grok 4.3 cocok untuk Coding Agent?

Sangat cocok. Grok 4.3 meraih skor 98% di τ²-Bench Telecom, dengan stabilitas pemanggilan alat dan percakapan multi-putaran yang lebih baik daripada grok-code-fast-1. Selain itu, biaya per unitnya sangat rendah, sehingga sangat ideal untuk plugin IDE, CLI Agent, dan skrip otomatisasi operasional yang sering digunakan.

Kesimpulan: Poin Utama Peluncuran Grok 4.3 dan Migrasi API xAI

Daya tarik utama dari rilis Grok 4.3 kali ini bukan sekadar "lebih kuat", melainkan "lebih murah namun tetap lebih kuat". Dengan harga $1,25/$2,50, xAI membawa jendela konteks 1M dan pemanggilan alat Agen berkualitas tinggi ke kisaran harga yang sama dengan Gemini 3.1 Pro, yang secara langsung mendefinisikan ulang tolok ukur efisiensi biaya untuk lapisan penggunaan umum yang intensif. Di saat yang sama, penghentian 8 model lama pada 15 Mei menjadi pengingat bagi semua tim: ID model tidak boleh di-hard-code ke dalam kode bisnis, melainkan harus diabstraksi di balik lapisan perutean yang dapat dikonfigurasi.

Kami menyarankan untuk menjadikan Grok 4.3 sebagai model utama untuk pemanggilan intensif dan rantai alat Agen. Selesaikan migrasi melalui antarmuka terpadu APIYI (apiyi.com) untuk menekan biaya peralihan seminimal mungkin, sekaligus mempertahankan kemampuan kombinasi multi-model seperti Claude 4.7 Opus, GPT-5.4, dan Gemini 3.1 Pro agar Anda dapat melakukan penjadwalan dinamis pada berbagai tugas demi mencapai keseimbangan biaya dan kualitas yang optimal secara keseluruhan.

Tim Teknis APIYI · Fokus pada konten praktis seputar API Model AI dan alat pengembang. Untuk artikel teknis lainnya, silakan kunjungi apiyi.com

Similar Posts