Gemini 3.1 Pro Preview telah menambahkan level berpikir medium, yang merupakan salah satu perbedaan terbesar dibandingkan generasi sebelumnya, Gemini 3 Pro. Sekarang, Anda dapat mengontrol kedalaman penalaran model secara presisi di antara tiga level: low, medium, dan high, di mana mode high akan mengaktifkan kemampuan Deep Think Mini.
Nilai Inti: Setelah membaca artikel ini, Anda akan menguasai metode konfigurasi lengkap untuk parameter thinkingLevel, serta belajar menemukan keseimbangan optimal antara kualitas, kecepatan, dan biaya.

Matriks Dukungan Lengkap Level Berpikir Gemini 3.1 Pro
Mari kita lihat gambaran besarnya: model Gemini yang berbeda mendukung level berpikir yang berbeda pula.
| Level Berpikir | Gemini 3.1 Pro | Gemini 3 Pro | Gemini 3 Flash | Keterangan |
|---|---|---|---|---|
| minimal | ❌ Tidak mendukung | ❌ Tidak mendukung | ✅ Mendukung | Mendekati penonaktifan penalaran, hanya didukung Flash |
| low | ✅ Mendukung | ✅ Mendukung | ✅ Mendukung | Respon cepat, biaya terendah |
| medium | ✅ Dukungan Baru | ❌ Tidak mendukung | ✅ Mendukung | Penalaran seimbang, upgrade inti dari 3.1 Pro |
| high | ✅ Mendukung (default) | ✅ Mendukung (default) | ✅ Mendukung (default) | Penalaran terdalam, mengaktifkan Deep Think Mini |
Perubahan Kunci: Upgrade Level Berpikir dari 3 Pro → 3.1 Pro
| Perbandingan | Gemini 3 Pro | Gemini 3.1 Pro |
|---|---|---|
| Level yang tersedia | low, high (hanya 2 level) | low, medium, high (3 level) |
| Level default | high | high |
| Arti mode high | Penalaran mendalam | Deep Think Mini (lebih kuat) |
| Bisakah menonaktifkan penalaran | Tidak bisa | Tidak bisa |
Pemahaman Inti: Kedalaman penalaran high pada Gemini 3 Pro ≈ medium pada Gemini 3.1 Pro. Sedangkan high pada 3.1 Pro adalah Deep Think Mini yang benar-benar baru, dengan kedalaman penalaran yang jauh melampaui generasi sebelumnya.
🎯 Saran Migrasi: Jika sebelumnya Anda menggunakan mode high pada Gemini 3 Pro, disarankan untuk mencoba level medium terlebih dahulu setelah beralih ke 3.1 Pro (untuk menjaga kualitas dan biaya yang serupa), dan hanya aktifkan high saat membutuhkan penalaran yang sangat mendalam. APIYI (apiyi.com) mendukung semua model Gemini dan level berpikir secara bersamaan.
Metode Pengaturan API Level Berpikir Gemini 3.1 Pro
Panggil melalui APIYI (Format Kompatibel OpenAI)
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # Interface terpadu APIYI
)
# Mode LOW: Respons cepat
response_low = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "Terjemahkan teks Inggris ini ke Bahasa Indonesia: Hello World"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 1024}
}
)
# Mode MEDIUM: Penalaran seimbang (Baru!)
response_med = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "Tinjau apakah kode ini memiliki risiko kebocoran memori"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 8192}
}
)
# Mode HIGH: Deep Think Mini
response_high = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "Buktikan: Untuk semua bilangan bulat positif n, n^3-n dapat dibagi habis oleh 6"}],
extra_body={
"thinking": {"type": "enabled", "budget_tokens": 32768}
}
)
Panggilan Native melalui Google SDK
from google import genai
from google.genai import types
client = genai.Client()
# Gunakan parameter thinkingLevel
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="petunjuk Anda",
config=types.GenerateContentConfig(
thinking_config=types.ThinkingConfig(
thinking_level="MEDIUM" # "LOW" / "MEDIUM" / "HIGH"
)
),
)
# Lihat konsumsi token pemikiran
print(f"Token pemikiran: {response.usage_metadata.thoughts_token_count}")
print(f"Token output: {response.usage_metadata.candidates_token_count}")
Panggilan REST API
POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent
{
"contents": [{"parts": [{"text": "petunjuk Anda"}]}],
"generationConfig": {
"thinkingConfig": {
"thinkingLevel": "MEDIUM"
}
}
}
⚠️ Peringatan Penting:
thinkingLeveldanthinkingBudgettidak dapat digunakan secara bersamaan, jika tidak, akan mengembalikan error 400. Untuk model Gemini 3+, direkomendasikan menggunakanthinkingLevel, sedangkan untuk model Gemini 2.5 menggunakanthinkingBudget.
Perbandingan Detail 3 Level Berpikir Gemini 3.1 Pro
LOW: Tercepat dan Termurah
| Dimensi | Detail |
|---|---|
| Kedalaman Penalaran | Token pemikiran paling sedikit, namun tetap lebih baik daripada model tanpa fitur berpikir |
| Kecepatan Respons | Dalam hitungan detik (tercepat) |
| Biaya | Terendah (token pemikiran sedikit → token output sedikit → biaya rendah) |
| Skenario Penggunaan | Auto-complete, klasifikasi, ekstraksi data terstruktur, terjemahan sederhana, ringkasan |
| Tidak Cocok Untuk | Penalaran kompleks, pembuktian matematika, debugging multi-langkah |
MEDIUM: Pilihan Seimbang (Baru)
| Dimensi | Detail |
|---|---|
| Kedalaman Penalaran | Token pemikiran menengah, ≈ level high pada versi 3.0 Pro lama |
| Kecepatan Respons | Latensi menengah |
| Biaya | Menengah |
| Skenario Penggunaan | Tinjauan kode, analisis dokumen, coding harian, panggilan API standar, tanya jawab |
| Tidak Cocok Untuk | Matematika tingkat IMO, penalaran multi-langkah yang sangat kompleks |
HIGH: Deep Think Mini (Default)
| Dimensi | Detail |
|---|---|
| Kedalaman Penalaran | Penalaran maksimal, mengaktifkan kemampuan Deep Think Mini |
| Kecepatan Respons | Mungkin membutuhkan beberapa menit (soal IMO ~8 menit) |
| Biaya | Tertinggi (banyak token pemikiran ditagih sesuai harga output) |
| Skenario Penggunaan | Debugging kompleks, desain algoritma, pembuktian matematika, tugas penelitian, alur kerja Agent |
| Kemampuan Khusus | Tanda tangan pemikiran (thought signatures) menjaga kontinuitas penalaran di berbagai panggilan API |

Aturan Penagihan Token Berpikir Gemini 3.1 Pro
Memahami skema penagihan adalah kunci dalam memilih tingkat berpikir (thinking level) yang tepat.
Prinsip Utama Penagihan
| Item Penagihan | Keterangan |
|---|---|
| Apakah token berpikir dikenakan biaya? | Ya, dikenakan biaya dengan harga yang sama dengan token output |
| Harga token output | $12.00 / 1 juta token (termasuk token berpikir) |
| Basis penagihan | Dihitung berdasarkan rantai penalaran internal yang lengkap, bukan hanya ringkasannya saja |
| Ringkasan pemikiran | API hanya mengembalikan ringkasan pemikiran, tetapi biaya dihitung berdasarkan jumlah total token berpikir yang dihasilkan |
Penjelasan resmi dari Google:
"Model berpikir menghasilkan pemikiran lengkap untuk meningkatkan kualitas respons akhir, lalu mengeluarkan ringkasan untuk memberikan wawasan tentang proses berpikir tersebut. Harga didasarkan pada total token pemikiran yang perlu dihasilkan model untuk membuat ringkasan, meskipun hanya ringkasannya saja yang dikeluarkan dari API."
Estimasi Biaya untuk Tiga Tingkatan
| Tingkat | Estimasi Token Berpikir | Per 1.000 Panggilan | Tren Biaya Bulanan |
|---|---|---|---|
| LOW | ~500-2K / panggilan | $6-24 | Terendah |
| MEDIUM | ~2K-8K / panggilan | $24-96 | Menengah |
| HIGH | ~8K-32K+ / panggilan | $96-384+ | Lebih tinggi, lebih banyak untuk tugas kompleks |
💰 Optimasi Biaya: Tidak semua permintaan membutuhkan level HIGH. Mengatur 80% tugas harian ke LOW atau MEDIUM, dan hanya menggunakan HIGH untuk 20% tugas yang benar-benar kompleks, dapat mengurangi pengeluaran API sebesar 50-70%. Anda dapat mengonfigurasi ini secara fleksibel melalui platform APIYI apiyi.com.
Panduan Pencocokan Jenis Tugas dengan Tingkat Berpikir Gemini 3.1 Pro
Rekomendasi Skenario Detail
| Jenis Tugas | Tingkat Rekomendasi | Alasan | Estimasi Latensi |
|---|---|---|---|
| Terjemahan sederhana | LOW | Tidak butuh penalaran mendalam | < 5 detik |
| Klasifikasi teks | LOW | Tugas pencocokan pola | < 5 detik |
| Ekstraksi ringkasan | LOW | Kompresi informasi, bukan penalaran | < 10 detik |
| Auto-complete | LOW | Sensitif terhadap latensi | < 3 detik |
| Code review | MEDIUM | Butuh analisis moderat | 10-30 detik |
| Tanya jawab dokumen | MEDIUM | Pemahaman + Jawaban | 10-30 detik |
| Coding harian | MEDIUM | Pembuatan kode rutin | 15-40 detik |
| Analisis Bug | MEDIUM | Penalaran kompleksitas menengah | 20-40 detik |
| Debugging kompleks | HIGH | Rantai penalaran multi-langkah | 1-5 menit |
| Pembuktian matematika | HIGH | Deep Think Mini | 3-8 menit |
| Desain algoritma | HIGH | Penalaran mendalam | 2-5 menit |
| Analisis riset | HIGH | Analisis mendalam multi-dimensi | 2-5 menit |
| Workflow Agent | HIGH | Menjaga kontinuitas signature pemikiran | Tergantung tugas |
Pemilihan Tingkat Dinamis: Contoh Kode Praktis
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # Interface terpadu APIYI
)
# Pilih tingkat berpikir secara otomatis berdasarkan jenis tugas
THINKING_CONFIG = {
"simple": {"type": "enabled", "budget_tokens": 1024}, # LOW
"medium": {"type": "enabled", "budget_tokens": 8192}, # MEDIUM
"complex": {"type": "enabled", "budget_tokens": 32768}, # HIGH
}
def smart_think(prompt, complexity="medium"):
"""Atur tingkat berpikir secara otomatis berdasarkan kompleksitas tugas"""
return client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": prompt}],
extra_body={"thinking": THINKING_CONFIG[complexity]}
)
# Terjemahan sederhana → LOW
resp1 = smart_think("Terjemahkan: Good morning", "simple")
# Code review → MEDIUM
resp2 = smart_think("Tinjau keamanan kode ini: ...", "medium")
# Pembuktian matematika → HIGH (Deep Think Mini)
resp3 = smart_think("Buktikan kasus khusus dari Hipotesis Riemann", "complex")
Gemini 3.1 Pro vs 3 Pro: Evolusi Tingkat Berpikir (Thinking Level)

Di Mana Letak Kehebatan Deep Think Mini?
Deep Think Mini yang diaktifkan melalui mode HIGH pada Gemini 3.1 Pro adalah sorotan utama dari pembaruan kali ini.
Apa Itu Deep Think Mini?
Deep Think Mini bukanlah model yang berdiri sendiri, melainkan mode penalaran khusus dari Gemini 3.1 Pro di bawah tingkat berpikir HIGH. Google mendeskripsikannya sebagai "versi mini dari Gemini Deep Think" — Deep Think adalah model penalaran berat khusus milik Google (skor ARC-AGI-2 mencapai 84,6%).
Performa Nyata Deep Think Mini
| Item Pengujian | Deep Think Mini (3.1 Pro HIGH) | Gemini 3 Pro HIGH | Tingkat Peningkatan |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | 31.1% | +148% |
| Soal Matematika IMO | Selesai dalam ~8 menit | Tidak dapat diselesaikan | Dari tidak bisa menjadi bisa |
| Tugas Perencanaan Kompleks | Peningkatan benchmark 40-60% | Dibandingkan dengan Gemini 2.5 Pro | Peningkatan signifikan |
Tanda Tangan Pemikiran (Thought Signatures)
Deep Think Mini memperkenalkan teknologi unik: thought signatures. Ini adalah representasi status penalaran menengah yang terenkripsi dan tahan manipulasi.
Dalam alur kerja Agent, penalaran model sering kali mencakup beberapa panggilan API. Thought signatures dapat meneruskan konteks penalaran dari panggilan sebelumnya ke panggilan berikutnya, menjaga kontinuitas penalaran. Ini sangat penting untuk tugas Agent yang melibatkan banyak langkah.
Tugas Apa yang Layak Menggunakan Deep Think Mini?
| Layak Menggunakan HIGH (Deep Think Mini) | Tidak Perlu Menggunakan HIGH |
|---|---|
| Penalaran tingkat kompetisi matematika | Operasi aritmatika dasar |
| Debugging bug kompleks lintas file | Perbaikan kesalahan sintaksis |
| Desain dan optimasi algoritma | Pembuatan kode CRUD |
| Analisis metodologi jurnal akademik | Ringkasan artikel |
| Tugas panjang Agent multi-langkah | Tanya jawab satu putaran |
| Analisis mendalam celah keamanan | Konversi format |
💡 Saran Praktis: Kehebatan Deep Think Mini ada harganya — latensi dan biayanya cukup tinggi. Disarankan untuk menggunakan HIGH hanya pada tugas yang benar-benar membutuhkan "pemikiran mendalam", sedangkan untuk tugas sehari-hari, mode MEDIUM sudah cukup. Melalui APIYI apiyi.com, Anda dapat beralih secara fleksibel di setiap level permintaan.
thinkingLevel vs thinkingBudget: Jangan Sampai Tertukar
Google memiliki dua parameter untuk mengontrol proses berpikir (reasoning), yang berlaku untuk seri model yang berbeda:
| Parameter | Model yang Didukung | Tipe Nilai | Penjelasan |
|---|---|---|---|
| thinkingLevel | Gemini 3+ (3 Flash, 3 Pro, 3.1 Pro) | Enum: MINIMAL/LOW/MEDIUM/HIGH | Direkomendasikan untuk seri Gemini 3 |
| thinkingBudget | Gemini 2.5 (Pro, Flash, Flash Lite) | Integer: 0-32768 | Berlaku untuk seri 2.5 |
⚠️ Kedua parameter ini tidak bisa digunakan secara bersamaan! Jika dikirim bersamaan, API akan mengembalikan error 400.
| Skenario | Cara yang Benar | Cara yang Salah |
|---|---|---|
| Memanggil Gemini 3.1 Pro | Gunakan thinkingLevel: "MEDIUM" |
Gunakan thinkingBudget: 8192 |
| Memanggil Gemini 2.5 Pro | Gunakan thinkingBudget: 8192 |
Gunakan thinkingLevel: "MEDIUM" |
| Mengirim kedua parameter | — | Error 400 ❌ |
🎯 Tips Menghafal: Seri Gemini 3 → thinkingLevel (level dalam bentuk string), Seri Gemini 2.5 → thinkingBudget (jumlah token dalam bentuk angka). APIYI apiyi.com mendukung kedua format parameter ini.
Pertanyaan yang Sering Diajukan (FAQ)
Q1: Apa level default jika thinkingLevel tidak diatur?
Default-nya adalah HIGH. Ini berarti jika Anda tidak mengaturnya secara manual, setiap pemanggilan akan menggunakan seluruh kemampuan penalaran Deep Think Mini, yang mengonsumsi token berpikir paling banyak. Disarankan untuk mengatur level yang sesuai dengan kebutuhan tugas agar lebih hemat biaya. Melalui APIYI apiyi.com, Anda bisa mengontrolnya secara fleksibel di setiap request.
Q2: Bagaimana perhitungan biaya token berpikir? Apakah mahal?
Token berpikir dikenakan biaya dengan harga yang sama dengan token output ($12.00 / 1M tokens). Dalam mode HIGH, satu permintaan kompleks bisa menghabiskan 30 ribu+ token berpikir, dengan biaya sekitar $0.36. Sedangkan dalam mode LOW, permintaan yang sama mungkin hanya menghabiskan 1000 token berpikir, dengan biaya sekitar $0.012. Perbedaannya bisa mencapai 30 kali lipat.
Q3: Apakah MEDIUM di 3.1 Pro sama dengan HIGH di 3.0 Pro?
Hampir setara. Deskripsi dari Google menyatakan bahwa MEDIUM pada 3.1 Pro memberikan "pemikiran yang seimbang, cocok untuk menangani sebagian besar tugas", yang sejalan dengan posisi HIGH pada 3.0 Pro. Jika Anda bermigrasi dari 3.0 Pro ke 3.1 Pro, mengubah HIGH menjadi MEDIUM dapat menjaga kualitas dan biaya yang serupa. Melalui APIYI apiyi.com, Anda bisa memanggil kedua versi secara bersamaan untuk melakukan perbandingan.
Q4: Bisakah fitur berpikir ini dimatikan?
Gemini 3.1 Pro tidak bisa mematikan fitur berpikir sepenuhnya. Level terendah yang bisa diatur adalah LOW, dan model tetap akan melakukan penalaran dasar. Jika Anda membutuhkan respons tanpa proses berpikir sama sekali, Anda bisa mempertimbangkan mode MINIMAL pada Gemini 3 Flash.
Mispersepsi Umum Tingkat Berpikir (Thinking Level) Gemini 3.1 Pro
| Mispersepsi | Fakta |
|---|---|
| "Tingkat HIGH memberikan kualitas jawaban terbaik, jadi harus selalu digunakan" | Kualitas HIGH pada tugas sederhana hampir sama dengan MEDIUM, tetapi biayanya 5-10 kali lebih mahal |
| "Tingkat LOW memiliki kemampuan penalaran yang buruk" | LOW tetap lebih baik daripada model yang tidak berpikir sama sekali, hanya saja jumlah token berpikirnya lebih sedikit |
| "MEDIUM adalah fitur baru, mungkin tidak stabil" | Kedalaman penalaran MEDIUM ≈ HIGH pada versi 3.0 Pro lama, dan sudah teruji sepenuhnya |
| "Token berpikir tidak dikenakan biaya" | Dikenakan biaya! Dihitung dengan harga yang sama dengan token output ($12/MTok) |
| "Berpikir pada 3.1 Pro bisa dimatikan" | Tidak bisa, pengaturan terendah adalah LOW, yang tetap memiliki penalaran dasar |
| "thinkingLevel dan thinkingBudget bisa digunakan bersamaan" | Tidak bisa! Penggunaan bersamaan akan menghasilkan error 400 |
| "Mengatur tingkat tinggi akan menambah latensi, tetapi hasilnya langsung muncul" | Mode HIGH mungkin membutuhkan waktu beberapa menit sebelum mulai memberikan respons, bukan sekadar jeda singkat |
Ringkasan: Panduan Cepat Pemilihan Tingkat Berpikir Gemini 3.1 Pro
| Tingkat | Penjelasan Singkat | Skenario Penggunaan | Biaya Relatif |
|---|---|---|---|
| LOW | Paling cepat dan murah | Terjemahan, klasifikasi, ringkasan, pelengkapan (completion) | 1x |
| MEDIUM | Pilihan seimbang (Baru) | Coding, review, analisis, tanya jawab | 2-3x |
| HIGH | Deep Think Mini | Matematika, debugging, riset, Agent | 5-10x+ |
Rekomendasi Utama:
- Gunakan MEDIUM untuk pengembangan harian — Kualitas bagus, biaya masuk akal, setara dengan HIGH versi lama.
- Gunakan LOW untuk tugas sederhana — Menghemat 70%+ biaya token berpikir.
- Gunakan HIGH untuk penalaran mendalam — Kemampuan Deep Think Mini sangat unik, namun perhatikan biayanya.
- Default-nya adalah HIGH — Jika tidak diatur, maka akan masuk ke mode termahal, jadi ingatlah untuk menyesuaikannya secara manual.
Direkomendasikan untuk beralih tingkat berpikir secara dinamis berdasarkan jenis tugas melalui platform APIYI apiyi.com guna mencapai keseimbangan optimal antara kualitas dan biaya.
Referensi
-
Dokumen Google AI: Panduan Konfigurasi Berpikir Gemini
- Tautan:
ai.google.dev/gemini-api/docs/thinking - Deskripsi: Dokumentasi lengkap untuk parameter thinkingLevel
- Tautan:
-
Dokumen Google AI: Halaman Model Gemini 3.1 Pro
- Tautan:
ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview - Deskripsi: Matriks dukungan tingkat berpikir dan hal-hal yang perlu diperhatikan
- Tautan:
-
Halaman Harga Gemini API: Penjelasan Penagihan Token Berpikir
- Tautan:
ai.google.dev/gemini-api/docs/pricing - Deskripsi: Token berpikir ditagih sesuai dengan harga token output
- Tautan:
-
VentureBeat: Pengalaman Mendalam Deep Think Mini
- Tautan:
venturebeat.com/technology/google-gemini-3-1-pro-first-impressions - Deskripsi: Data pengujian nyata untuk penyelesaian soal IMO dalam waktu 8 menit
- Tautan:
-
Blog Resmi Google: Pengumuman Rilis Gemini 3.1 Pro
- Tautan:
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro - Deskripsi: Pengenalan resmi sistem berpikir tiga tingkat dan Deep Think Mini
- Tautan:
📝 Penulis: APIYI Team | Untuk diskusi teknis, kunjungi APIYI apiyi.com
📅 Tanggal Pembaruan: 20 Februari 2026
🏷️ Kata Kunci: Tingkat berpikir Gemini 3.1 Pro, thinkingLevel, Deep Think Mini, LOW MEDIUM HIGH, Panggilan API, Kontrol penalaran
