|

Bagaimana cara mengatur tingkat berpikir Gemini 3.1 Pro? Kontrol 3 tingkat + Panduan konfigurasi lengkap Deep Think Mini

Gemini 3.1 Pro Preview telah menambahkan level berpikir medium, yang merupakan salah satu perbedaan terbesar dibandingkan generasi sebelumnya, Gemini 3 Pro. Sekarang, Anda dapat mengontrol kedalaman penalaran model secara presisi di antara tiga level: low, medium, dan high, di mana mode high akan mengaktifkan kemampuan Deep Think Mini.

Nilai Inti: Setelah membaca artikel ini, Anda akan menguasai metode konfigurasi lengkap untuk parameter thinkingLevel, serta belajar menemukan keseimbangan optimal antara kualitas, kecepatan, dan biaya.

gemini-3-1-pro-preview-thinking-level-control-guide-id 图示


Matriks Dukungan Lengkap Level Berpikir Gemini 3.1 Pro

Mari kita lihat gambaran besarnya: model Gemini yang berbeda mendukung level berpikir yang berbeda pula.

Level Berpikir Gemini 3.1 Pro Gemini 3 Pro Gemini 3 Flash Keterangan
minimal ❌ Tidak mendukung ❌ Tidak mendukung ✅ Mendukung Mendekati penonaktifan penalaran, hanya didukung Flash
low ✅ Mendukung ✅ Mendukung ✅ Mendukung Respon cepat, biaya terendah
medium Dukungan Baru ❌ Tidak mendukung ✅ Mendukung Penalaran seimbang, upgrade inti dari 3.1 Pro
high ✅ Mendukung (default) ✅ Mendukung (default) ✅ Mendukung (default) Penalaran terdalam, mengaktifkan Deep Think Mini

Perubahan Kunci: Upgrade Level Berpikir dari 3 Pro → 3.1 Pro

Perbandingan Gemini 3 Pro Gemini 3.1 Pro
Level yang tersedia low, high (hanya 2 level) low, medium, high (3 level)
Level default high high
Arti mode high Penalaran mendalam Deep Think Mini (lebih kuat)
Bisakah menonaktifkan penalaran Tidak bisa Tidak bisa

Pemahaman Inti: Kedalaman penalaran high pada Gemini 3 Pro ≈ medium pada Gemini 3.1 Pro. Sedangkan high pada 3.1 Pro adalah Deep Think Mini yang benar-benar baru, dengan kedalaman penalaran yang jauh melampaui generasi sebelumnya.

🎯 Saran Migrasi: Jika sebelumnya Anda menggunakan mode high pada Gemini 3 Pro, disarankan untuk mencoba level medium terlebih dahulu setelah beralih ke 3.1 Pro (untuk menjaga kualitas dan biaya yang serupa), dan hanya aktifkan high saat membutuhkan penalaran yang sangat mendalam. APIYI (apiyi.com) mendukung semua model Gemini dan level berpikir secara bersamaan.


Metode Pengaturan API Level Berpikir Gemini 3.1 Pro

Panggil melalui APIYI (Format Kompatibel OpenAI)

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Interface terpadu APIYI
)

# Mode LOW: Respons cepat
response_low = client.chat.completions.create(
    model="gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Terjemahkan teks Inggris ini ke Bahasa Indonesia: Hello World"}],
    extra_body={
        "thinking": {"type": "enabled", "budget_tokens": 1024}
    }
)

# Mode MEDIUM: Penalaran seimbang (Baru!)
response_med = client.chat.completions.create(
    model="gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Tinjau apakah kode ini memiliki risiko kebocoran memori"}],
    extra_body={
        "thinking": {"type": "enabled", "budget_tokens": 8192}
    }
)

# Mode HIGH: Deep Think Mini
response_high = client.chat.completions.create(
    model="gemini-3.1-pro-preview",
    messages=[{"role": "user", "content": "Buktikan: Untuk semua bilangan bulat positif n, n^3-n dapat dibagi habis oleh 6"}],
    extra_body={
        "thinking": {"type": "enabled", "budget_tokens": 32768}
    }
)

Panggilan Native melalui Google SDK

from google import genai
from google.genai import types

client = genai.Client()

# Gunakan parameter thinkingLevel
response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="petunjuk Anda",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(
            thinking_level="MEDIUM"  # "LOW" / "MEDIUM" / "HIGH"
        )
    ),
)

# Lihat konsumsi token pemikiran
print(f"Token pemikiran: {response.usage_metadata.thoughts_token_count}")
print(f"Token output: {response.usage_metadata.candidates_token_count}")

Panggilan REST API

POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent

{
  "contents": [{"parts": [{"text": "petunjuk Anda"}]}],
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "MEDIUM"
    }
  }
}

⚠️ Peringatan Penting: thinkingLevel dan thinkingBudget tidak dapat digunakan secara bersamaan, jika tidak, akan mengembalikan error 400. Untuk model Gemini 3+, direkomendasikan menggunakan thinkingLevel, sedangkan untuk model Gemini 2.5 menggunakan thinkingBudget.


Perbandingan Detail 3 Level Berpikir Gemini 3.1 Pro

LOW: Tercepat dan Termurah

Dimensi Detail
Kedalaman Penalaran Token pemikiran paling sedikit, namun tetap lebih baik daripada model tanpa fitur berpikir
Kecepatan Respons Dalam hitungan detik (tercepat)
Biaya Terendah (token pemikiran sedikit → token output sedikit → biaya rendah)
Skenario Penggunaan Auto-complete, klasifikasi, ekstraksi data terstruktur, terjemahan sederhana, ringkasan
Tidak Cocok Untuk Penalaran kompleks, pembuktian matematika, debugging multi-langkah

MEDIUM: Pilihan Seimbang (Baru)

Dimensi Detail
Kedalaman Penalaran Token pemikiran menengah, ≈ level high pada versi 3.0 Pro lama
Kecepatan Respons Latensi menengah
Biaya Menengah
Skenario Penggunaan Tinjauan kode, analisis dokumen, coding harian, panggilan API standar, tanya jawab
Tidak Cocok Untuk Matematika tingkat IMO, penalaran multi-langkah yang sangat kompleks

HIGH: Deep Think Mini (Default)

Dimensi Detail
Kedalaman Penalaran Penalaran maksimal, mengaktifkan kemampuan Deep Think Mini
Kecepatan Respons Mungkin membutuhkan beberapa menit (soal IMO ~8 menit)
Biaya Tertinggi (banyak token pemikiran ditagih sesuai harga output)
Skenario Penggunaan Debugging kompleks, desain algoritma, pembuktian matematika, tugas penelitian, alur kerja Agent
Kemampuan Khusus Tanda tangan pemikiran (thought signatures) menjaga kontinuitas penalaran di berbagai panggilan API

gemini-3-1-pro-preview-thinking-level-control-guide-id 图示


Aturan Penagihan Token Berpikir Gemini 3.1 Pro

Memahami skema penagihan adalah kunci dalam memilih tingkat berpikir (thinking level) yang tepat.

Prinsip Utama Penagihan

Item Penagihan Keterangan
Apakah token berpikir dikenakan biaya? Ya, dikenakan biaya dengan harga yang sama dengan token output
Harga token output $12.00 / 1 juta token (termasuk token berpikir)
Basis penagihan Dihitung berdasarkan rantai penalaran internal yang lengkap, bukan hanya ringkasannya saja
Ringkasan pemikiran API hanya mengembalikan ringkasan pemikiran, tetapi biaya dihitung berdasarkan jumlah total token berpikir yang dihasilkan

Penjelasan resmi dari Google:

"Model berpikir menghasilkan pemikiran lengkap untuk meningkatkan kualitas respons akhir, lalu mengeluarkan ringkasan untuk memberikan wawasan tentang proses berpikir tersebut. Harga didasarkan pada total token pemikiran yang perlu dihasilkan model untuk membuat ringkasan, meskipun hanya ringkasannya saja yang dikeluarkan dari API."

Estimasi Biaya untuk Tiga Tingkatan

Tingkat Estimasi Token Berpikir Per 1.000 Panggilan Tren Biaya Bulanan
LOW ~500-2K / panggilan $6-24 Terendah
MEDIUM ~2K-8K / panggilan $24-96 Menengah
HIGH ~8K-32K+ / panggilan $96-384+ Lebih tinggi, lebih banyak untuk tugas kompleks

💰 Optimasi Biaya: Tidak semua permintaan membutuhkan level HIGH. Mengatur 80% tugas harian ke LOW atau MEDIUM, dan hanya menggunakan HIGH untuk 20% tugas yang benar-benar kompleks, dapat mengurangi pengeluaran API sebesar 50-70%. Anda dapat mengonfigurasi ini secara fleksibel melalui platform APIYI apiyi.com.


Panduan Pencocokan Jenis Tugas dengan Tingkat Berpikir Gemini 3.1 Pro

Rekomendasi Skenario Detail

Jenis Tugas Tingkat Rekomendasi Alasan Estimasi Latensi
Terjemahan sederhana LOW Tidak butuh penalaran mendalam < 5 detik
Klasifikasi teks LOW Tugas pencocokan pola < 5 detik
Ekstraksi ringkasan LOW Kompresi informasi, bukan penalaran < 10 detik
Auto-complete LOW Sensitif terhadap latensi < 3 detik
Code review MEDIUM Butuh analisis moderat 10-30 detik
Tanya jawab dokumen MEDIUM Pemahaman + Jawaban 10-30 detik
Coding harian MEDIUM Pembuatan kode rutin 15-40 detik
Analisis Bug MEDIUM Penalaran kompleksitas menengah 20-40 detik
Debugging kompleks HIGH Rantai penalaran multi-langkah 1-5 menit
Pembuktian matematika HIGH Deep Think Mini 3-8 menit
Desain algoritma HIGH Penalaran mendalam 2-5 menit
Analisis riset HIGH Analisis mendalam multi-dimensi 2-5 menit
Workflow Agent HIGH Menjaga kontinuitas signature pemikiran Tergantung tugas

Pemilihan Tingkat Dinamis: Contoh Kode Praktis

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Interface terpadu APIYI
)

# Pilih tingkat berpikir secara otomatis berdasarkan jenis tugas
THINKING_CONFIG = {
    "simple":  {"type": "enabled", "budget_tokens": 1024},   # LOW
    "medium":  {"type": "enabled", "budget_tokens": 8192},   # MEDIUM
    "complex": {"type": "enabled", "budget_tokens": 32768},  # HIGH
}

def smart_think(prompt, complexity="medium"):
    """Atur tingkat berpikir secara otomatis berdasarkan kompleksitas tugas"""
    return client.chat.completions.create(
        model="gemini-3.1-pro-preview",
        messages=[{"role": "user", "content": prompt}],
        extra_body={"thinking": THINKING_CONFIG[complexity]}
    )

# Terjemahan sederhana → LOW
resp1 = smart_think("Terjemahkan: Good morning", "simple")

# Code review → MEDIUM
resp2 = smart_think("Tinjau keamanan kode ini: ...", "medium")

# Pembuktian matematika → HIGH (Deep Think Mini)
resp3 = smart_think("Buktikan kasus khusus dari Hipotesis Riemann", "complex")

Gemini 3.1 Pro vs 3 Pro: Evolusi Tingkat Berpikir (Thinking Level)

gemini-3-1-pro-preview-thinking-level-control-guide-id 图示


Di Mana Letak Kehebatan Deep Think Mini?

Deep Think Mini yang diaktifkan melalui mode HIGH pada Gemini 3.1 Pro adalah sorotan utama dari pembaruan kali ini.

Apa Itu Deep Think Mini?

Deep Think Mini bukanlah model yang berdiri sendiri, melainkan mode penalaran khusus dari Gemini 3.1 Pro di bawah tingkat berpikir HIGH. Google mendeskripsikannya sebagai "versi mini dari Gemini Deep Think" — Deep Think adalah model penalaran berat khusus milik Google (skor ARC-AGI-2 mencapai 84,6%).

Performa Nyata Deep Think Mini

Item Pengujian Deep Think Mini (3.1 Pro HIGH) Gemini 3 Pro HIGH Tingkat Peningkatan
ARC-AGI-2 77.1% 31.1% +148%
Soal Matematika IMO Selesai dalam ~8 menit Tidak dapat diselesaikan Dari tidak bisa menjadi bisa
Tugas Perencanaan Kompleks Peningkatan benchmark 40-60% Dibandingkan dengan Gemini 2.5 Pro Peningkatan signifikan

Tanda Tangan Pemikiran (Thought Signatures)

Deep Think Mini memperkenalkan teknologi unik: thought signatures. Ini adalah representasi status penalaran menengah yang terenkripsi dan tahan manipulasi.

Dalam alur kerja Agent, penalaran model sering kali mencakup beberapa panggilan API. Thought signatures dapat meneruskan konteks penalaran dari panggilan sebelumnya ke panggilan berikutnya, menjaga kontinuitas penalaran. Ini sangat penting untuk tugas Agent yang melibatkan banyak langkah.

Tugas Apa yang Layak Menggunakan Deep Think Mini?

Layak Menggunakan HIGH (Deep Think Mini) Tidak Perlu Menggunakan HIGH
Penalaran tingkat kompetisi matematika Operasi aritmatika dasar
Debugging bug kompleks lintas file Perbaikan kesalahan sintaksis
Desain dan optimasi algoritma Pembuatan kode CRUD
Analisis metodologi jurnal akademik Ringkasan artikel
Tugas panjang Agent multi-langkah Tanya jawab satu putaran
Analisis mendalam celah keamanan Konversi format

💡 Saran Praktis: Kehebatan Deep Think Mini ada harganya — latensi dan biayanya cukup tinggi. Disarankan untuk menggunakan HIGH hanya pada tugas yang benar-benar membutuhkan "pemikiran mendalam", sedangkan untuk tugas sehari-hari, mode MEDIUM sudah cukup. Melalui APIYI apiyi.com, Anda dapat beralih secara fleksibel di setiap level permintaan.


thinkingLevel vs thinkingBudget: Jangan Sampai Tertukar

Google memiliki dua parameter untuk mengontrol proses berpikir (reasoning), yang berlaku untuk seri model yang berbeda:

Parameter Model yang Didukung Tipe Nilai Penjelasan
thinkingLevel Gemini 3+ (3 Flash, 3 Pro, 3.1 Pro) Enum: MINIMAL/LOW/MEDIUM/HIGH Direkomendasikan untuk seri Gemini 3
thinkingBudget Gemini 2.5 (Pro, Flash, Flash Lite) Integer: 0-32768 Berlaku untuk seri 2.5

⚠️ Kedua parameter ini tidak bisa digunakan secara bersamaan! Jika dikirim bersamaan, API akan mengembalikan error 400.

Skenario Cara yang Benar Cara yang Salah
Memanggil Gemini 3.1 Pro Gunakan thinkingLevel: "MEDIUM" Gunakan thinkingBudget: 8192
Memanggil Gemini 2.5 Pro Gunakan thinkingBudget: 8192 Gunakan thinkingLevel: "MEDIUM"
Mengirim kedua parameter Error 400 ❌

🎯 Tips Menghafal: Seri Gemini 3 → thinkingLevel (level dalam bentuk string), Seri Gemini 2.5 → thinkingBudget (jumlah token dalam bentuk angka). APIYI apiyi.com mendukung kedua format parameter ini.


Pertanyaan yang Sering Diajukan (FAQ)

Q1: Apa level default jika thinkingLevel tidak diatur?

Default-nya adalah HIGH. Ini berarti jika Anda tidak mengaturnya secara manual, setiap pemanggilan akan menggunakan seluruh kemampuan penalaran Deep Think Mini, yang mengonsumsi token berpikir paling banyak. Disarankan untuk mengatur level yang sesuai dengan kebutuhan tugas agar lebih hemat biaya. Melalui APIYI apiyi.com, Anda bisa mengontrolnya secara fleksibel di setiap request.

Q2: Bagaimana perhitungan biaya token berpikir? Apakah mahal?

Token berpikir dikenakan biaya dengan harga yang sama dengan token output ($12.00 / 1M tokens). Dalam mode HIGH, satu permintaan kompleks bisa menghabiskan 30 ribu+ token berpikir, dengan biaya sekitar $0.36. Sedangkan dalam mode LOW, permintaan yang sama mungkin hanya menghabiskan 1000 token berpikir, dengan biaya sekitar $0.012. Perbedaannya bisa mencapai 30 kali lipat.

Q3: Apakah MEDIUM di 3.1 Pro sama dengan HIGH di 3.0 Pro?

Hampir setara. Deskripsi dari Google menyatakan bahwa MEDIUM pada 3.1 Pro memberikan "pemikiran yang seimbang, cocok untuk menangani sebagian besar tugas", yang sejalan dengan posisi HIGH pada 3.0 Pro. Jika Anda bermigrasi dari 3.0 Pro ke 3.1 Pro, mengubah HIGH menjadi MEDIUM dapat menjaga kualitas dan biaya yang serupa. Melalui APIYI apiyi.com, Anda bisa memanggil kedua versi secara bersamaan untuk melakukan perbandingan.

Q4: Bisakah fitur berpikir ini dimatikan?

Gemini 3.1 Pro tidak bisa mematikan fitur berpikir sepenuhnya. Level terendah yang bisa diatur adalah LOW, dan model tetap akan melakukan penalaran dasar. Jika Anda membutuhkan respons tanpa proses berpikir sama sekali, Anda bisa mempertimbangkan mode MINIMAL pada Gemini 3 Flash.


Mispersepsi Umum Tingkat Berpikir (Thinking Level) Gemini 3.1 Pro

Mispersepsi Fakta
"Tingkat HIGH memberikan kualitas jawaban terbaik, jadi harus selalu digunakan" Kualitas HIGH pada tugas sederhana hampir sama dengan MEDIUM, tetapi biayanya 5-10 kali lebih mahal
"Tingkat LOW memiliki kemampuan penalaran yang buruk" LOW tetap lebih baik daripada model yang tidak berpikir sama sekali, hanya saja jumlah token berpikirnya lebih sedikit
"MEDIUM adalah fitur baru, mungkin tidak stabil" Kedalaman penalaran MEDIUM ≈ HIGH pada versi 3.0 Pro lama, dan sudah teruji sepenuhnya
"Token berpikir tidak dikenakan biaya" Dikenakan biaya! Dihitung dengan harga yang sama dengan token output ($12/MTok)
"Berpikir pada 3.1 Pro bisa dimatikan" Tidak bisa, pengaturan terendah adalah LOW, yang tetap memiliki penalaran dasar
"thinkingLevel dan thinkingBudget bisa digunakan bersamaan" Tidak bisa! Penggunaan bersamaan akan menghasilkan error 400
"Mengatur tingkat tinggi akan menambah latensi, tetapi hasilnya langsung muncul" Mode HIGH mungkin membutuhkan waktu beberapa menit sebelum mulai memberikan respons, bukan sekadar jeda singkat

Ringkasan: Panduan Cepat Pemilihan Tingkat Berpikir Gemini 3.1 Pro

Tingkat Penjelasan Singkat Skenario Penggunaan Biaya Relatif
LOW Paling cepat dan murah Terjemahan, klasifikasi, ringkasan, pelengkapan (completion) 1x
MEDIUM Pilihan seimbang (Baru) Coding, review, analisis, tanya jawab 2-3x
HIGH Deep Think Mini Matematika, debugging, riset, Agent 5-10x+

Rekomendasi Utama:

  1. Gunakan MEDIUM untuk pengembangan harian — Kualitas bagus, biaya masuk akal, setara dengan HIGH versi lama.
  2. Gunakan LOW untuk tugas sederhana — Menghemat 70%+ biaya token berpikir.
  3. Gunakan HIGH untuk penalaran mendalam — Kemampuan Deep Think Mini sangat unik, namun perhatikan biayanya.
  4. Default-nya adalah HIGH — Jika tidak diatur, maka akan masuk ke mode termahal, jadi ingatlah untuk menyesuaikannya secara manual.

Direkomendasikan untuk beralih tingkat berpikir secara dinamis berdasarkan jenis tugas melalui platform APIYI apiyi.com guna mencapai keseimbangan optimal antara kualitas dan biaya.


Referensi

  1. Dokumen Google AI: Panduan Konfigurasi Berpikir Gemini

    • Tautan: ai.google.dev/gemini-api/docs/thinking
    • Deskripsi: Dokumentasi lengkap untuk parameter thinkingLevel
  2. Dokumen Google AI: Halaman Model Gemini 3.1 Pro

    • Tautan: ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview
    • Deskripsi: Matriks dukungan tingkat berpikir dan hal-hal yang perlu diperhatikan
  3. Halaman Harga Gemini API: Penjelasan Penagihan Token Berpikir

    • Tautan: ai.google.dev/gemini-api/docs/pricing
    • Deskripsi: Token berpikir ditagih sesuai dengan harga token output
  4. VentureBeat: Pengalaman Mendalam Deep Think Mini

    • Tautan: venturebeat.com/technology/google-gemini-3-1-pro-first-impressions
    • Deskripsi: Data pengujian nyata untuk penyelesaian soal IMO dalam waktu 8 menit
  5. Blog Resmi Google: Pengumuman Rilis Gemini 3.1 Pro

    • Tautan: blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro
    • Deskripsi: Pengenalan resmi sistem berpikir tiga tingkat dan Deep Think Mini

📝 Penulis: APIYI Team | Untuk diskusi teknis, kunjungi APIYI apiyi.com
📅 Tanggal Pembaruan: 20 Februari 2026
🏷️ Kata Kunci: Tingkat berpikir Gemini 3.1 Pro, thinkingLevel, Deep Think Mini, LOW MEDIUM HIGH, Panggilan API, Kontrol penalaran

Similar Posts