|

Interpretasi Mendalam ARIS-Code: 5 Langkah Membangun Alur Kerja Penelitian Otomatis dengan Model Claude

Proyek sumber terbuka di GitHub bernama ARIS-Code baru-baru ini menarik perhatian dengan meraih 8.400+ bintang dan 783 fork. Proyek yang dikembangkan oleh wanshuiyin ini merupakan iterasi dari versi open-source Claude Code. Nama lengkapnya adalah Auto-Research-In-Sleep, yang secara harfiah berarti "melakukan riset sambil tidur". Ini bukan sekadar jargon pemasaran—alat ini benar-benar memungkinkan Claude Code untuk menjalankan eksperimen, mencari literatur, dan merevisi makalah secara otomatis saat Anda tidur, sehingga saat bangun, progres pekerjaan Anda sudah jauh lebih maju.

Diskusi mengenai ARIS-Code di kalangan akademisi sangat menarik untuk disimak: tiga contoh makalah komunitas yang dipublikasikan oleh penulis proyek menunjukkan bahwa draf yang dihasilkan mencapai skor penilaian AI sebesar 7-8/10. Makalah-makalah tersebut telah dikirimkan ke konferensi CS tingkat atas, AAAI 2026, dan IEEE TGRS. Ini membuktikan bahwa riset otomatis berbasis AI bukan lagi sekadar demo, melainkan sudah mampu menghasilkan draf yang layak untuk disubmit.

Artikel ini akan membedah secara mendalam arsitektur inti ARIS-Code, 42 skill bawaan, serta cara mengakses model Claude di lingkungan domestik melalui layanan proksi API pihak ketiga, guna membantu Anda menentukan apakah alat ini cocok untuk alur kerja penelitian Anda.

🎯 Catatan Khusus: Karena ARIS-Code merupakan iterasi dari versi open-source Claude Code, eksekutornya hanya dapat mengakses model seri Claude (Sonnet/Opus/Haiku). Tidak mendukung GPT atau seri Gemini sebagai eksekutor utama. Kami menyarankan untuk mengakses model Claude melalui platform APIYI (apiyi.com). Platform ini kompatibel dengan protokol asli Anthropic, stabil untuk akses domestik, menggunakan sistem bayar sesuai pemakaian (pay-as-you-go), dan tidak memerlukan kartu kredit luar negeri.

Apa itu ARIS-Code: Proyek Auto-Research-In-Sleep

ARIS (Auto-Research-In-Sleep) adalah sistem alur kerja riset otonom yang ditujukan bagi peneliti ML/AI. Alamat proyeknya ada di GitHub: github.com/wanshuiyin/Auto-claude-code-research-in-sleep. Tujuan desainnya sangat jelas: memungkinkan peneliti menyelesaikan seluruh alur kerja—mulai dari tinjauan literatur, pembuatan ide, pelaksanaan eksperimen, penulisan makalah, hingga penanganan rebuttal—dengan intervensi manusia seminimal mungkin, sehingga peneliti terbebas dari pekerjaan fisik yang repetitif.

Inti dari ARIS-Code adalah perpustakaan metodologi. Seluruh sistem terdiri dari file Markdown murni (SKILL.md) tanpa kerangka kerja yang perlu diinstal, tanpa basis data yang perlu dikelola, dan tanpa Docker yang perlu dikonfigurasi. Setiap skill adalah instruksi alur kerja yang dapat dibaca oleh agen LLM mana pun. Oleh karena itu, Anda dapat mengganti eksekutor dari Claude Code ke Codex CLI, OpenClaw, Cursor, Trae, atau alat lain yang mendukung mode agen, dan alur kerjanya akan tetap berfungsi.

Desain "tanpa ketergantungan dan tanpa penguncian" (zero-dependency, zero-lock-in) inilah yang menjadi fitur pembeda utama ARIS-Code dibandingkan alat AI riset lainnya. Pada dasarnya, sistem ini mengubah alur kerja riset menjadi rekayasa petunjuk yang dapat dieksekusi, bukan membungkusnya ke dalam alat kotak hitam. Hal ini sangat penting bagi peneliti karena berarti alur kerja tersebut dapat dibaca, dimodifikasi, dan dipindahkan, bukan terikat pada produk komersial tertentu.

Perlu disebutkan bahwa repositori ARIS-Code telah mengumpulkan 719 commit dan proyek ini masih terus berkembang pesat. Dalam tiga bulan terakhir, telah ditambahkan berbagai skill bernilai tinggi seperti paper-talk (pembuatan naskah presentasi konferensi), resubmit-pipeline (alur kerja pengiriman ulang setelah penolakan), dan kill-argument (pembuatan sanggahan adversarial), yang membuat ekosistemnya sangat aktif.

aris-code-claude-research-guide-id 图示

Arsitektur Inti ARIS-Code: Konfrontasi Dua Model Executor-Reviewer

Nilai rekayasa paling krusial dari ARIS-Code terletak pada arsitektur konfrontasi dua model, yang menjadi pembeda mendasar antara alat ini dengan asisten riset lainnya di pasaran. Penulis proyek ini mengajukan pengamatan yang sangat mendalam di README-nya: swa-tinjau (self-review) oleh satu model memiliki kelemahan struktural. Karena model yang sama menjalankan tugas sekaligus meninjau hasilnya, ia akan secara sistematis mereplikasi titik butanya sendiri, sehingga terjebak dalam perangkap optimal lokal.

aris-code-claude-research-guide-id 图示

Solusi yang diberikan ARIS-Code adalah menyerahkan wewenang peninjauan kepada model yang sepenuhnya independen. Pembagian peran spesifiknya adalah sebagai berikut:

Peran Pemilihan Model Penentuan Tugas Kecenderungan Kemampuan
Executor (Pelaksana) Claude Sonnet / Opus Eksekusi utama: menulis kode, riset literatur, menjalankan eksperimen, draf makalah Kecepatan tinggi, jendela konteks panjang, pemanggilan alat stabil
Reviewer (Peninjau) GPT-5.4 (Codex MCP) / Oracle Pro Peninjauan konfrontatif: mencari celah, mempertanyakan kesimpulan, mengajukan kontra-argumen Penalaran mendalam, kritis, gaya independen
Mekanisme Koordinasi Rantai alat LlmReview Komunikasi lintas model, persistensi status Transmisi transparan protokol MCP

Seluruh alur kerja dapat diringkas menjadi siklus sederhana: Executor menulis → Reviewer meninjau → Executor memperbaiki → ditinjau dan diperbaiki lagi, hingga Reviewer memberikan keputusan lolos. Siklus ini efektif karena kedua model berasal dari vendor yang berbeda, data pelatihan yang berbeda, dan gaya penalaran yang berbeda, sehingga titik buta mereka tidak akan tumpang tindih.

Untuk mencegah polusi halusinasi LLM terhadap kesimpulan riset, ARIS-Code juga merancang rantai audit bukti berlapis: experiment-audit (integritas kode) → result-to-claim (hasil ke pernyataan) → paper-claim-audit (audit pernyataan makalah) → citation-audit (verifikasi kutipan). Setiap lapisan memiliki verdict JSON independen dan hash SHA256 untuk verifikasi reproduktifitas, ketelitian rekayasa semacam ini cukup langka di alat AI riset.

🔧 Saran Konfigurasi: Jika Anda ingin mereplikasi arsitektur dua model ARIS-Code secara lengkap, di lingkungan domestik disarankan untuk menggunakan APIYI apiyi.com guna mendapatkan kunci API model Claude dan GPT secara bersamaan. Satu platform menangani dua set antarmuka, sehingga Anda tidak perlu membuka akun luar negeri dan menautkan kartu kredit secara terpisah.

ARIS-Code Memiliki 42 Skills untuk Seluruh Alur Kerja Riset

Hal yang paling mengesankan dari ARIS-Code adalah 42+ Skills bawaannya. Skill ini bukanlah alat kecil yang terisolasi, melainkan alur kerja yang mencakup seluruh siklus hidup riset. Saya mengategorikannya berdasarkan tahap alur kerja sebagai berikut:

Tahap Alur Kerja Skill Utama Kemampuan Inti
Tahap Pemilihan Topik (Idea Discovery) research-lit / novelty-check / idea-creator / idea-discovery Pencarian literatur multi-sumber, verifikasi kebaruan lintas model, pembuatan 8-12 ide kandidat
Tahap Eksperimen (Experimentation) experiment-bridge / experiment-queue / run-experiment Tinjauan kode → deployment GPU → orkestrasi multi-seed → penanganan otomatis OOM
Peninjauan Otomatis (Auto Review) auto-review-loop / research-review / experiment-audit 4 putaran perbaikan iteratif, tinjauan sejawat terstruktur, verifikasi integritas kode
Penulisan Makalah (Paper Writing) paper-writing / paper-claim-audit / proof-checker / citation-audit Narasi → LaTeX → PDF, audit pernyataan, pengecekan pembuktian, verifikasi kutipan
Penanganan Rebuttal rebuttal Analisis komentar peninjau → draf balasan → pengujian tekanan
Meta-kemampuan research-wiki / meta-optimize / deepxiv Basis pengetahuan persisten, optimasi loop luar, sumber literatur alternatif

Skill dengan nilai praktis paling tinggi adalah experiment-bridge, yang menghubungkan "tinjauan kode → deployment jarak jauh GPU → peluncuran eksperimen → pengambilan hasil" menjadi satu alur kerja. Ketika Reviewer mengusulkan "di sini perlu dilakukan eksperimen ablasi", Executor akan secara otomatis menulis skrip, melakukan rsync ke node GPU, memulai pelatihan, memantau log, dan mengumpulkan hasil. Seluruh proses tidak memerlukan intervensi manual dari peneliti.

Hal lain yang patut diperhatikan adalah Skill citation-audit. Dengan menghubungkan basis data nyata DBLP dan CrossRef, skill ini menghilangkan masalah terbesar saat LLM menulis makalah, yaitu halusinasi kutipan. Setiap BibTeX berasal dari basis data nyata, bukan karangan model sendiri. Ini adalah persyaratan dasar untuk penulisan akademik; kutipan fiktif apa pun dapat menyebabkan makalah langsung ditolak.

Peneliti juga sangat menghargai research-wiki, basis pengetahuan persisten lintas sesi. Alat ini mengakumulasi catatan bacaan makalah, draf ide, dan catatan eksperimen yang gagal dari peneliti di berbagai proyek, membentuk memori riset pribadi yang terus berkembang. Saat Anda kembali ke arah riset yang sempat tertunda tiga bulan kemudian, Anda tidak perlu membaca ulang semua makalah terkait; asisten AI telah menyimpan konteksnya untuk Anda.

💡 Tips Penggunaan: Memanggil Skill apa pun akan menghabiskan banyak Token API Claude, terutama untuk tugas pembuatan teks panjang seperti paper-writing. Kami menyarankan untuk mengakses model Claude melalui apiyi.com. Platform ini mendukung penagihan sesuai penggunaan (pay-as-you-go) dan menyediakan pemantauan penggunaan token yang lengkap, sehingga memudahkan Anda memperkirakan biaya per makalah.

Panduan Konfigurasi Lengkap Menghubungkan ARIS-Code ke APIYI

Karena eksekutor ARIS-Code dikembangkan berdasarkan versi open-source Claude Code, ia hanya menerima protokol API asli Anthropic. Artinya, model seri GPT dan Gemini tidak dapat digunakan sebagai Eksekutor. Ini adalah batasan teknis yang kaku dan sering menjadi titik kebingungan utama bagi pengembang saat pertama kali melakukan deployment.

Langkah-langkah untuk menghubungkan model Claude melalui APIYI sangat ringkas dan dapat diringkas dalam 5 langkah berikut:

# Langkah 1: Clone repositori proyek
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
cd Auto-claude-code-research-in-sleep

# Langkah 2: Instal Skills ke direktori konfigurasi Claude Code lokal
mkdir -p ~/.claude/skills/
cp -r skills/* ~/.claude/skills/

# Langkah 3: Konfigurasi alamat proksi APIYI (Langkah inti)
export ANTHROPIC_BASE_URL="https://vip.apiyi.com"
export ANTHROPIC_AUTH_TOKEN="Kunci APIYI Anda"

# Langkah 4: Jalankan Claude Code
claude

# Langkah 5: Panggil Skill apa pun di dalam Claude Code
# Contoh: /research-pipeline "factorized gap in discrete diffusion LMs"

Bagian terpenting di sini adalah langkah ke-3, yaitu mengatur variabel lingkungan ANTHROPIC_BASE_URL. Ini memberi tahu Claude Code agar tidak meminta ke titik akhir resmi Anthropic, melainkan ke gerbang proksi. Antarmuka gerbang ini sepenuhnya kompatibel dengan protokol asli Anthropic. Skill yang tertanam di dalam ARIS-Code tidak memerlukan modifikasi kode apa pun; semua fitur termasuk pemanggilan alat, streaming output, dan rantai pemikiran (thinking) dapat diteruskan secara transparan.

Jika Anda juga perlu men-deploy sisi Reviewer (Codex MCP), prosedurnya adalah:

# Instal Codex MCP untuk sisi peninjauan
npm install -g @openai/codex
codex setup  # Di sini Anda juga bisa mengisi alamat proksi untuk model GPT
claude mcp add codex -s user -- codex mcp-server

Bagi peneliti yang ingin mereplikasi efek tingkat makalah ARIS-Code sepenuhnya, proyek ini juga menyediakan skema akses Oracle MCP ke GPT-5.4 Pro sebagai Reviewer tingkat lanjut. Skema ini sangat berguna selama tahap akhir penulisan makalah yang serius, karena kedalaman kritik dan kemampuan konstruksi contoh tandingan versi Pro jauh lebih unggul dibandingkan versi dasar.

🚀 Solusi Akses Terpadu: Platform APIYI (apiyi.com) mendukung model utama seperti seri Claude (Sonnet 4.5/Opus 4), seri GPT (GPT-5/o4), dan seri Gemini (Gemini 3 Pro) secara bersamaan. Satu kunci dapat menggerakkan sisi Eksekutor dan Reviewer ARIS-Code, yang sangat memudahkan manajemen biaya dan pengumpulan catatan pemanggilan bagi tim peneliti.

Tingkat Upaya (Effort Levels) ARIS-Code dan Strategi Konfigurasi GPU

ARIS-Code menyediakan 4 tingkat Effort Level untuk menyeimbangkan biaya dan kualitas, yang merupakan desain yang sangat teknis. Tahap penelitian yang berbeda memiliki kebutuhan kedalaman yang sangat bervariasi; pada tahap eksplorasi awal tidak perlu membuang token, sedangkan pada tahap akhir pengajuan makalah, kualitas harus didorong hingga maksimal.

aris-code-claude-research-guide-id 图示

Effort Level Pengali Token Skenario Penggunaan Estimasi per Panggilan
lite 0.4× Eksplorasi cepat, validasi ide Sangat rendah
balanced 1.0× Alur penelitian harian standar Standar
max 2.5× Tahap eksperimen makalah serius Menengah-tinggi
beast 5-8× Pengejaran konferensi top, Mode Submission Tinggi

Untuk sisi GPU, ARIS-Code juga memberikan 4 opsi konfigurasi yang mengakomodasi pengguna lokal maupun pengguna cloud:

Konfigurasi GPU Skenario Penggunaan Karakteristik Biaya
local Peneliti dengan GPU lokal Biaya perangkat keras sekali bayar
remote Server SSH laboratorium Gratis menggunakan sumber daya kampus
vast Pelatihan intensitas tinggi jangka pendek Penagihan per jam, fleksibel
modal Tugas ringan berkala Serverless, kuota gratis 30 USD

💰 Saran Kontrol Biaya: Jika Anda baru mulai mencoba ARIS-Code, disarankan untuk menggunakan lite + local terlebih dahulu untuk menjalankan alur kerja, dan gunakan proksi apiyi.com untuk pemanggilan model agar mudah menghitung penggunaan token. Setelah alur kerja stabil, baru tingkatkan ke mode max atau beast untuk penelitian serius guna menghindari biaya token yang mahal akibat kesalahan konfigurasi di awal.

Alur Kerja Praktis ARIS-Code: Dari Satu Kalimat Menjadi Sebuah Makalah

Hal yang paling memukau dari ARIS-Code adalah pipeline ujung-ke-ujung /research-pipeline miliknya. Skill ini merangkai semua tahapan di atas menjadi satu perintah tunggal. Anda hanya perlu memberikan deskripsi arah penelitian, dan sistem akan secara otomatis menghasilkan draf awal dalam waktu 8-24 jam.

Cara pemanggilan yang umum adalah sebagai berikut:

# Skenario 1: Arah baru, mulai dari nol
/research-pipeline "factorized gap in discrete diffusion LMs"

# Skenario 2: Meningkatkan makalah yang sudah ada
/research-pipeline "improve method X" \
  --ref-paper https://arxiv.org/abs/2406.04329 \
  --base-repo https://github.com/org/project

# Skenario 3: Hanya untuk Rebuttal
/rebuttal "paper/ + reviews" --venue ICML --char-limit 5000

Saat dijalankan, ARIS-Code akan mengikuti langkah-langkah sistematis: tinjauan pustaka → pembuatan ide → pemeriksaan kebaruan → desain eksperimen → penjadwalan GPU → pengumpulan hasil → penulisan makalah → audit sitasi → pemformatan. Ketika menemui titik keputusan yang ambigu, sistem akan berhenti dan menunggu checkpoint manusia. Secara default, konfigurasi --AUTO_PROCEED false memungkinkan Anda untuk melakukan intervensi manual setelah setiap putaran umpan balik dari Reviewer.

ARIS-Code juga menyediakan parameter style-ref yang sangat berguna. Anda dapat menentukan makalah referensi gaya (misalnya, makalah terbaik dari konferensi yang sama), dan sistem akan meniru struktur organisasi serta ritme narasinya tanpa menyalin paragraf secara spesifik. Bagi peneliti yang mengejar "tingkat keberhasilan publikasi", ini hampir seperti senjata rahasia, karena persyaratan implisit dari peninjau konferensi papan atas mengenai gaya penulisan sering kali lebih sulit dipahami daripada kontennya sendiri.

Detail teknis lain yang patut diperhatikan adalah integrasi ARIS-Code dengan sistem eksternal seperti sinkronisasi dua arah Overleaf, pemantauan kurva pelatihan W&B, serta notifikasi seluler melalui Lark/Feishu. Ketika eksperimen di GPU mencapai titik krusial, Anda akan langsung menerima notifikasi di ponsel, benar-benar mewujudkan konsep "melakukan penelitian sambil tidur".

📊 Data Performa: Berdasarkan 3 contoh makalah komunitas yang dipublikasikan oleh penulis proyek, makalah yang dihasilkan oleh ARIS-Code mencapai skor tinjauan AI sebesar 7-8/10 (konferensi CS, AAAI 2026, IEEE TGRS). Namun, penulis juga memberikan peringatan tegas bahwa peninjau manusia akan membawa perspektif yang tidak dapat ditangkap oleh sistem tinjauan AI, sehingga AI tidak bisa sepenuhnya menggantikan kendali manusia.

FAQ ARIS-Code

Q1: Mengapa ARIS-Code tidak bisa menggunakan GPT-5 sebagai Executor?

Karena ARIS-Code dikembangkan dari versi open-source Claude Code, lapisan eksekutornya terkunci sepenuhnya pada protokol API asli Anthropic, termasuk format pemanggilan alat, format output streaming, dan format rantai pemikiran yang terikat erat dengan model Claude. Jika ingin mengganti eksekutor, Anda perlu menggunakan distribusi OpenClaw atau Codex CLI, tetapi itu bukan lagi ARIS-Code yang asli. Kami menyarankan untuk mengakses model Claude secara langsung melalui APIYI.com, yang merupakan solusi paling praktis.

Q2: Berapa banyak Token yang dibutuhkan untuk menjalankan satu makalah lengkap?

Dalam mode beast, menjalankan /research-pipeline secara penuh menghabiskan sekitar 5 juta hingga 15 juta input + output token, yang jika dikonversi ke harga Claude Sonnet berada di kisaran puluhan hingga ratusan ribu rupiah. Mode balanced dapat menurunkannya menjadi 2-5 juta token. Biaya spesifik bergantung pada kompleksitas eksperimen dan jumlah putaran iterasi.

Q3: Bisakah menggunakan ARIS-Code tanpa GPU lokal?

Tentu saja bisa. ARIS-Code telah merancang dua mode GPU cloud, yaitu vast dan modal. Modal bahkan memiliki kredit gratis sebesar 30 USD, yang lebih dari cukup untuk menjalankan eksperimen ringan. Jika hanya mengerjakan makalah teoretis (/proof-writer + /formula-derivation), Anda bahkan tidak memerlukan GPU sama sekali.

Q4: Apakah Reviewer dalam arsitektur model ganda harus menggunakan GPT-5.4?

Tidak wajib. Proyek ini mendukung penggantian dengan model apa pun yang kompatibel dengan protokol OpenAI, seperti GLM, MiniMax, Kimi, dan lainnya. Kami menyarankan untuk mendapatkan berbagai model kandidat Reviewer melalui platform agregator seperti APIYI.com agar Anda dapat melakukan A/B testing untuk menemukan LLM kritis yang paling cocok dengan bidang Anda. Beberapa peneliti melaporkan bahwa Gemini 3 Pro memberikan hasil yang sangat baik sebagai Reviewer untuk makalah penalaran matematika, sementara GPT-5.4 tetap menjadi pilihan utama untuk makalah optimasi teknik.

Q5: Apakah ARIS-Code cocok untuk mahasiswa sarjana atau pemula?

Lebih cocok untuk mahasiswa pascasarjana atau mereka yang sudah memiliki pengalaman penelitian. Alasannya, kualitas output sangat bergantung pada penilaian peneliti terhadap bidang tersebut. Misalnya, ketika Reviewer mengajukan sanggahan, Anda perlu menilai apakah itu benar-benar celah kritis atau masalah teknis yang tidak relevan. Seseorang tanpa pengalaman akan mudah tersesat oleh arah yang diberikan AI.

Q6: Apa yang harus dilakukan jika jaringan tidak stabil saat menjalankan ARIS-Code di Indonesia?

Koneksi langsung ke antarmuka resmi Anthropic di Indonesia memang sering mengalami reset atau timeout, yang dapat menyebabkan tugas research-pipeline yang panjang gagal di tengah jalan. Solusi yang matang adalah dengan mengalihkan ANTHROPIC_BASE_URL ke gateway proksi API yang ditempatkan di IDC domestik. Dengan cara ini, ARIS-Code dapat berjalan terus-menerus selama 8 jam dalam mode tidur tanpa terputus oleh gangguan jaringan, yang sangat krusial untuk eksperimen berkelanjutan dalam mode beast.

Kesimpulan

Munculnya ARIS-Code membuktikan tren penting: alat produktivitas riset di era Model Bahasa Besar kini bergeser dari "bantuan satu titik" menuju "otomatisasi alur kerja penuh". Arsitektur model ganda Executor-Reviewer, 42 skill alur kerja, dan desain Markdown tanpa dependensi yang diusungnya, secara kolektif membentuk kerangka metodologi yang sangat matang.

Bagi peneliti di Indonesia, hambatan terbesar dalam menggunakan ARIS-Code bukanlah kurva pembelajaran teknis, melainkan stabilitas pemanggilan model Claude. Kami menyarankan untuk mengakses seri model Claude melalui platform APIYI, sekaligus mendapatkan akses ke seri model GPT untuk sisi Reviewer. Dengan cara ini, satu platform dapat memenuhi kebutuhan model untuk seluruh alur kerja ARIS-Code, sehingga penyelesaian biaya dan pengumpulan log pemanggilan menjadi jauh lebih praktis. Selain itu, stabilitas node IDC domestik memastikan skenario utama seperti "menjalankan eksperimen saat tidur" tidak akan terputus karena masalah jaringan.

Jika Anda sedang mempersiapkan pengajuan ke konferensi tingkat atas, atau memiliki arah penelitian yang ingin divalidasi namun tidak punya waktu untuk iterasi manual, ARIS-Code layak dicoba dengan serius di akhir pekan ini—jika Anda benar-benar bisa melihat draf awal saat bangun tidur, investasi waktu ini akan sangat berharga.

📌 Penulis: Tim APIYI — Fokus jangka panjang pada layanan API Model Bahasa Besar AI dan ekosistem pengembang. Untuk contoh akses multi-model Claude/GPT/Gemini lainnya, silakan lihat pusat dokumentasi APIYI.

Similar Posts