|

Tutorial Lengkap 5 Langkah Mengakses API Gambar Nano Banana Pro Menggunakan OpenClaw

Membuat OpenClaw AI Agent bisa menghasilkan gambar secara otomatis adalah fitur yang ingin diwujudkan oleh banyak pengembang. Artikel ini akan membahas bagaimana cara membuat Skill kustom untuk OpenClaw dalam 5 langkah, serta menghubungkannya ke API pembuatan gambar Nano Banana Pro untuk mewujudkan alur kerja lengkap mulai dari instruksi chat hingga hasil gambar otomatis.

Nilai Inti: Setelah membaca artikel ini, Anda akan menguasai metode pembuatan Skill kustom di OpenClaw, mempelajari cara terhubung ke Nano Banana Pro melalui platform APIYI untuk melakukan teks ke gambar, pengeditan gambar, dan pemrosesan massal, sehingga AI Agent Anda memiliki kemampuan pembuatan gambar tingkat profesional.

openclaw-nano-banana-pro-image-api-tutorial-id 图示


Ikhtisar Kemampuan Inti API Gambar Nano Banana Pro

Sebelum mulai mengintegrasikannya, mari kita pahami apa saja kemampuan yang bisa diberikan Nano Banana Pro untuk OpenClaw Agent Anda.

Nano Banana Pro (nama resminya Gemini 3 Pro Image Preview) adalah model pembuatan gambar AI tingkat profesional yang diluncurkan oleh Google DeepMind. Dibangun berdasarkan Gemini 3 Pro, model ini dinilai oleh industri sebagai "model terbaik untuk menghasilkan gambar dengan render teks yang benar dan terbaca jelas".

Parameter Teknis Inti Nano Banana Pro

Kemampuan Parameter Keterangan
Render Teks Tingkat kesalahan < 10% Akurasi teks baris tunggal terdepan di industri
Resolusi Output 1K / 2K / 4K Resolusi tinggi asli, tanpa perlu pemrosesan tambahan
Gambar Referensi Hingga 14 gambar Mendukung sintesis multi-gambar dan konsistensi karakter
Konsistensi Karakter Hingga 5 karakter Konsistensi wajah karakter di berbagai adegan
Mode Berpikir Thinking Process Visualisasi penalaran komposisi yang rumit
Grounding Pencarian Google Search Pembuatan visual berdasarkan data real-time

🎯 Saran Integrasi: Versi resmi Nano Banana Pro memerlukan kartu kredit luar negeri Google Cloud yang terikat, yang memiliki ambang batas tinggi. Kami menyarankan untuk mengaksesnya melalui platform APIYI apiyi.com. Mereka menawarkan harga flat $0,05/gambar (diskon 80% dari harga resmi 4K), mendukung pembayaran Alipay/WeChat Pay, dan tidak memerlukan kartu luar negeri.


Arsitektur Lengkap Integrasi OpenClaw Skill ke Nano Banana Pro

Memahami arsitektur keseluruhan akan membantu kamu melakukan konfigurasi selanjutnya dengan lebih baik.

openclaw-nano-banana-pro-image-api-tutorial-id 图示

Mengapa memilih akses melalui APIYI

Perbandingan Koneksi Langsung Google Resmi Melalui APIYI apiyi.com
Harga Satuan 4K $0.24/gambar $0.05/gambar (Diskon 80%)
Metode Pembayaran Kartu Kredit Luar Negeri Alipay/WeChat Pay/USDT
Format API SDK Asli Google Kompatibel dengan format asli Gemini
Persyaratan Jaringan Perlu VPN/Proxy Koneksi langsung (lokal)
Batasan Konkurensi Dibatasi oleh Kuota Konkurensi tidak terbatas, RPM 2000+
Diskon Pelanggan Besar Tidak ada Bonus top-up hingga 20%

Langkah 1: Membuat Struktur Direktori OpenClaw Skill

# Membuat struktur direktori Skill
mkdir -p ~/.openclaw/skills/nano-banana-pro/scripts
cd ~/.openclaw/skills/nano-banana-pro
touch SKILL.md scripts/generate.py scripts/edit.py

Langkah 2: Menulis File Definisi SKILL.md

SKILL.md adalah file inti yang digunakan OpenClaw untuk mengenali dan memanggil Skill Anda. File ini terdiri dari metadata YAML di bagian depan dan instruksi Markdown.

---
name: nano-banana-pro
description: Generate and edit images using Nano Banana Pro (Gemini 3 Pro Image) via APIYI platform. Supports text-to-image, image editing, multi-image composition, and batch processing.
version: 1.0.0
metadata:
  openclaw:
    requires:
      env:
        - APIYI_API_KEY
      bins:
        - python3
    primaryEnv: APIYI_API_KEY
emoji: "🎨"
---

# Skill Pembuatan Gambar Nano Banana Pro


## Fitur
- **Teks ke gambar**: Menghasilkan gambar berkualitas tinggi berdasarkan deskripsi teks (1K/2K/4K)
- **Pengeditan gambar**: Melakukan modifikasi, penggabungan, dan transfer gaya pada gambar yang sudah ada
- **Pemrosesan batch**: Mendukung pembuatan dan pengeditan secara massal

Cara Penggunaan

Membuat Gambar

exec python3 scripts/generate.py --prompt "deskripsi" --aspect-ratio "16:9" --resolution "2K"

Mengedit Gambar

exec python3 scripts/edit.py --instruction "instruksi edit" --image-url "URL gambar"

Hal-hal yang Perlu Diperhatikan

  • Gunakan format API asli Gemini: /v1beta/models/{model}:generateContent
  • Gambar 4K membutuhkan waktu sekitar 60 detik, disarankan mengatur exec timeout=120
  • Disarankan menggunakan petunjuk dalam bahasa Inggris untuk mendapatkan hasil terbaik

> 💡 **Tips Pengembangan**: Setelah `primaryEnv: APIYI_API_KEY` dideklarasikan, OpenClaw akan secara otomatis memasukkan kunci API ke dalam lingkungan eksekusi Skill. Skrip Anda dapat langsung membacanya melalui variabel lingkungan tanpa perlu melakukan *hard-coding* kunci.

---

## Langkah Ketiga: Menulis Skrip Teks ke Gambar generate.py

Ini adalah skrip inti yang bertanggung jawab untuk menerima parameter dari OpenClaw dan memanggil API Nano Banana Pro untuk membuat gambar.

### Pengujian Cepat dengan curl (Format Asli Gemini)

Gunakan perintah curl untuk memverifikasi apakah API berjalan lancar, ini adalah cara tercepat untuk pengujian:

```bash
curl -s -X POST \
  "https://api.apiyi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "Authorization: Bearer sk-kunci-APIYI-Anda" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"}
      ]
    }],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "2K"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
img_data = data['candidates'][0]['content']['parts'][0]['inlineData']['data']
sys.stdout.buffer.write(base64.b64decode(img_data))
" > gemini-native-image.png

Setelah berhasil dijalankan, file gemini-native-image.png akan dibuat di direktori saat ini.

Skrip Python (Format Asli Gemini)

#!/usr/bin/env python3
"""Skrip Teks ke Gambar Nano Banana Pro - OpenClaw Skill (Format Asli Gemini)"""
import os, json, base64, argparse, requests
from datetime import datetime

API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models"  # Antarmuka asli Gemini dari APIYI

def generate_image(prompt, aspect_ratio="16:9", resolution="2K"):
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    }
    data = {
        "contents": [{"parts": [{"text": prompt}]}],
        "generationConfig": {
            "responseModalities": ["IMAGE"],
            "imageConfig": {
                "aspectRatio": aspect_ratio,
                "imageSize": resolution
            }
        }
    }
    response = requests.post(url, headers=headers, json=data, timeout=120)
    response.raise_for_status()
    result = response.json()

    # Format asli Gemini: mengekstrak inlineData dari candidates
    parts = result["candidates"][0]["content"]["parts"]
    for part in parts:
        if "inlineData" in part:
            img_bytes = base64.b64decode(part["inlineData"]["data"])
            filename = f"nano_banana_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
            with open(filename, "wb") as f:
                f.write(img_bytes)
            print(f"Gambar telah dibuat: {filename} ({len(img_bytes)/1024:.1f} KB)")
            return filename
    print("Gagal mengekstrak data gambar")
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--prompt", required=True)
    parser.add_argument("--aspect-ratio", default="16:9")
    parser.add_argument("--resolution", default="2K", help="Resolusi: 1K/2K/4K")
    args = parser.parse_args()
    generate_image(args.prompt, args.aspect_ratio, args.resolution)

🚀 Mulai Cepat: Kode di atas menggunakan antarmuka format asli Gemini dari APIYI (apiyi.com), dengan endpoint /v1beta/models/{model}:generateContent. Struktur responsnya identik dengan Google resmi. Cukup buat kunci API di konsol APIYI: api.apiyi.com untuk mulai menggunakan.


Langkah 4: Menulis skrip pengeditan gambar edit.py

Nano Banana Pro tidak hanya bisa membuat gambar, tetapi juga mendukung pengeditan pada gambar yang sudah ada.

#!/usr/bin/env python3
"""Skrip pengeditan gambar Nano Banana Pro - Skill OpenClaw (format asli Gemini)"""
import os, json, base64, argparse, requests
from datetime import datetime

# Mengambil kunci API dari environment variable
API_KEY = os.environ.get("APIYI_API_KEY", "")
API_BASE = "https://api.apiyi.com/v1beta/models"

def edit_image(instruction, image_url, extra_images=None):
    url = f"{API_BASE}/gemini-3-pro-image-preview:generateContent"
    headers = {"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"}

    # Membangun bagian (parts) multimodal format asli Gemini
    parts = [{"text": instruction}]
    # Mengonversi URL gambar menjadi data inline base64
    img_resp = requests.get(image_url, timeout=30)
    parts.append({"inlineData": {"mimeType": "image/png",
                                  "data": base64.b64encode(img_resp.content).decode()}})
    if extra_images:  # Mendukung komposisi multi-gambar (maksimal 14 gambar referensi)
        for img_url in extra_images[:13]:
            r = requests.get(img_url, timeout=30)
            parts.append({"inlineData": {"mimeType": "image/png",
                                          "data": base64.b64encode(r.content).decode()}})

    data = {
        "contents": [{"parts": parts}],
        "generationConfig": {"responseModalities": ["IMAGE"]}
    }
    response = requests.post(url, headers=headers, json=data, timeout=120)
    response.raise_for_status()
    result_parts = response.json()["candidates"][0]["content"]["parts"]
    for part in result_parts:
        if "inlineData" in part:
            filename = f"edited_{datetime.now().strftime('%Y%m%d_%H%M%S')}.png"
            with open(filename, "wb") as f:
                f.write(base64.b64decode(part["inlineData"]["data"]))
            print(f"Pengeditan selesai: {filename}")
            return filename
    return None

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--instruction", required=True)
    parser.add_argument("--image-url", required=True)
    parser.add_argument("--extra-images", nargs="*")
    args = parser.parse_args()
    edit_image(args.instruction, args.image_url, args.extra_images)

Ringkasan Kemampuan Pengeditan Gambar

Jenis Edit Contoh Petunjuk Waktu Proses
Ganti Latar Belakang "Remove background and add sunset" ~10 detik
Transformasi Gaya "Convert to anime style" ~15 detik
Penambahan Elemen "Add sunglasses to the person" ~10 detik
Komposisi Multi-gambar "Combine these logos and add…" ~20 detik
Penambahan Teks "Add title text: Hello World" ~10 detik
Penyesuaian Warna "Make the image warmer, increase contrast" ~8 detik

Langkah 5: Konfigurasi OpenClaw dan Pengujian

Konfigurasi Kunci API

Tambahkan konfigurasi Skill di file konfigurasi OpenClaw ~/.openclaw/openclaw.json:

{
  "skills": {
    "entries": {
      "nano-banana-pro": {
        "enabled": true,
        "apiKey": "sk-Kunci-APIYI-Anda"
      }
    }
  }
}

openclaw-nano-banana-pro-image-api-tutorial-id 图示

Menguji Skill

Kirim petunjuk pengujian di platform pesan untuk memverifikasi fungsi:

Buat gambar tampilan produk e-commerce dengan gaya minimalis modern, latar belakang putih, produk berada di tengah

Verifikasi apakah Skill sudah dimuat dengan benar:

openclaw skills list | grep nano-banana
openclaw skills test nano-banana-pro

💰 Optimasi Biaya: Nano Banana Pro melalui harga seragam di APIYI apiyi.com adalah $0.05/gambar, tanpa membedakan resolusi. Jika konsumsi harian proyek Anda melebihi 5000 gambar, Anda bisa menikmati bonus isi ulang hingga 20%, sehingga biaya per gambar bisa serendah $0.04.


Perbandingan Biaya dan Performa API Nano Banana Pro

Memilih metode akses yang tepat sangat penting untuk penggunaan jangka panjang.

openclaw-nano-banana-pro-image-api-tutorial-id 图示

Grafik SVG di atas menunjukkan perbandingan harga dan parameter performa secara mendetail. Data kunci: Melalui akses APIYI untuk Nano Banana Pro, biaya per gambar 4K hanya $0,05 (diskon 80% dari harga resmi $0,24). Untuk pelanggan besar, biaya bisa turun hingga $0,04 per gambar setelah bonus pengisian saldo. Platform ini menangani lebih dari 100 ribu gambar per hari tanpa batasan konkurensi.


Pertanyaan yang Sering Diajukan (FAQ)

Q1: Apa saja dependensi yang perlu diinstal untuk menghubungkan OpenClaw ke Nano Banana Pro?

Hanya butuh Python 3 dan pustaka requests. Kita memanggilnya melalui antarmuka format asli Gemini dari APIYI apiyi.com (/v1beta/models/{model}:generateContent), jadi tidak perlu menginstal SDK google-generativeai dari Google. Cukup jalankan pip install requests. Anda juga bisa mengetesnya langsung dengan perintah curl tanpa dependensi apa pun.

Q2: Bagaimana jika OpenClaw mengalami timeout saat membuat gambar 4K?

Nano Banana Pro membutuhkan sekitar 60 detik untuk menghasilkan gambar 4K. Dalam petunjuk penggunaan di SKILL.md, disarankan agar OpenClaw menggunakan exec timeout=120 atau exec timeout=180 saat memanggil skrip untuk menghindari terputusnya tugas akibat timeout default.

Q3: Bisakah saya menggunakan model pembuatan gambar lain sebagai pengganti Nano Banana Pro?

Bisa. Platform APIYI apiyi.com mendukung berbagai model pembuatan gambar secara bersamaan. Anda hanya perlu mengubah parameter model di dalam generate.py untuk beralih; format API-nya benar-benar konsisten, sehingga tidak perlu mengubah kode lainnya.

Q4: Bagaimana cara memastikan keamanan OpenClaw Skill?

Ada tiga langkah kunci: Pertama, kunci API dimasukkan melalui variabel lingkungan (environment variables), jangan ditulis langsung (hardcode) di dalam skrip; kedua, gunakan hanya Skill yang Anda buat sendiri, hindari menginstal skill pembuatan gambar dari sumber yang tidak jelas di ClawHub (lebih dari 820 skill berbahaya telah ditemukan); ketiga, periksa log OpenClaw secara berkala untuk memastikan tidak ada pemanggilan yang mencurigakan.

Q5: Operasi pengeditan gambar apa saja yang didukung? Bagaimana hasilnya?

Nano Banana Pro mendukung penggantian latar belakang, transfer gaya, penambahan/penghapusan elemen, komposisi multi-gambar (hingga 14 gambar referensi), perenderan teks, dan lainnya. Perenderan teks adalah keunggulan utamanya, dengan tingkat kesalahan teks baris tunggal di bawah 10%, jauh melampaui DALL-E 3 dan Midjourney. Melalui platform APIYI, pemanggilan fitur pengeditan hanya membutuhkan biaya $0.05 per sesi dan selesai dalam rata-rata 10 detik.


Kesimpulan

Melalui 5 langkah dalam tutorial ini, Anda telah menguasai alur lengkap pembuatan Skill kustom untuk OpenClaw guna mengakses API gambar Nano Banana Pro:

  1. Membuat Direktori Skill — Struktur standar SKILL.md + scripts/
  2. Menulis SKILL.md — Mendeklarasikan dependensi, variabel lingkungan, dan instruksi penggunaan
  3. Menulis Skrip Teks ke Gambar — Memanggil Nano Banana Pro melalui antarmuka format asli Gemini di APIYI
  4. Menulis Skrip Pengeditan — Mendukung komposisi multi-gambar, penggantian latar belakang, dan transfer gaya
  5. Konfigurasi dan Pengujian — Mengatur kunci API di openclaw.json dan memverifikasi fungsi

Kami merekomendasikan akses Nano Banana Pro melalui APIYI apiyi.com untuk menikmati harga flat $0.05/gambar (diskon 80% dari harga resmi 4K), dukungan antarmuka terpadu untuk Claude, GPT-4o, DeepSeek, dan model lainnya, serta uji coba gratis hasil gambar di imagen.apiyi.com.


Artikel ini ditulis oleh tim teknis APIYI, yang berfokus pada praktik integrasi API Model Bahasa Besar dan tutorial pengembangan Agent. Untuk panduan teknis lebih lanjut, silakan kunjungi Pusat Bantuan APIYI: help.apiyi.com

Similar Posts