Sesi 7.2: Google Search Grounding

Kursus → Modul 7: API sebagai Alat Riset

Sesi 2 dari 7

Google Search grounding menghubungkan AI generation dengan hasil pencarian live. Alih-alih model generate dari training data doang (yang terkompresi, dirata-ratakan, dan punya knowledge cutoff), model bisa mengecek klaim-klaimnya terhadap hasil pencarian terkini sebelum merespons. Menurut benchmark Google, grounding dengan Google Search mengurangi halusinasi sekitar 40% dibandingkan respons tanpa grounding.

Itu bukan obat mujarab. Tapi itu peningkatan signifikan di domain yang peningkatannya memang penting.

Cara Kerja Grounding

Waktu kamu mengaktifkan Google Search grounding lewat Gemini API, model ga cuma search lalu copy-paste. Dia ikuti proses multi-langkah.

graph TD A["Kamu kirim prompt
dengan search grounding aktif"] --> B["Model analisis:
apakah search akan
memperbaiki respons ini?"] B -->|"Tidak"| C["Generate dari
training data saja"] B -->|"Ya"| D["Model generate
query pencarian"] D --> E["Eksekusi pencarian
di Google"] E --> F["Proses hasil pencarian"] F --> G["Sintesis respons
dari data pencarian +
training data"] G --> H["Kembalikan respons dengan
groundingMetadata"] style D fill:#2a2a28,stroke:#c8a882,color:#ede9e3 style H fill:#2a2a28,stroke:#6b8f71,color:#ede9e3

Poin kuncinya: model yang memutuskan apakah search diperlukan. Kalo prompt kamu minta creative writing atau opini, model mungkin skip search-nya. Kalo prompt kamu bertanya soal peristiwa terkini, data terbaru, atau fakta yang bisa diverifikasi, model otomatis searching. Ini grounding yang cerdas, bukan search-semua-hal tanpa pandang bulu.

Yang Kamu Dapat Balik

Respons yang di-ground menyertakan lebih dari sekadar teks. Field groundingMetadata berisi jejak bukti.

Field Metadata	Isi	Kenapa Penting
searchQueries	Query yang di-generate model	Menunjukkan apa yang model cari
groundingChunks	Halaman web yang dikonsultasi (judul + URI)	Daftar sumber kamu untuk sitasi
groundingSupports	Pemetaan kalimat respons ke sumber	Kasih tahu klaim mana dari sumber mana
webSearchQueries	Query pencarian aktual yang dieksekusi	Jejak audit untuk proses riset

Grounding ga cuma meningkatkan akurasi. Dia kasih jejak audit. Setiap klaim di respons bisa dilacak balik ke sumber tertentu. Ini bedanya antara "AI bilang gitu" dan "AI nemuin sumber ini yang bilang gitu."

Grounding vs. Tavily: Tool Beda, Tujuan Beda

Google Search grounding dan Tavily search melayani tujuan yang tumpang tindih tapi berbeda di pipeline kamu.

Fitur	Google Search Grounding	Tavily Search API
Integrasi	Built-in di panggilan Gemini API	Panggilan API terpisah di pipeline kamu
Kontrol atas query	Model yang memutuskan apa yang dicari	Kamu yang tentukan query persis
Kapan search terjadi	Selama generation	Sebelum generation (fase riset)
Filter sumber	Terbatas (model yang pilih sumber)	Kontrol penuh (domain include/exclude)
Paling cocok untuk	Fact-checking selama menulis	Riset terstruktur sebelum menulis

Di pipeline yang solid, kamu bisa pakai Tavily untuk pre-research terstruktur (kumpulkan sumber dan bangun research brief) dan Google Search grounding untuk langkah generation (supaya model bisa verifikasi klaim secara real time). Keduanya saling melengkapi, bukan berkompetisi.

Keterbatasan

Grounding mengurangi halusinasi. Bukan menghilangkan. Model masih bisa salah interpretasi hasil pencarian, menggabungkan informasi dari beberapa sumber secara keliru, atau generate klaim yang ga sepenuhnya didukung hasil pencarian. Pengurangan 40% halusinasi artinya 60% risiko halusinasi asli masih ada.

Grounding juga menambah latensi (model butuh waktu untuk search dan proses hasil) dan biaya (panggilan yang di-ground konsumsi lebih banyak token karena hasil pencarian masuk ke konteks). Untuk konten yang kecepatan lebih penting dari presisi faktual, atau konten yang sepenuhnya kreatif, grounding menambah biaya tanpa manfaat proporsional.

Implementasi

Mengaktifkan grounding itu straightforward. Di Gemini API, kamu tambahkan tool google_search_retrieval ke konfigurasi panggilan API. Di Google AI Studio, kamu toggle opsi "Grounding with Google Search" di bawah Tools. Model yang urus sisanya: memutuskan kapan search, apa yang dicari, dan gimana mengintegrasikan hasilnya ke responsnya.

Untuk pipeline produksi, pendekatan API lebih baik karena kamu bisa secara programatis mengaktifkan atau menonaktifkan grounding per panggilan. Konten berat riset dapat grounding. Konten kreatif ga perlu. Script kamu yang ambil keputusan berdasarkan tipe konten, bukan toggle manual kamu.

Tugas

Ambil satu klaim faktual dari AI generation terbaru (statistik, tanggal, fakta perusahaan, atau klaim historis). Verifikasi secara manual pakai Google search.
Sekarang setup grounded generation untuk konten yang sama pakai Gemini API (atau Google AI Studio untuk tes cepat). Bandingkan akurasi output yang di-ground dengan versi tanpa grounding.
Periksa groundingMetadata di respons. Bisakah kamu lacak setiap klaim faktual ke sumber tertentu? Dokumentasikan kasus di mana grounding menangkap error dan kasus di mana dia ga menangkapnya.

Google Search Grounding