Google Search Grounding
Sesi 7.2 · ~5 menit baca
Google Search grounding menghubungkan AI generation dengan hasil pencarian live. Alih-alih model generate dari training data doang (yang terkompresi, dirata-ratakan, dan punya knowledge cutoff), model bisa mengecek klaim-klaimnya terhadap hasil pencarian terkini sebelum merespons. Menurut benchmark Google, grounding dengan Google Search mengurangi halusinasi sekitar 40% dibandingkan respons tanpa grounding.
Itu bukan obat mujarab. Tapi itu peningkatan signifikan di domain yang peningkatannya memang penting.
Cara Kerja Grounding
Waktu kamu mengaktifkan Google Search grounding lewat Gemini API, model ga cuma search lalu copy-paste. Dia ikuti proses multi-langkah.
dengan search grounding aktif"] --> B["Model analisis:
apakah search akan
memperbaiki respons ini?"] B -->|"Tidak"| C["Generate dari
training data saja"] B -->|"Ya"| D["Model generate
query pencarian"] D --> E["Eksekusi pencarian
di Google"] E --> F["Proses hasil pencarian"] F --> G["Sintesis respons
dari data pencarian +
training data"] G --> H["Kembalikan respons dengan
groundingMetadata"] style D fill:#2a2a28,stroke:#c8a882,color:#ede9e3 style H fill:#2a2a28,stroke:#6b8f71,color:#ede9e3
Poin kuncinya: model yang memutuskan apakah search diperlukan. Kalo prompt kamu minta creative writing atau opini, model mungkin skip search-nya. Kalo prompt kamu bertanya soal peristiwa terkini, data terbaru, atau fakta yang bisa diverifikasi, model otomatis searching. Ini grounding yang cerdas, bukan search-semua-hal tanpa pandang bulu.
Yang Kamu Dapat Balik
Respons yang di-ground menyertakan lebih dari sekadar teks. Field groundingMetadata berisi jejak bukti.
| Field Metadata | Isi | Kenapa Penting |
|---|---|---|
| searchQueries | Query yang di-generate model | Menunjukkan apa yang model cari |
| groundingChunks | Halaman web yang dikonsultasi (judul + URI) | Daftar sumber kamu untuk sitasi |
| groundingSupports | Pemetaan kalimat respons ke sumber | Kasih tahu klaim mana dari sumber mana |
| webSearchQueries | Query pencarian aktual yang dieksekusi | Jejak audit untuk proses riset |
Grounding ga cuma meningkatkan akurasi. Dia kasih jejak audit. Setiap klaim di respons bisa dilacak balik ke sumber tertentu. Ini bedanya antara "AI bilang gitu" dan "AI nemuin sumber ini yang bilang gitu."
Grounding vs. Tavily: Tool Beda, Tujuan Beda
Google Search grounding dan Tavily search melayani tujuan yang tumpang tindih tapi berbeda di pipeline kamu.
| Fitur | Google Search Grounding | Tavily Search API |
|---|---|---|
| Integrasi | Built-in di panggilan Gemini API | Panggilan API terpisah di pipeline kamu |
| Kontrol atas query | Model yang memutuskan apa yang dicari | Kamu yang tentukan query persis |
| Kapan search terjadi | Selama generation | Sebelum generation (fase riset) |
| Filter sumber | Terbatas (model yang pilih sumber) | Kontrol penuh (domain include/exclude) |
| Paling cocok untuk | Fact-checking selama menulis | Riset terstruktur sebelum menulis |
Di pipeline yang solid, kamu bisa pakai Tavily untuk pre-research terstruktur (kumpulkan sumber dan bangun research brief) dan Google Search grounding untuk langkah generation (supaya model bisa verifikasi klaim secara real time). Keduanya saling melengkapi, bukan berkompetisi.
Keterbatasan
Grounding mengurangi halusinasi. Bukan menghilangkan. Model masih bisa salah interpretasi hasil pencarian, menggabungkan informasi dari beberapa sumber secara keliru, atau generate klaim yang ga sepenuhnya didukung hasil pencarian. Pengurangan 40% halusinasi artinya 60% risiko halusinasi asli masih ada.
Grounding juga menambah latensi (model butuh waktu untuk search dan proses hasil) dan biaya (panggilan yang di-ground konsumsi lebih banyak token karena hasil pencarian masuk ke konteks). Untuk konten yang kecepatan lebih penting dari presisi faktual, atau konten yang sepenuhnya kreatif, grounding menambah biaya tanpa manfaat proporsional.
Implementasi
Mengaktifkan grounding itu straightforward. Di Gemini API, kamu tambahkan tool google_search_retrieval ke konfigurasi panggilan API. Di Google AI Studio, kamu toggle opsi "Grounding with Google Search" di bawah Tools. Model yang urus sisanya: memutuskan kapan search, apa yang dicari, dan gimana mengintegrasikan hasilnya ke responsnya.
Untuk pipeline produksi, pendekatan API lebih baik karena kamu bisa secara programatis mengaktifkan atau menonaktifkan grounding per panggilan. Konten berat riset dapat grounding. Konten kreatif ga perlu. Script kamu yang ambil keputusan berdasarkan tipe konten, bukan toggle manual kamu.
Further Reading
- Grounding with Google Search (Gemini API Documentation)
- Gemini API and Google AI Studio Now Offer Grounding with Google Search (Google Developers Blog)
- Grounding with Google Search via Firebase (Firebase Documentation)
- Grounding with Google Search on Vertex AI (Google Cloud Documentation)
Tugas
- Ambil satu klaim faktual dari AI generation terbaru (statistik, tanggal, fakta perusahaan, atau klaim historis). Verifikasi secara manual pakai Google search.
- Sekarang setup grounded generation untuk konten yang sama pakai Gemini API (atau Google AI Studio untuk tes cepat). Bandingkan akurasi output yang di-ground dengan versi tanpa grounding.
- Periksa groundingMetadata di respons. Bisakah kamu lacak setiap klaim faktual ke sumber tertentu? Dokumentasikan kasus di mana grounding menangkap error dan kasus di mana dia ga menangkapnya.