以下の内容はhttps://blog.g-gen.co.jp/entry/how-to-query-bigquery-with-natural-languageより取得しました。


BigQueryに自然言語でクエリする10個の方法

記事タイトルとURLをコピーする

G-genの杉村です。当記事では、BigQuery に対して自然言語によってデータの抽出や分析を行うための方法を10個紹介します。BigQuery の Conversational Analytics、Gemini Enterprise の Data Insights エージェント、MCP サーバーの利用など、現在ではさまざまな手段が用意されています。

はじめに

自然言語によるデータベースへのクエリ

これまでのデータ分析業務では、アナリストやエンジニアが SQL を記述してデータを抽出する必要がありました。しかし生成 AI の発達に伴い、SQL を書かなくても、自然言語(私たちが普段使う言葉)でデータベースからデータを抽出することができるようになりました。なお自然言語による人間の指示を AI 等が SQL に変換する技術のことを NL2SQL(Natural Language to SQL)と呼びます。

こういった技術を使うことで、非エンジニアや非アナリストでも「昨日の売上を商品カテゴリごとに集計して」といった自然言語の指示でデータを抽出できます。サービスによっては、ユーザーは自動的に生成された SQL を意識する必要さえなく、AI が抽出結果や分析結果だけを返してくれます。

当記事では、Google Cloud が提供する分析用データベースである BigQuery に対して、自然言語でクエリや分析を行う10個の方法を解説します。

10個の方法

当記事で紹介する手法は、以下のとおりです。

BigQuery に自然言語で問い合わせる方法の一覧

以下のリストは、技術的な難易度や実装の工数が低い方から順番に並べています。なお、表の「追加金銭コスト」は、BigQuery の料金とは別に追加で発生する料金等を指します。例えば Looker Studio Pro(Conversational Analytics)では、BigQuery の利用料金のほかに、Looker Studio Pro のライセンス料金が発生します。「高」「中」「低」は、上記表の中で比較した相対的なものです。

難易度 手法名称 概要 追加金銭コスト
1 Looker Studio Pro
(Conversational Analytics)
Looker Studio Pro に付属する対話型分析
2 Looker
(Conversational Analytics)
Looker に付属する対話型分析
3 Gemini Enterprise
(Data Insights エージェント)
AI プラットフォーム Web ツール「Gemini Enterprise」の対話型 AI エージェント
4 BigQuery data agents
(Conversational Analytics)
Google Cloud コンソール画面に付属する対話型分析 なし
5 BigQuery データキャンバス BigQuery Studio(Web コンソール)で使える AI 補助ありのテーブル分析機能 なし
6 Gemini in BigQuery BigQuery Studio(Web コンソール)で使える AI による SQL コーディング補助 なし
7 MCP サーバーの利用 Gemini CLI や IDE 等から MCP サーバーを通じて BigQuery にアクセス 低(※)
8 Colab Enterprise
(Data Science Agent)
Colab Enterprise ノートブック上でデータサイエンティストによる分析を補助
9 Agent Development Kit
(BigQuery ツールセット)
ADK で BigQuery にアクセスする AI エージェントを実装 低(※)
10 LLM アプリケーション
の実装
フルスクラッチで自然言語問い合わせアプリを実装 ツールに依存

※トークン量(AI への入出力データ量)に応じて変動する

注意点

Google Cloud に組み込まれている生成 AI 機能では、基本的に LLM への入出力データは保護され、Google によりモデルの再トレーニング等に利用されることはありません。当記事で紹介した手法のうち、Google Cloud 関連サービス(Looker Studio Pro、Looker、Gemini Enterprise、BigQuery、Colab Enterprise、Gemini CLI の特定の利用方法など)では、データは保護されます。

しかし、無償版の Google AI Studio(API キーの発行含む)を使用したり、個人 Google アカウントで Gemini CLI にログインしたりした場合、データは Google のサービス改善や、モデルの再トレーニングに使用される可能性があります。機密情報を扱ったり、企業データの保護を図る場合は、有償版サービスや Google Cloud サービスを利用する必要がある点に十分留意してください。

Looker Studio Pro(Conversational Analytics)

Looker Studio は、Google Cloud の可視化ダッシュボードツールです。Google アカウントがあれば無償で使える無償版と、組織向けの管理機能を強化した有償の Looker Studio Pro が用意されています。なお、後述の Looker と Looker Studio は名称が似ているものの別製品であり、性質が異なります。詳細は以下の記事も参照してください。

blog.g-gen.co.jp

有償版の Looker Studio Pro には Gemini in Looker Studio の機能が付属しており、その中の1機能が Conversational Analytics(対話型分析)です。Conversational Analytics は、ユーザーからの自然言語指示によりデータを抽出したり、分析をすることができる機能です。

Looker Studio Pro の Conversational Analytics

Looker Studio にはデータソースとして BigQuery を簡単に接続可能です。Conversational Analytics を使うと、データソースとして追加された BigQuery のテーブルやビュー等に対して、自然言語でクエリすることができます。SQL や IT 技術の知識は不要です。

2025年12月現在、Looker Studio Pro の Conversational Analytics は Preview 公開の位置づけであり、通常のライセンス料金($9/ユーザー/月)のほかは、追加の課金は発生しません。

Looker(Conversational Analytics)

Looker は、Google Cloud のエンタープライズ向け BI プラットフォームです。Looker には Gemini in Looker が搭載されており、生成 AI モデルである Gemini が、ユーザーによるデータの探索や分析を補助してくれます。

Gemini in Looker の1機能である Conversational Analytics(対話型分析)は、ユーザーからの自然言語指示によりデータを抽出したり、分析をすることができる機能です。

Looker の Conversational Analytics は、Looker Studio Pro の Conversational Analytics と類似の機能ではありますが、Looker では事前に独自言語である LookML を用いてディメンションとメジャーを定義する必要がある点が異なります。これは AI 機能とは関係なく、Looker の特徴として必要な工程です。LookML によるセマンティックレイヤの定義は、Looker の最大の強みでもあります。ただし、この LookML によるセマンティックレイヤをメンテナンスする体制が必要になることから、初期導入や運用の難易度は Looker Studio よりも高くなります。ただし、データ管理者により上記のような定義が一度されてしまえば、一般ユーザーにとっては SQL 等の知識なく、データの抽出や分析が可能になります。

なお Looker の Conversational Analytics の料金は、2026年9月30日までは割り当て(クォータ)制限や追加料金なしであり、2026年10月1日以降、入出力データのトークン数に応じた料金が発生するとされています。Looker のライセンス料金は、前述の Looker Studio Pro に比較すると高価です。

Gemini Enterprise(Data Insights エージェント)

Gemini Enterprise は、Google Cloud が提供する生成 AI アシスタントサービスです。組織内データを横断検索したり、各種 AI エージェント機能により、人間の業務を効率化します。このプロダクトにより、企業や官公庁等の組織が、組織内のデータを有効活用しつつ、AI の力を借りることができます。

Gemini Enterprise の画面

Gemini Enterprise でできることやライセンス体系、各機能については、以下の記事で詳細に解説されています。

blog.g-gen.co.jp

Gemini Enterprise には Data Insights エージェントが搭載されています。自然言語での質問に基づいて AI が SQL を生成し、BigQuery に投入して結果を得て、回答を生成します。

Data Insights エージェントは2025年12月現在、Private Preview であり、使用には Google への申請が必要です。

Gemini Enterprise にはコネクタを通じて様々なデータソースを接続可能です。Gemini Enterprise に BigQuery をデータソースとして統合することで、Data Insights エージェントが BigQuery のテーブルやビューにアクセスできるようになります。Gemini Enterprise は Google Cloud と統合されているため、BigQuery との接続作業は容易です。当機能の利用者にとっては、SQL や技術的な知識は一切不要です。

Data Insights エージェントの料金は Gemini Enterprise のライセンス料金に組み込まれています。一般公開後は、割り当て制限が適用される可能性があります。

BigQuery data agents(Conversational Analytics)

BigQuery には、Conversational Analytics(対話型分析)機能が備わっています。Google Cloud の Web コンソール画面で BigQuery の画面に遷移し、左部のメニューから「エージェント」を選択するだけで、Conversational Analytics 機能にアクセスできます。

この機能では、AI とのチャット形式で、データに関する質問をすることができます。AI は自動的にクエリを生成して、テキストや図表を使ってユーザーに回答します。

同機能は2026年1月29日に Preview 公開され、同日現在では無料で使用できます(BigQuery へのクエリ料金は通常どおり発生します)。

BigQuery の Conversational Analytics 機能

同機能を使用するには、まず管理者がデータエージェントを作成します。ここでは以下のような設定が可能です。

  • データソースとなるテーブル、ビュー、UDF(ユーザー定義関数)
  • システム指示(エージェントに遵守させるプロンプト)
  • 検証済みクエリ(AI が参考にするための、ビジネスロジックを反映したゴールデンクエリ。想定質問とそれに対する SQL を登録)
  • Dataplex 用語集(ユーザープロンプト理解のため AI が参考にする)
  • 課金される最大バイト数(費用スパイクを防止する)

エージェント作成画面

作成したエージェントは、IAM による制御で特定の従業員にだけ公開できます。エージェントに質問するユーザーは、エージェントに対する権限に加え、データソースとなるテーブルやビュー等に対する閲覧権限も必要です。

これらの設定により、SQL の知識を持たない一般ユーザーが、BigQuery に日本語などの自然言語を使ってクエリできるようになります。よりよい精度を得るためには、管理者がエージェントを作成する際に、適切なシステム指示や検証済みクエリ、Dataplex 用語集などをエージェントに登録し、組織のビジネスロジックをエージェントに組み入れることが重要です。

BigQuery データキャンバス

BigQuery データキャンバス(BigQuery data canvas)は、Google Cloud コンソール上で提供される、自然言語中心のデータ分析インターフェースです。BigQuery に統合された AI 機能群である Gemini in BigQuery 機能の1つです。

従来の SQL エディタとは異なり、テーブル間の関係性が可視化された UI で対話的に分析を進めます。BigQuery データキャンバスはテーブル等のメタデータを解釈できるため、連結すべき対象テーブル等を自然言語によって検索することもできます。

BigQuery データキャンバス

BigQuery データキャンバスでは、自然言語による対話の結果として SQL が生成されます。このことからも、当機能の想定ユーザーは比較的 SQL に関する知識があるデータアナリストやデータエンジニアなどであると考えられます。

BigQuery データキャンバスの料金は BigQuery 利用料金に組み込まれており、追加の課金は発生しません。ただし、組織ごとの割り当て制限が存在します。

当機能については、以下の当社記事も参照してください。

blog.g-gen.co.jp blog.g-gen.co.jp

Gemini in BigQuery

BigQuery の Web ユーザーインターフェイスである BigQuery Studio には、標準で Gemini による支援機能が組み込まれています。

SQL エディタ上でコメントとして -- 過去3ヶ月のユーザーごとの購入回数を集計 等と記述して Enter キーを押すと、Gemini がテーブルスキーマを考慮した SQL を提案(オートコンプリート)します。また、既存の複雑な SQL をハイライトして「このクエリを解説して」と依頼することも可能です。

データキャンバスが「対話的な分析体験」を提供するのに対し、こちらは「SQL 記述作業を支援する」位置づけです。利用には、一定の SQL 知識が必要になります。

BigQuery Studio での SQL 生成は BigQuery 利用料金に組み込まれており、追加の課金は発生しません。ただし、データキャンバスと同様、組織ごとの割り当て制限が存在します。

SQL のサジェスト

当機能については、以下の記事で解説しています。

MCP サーバーの利用

MCP サーバーを利用することで、Gemini CLI や Curosor 等の IDE といった MCP クライアントから、BigQuery に自然言語でクエリを投入することができます。

Google Cloud は、Google Cloud MCP servers という、フルマネージドのリモート MCP サーバーを公開しています。これを利用することで、ローカルでの MCP サーバーのセットアップをすることなく、MCP クライアントから BigQuery の MCP サーバーへアクセスできます。

以下の記事も参照してください。

blog.g-gen.co.jp

blog.g-gen.co.jp

また、Google は BigQuery 等のデータベースへアクセスするためのオープンソースの MCP サーバーである MCP Toolbox for Databases を公開しています。ローカル環境に MCP サーバーをセットアップしたい場合は、こちらの利用も検討します。

また、Gemini CLI BigQuery extensions を使うことで、Gemini CLI から簡単に BigQuery に問い合わせが可能です。Gemini CLI は、Linux、macOS、Windows 等の Node.js 環境で動作する、オープンソースの生成 AI エージェント CLI ツールです。Gemini CLI は extensions(拡張機能)と呼ばれるアドオンを追加することで、さまざまな機能を拡張できます。BigQuery extensions を Gemini CLI に追加することで、BigQuery に対するさまざまな操作を自然言語で指示することができます。なお BigQuery extensions は MCP Toolbox for Databases をベースとしています。

Gemini CLI

Gemini CLI については、以下の記事で詳細に解説しています。

blog.g-gen.co.jp

ターミナルでの作業を行うエンジニアや分析者にとって、CLI や IDE といった使い慣れたツールから自然言語でクエリを BigQuery へクエリできる点は大きなメリットです。一方で、これらのツールはビジネスユーザー向けではありません。

オープンソースツールを利用する場合にはツール自体の利用料金はかかりませんが、CLI の背後で動作する LLM として Gemini 等を利用するため、それらの LLM の利用料金を考慮する必要があります。

Colab Enterprise(Data Science Agent)

Colab Enterprise は、Vertex AI および BigQuery 上で動作するマネージドな Jupyter ノートブック環境です。Colab Enterprise の Data Science Agent 機能では、Gemini による支援を受けることができます。

ノートブックのセルにおいて「BigQuery の my_dataset.my_table からデータを読み込んで、Pandas DataFrame に変換し、欠損値を確認して」等と指示すると、必要な Python コード(BigQuery Storage API の利用コード等)を生成します。

Colab Enterprise の Data Science Agent

Data Science Agent は、SQL だけでなく、Python によるデータサイエンスを自然言語で効率化する場合に適しています。データサイエンティスト等を支援する目的の機能であるため、Python 等の知識が必要であり、ビジネスユーザー向けではありません。

2025年12月現在、Data Science Agent は Preview 段階の機能であり、ノートブックランタイムの料金以外の追加料金は発生しません。

Agent Development Kit(BigQuery ツールセット)

ここからは、独自の AI アプリケーション開発の領域に入ります。Google が公開するオープンソースフレームワークである Agent Development Kit(ADK)を使用すると、マルチ AI エージェントを少ないソースコード行数で開発することができます。

ADK では、BigQuery へクエリするモジュールを「ツール(tools)」として LLM に与えることができます。ユーザーの質問(「在庫が少ない商品は?」)に対し、エージェント(LLM)が自律的に「在庫テーブルを検索する必要がある」と判断し、適切な SQL を生成・実行して、結果を回答として返します。BigQuery 用の tool である BigQuery ツールセットは ADK にビルトインされているため、開発者が独自に開発する必要がありません。

以下の記事では、ADK の BigQuery ツールセットについて解説しています。

blog.g-gen.co.jp

AI エージェントアプリケーションの開発は、特定の業務ロジックや、複数のデータソースを横断するような複雑なエージェントを構築する場合に採用されます。当手法は、エンジニアによる開発が必要になるほか、開発したエージェントをサーバーやクラウドのサーバーレスサービスにホストする必要があります。

ADK 自体はオープンソースであり、利用料金は発生しません。背後で動作する Gemini 等の LLM の利用料金を考慮する必要があります。

LLM アプリケーションの実装

最も自由度が高く、かつ難易度が高いのが、LangChain などのライブラリと LLM(Gemini API 等)を組み合わせて、フルスクラッチで自然言語問い合わせアプリケーションを実装する方法です。

テーブルスキーマ(DDL)をどのようにプロンプトに含めるか、大量のテーブルがある場合にどうやって関連テーブルを検索するか(RAG)、生成された SQL の構文エラーをどう修正するかといった仕組みを自前で実装する必要があります。

既存のツールでは対応できない特殊な要件がある場合や、自社サービスの中に NL2SQL 機能を組み込みたい場合に選択されます。

杉村 勇馬 (記事一覧)

執行役員 CTO

元警察官という経歴を持つ IT エンジニア。クラウド管理・運用やネットワークに知見。AWS 認定資格および Google Cloud 認定資格はすべて取得。X(旧 Twitter)では Google Cloud や Google Workspace のアップデート情報をつぶやいています。




以上の内容はhttps://blog.g-gen.co.jp/entry/how-to-query-bigquery-with-natural-languageより取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14