こんにちは。クラウドエンジニアの重永です。
今回は、Google Cloud の Vertex AI RAG Engine を利用している方、特に「とりあえず試してみた」という方に向けた、緊急度の高い課金に関する注意喚起です。
先日、Google Cloud から "[Billing Update] RagManaged vector store is now generally available" という件名のメールが届いていませんか? このメール、読み飛ばすと高額な請求に驚くことになるかもしれません。
本記事では、そもそも Vertex AI RAG Engine とは何ができるサービスなのかを振り返りつつ、今回の仕様変更で何が変わり、どう対応すべきかを解説します。
まずは、今回対象となっているサービスについて簡単におさらいしましょう。
LLM(大規模言語モデル)に自社独自のデータやプライベートな情報を組み合わせて回答させる「検索拡張生成(RAG)」を、簡単に実装できるフルマネージドサービスです 。
一般的な LLM は、トレーニングに使用された公開データしか知りません。そのため、社内の規定や最新の製品情報について質問すると、もっともらしい嘘(ハルシネーション)をつくことがあります 。
Vertex AI RAG Engine を使うと、以下のようなことが実現できます:
つまり、「自社のデータを LLM に理解させ、業務で使えるAIアプリを素早く作るための基盤」と言えます。
非常に便利なサービスですが、その裏側で動いているデータベースの仕様変更に伴い、課金体系が大きく変わりました。 2025年7月9日頃の通知によると、以下の変更が行われました。
⚠️ ここが最大の落とし穴です ⚠️
「RAG Engine を少し試しただけ」という場合でも、裏側でプロビジョニングされたデータベースが残っていると、2025年8月8日以降、Enterprise Spanner インスタンス(1,000 PU)としての料金が発生してます 。
ドキュメントにも記載がある通り、Vertex AI RAG Engine で管理される Spanner インスタンスはベクトルデータベースとして使用されており、今回一般提供(GA)となったことで課金が有効化されています 。
Google からの通知によると、2025年8月8日までに以下のいずれかのアクションを取ることが推奨されていました 。
本番運用ではなく、プロトタイプや小規模な利用であれば、Scaled Tier (1,000 PU) はオーバースペックです。Basic Tier に下げることでコストを抑えられます。
実行コマンド例(API利用) :
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://us-central1-aiplatform.googleapis.com/v1/projects/{project_id}/locations/{location_id}/ragEngineConfig -d \
'{"ragManagedDbConfig": { "basic": {} }}'
※ {project_id} と {location_id} はご自身の環境に合わせて書き換えてください。
もし「過去にチュートリアルで作成しただけで、現在は使っていない」という場合は、削除するのが最も確実です。設定を unprovisioned にすることで、Managed Cloud Spanner インスタンスを削除できます。
実行コマンド例(API利用) :
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://us-central1-aiplatform.googleapis.com/v1/projects/{project_id}/locations/{location_id}/ragEngineConfig -d \
'{"ragManagedDbConfig": { "unprovisioned": {} }}'
※ {project_id} と {location_id} はご自身の環境に合わせて書き換えてください。
本格的な運用で、コストや性能の要件が Spanner と合致しない場合は、他の選択肢も検討可能です。Vertex AI RAG Engine は、デフォルトの Spanner (RagManagedDb) 以外にも複数のベクトルデータベースをサポートしています 。
クラウドの従量課金は便利ですが、仕様変更のキャッチアップは必須です。 「身に覚えがあるかも…」という方は、今すぐ Google Cloud コンソールで対象プロジェクトを確認しましょう!
Google Cloud、Google Workspaceに関する お問い合わせはこちら