はじめに
こんにちは。クラウドエンジニアの重永です。
今回は、Google Cloud の Vertex AI RAG Engine を利用している方、特に「とりあえず試してみた」という方に向けた、緊急度の高い課金に関する注意喚起です。
先日、Google Cloud から "[Billing Update] RagManaged vector store is now generally available" という件名のメールが届いていませんか? このメール、読み飛ばすと高額な請求に驚くことになるかもしれません。
本記事では、そもそも Vertex AI RAG Engine とは何ができるサービスなのかを振り返りつつ、今回の仕様変更で何が変わり、どう対応すべきかを解説します。
そもそも Vertex AI RAG Engine とは?
まずは、今回対象となっているサービスについて簡単におさらいしましょう。
Vertex AI RAG Engine とは
LLM(大規模言語モデル)に自社独自のデータやプライベートな情報を組み合わせて回答させる「検索拡張生成(RAG)」を、簡単に実装できるフルマネージドサービスです 。
何に使えるのか?
一般的な LLM は、トレーニングに使用された公開データしか知りません。そのため、社内の規定や最新の製品情報について質問すると、もっともらしい嘘(ハルシネーション)をつくことがあります 。
Vertex AI RAG Engine を使うと、以下のようなことが実現できます:
- 社内ナレッジ検索: Google ドライブや Cloud Storage にある社内ドキュメントを取り込み、それに基づいた正確な回答をするチャットボットを作成する 。
- ハルシネーションの低減: 回答の根拠となる情報を提示させ、事実に基づいた(グラウンディングされた)生成を行わせる 。
- RAG パイプラインの自動化: データの取り込み、チャンク分割(変換)、ベクトル化(エンベディング)、インデックス作成、検索といった複雑な RAG の工程を一元管理する 。
つまり、「自社のデータを LLM に理解させ、業務で使えるAIアプリを素早く作るための基盤」と言えます。
今回、何が起きたのか?
非常に便利なサービスですが、その裏側で動いているデータベースの仕様変更に伴い、課金体系が大きく変わりました。 2025年7月9日頃の通知によると、以下の変更が行われました。
- 名称変更: RagManaged vector store が Managed Cloud Spanner instance に変更されます 。
- 課金開始: 2025年8月8日より、このリソースに対する課金が開始されます 。
- 既存ユーザーの扱い: これまで RagManaged vector store を利用していたユーザーは、デフォルトで Spanner の「Scaled Tier (1000 processing units)」 として課金されます 。
⚠️ ここが最大の落とし穴です ⚠️
「RAG Engine を少し試しただけ」という場合でも、裏側でプロビジョニングされたデータベースが残っていると、2025年8月8日以降、Enterprise Spanner インスタンス(1,000 PU)としての料金が発生してます 。
ドキュメントにも記載がある通り、Vertex AI RAG Engine で管理される Spanner インスタンスはベクトルデータベースとして使用されており、今回一般提供(GA)となったことで課金が有効化されています 。
高額請求を避けるための3つのアクション
Google からの通知によると、2025年8月8日までに以下のいずれかのアクションを取ることが推奨されていました 。
1. Basic Tier (100 PU) へのダウングレード
本番運用ではなく、プロトタイプや小規模な利用であれば、Scaled Tier (1,000 PU) はオーバースペックです。Basic Tier に下げることでコストを抑えられます。
実行コマンド例(API利用) :
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://us-central1-aiplatform.googleapis.com/v1/projects/{project_id}/locations/{location_id}/ragEngineConfig -d \
'{"ragManagedDbConfig": { "basic": {} }}'
※ {project_id} と {location_id} はご自身の環境に合わせて書き換えてください。
2. インスタンスの削除
もし「過去にチュートリアルで作成しただけで、現在は使っていない」という場合は、削除するのが最も確実です。設定を unprovisioned にすることで、Managed Cloud Spanner インスタンスを削除できます。
実行コマンド例(API利用) :
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://us-central1-aiplatform.googleapis.com/v1/projects/{project_id}/locations/{location_id}/ragEngineConfig -d \
'{"ragManagedDbConfig": { "unprovisioned": {} }}'
※ {project_id} と {location_id} はご自身の環境に合わせて書き換えてください。
3. 他のベクトルストアへの移行
本格的な運用で、コストや性能の要件が Spanner と合致しない場合は、他の選択肢も検討可能です。Vertex AI RAG Engine は、デフォルトの Spanner (RagManagedDb) 以外にも複数のベクトルデータベースをサポートしています 。
- Vertex AI Vector Search: 大規模データ、低レイテンシ向け 。
- Vertex AI Feature Store: BigQuery インフラを活用 。
- その他オープンソースや他社マネージドサービス 。
まとめ
- Vertex AI RAG Engine は、社内データを活用したAIアプリ開発に強力なツールです。
- しかし、デフォルトDB(旧 RagManaged vector store)は 2025年8月8日から Spanner として課金 されています。
- 既存のリソースは Scaled Tier (1,000 PU) という高スペックな設定になるため、放置すると予期せぬコストが発生します。
- 不要であれば削除、利用継続なら Basic Tier へのダウングレードを今すぐ検討してください。
クラウドの従量課金は便利ですが、仕様変更のキャッチアップは必須です。 「身に覚えがあるかも…」という方は、今すぐ Google Cloud コンソールで対象プロジェクトを確認しましょう!
Google Cloud、Google Workspace に関するご相談はXIMIXへ!
Google Cloud、Google Workspaceに関する お問い合わせはこちら
- カテゴリ:
- クラウド
- キーワード:
- Google Cloud