[Google Cloud Next '24 Las Vegas] AI時代のデータガバナンス

 2024.04.16 Yudai Imai

IMG_0380

Google Cloud Next '24 Las Vegasとは

Google Cloud Next '24は、2024年4月9日から4月11日の3日間、アメリカ・ラスベガスのMandalay Bayにおいて開催されるGoogleのクラウドサービスに関する世界最大級のイベントです。開発者、エンジニア、IT専門家、業界リーダーが集結し、3日間にわたり技術の最前線を駆け巡ります。特に今年のイベントは、AI/ML(人工知能・機械学習)にフォーカスが当てられ、セッションの約4割がAI/ML関連となり、その最新情報が発表されることが強く期待されています。

私たち日本情報通信株式会社も、Google Cloudに精通した専門家として、技術イノベーションの最新動向を取り入れ、顧客に対するソリューション提供に活かしていくことを目指して参加しています。

このような貴重な機会ですので、現地からいち早くブログで最新情報や熱量を発信してまいります。

本記事で紹介するセッション概要

  • 講演日時:2024年4月10日 11:30 - 12:30  GMT-7
  • セッションタイトル:Data governance in the AI era
  • 登壇者
    • Lu Yang
      • グーグルクラウドのシニアプロダクトマネージャー
    • Cynthia Gumbs
      • フォード・モーターのデータディスカバリーマネージャー
    • Steve Jarrett
      • オレンジ(フランスの通信事業者)のAI最高責任者
  • セッション内容のサマリ
    • AIの導入が急ピッチで進む中、データガバナンスは、高品質なデータがAIモデルや大規模な言語モデルを強化するために不可欠なものとなっています。Vertex AIとの新たな統合を含むDataplexの最新のデータガバナンスイノベーションについて学び、企業があらゆるデータタイプのデータを一元的に発見、管理、監視、統制し、アナリティクスとAIを大規模に強化できるようにしましょう。OrangeとFordのリーダーから、AI時代にデータを安全に管理・統制するためにDataplexをどのように活用しているかについて学びます。

このセッションで期待できること

  • Google Cloudで提供されているDataplexの自動化されたカタログ作成機能、BigQueryのカラムレベルのData lineage、DataplexのCollibraとの連携機能について知ることができます。
  • 企業のAI導入が進む中でデータが重要な役割を果たし、よく管理された高品質なデータの需要が高まっているが、多くの企業は発見されていない「ダークデータ」やデータ品質に関する問題に直面していることを知ることができます。

セッション内容

本ブログでは、私が現地でセッションを聴講していて特に興味深いと感じた内容を抜粋してご紹介させていただきます。セッション内ではオレンジ社やフォードモーター社の事例も紹介されていましたが、気になる内容のみ掲載させていただきます。

フォードモーター社のDataplex活用方法

フォードモーター社では、データに対してDataplexのメタデータ機能を利用して情報の付与を行っているそうです。そして、そのメタデータをもとにして自社サービス上から検索するシステムを構築しているそうです。

このシステムは現在は、GenAIで新規で追加されたデータに対して自動でメタデータを付与することや既存のメタデータを更新するといった機能を実験されていて、データガバナンスからデータの探索までを効率化するといったことに取り組まれているそうです。

オレンジ社のデータ民主化のための活用事例

オレンジ社はヨーロッパとアフリカの26か国で電気通信事業を行っており、各国で独自のデータ基盤が構築・維持されていたそうです。この状況に対してオレンジ社はデータの民主化のビジョンを掲げ、データ基盤のサイロを打破し標準化されたデータ品質管理方法とパイプラインの品質維持プロセスを導入したことにより、データを各国内で広く利用可能にしたそうです。

オレンジ社はデータの民主化ビジョンを達成するためにGoogle Cloudでデータメッシュの初期実装を構築し、データカタログの自動化、データ品質管理、ロールベースのアクセスコントロールなどの機能の向上を図ったそうです。また、各国が自らのデータの鮮度や品質を管理する責任を持つように現在も変革を進めているそうです。

Dataplexの自動カタログ機能

Dataplexには現在さまざまなGoogle Cloudのデータサービスから自動で情報を収集してデータカタログを作成する機能がリリースされています。この機能によりGoogle Cloud中に分散されたデータを一貫性を持って管理することが可能になります。

現在、画像の中ではLookerのみがComing Soonとなっていますが、セッションスピーカーのLuさんにセッション後に質問したところ、24年3Qを目途にサービスとして利用できるようになるそうです。サポートするLookerファミリーはLooker Coreとセルフサービス版のLookerとなる予定で、Looker StudioやLooker Studio Proはまだサポートされるかは未定となっているとの回答でした。

Gemini in Dataplexの新機能

Gemini in Dataplexの新機能としていくつか発表されたため、こちらについても紹介させていただきます。

Gemini in Dataplexの新機能として、データの探索画面で自然言語でデータについて検索できるようになる機能とデータ資産からインサイトを得るためのSQLを自動で生成する機能が紹介されました。これらの機能はどちらも自然言語で利用することができるため、データガバナンスの担当者があまり技術に明るくなくても管理を実施できるようになると思います。

DataplexとCollibraとの連携機能

また、DataplexとCollibraの連携機能についても紹介されていました。Google Cloudのデータの管理についてはDataplexを使って実施して、その他のクラウドサービスのデータの情報についてはCollibraを利用して収集を行うことができるようになるとのことです。

会場の様子

会場には組織のデータガバナンス担当者が多く存在していました。セッション中にデータガバナンス担当者がどれくらいいるかという質問がされたときに多くの方が挙手していて、アメリカではやはりデータガバナンスという分野は重要視されているのだなと感じました。

また、セッションの終了後にセッションスピーカーのお三方には列ができるほど質問者が並んでおり、私も質問しようと並びましたが質問できるまで相当待つことになるほど注目度が高かったようです。

まとめ・感想

データガバナンスの分野についてもGeminiとの連携機能が追加されるくらい生成AIの活用は進んできているのだなと感じました。その他にもマルチクラウドやハイブリッドクラウドを進めていくための技術にも取り組んでいることが感じられるセッションだったと思います。

私自身は、オレンジ社のデータの民主化に取り組まれていた事例について興味深く聴講させていただきました。日本でデータの民主化に取り組むためには多くの障壁があるとは思いますが、機会があれば取り組んでみたいことの一つになったと感じています。

参考

Google Cloud、Google Workspace に関するご相談はXIMIXへ!

Google Cloud、Google Workspaceに関する お問い合わせはこちら
XIMIX®は日本情報通信株式会社が所有する登録商標です。(商標登録第6755234号)

執筆者紹介

Yudai Imai
Yudai Imai
入社してから継続してGoogle Cloudのデータエンジニアとして案件に参画。目標はブログ記事を年間20件執筆すること。

[Google Cloud Next '24 Las Vegas] AI時代のデータガバナンス

BACK TO LIST