はじめに
先日、GoogleCloudの試験、Associate Data Practitionerを初受験し合格したので、試験のご紹介をします。
試験概要
2024年10月30日にBeta 版公開され、2025年1月に一般公開(GA)となった試験です。受験した2025年4月時点では英語版でのみ受験が可能です。
公式ページには以下のように説明されています。
Associate Data Practitioner は、Google Cloud 上のデータの保護と管理を行います。 データの取り込み、変換、パイプライン管理、分析、機械学習、可視化などのタスクに Google Cloud データサービスを使用した経験があります。受験者は、Infrastructure as a Service(IaaS)、Platform as a Service(PaaS)、Software as a Service(SaaS)などのクラウド コンピューティングのコンセプトに関する基本的な知識が求められます。
他試験との違い
他にもデータ系の試験としては、Professional Data EngineerとProfessional Cloud Database Engineerがあります。いずれもプロフェッショナルレベルの資格であり、このAssociateはそれよりも下位資格という扱いです。
取扱う内容については、以下のような差があるというのが受験したうえでの印象です。
- Data Engineer: BigQueryを主体としつつ他のサービスと組み合わせたアーキテクチャやML関連についてもやや深堀りしている
- Database Engineer: BigQuery以外のデータベース系サービス(特にCloudSQL)を主に取り扱い、オンプレからのデータ移行やデータベース運用管理についてやや深堀している
- Data Practitioner: ETLまたはELTパイプラインの構築と運用管理を主体に、データベース系のサービスについては広く取り扱っている
Professional系ほど専門性は高くありませんがそれぞれと近い内容のものが出題されつつ、BigQueryにデータを投入するためのパイプライン構築は細かく問われる傾向があります。
実試験
試験を受けてみての様子や感想としては以下の通りです。あくまで私が受けた今回の試験に限った話ですので、別のパターンにあたることもあり得ます。
全体
- 試験問題は40問
- すべて単一選択問題
- 問題の英文については2~3行程度であまり長くない
- 「Google Recommended」な方法で、という定番の記載が多々出現
問題の傾向
- 単純なサービス選択をするだけの問題もいくつかあり
- パイプライン構築問題が多く、その中で「コストを小さく」「構築を簡単に」「ローコードで構築」「GUIで構築」などのように要件が多いので、それぞれ見落とさないのが重要
- 正しいクエリを選択する、というように多少はコードを読める必要あり
感触・感想
- 50分程度で最後まで一周して、その後見直し20分程度で完了
- 回答に自信が無かったものは3~4問程度
- どっちでもいいのかも?と思わせる選択肢があり若干苦戦したものも数問
- Database Engineerと同じくらいの難易度かもしれない
勉強方法(案)
事前に勉強をせずに試験を受けたので、あくまで受けた後で「ここを勉強しておくのが良さそう」という感想です。
- パイプライン構築のためのサービスの使い分けはマスターしておくこと
- Dataflow, Cloud Composer, Data Fusionなど、どのサービスを使うとどういうパイプラインが構築できるのかを理解しておくことが重要です。それだけで「現行のApache AirflowパイプラインをGoogle Cloudで」のような問題は即答が可能です。
- 問題の傾向として記述した通り、パイプラインを構築するにあたっての要件が示されます。とはいえ実際にパイプラインを作ったことがなくてもドキュメントから学べるレベルのものですので、基本的な使い方の網羅をしておくのが良いです。
- ETL(ELT)の鉄板アーキテクチャは覚えておくこと
- たいていのETL(ELT)が、Cloud Storageにファイルが置かれるか、PubSubメッセージでデータを受け取るかで構成されています。リアルタイム性を求められるか日次のバッチかの差分も込みで、データのインプットに対してどういうアーキテクチャを取ればいいか理解しておけば、問題文の理解もスムーズになると思います。
- たいていのETL(ELT)が、Cloud Storageにファイルが置かれるか、PubSubメッセージでデータを受け取るかで構成されています。リアルタイム性を求められるか日次のバッチかの差分も込みで、データのインプットに対してどういうアーキテクチャを取ればいいか理解しておけば、問題文の理解もスムーズになると思います。
- ML系の基本的な理解
- BigQueryに集めたデータに対して分析や機械学習をしたいというケースが出てきます。AutoMLやBigQuery MLといった方法により、BigQuery上で簡単に機械学習が行えることは抑えておきましょう。
- Lookerも知っておくこと
- 他のGoogle Cloud試験では出題経験がないLooker関連の問題が数問含まれていました。試験範囲にも明示的に示されているので、基本的な知識を押さえておくことをおすすめします。
- 他のGoogle Cloud試験では出題経験がないLooker関連の問題が数問含まれていました。試験範囲にも明示的に示されているので、基本的な知識を押さえておくことをおすすめします。
- その他については機能や思想レベルで把握しておくこと
- Cloud Storageでのライフサイクルや保持ポリシー機能
- 権限を付ける場合は最少権限の原則、個人ではなくグループに付ける
- CloudSQLの可用性や災害対策の方法
学習アプローチ
-
Professional Data系資格を既に取得している方
パイプライン構築を中心に少し復習し、経験が足りない部分をドキュメントで補う勉強法が適しています。 -
Associate Cloud Engineer取得済の方
BigQueryを主体に学習するのがおすすめです。Data Engineer向け教材は豊富なので、それを活用しながら試験範囲外の部分をスキップすると効率的かもしれません。
参考
Google Cloud、Google Workspace に関するご相談はXIMIXへ!
Google Cloud、Google Workspaceに関する お問い合わせはこちら
執筆者紹介

- カテゴリ:
- Google Cloud