AI

G検定取得したい方必見:2021#2の試験を振り返る

G検定を受験された方、現在受験勉強をしている皆さん、お疲れ様です。GRIの分析官・講師のヤンです。
今回は、G検定試験の最近の出題傾向や問題の特徴を解説するとともに、これから受験する方のために学習法を何点かお勧めしたいと思います。

この中で語る分析結果は、2021年7月17日に実施された2021年第2回(2021#2と略記)のG検定試験に基づいたものです。この2021#2の試験は少し特別です。なぜならば、2021年4月にディープラーニング 協会(JDLA)の方でシラバスが改定され、それに伴い、重点的に出題される分野も多少なり変わってきたからです。ということで、2021#2の試験はシラバス改定後の初めての試験です。また、今回から、G検定では合否だけではなく、出題分野ごとの得点率が受験者に知らせられるようになりました。さあ、出題の特徴と皆の感想を見ていきましょう。

事前に断っておきますが、実際、私も今回受験をしました。私は問題作成には関わっておりません。講師や執筆の業務を行う上で、新シラバスの特徴を正確に把握し、皆さんにより良い講座や読み物を提供していきたいがために受験したわけです。(※過去問は未公開なので、もちろんここでも実際の問題を公開しません。)

ということで、以下の順で話していきます。

  • G検定とはそもそもなんでしょうか(まだ知らない方のために)
  • 2021年の出題傾向がこれまでとどう変わったのか(シラバス改定に伴い)
  • SNSの声→ 分析してみました。
  • おすすめの学習法、教材など

■イントロダクション

「G検定とは」を知りたい方は、弊社監修のこちらの記事をご参考にしてください。

www.sbbit.jp

本記事ででも簡単に紹介しますね。
G検定(公式名:ジェネラリスト検定)は、一般社団法人日本ディープラーニング協会(JDLA; Japan Deep Learning Association;) が実施している資格試験です。その目的は、人工知能(AI)やデータサイエンスをビジネスに活用できる基礎知識を有しているかどうかを認定することです。(公式サイト: https://www.jdla.org/business/certificate/

G検定の「G」が代表する「ジェネラリスト」(generalist)とは、「幅広い基礎知識を有し、適切な活用方針を決定して事業応用する能力を持つ人材」とJDLAでは定義されています。G検定はまさに、技術とその社会実装の双方の理解ができるビジネストランスレーターの育成を目指しています。

f:id:gri-blog:20210821164800p:plain
参考:資格試験について – 一般社団法人日本ディープラーニング協会【公式】

AI人材育成の需要が高まるとともに、G検定はますます注目を浴びてきており、受講者数も全体的に上昇しています。「合格率」は 60~70% にあると 言えます。ただし、過去の試験問題や合格基準は非公開です。

f:id:gri-blog:20210821164856p:plain
出典:資格試験について – 一般社団法人日本ディープラーニング協会【公式】

■出題傾向・最近何が変わったのか

G 検定で比較的多く出題される問題は以下だと感じています:

  • 専門用語の定義、具体的な技術や分析手法の名称と内容
  • 技術・手法の仕組みや特徴に関する理解
  • ディープラーニングを応用した最新技術の用語
  • AI を活用するための知見(社会・産業への影響、法的規制、倫理、現行の議論) → 多くの受験者が難しいと感じている
  • 計算機技術の基礎となる数学(微積分、統計学、精度スコアの 計算など)

今回の試験より、全体的に、内容が「ハードな暗記を要する超難問」よりも、「実際に技術を業務に応用できる人材が知るべき」実践的な内容にシフトしているように感じます。例えば強化学習について理論的な深い部分に関する難問が減りましたね。本当にジェネラリストとして知るべき本質的な質問が増えてきました。

そして、細かいことですが、しばらく前は1つの問題文で(ア)〜(エ)の埋めるべき空欄が多数あって、同じ問題文は複数の設問にわたるような出題はなくなり、問題文が簡潔になり、逆に問われることの濃密度が上がったように感じます。

具体的に、今回出題が増えたなあ、と感じるのは以下の分野です。

モデルの解釈性

予測結果の解釈と根拠の明白化、AI における透明性、XAI(Explainable AI;説明可能AI)、ブラックボックス性問題、モデルを解釈するために使われる可視化ツールなど

AIを社会に実装する上で、起こりうる問題

個人情報の扱い、データの取得・利用・保管に関する規則、AIシステムへの攻撃(セキュリティ)、営業秘密など

この辺の内容が属する分野は、以前の試験では、どちらかというと純粋な法律の問題に近いものが出題されることが多かったです。例えば、特許権法や著作権法などの詳細を覚える必要がありました。今ではより「AIと社会を結びつける」ことに傾いた内容に切り替わりつつあるように感じます。

数学・統計学

相関係数、共分散、全微分偏微分の違い、ベイズ推定、事後確率など

AIをビジネスに利用する上の考え方、プロジェクトの計画の立て方

モデルを学習するための学習データの使い方、データ拡張の正しい行い方、データセットの偏り、AIの実装から本番導入までの流れ、MLOps、PoC、共同開発など

上記以外に、以前の試験と相変わらず、かなり満遍なく … ディープラーニングの仕組みの基本をいかに理解しているのか、それ以外の機械学習アルゴリズム自然言語処理強化学習、画像生成、この中で、音声認識(今までは画像系だった…)について特に今回多く問われたのが印象的でした。

SNSから見た皆さんの感想

「皆さんはどういう分野を難しく感じているのか」の感覚を持つ目的も兼ねて、Twitter上の声を収集し分析してみました。データ収集期間は、試験当日から2週間(7/17~30)です。

得点率から見た苦手意識

そこで、収集したツィートの中で、分野ごとの得点率に関与する内容を提供してくれた方の情報を可視化してみました。さらにそこには、ご好意で情報提供を受けた2021#2を受験した知り合い数名の点数も加えてあります。

以下で見せる分布は、合計63名の得点率を表したものです。

分野はこのように区切られています(情報提供に同意した受講者・匿名):

f:id:gri-blog:20210822095308p:plain

【注意】

  • 横軸は「得点」ではなく「得点率」である
  • 63名は十分なデータとはいえないし、当然(結果が悪く公表しない方など)バイアスがかかっているので、この分析結果は受験者全体の様子を正しく反映しているとは言えない
  • 上記の制約があるものの、出題分野間の難易度のラフな相対評価の参考にはなるとは思う
f:id:gri-blog:20210821170740p:plain

分野1~4

f:id:gri-blog:20210821170810p:plain

分野5~6

【グラフの分布に対する考察】

  • 分野1(人工知能の定義・歴史などを中心に問う)と分野2(機械学習全般の考え方と個別の機械学習アルゴリズム)に関しては、普段講座でも「しっかり学習すれば点数を取りやすい」とよく申し上げております。得点率からでも比較的高得点に偏っていることがわかりますね。
  • 分野3(ディープラーニングの仕組み)や分野4(最新の研究分野)は、機械学習の中でも複雑で細かい、正しい理解がマストである設問内容の多いことから、分布は真ん中にピークする形に見えます。
  • 分野5(AIの社会実装に伴う法律・倫理の問題、プロジェクトの進め方など)は、かなり難易度が高く感じられた方も多いでしょう。試験勉強の段階からこの分野に苦手意識を持つ方も多いと聞いております。それでも可能の限りこの苦手分野を克服することで、満点をとることは難しくても、合否が危うくなるほどの低い点数を免れます
  • 分野6(数学・統計学):比較的基本的、かつ過去の試験にも出題された問題が出されたからか、満点をとるのは難しかったようですが、全6問のうち半分以上は取れた、という方は少なくないでしょう。
ツイート投稿から抽出した受験者の声

以下引用です。

  • 「G検定、そういえば、人物名は出題されなかったような。より実用的な問題重視になったってことかな?…」
  • 「広く技術や法制度、社会動向の知識が問われて…」
  • 「多分昨日のG検定は、「中国語の部屋」を忠実に再現した実験だった」

2020#3の試験の後も同様なSNSの分析をしました。

参考:
Twitterのコメントから分析するG検定 – GRI Blog

G検定に関するTwitter上の最頻出用語を解説 – GRI Blog

一年前は、「とにかく難しかった」の声が多かったのです。今回は「超難問だ!」の発言がさほど多くはないのです。私が上記で述べた感想「法律や理論の中身に関する深い知識」よりも、「社会に悪い影響を与えずに、技術をビジネスなどに正しく応用するための知識」に出題アプローチを転向させていますね。これはとてもよい変化だと思いますし、今後はこのような試験を受験したい方も増えていくのでしょう。

■おすすめ学習法

過去の試験問題や合格基準は非公開であることから、どういう問題が解ければ合格できるのかという点について、十分な情報が得られない不安を感じるかもしれません。学習をサポートする情報はこちらのページや動画の中でお伝えさせていただいております。

データサイエンス|G検定対策講座(日本ディープラーニング協会) | アガルートアカデミー

youtu.be

youtu.be

最重要ポイントとしては、

  • 時間内に全問回答することはきついと感じる方も多く、いちいちかんぺやウェブ検索などで調べなくていいように、とにかく練習問題を徹底的にこなすアウトプットが、最も効率的な試験対策法です。
  • 覚え方を極めることです。目の前の仮想的な質問者に「自分の言葉で相手に説明できるか」を試すのが有効ですよ!
  • 「どうしても覚えきれない項目」だけをまとめたノート/フラッシュカード/チートシートを作り、本番直前に「これだけ見れば良い!」のような存在にしましょう。
講座の紹介

弊社GRIでは、難関資格予備校かつ法律の専門家の集団であるアガルートアカデミーにて、G検定試験対策講座を提供しております。

www.agaroot.jp

講座では、初めてディープラーニングを学ぶ方でも安心・充実して学べるように、初歩的な事項から入り、本書と同じ口調で1つひとつ丁寧に知識を伝えています。基礎をしっかり固めた上でG検定合格を達成したい方に最適な講座です。講師との質疑応答が可能な「コーチング制度」も用意しています。本書と合わせて、皆さんの学習に役に立てればと思います。

書籍の紹介

この度、10月1日より、GRIよりG検定の書籍を刊行することとなりました。(※本記事執筆段階ではまだカバーデザインがマウントされていない状態かもしれません)。今までの講座で受講生の方々を指導させていただいた経験に基づいて執筆したもので、これ1冊できっと皆さんを合格に導いていけるという自信作です。ぜひ手に取っていただけたら幸いです。

www.amazon.co.jp

Point1 驚くほどわかりやすく覚えやすい解説!

G検定の試験は本来、ディープラーニングの知識をビジネスに活かす人材の育成が目的です。一方で残念ながら、多くの受検者は知識のハードな暗記にこだわりすぎて、受検後にはせっかく得た知識を忘れてしまいがちです。概念を「真に」理解していれば、暗記にさほど努力しなくても、知識がスッと頭に入り、定着しやすくなります。本書は読者に「理解」を届けることを目指しています。試しに、本書の本文に目を通してみてください。各分野の知識を体系的に、懇切丁寧に、まるで読者に語りがけるような口調で解説することを心掛けているのがわかります。アンサンブル学習、機械翻訳、深層強化学習、画像生成モデル…など難解と思える技術はじっくりとわかりやすく伝わるように説明しています。皆が悩む難問がこれでやっとわかる作りです。

Point2 本書のオリジナル問題は妥協しない質と量を誇ります!

本書のオリジナル演習問題は妥協しない質と量を誇ります。「奇抜な問題」と「簡単すぎる問題」(常識や消去法で解ける問題)を避け、「しっかり勉強すれば解ける良問」を中心に問題を設計しました。問題形式と難易度が本番試験に極めて近く、最新の出題傾向を的確に反映しています。巻末に模擬試験(200問)が付属されていることも本書の強みです。読者はこの模擬試験を予想問題として「リハーサル」することで、本番試験でのパフォーマンスの向上が得られるでしょう。もちろん、2021年4月にJDLAから発表されたシラバスの改訂にも対応しています。新シラバスで追加・強化された内容や問題を本書でも十分に扱っています。

Point3 赤シートを活用し、いつでも・どこでも、重要ポイントをラクラク覚える!

赤シートを利用することで、効率的に学習・問題演習できることが、本書の利用者の武器となります。

本文に関しては、最重要な(=最も出題されやすい)知識は赤字で書かれています。これらに赤シートを重ねると文字が消えます。この特徴を活用すると覚えるべき語句や箇所だけをピンポイントで確認しやすくなります。例えば、1回目は普通に本文を読み通し、2回目以降の復習では、文字を赤シートで隠しながら読み進めると、まるで問題を解いでいる効果が期待できます。しかも、場所を選ばず、例えば交通機関の中やちょっとした隙間時間にもさっと試験勉強できるのが魅力的です。

本文の学習後にすぐに取り組む章末問題に関しても、正解を赤シートで隠せるので、効率よく、一問一答の学習ができます。

プラスα G検定に合格後も長く使える!

著者は、多くの種類のデータサイエンスの講座を持っている他、データ分析とAI人材の育成を担うデータサイエンティスト集団の企業に所属しています。読者は、専門性を有する企業だからこそ伝えることができる知見を本書から得ることができます。G検定に出題される各概念を可能な限り、実務の現場の事例を使って説明しています。そのため、本書は、G検定に合格だけでなく、その後で実務で使う際までも長く使える一冊になっています。

■最後に、いつものメッセージ …

G検定の多くは、基礎知識として知っていることが期待されている内容が出題されます。一方で、最新の技術動向を完全にフォローすることは難しいです。最新の技術や議論を問う問題を解けなくても、受験者は自信を失う必要は全くありません。まず、このような難問は合否に影響しません。それだけではなく、著者はこのような最新用語の出題はある特定の意図をもってなされていると思っています。
難易度の高い問題は、必ずしも受験の際に知識を持っていることが期待されているわけではありません。どちらかというと、「受験を機に、解けなかった問題については自発的に調べて知識を広げてください」というメッセージのように受け止めてよいと思います。ディープラーニングの応用は、完成された学問分野ではなく、日々技術が進化し、社会への実装がリアルタイムで試みられている領域です。それに伴い、学ぶべき内容が変わっていくのは当然です。G検定が認定するのは、「受検したタイミングにおける基礎知識」に過ぎません。一度合格しても、継続的に学習を続けなければ、最先端の知識をもっていると言えないわけです。

受験者へのインタービュで得られた知見をシェアしたいと思います。

「2020#3に初めてG検定に合格した後、半年経った頃にはせっかく覚えた知識の多くがなくなってきているのを感じていた。しかし二度目受験し合格すると知識の定着生が全くレベルが違うように感じた」

合格はゴールではなく、ジェネラリストとしてのスタートです。継続的に勉強を続ける姿勢それこそがジェネラリストに求められることだと思います。

■新シラバスの参考となる記事

gri-blog.hatenablog.com

gri-blog.hatenablog.com

gri-blog.hatenablog.com

gri-blog.hatenablog.com

gri-blog.hatenablog.com

yan
データ分析官・データサイエンス講座の講師