統計検定 データサイエンスエキスパートの勉強方法とおすすめ参考書(優秀成績賞取得)

データサイエンスエキスパート 数学

こんにちは、かいとです。

本日は、2023年8月に僕が独学で統計検定 データサイエンスエキスパートの資格試験に合格した際に感じた、必要知識やおすすめ参考書、勉強方法を紹介します。
調べた方はわかると思いますが、データサイエンスエキスパートには、専用参考書・過去問がありません(2023年9月時点)。
なので今回は、僕自身勉強したことや経験をもとに、こんな勉強をしておくといいかも、こんな試験だった、ということを紹介していきます。

前提

データサイエンスエキスパートについて

データサイエンスエキスパートは、統計検定の一種で、データサイエンスに関する専門的なスキルを客観的に評価する試験です。
試験範囲は広く、数学に関しては大学専門レベルでの高度な内容について問われます(本当に高度でした)。さらに、数学の知識だけではなく、PythonやSQLなどのプログラミングの知識も問われるため、かなり広い範囲を勉強しないと合格は難しいでしょう。

さらに、前述したとおり専用の参考書や問題集がなく、対策もかなりしにくいです(公式ホームページにサンプル問題がある程度です)。
個人的な感想ですが、統計検定 準1級と同じくらいの難易度だと感じましたが、勉強がしにくい分こちらの試験のほうが対策しにくかったです。

ちなみに、サンプル問題の難易度ですが、SQLとPythonに関しては実際の試験と同レベルと考えてよいと思います。
それに加え、純粋な数学の問題が出るイメージです。

受験時のスキル

受験時、統計検定 準1級を合格してから1年が経っていました。
統計検定以降はITの資格ばかり勉強していたので、数学に触れるのも久しぶりで基礎的な部分から勉強のし直しとなりました。

受験時の僕の保有資格は、自己紹介ページをご覧ください。

合格時の点数

合格点は60点以上です。受験後にすぐ合否が出ます。
僕は一度受けたとき、56点で落ちてしまいました。
その後再受験したときには、81点で合格し、成績優秀賞までいただきました!

合格までに要した勉強時間は、40時間でした。

かいと
かいと

CBT方式なので、まずは試験の雰囲気を知るためにも1度受験をしてみました。
あわよくば、と思っていたのですが、残念ながら不合格となってしまいました。。。
ただ、合格点近くは取れていたので、近く再受験し無事合格することができました。
1度目で落ちた教訓を活かすことができ、優秀成績賞もいただけました。

※再受験のルールに関してはこちらの「Q. CBT方式試験の受験回数に制限はありますか?」で確認をお願いします。

必要な知識とおすすめ参考書

問題の構成と必要知識

前述のとおり2回受験して、問題構成は変わりませんでした。
これで固定なのかはわかりませんが、どちらも大問9問、大問1つにつき小問4問でした。
この大問1問につき小問4問というのは、サンプル問題と変わりませんね。

各大問には、出題範囲票の中から1~3個のキーワードがピックアップされ、それについて深堀されていくといったイメージです。
各キーワードに対してかなり深く知識を問われるので、深く理解しておくかその場で計算できるスキルが必要となります。
語句を答えたりの1問1答形式はほとんど出ないので注意です。

2回試験を受けて思った、合格に必要な知識は以下の3つです。
以下では、このそれぞれについて解説していきますね。

合格に必要なこと
① 統計検定 準1級相当の統計知識
② プログラミングの知識(Pythonがメイン、R・SQLも少し)
③ 数学の理論に対する理解・応用能力

① 統計検定 準1級相当の統計知識の取得

データサイエンスエキスパートの出題範囲は、統計検定 2級までとデータサイエンス発展の範囲を前提としたうえで、さらに高度な知識が出題されます。
統計検定準1級の出題範囲と見比べていただいても、結構出題範囲がかぶっていることがわかると思います。
そのため僕は、下記を軸にして勉強を進めました。

なお、上記には出題されない範囲も含まれているため、僕は以下の章は勉強しませんでした。
・14章、15章
・18章のロジスティック回帰以外
・25章、26章、29章

また、統計検定準1級の過去問も、関連しそうな部分は解いています。

統計検定準1級を受けたときにこの本は読み込んでいたこともあり、スムーズに勉強することができました。
当時の勉強方法はこちらに記載しているので、ぜひ読んでみてください。

② プログラミングの知識の取得

テスト問題はランダムなのでその時々によりますが、Pythonに絡んだ問題も多く出ます(SQL、Rは少しという感じです)。
割と多く出るので、Python知識は必須です。
どうPythonと数学が絡んでくるかというのは、サンプル問題のような感じです。
数学の知識も必要としつつ、Python(またはR)の実装の穴埋めや計算量、コードを実行したときの結果を答えるといったパターンがメインとなると思います。

ライブラリに関しては、numpyやpandas、matplotlibなどの基本的なものがメインとなります。
その他のライブラリもいくつかは出題されましたが、あまり有名どころではないライブラリはサンプルコードが最初に載っていたりしたので、そこまで心配しなくていいと思います。

必要なレベルとしては、1からは書けなくてよいけど、コードを読める(理解できる)・選択肢を見れば穴埋めはできるというレベルです。
Pythonにおすすめのテキストはこちらです。
AIの基本語句を理解できる点に加え、numpyなどのライブラリも使えるようになることが挙げられます。
また、計算グラフの利活用やCNNについても深く知れるので、かなり良いと思いました。

SQLのおすすめ書籍はこちらですが、SQLは問題数が少ないのとそこまでややこしい問題は出ないので、あまり深くは勉強しないでも問題ありません。
ただ、サブクエリ(副問い合わせ)はしっかりと理解しておきましょう。

Rに関しては、統計基礎の復讐にもなると思いこちらで勉強しました。
ただ、Pythonを理解していれば、Rは構文だけ理解しておくレベルでよいと思います。
メインはPythonになるのと、1個のプログラミングを知っていればそこまでハードルは高くないので、同じ感じで解けると思います。

③ 数学の理論に対する理解・応用能力

こちらは1度不合格となったあと、自分に足りなかった力はこれだと思い急ピッチで勉強したものになります。

前述のとおり、それぞれの大問で1~3個キーワードがピックアップされ、それについて深堀されていきます。
Pythonが絡まない問題の時は、式の導出や、ある条件の下での式の変形など、かなり深い知識と計算・応用力を要求されます。
1回目の受験の時は大問まるごと解けない問題も多々あり、それで不合格となってしまいました。
そのため、再受験に向けてはこちらで計算力を強化しました。
(いずれも以前読んでいる本で勉強したので、流し読み&出題範囲と被ってそうな部分のみです)

こちらは、かなり深いとこまで記載されている本格的な線形代数学の本です。
お堅そうには見えるのですが、説明がわかりやすいのと、章立ての順番もわかりやすいので、大学生のころに読み込んでました。
おすすめです。

大学の微分積分は、微分積分の計算を思い出すのに使用しました。
実際、期待値や分散の計算なども積分の計算なので、手を動かして演習問題を解きました。
特に2変数以上の場合についてはしっかり勉強しなおしました。

この2つの「これなら分かる」シリーズは、かなりわかりやすいです。つまずきポイントにしっかり解説を入れてくれているので、すっと理解できます。

2回受験しての感想

2回受験をしてみての感想です。

  • 統計の計算もあったが、それよりも数学の理論の計算や導出が求められることが多かった
  • Pythonなどのプログラミングは3割程度を占めていた(問題はランダムなのでブレはあります)
  • 一瞬で分かるような知識を問われる問題はほとんどない
  • 知らないキーワードが出てきても、問題文に簡単に説明(定義)が書かれているから、計算さえできれば導出可能そうな問題が散見された
  • 統計検定準1級よりも少し難しいと感じた(公式テキストや過去問もないため)
  • 1回目、2回目で出題される内容は大きく変わった(試験範囲が広いため)

1回目、2回目で出題内容が大きく変わるので、再受験の際には注意が必要です。
1回目で解けなかった問題をしっかり復習しても、2回目でも出題される可能性は低めとなるので、山を張るというよりも問題の雰囲気や傾向を知りまんべんなく勉強するようにしましょう。

試験の準備

数学系のCBTの時はいつもお伝えしていますが、準備段階として意識しておいて欲しいことは2点あります。

CBTで解く準備

試験はCBT形式で、選択問題と計算結果をキーボードで入力する2つのパターンがあります。
注意していただきたいのは、計算結果をキーボードで入力する問題です。
小数点何桁を四捨五入して、とかいう記述がどこかに書いてあるので、必ずそれに従ってください。
せっかく計算は合っているのに、小数点をミスってバツになってしまうのはかなり勿体無いですので。。。
人の手で採点されない分、部分点ももらえません。
普段から小数点を意識して問題を解くトレーニングをしましょう。

相棒の電卓を用意する

試験で使用する電卓を用意してください。
自分が使いやすいと思うものならなんでも良いですが、最低限ルートの計算とメモリ機能を備えたものが良いと思います。
オススメの電卓は色々なサイトで紹介されていますが、僕はこれを使っています。
勉強の段階から使用して、試験までに使いこなせるようにしておいてください。

最後に

以上、統計検定 データサイエンスエキスパートの勉強方法をご紹介しました。
統計検定の中でも難しい部類だと思います。
過去問等がないので勉強方法がイメージつかない、という方のために、なるべく試験のイメージが伝わればと思い書いてみました。

本記事が、これから試験を受ける方々の参考になれば幸いです。
ありがとうございました。

コメント

タイトルとURLをコピーしました