1.はじめに
はじめまして。ビックデータ推進課のY.Hです。
昨今新型コロナウイルスの影響により、不安な日々が続いていることと存じます。
手洗い・うがいを行い、感染予防に努めていきたいですね。
私は、睡眠をよく取るようにしています!
さて、今回の記事では、データサイエンティストに必要なスキルである、
「統計」について、ご紹介していきます。
2.統計について
2_1.データサイエンティストと統計
データサイエンティスト協会が提唱しているスキルマップによると、
「ビジネス力」「データサイエンス力」「データエンジニアリング力」
の3つのスキルがデータサイエンティストに必要とされています。
その中で、統計のスキルは「データサイエンス力」に欠かせない要素の一つです。
※データサイエンス…データから有益な知見を引き出そうとするアプローチのこと。その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを多方面的に扱う。
実際に案件を進める中で、データからグラフや表を作成し値の意味を読み取る際に、
この統計のスキルが重要になってきます。
作成した結果が意味のあるものなのか、そもそも分析方法は合っているかなどは、
統計学の知識なしには正確に判断出来ないからです!
2_2.統計検定
先程、統計学の知識が重要と書きましたが、私自身も初めから知っていた訳ではありませんでした。そこで、知識の取得し、案件で任せてもらえる幅を広げたいと思い、統計検定3級を受けることにしました。
ここでは、統計検定3級を受けるにあたって、
・受験概要
・取得するまでにかかった時間
・勉強方法
・押さえておきたいポイント
・取得して良かったこと
について、私の経験を元にご紹介してきます。
・受験概要
受験方法:ペーパー試験、CBT方式の2種。
※CBT方式は、自分で指定会場の中から好きな会場を選べます。
試験時期:ペーパー試験→6月・11月
CBT方式→自分で選べる
受験料 :ペーパー試験→4,000円
CBT方式→6,000円
合格水準:100点満点で70 点以上
出題内容:
量的変数、質的変数、母集団と標本、指数(指標)、
四分位数、四分位範囲、分散、標準偏差、箱ひげ図、
散布図、相関係数、確率、etc…
ちなみに私は、ペーパー試験で受験しました。
ペーパー試験では、試験時間は60分、出題数30問程度なので、
効率よく問題を解けるよう、時間を気にしながら問題を解く練習をしておくと良いと思います。特に、計算問題に時間をかけられるように、簡単な問題から解いていくのが重要なポイントです!
・取得するまでにかかった時間
1日約1時間の勉強を1ヶ月半行いました。私の場合、元々文系で数学が苦手だったこともあり、学習期間は余裕を持って取りました。
統計が得意な方や、理系の方はもう少し短い期間でも十分合格できると思います…!
毎日少しずつでも継続して勉強することが重要だと思うので、私は会社の昼休みにこつこつ学習していました。
・勉強方法
最初は、公式テキストを重点的に読みこみ、出題範囲の理解を進めました。
公式テキストを2周読んだ段階で過去問を解き始め、苦手な分野の洗い出しを行いました。
苦手な分野が分かったらテキストを読み返し、再度過去問を解くといったように、繰り返し問題を解くことで知識の定着につながったように思います。
※統計を学習したことがある方であれば、過去問から取り組んでも良いかもしれません。
・押さえておきたいポイント
標準偏差や四分位範囲、相関係数、確率は、出題されやすいと思うので確実に押さえておく必要があると思います。公式を覚えたり、出題傾向をしっかりと身に付けておくと良いと思います!
・取得して良かったこと
業務において、作成したグラフの傾向を読み取れるようになってきました。
また、四分位範囲を元に、値の分布を把握できるようになるなど、少しずつですが業務に知識を活かせています。
集計結果を統計的な観点から読み取れるようになり、取得して良かったと思っています!
現在は、さらなるスキルアップの為に統計検定2級の勉強を始めています。
スキルアップしていくには、一日一日のちょっとした積み重ねが大事だと痛感しています!
3.おわりに
データサイエンティストに必要なスキル「統計」について、ご理解頂けたでしょうか?
本記事を通して、少しでもデータサイエンティストについて、イメージして頂けていたら幸いです!
今後もデータサイエンティスト関連記事をご紹介していきます。
お楽しみに!
当社問い合わせフォーム:https://www.css-net.co.jp/contact/