データサイエンティストについて~業務紹介編~

1. はじめに

こんにちは。ビッグデータ推進課のTJと申します!

前回の記事では、データサイエンティストとは何かについてご紹介いたしました。

 

blog.css-net.co.jp

 

 

本項では、分析業務って何をするのか?に焦点を当てながら、弊社の分析業務を

担うビッグデータ推進課の業務についてご紹介いたします!

 

2. 担当業種(現状)

  通信、ソフトウェア、金融機関、製造、他...

 

3. 業務内容

  分析支援、BIツールの導入支援、他...

 

4. 案件紹介(一例)

【案件名】

    某企業様、施策効果検証業務

【案件概要】

    基本的にに3つのステップで業務を行います。

  1. お客様が実施した施策の効果検証実施
  2. 属性毎の集計やグラフによる可視化などの様々な角度から検証結果を分析

  3. 分析結果を基に、結論・仮説を導き出し、お客様に提案

【使用言語】

    Python、SAS

 

【使用ツール】

    Tableau、Yellowfin

 

【分析方法】※一例

    Roc曲線(Receiver Operating Characteristic curve)

    施策の評価で使用します。

    False Positive Rate(偽陽性率)を横軸に、True Positive Rate(真陽性率)を縦軸に置

    き、グラフ化します。

    False Positive Rate(偽陽性率) : 正解データが負であるものを誤って正と予測した割合

    True Positive Rate(真陽性率)  : 正解データ正であるものを正しく予測した割合

    ※正負のクラス間の偏りを考慮した指標設定も重要となります。   

    ※上記の割合の計算方法や、詳細について、今回は割愛させていただきます。

    

    以下のように曲線下部の面積(AUC)が大きいほど精度が高いモデルとなります。

    ※AUC = Area under an ROC curve

f:id:css_blog:20200507134258j:plain  

   とてもざっくりとした説明になっているので、気になる方は調べていただけると理解が深まるかと思います。(機会があれば今度紹介させていただきます!)

 

  その他にも、お客様の業種・環境によって様々な方法でご支援を行っておりま

  す。

 

 5. おわりに

私たちが携わっている分析業務は、プログラムや分析ツールなども使用するため、時にはシステム構築を行うこともございます。

システムについての理解、分析手法の知識、お客様の業務知識など、覚えることは多岐にわたりますがその分、データサイエンティスト(の卵)になるというのは強みになると思うので、興味のある方は分析方法や統計について調べてみてください!

その他の案件につきましては、当ブログにて他のメンバーからご紹介があるかも知れません。

このようにビッグデータ推進課では、様々な業種のお客様に対して、分析支援業務を行っております。

 

次回は、データサイエンティストに必要とされるスキルについてご紹介いたします!

記事はこちら👇

blog.css-net.co.jp