数学嫌いが最もセクシーな職業「データサイエンティスト」になるための第一歩を踏み出したお話
またまた久しぶりの更新です。
社会人1年目の冬、はじめて満額の賞与がでることを楽しみに、増えてきた残業もなんとか頑張れている私です。
さて、みなさんは「21世紀で最もセクシーな職業」と呼ばれている「データサイエンティスト」はご存知でしょうか?
データサイエンティストとは
2013年頃より、データサイエンティスト協会なるものが発足されたのでそちらの資料を参考に。
https://www.datascientist.or.jp/common/docs/skillcheck.pdf
こちらにでている「データサイエンスティスト力」とは「情報処理、人工知能、統計学などの情報科学系の知恵を理解し活用する力」。
「データエンジニアリング力」とは「データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力」とされています。
前者はデータの解析力や分析する能力、後者はデータの加工し実際にビジネスに活用していく能力なのかなと。
要するに
データサイエンティストとは、「ビッグデータを高度な統計解析ツールで収集、加工、分析し、ビジネスに活用できる知見を引き出す専門家」のことを指すと。
この数年間でよく「ビックデータの活用」という言葉をよく聞くようになりましたねぇ。
なぜ「データサイエンティスト」に興味を持ったのか
ここからは私個人の話になるのですが、
昨年(2017年春頃)就職活動をしているときに、「AIを活用した仕事をしたい!」とあまり理解が無いのに、最近のAIブームに乗せられ調子に乗ったことを言って今の会社の内定を頂きました。(奇跡
当時、IT系企業の説明会をまわるとどの会社でも「AI」、「IoT」、「ビックデータ」、「ブロックチェーン」の言葉がでていましたが、、、
最近では「ブロックチェーン」についてあまり騒がれなくなったような。
そこで、入社すると幸運にもAIを導入をしていく部門に配属となりました。
そして、上司からいずれは「データサイエンティスト」のような仕事ができるようになってほしいと言われたのです。
しかし、大きな問題が……
私は、理系の大学院まで出ましたが数学に苦手意識を持っているのです。。
私のスペックは…
- 一応理系大学院卒業したもののいまだに払拭できない数学への苦手意識
- データサイエンティストに必要な統計学の知識はほぼほぼ忘れている
こんな感じですね。
理系といえども、数学から少し離れていた研究を行っていたので。
また、学部生の頃に受講した統計学もなぜ行うのか?を教えてくれずに、私自身もテストに出るものと数式を暗記して挑んで単位を獲得していた記憶があります。。
今思えば、統計学の知識があれば研究結果の分析も掘り下げられたのではないかと後悔しております。
そもそも、AI≒機械学習をやりたいのに大学の統計学あんまり覚えてないです…とかそもそもなめてるんですがねw
ほんと、よく内定もらえたなぁ。
データサイエンス力を鍛えておこう
ひとまず、いまのうちにデータサイエンス力を鍛えておこう!
ということで統計学の復習…いやほぼ初学者としてお勉強を開始することにしました。
会社の先輩に「とりあえずまずは統計検定2級ぐらいの知識があれば十分だよ。」と言われたので、統計検定の公式テキストをチェック!
ちなみに、統計検定2級は大学基礎程度とのこと。
うーん、、数式だらけで頭が痛くなる…。
自分が数学苦手なだけでそう思ってしまっただけかと思いましたが、
だいぶ評判は悪いようです。
じゃあ、もっとも「統計学」をわかりやすくかみ砕いている本はないかと。
こちらがありました。
本書は統計の基礎から独立性の検定まで、マンガで理解!
統計の基礎である平均、分散、標準偏差や正規分布、検定などを押さえたうえで、アンケート分析に必要な手法の独立性の検定ができることを目標としている
マンガですよ。マンガ。絵もかわいいですし(?
大学でなんとなく受けていた(そういう受け身の私自身の講義の受け方も良くなかったですが…)統計学の授業でしたが…
この本を読んで「統計学ってどう使われるの?何を知れるの?」と復習もしつつ知識を身に着けることができました。
統計学について知りたいけど、いきなり数式がずらずら書かれている参考書を買うはちょっと…という人にはうってつけの本だと思います。
統計学を学ぶにあたってのハードルをかなり下げてくれる本ですね。
あと、もう一本はこちら!
ポテトのばらつきやアンケート集計の結果など、
ファストフード店で起こる統計的な疑問の数々を、
登場人物たちと一緒に悩み、一緒に解決していきましょう。仕事でデータ分析の必要を感じているビジネスマン、
論文を書くために統計学の知識を必要としている学生さんなどに、
とっかかりの一冊としておすすめです。
じつは、こちらの本は大学の教授が自身で作成されたHPがあるのですが、そちらを書籍化したものです。
HPを閲覧してみて、通勤中の電車で読みたいため書籍を購入しました。
こちらも、統計学を簡単にかみ砕いてくれている本なのでおすすめです。
「データサイエンティスト」になるために
上記の2冊を買って、絶賛統計学のお勉強中なのですがこれだけでは
データサイエンティストになるためにはまだまだ抑えておくポイントが足りないことを実感しております。
第一歩を踏み出した…と書きましたがほんの小さな一歩ですね。
ビジネス力、データエンジニアリング力は仕事をこなしながら身に着けていくとして、
まずは自分の知識を統計検定2級合格レベルまで持っていく必要があるかと考えております。
というわけで、仕事を覚えながら統計学のお勉強は続きます。