データサイエンティストの概要や年収、仕事内容、求められるスキル、未経験から目指す方法まで未経験からデータサイエンティストを目指す方法

最終更新日:2020年6月9日

レバテックキャリアは
ITエンジニア・Webクリエイター専門の転職エージェントです

データサイエンティストは、データを収集・分析し、ビジネス戦略や施策改善などを立案・実行する職種です。膨大かつ複雑で、一貫性が無いビッグデータを分析し、その結果をもとに問題解決・状況改善に向けた施策立案などを行います。近年、生産やマーケティングなどさまざまな領域でビッグデータの活用が進んでいます。ビッグデータ時代の到来に伴い、データサイエンティストなどのIT人材の需要はますます高まってきています。

データサイエンティストには、高いスキルと広範な知識が求められるものの、一定の条件を満たすことにより、未経験からでも目指すことができます。この記事では、データサイエンティストの概要や年収、仕事内容、求められるスキル、未経験から目指す方法を解説します。

1. データサイエンティストの仕事内容

はじめに、データサイエンティストの仕事内容を具体的に紹介します。データサイエンティストの仕事内容は企業によってさまざまです。そのため、ここでは実際の求人から抽出した仕事内容を紹介しています。

課題抽出および仮説立案

顧客企業が抱えるビジネス課題を抽出し、どの課題を解決すべきか・解決方法にはどのような方法があるかを整理・提案します。このとき、机上の空論にならないように実際に収集可能なデータや実行可能な分析方法を踏まえながら、仮説を立てることが大切です。ここで決定した仮説に基づいて後続の作業(データ収集・分析・環境構築)などが行われるため、データサイエンティストの仕事の中でも重要度が高いフェーズです。

データ分析設計・環境構築

立案した仮説をもとに、必要なデータや分析モデルの確定、データ分析基盤の構築などを行います。たとえば、ERPやCRMからどのデータを収集すべきかを確定し、API接続によってデータが取得できるように、プログラムの設計・開発を行います。また、データの蓄積・検索・運用に使用する各種データベースの構築も担うことがあるでしょう。

このようにエンジニア色の強い仕事も含まれるため、プログラミング言語やDB関連のソフトウェアに関する知見・スキルが問われます。プログラミング言語としてはJavaやPython、Rなどが該当し、DB関連ではHadoop、MySQL、NoSQLなどの構築・運用スキルを求められることが多いでしょう。

データ加工、レポーティング

データ設計や環境構築が完了した後は、データ収集・加工作業に入ります。収集したデータを加工し、グラフや表などを用いた可視化やKPIの設定などを行うこともあります。

データ分析と仮説検証

データ分析では、収集した各データを組み合わせながら、統計的に有意なデータ項目を特定します。例えば、「サービスの継続率に関連するデータ項目はどれか」「継続率を上げるためには、どのデータの動きに着目すべきか」といった観点でデータ項目を特定し、分析を行います。さらに、最初のフェーズで立案した仮説と突き合わせながら、仮説の妥当性を判断していきます。

戦略及び施策の提示とモデル構築

データ分析の結果をもとにビジネス上の課題解決につながる経営戦略や業務施策を決定し、顧客に提示します。さらに、提示した内容が当初の目的に合致しているかを判断するためのアルゴリズムを実装したり、予測モデルを構築したりといった仕事も担当します。

2. 未経験からデータサイエンティストを目指す方法

ここでは、データサイエンティストを目指す方法を解説します。

未経験からデータサイエンティストになるために学ぶべきこと

IT業界で技術職の経験が全くない状態からデータサイエンティストを目指す場合には、データ収集・分析で用いられるプログラミング言語の習得が必須です。特に、PythonやR、SQLなどを中心に学習を進めていきましょう。

Python
Pythonは、近年機械学習やAI構築などの分野で使用されているスクリプト言語です。シンプルな記述で複雑な処理を行えたり、分析用のライブラリが豊富であったりという特徴があります。データ加工に強みを持つ「NumPy」、機械学習の前処理(データ読み込みや欠損値処理)を行う「Pandas」、データ可視化・レポーティングに用いられる「Jupyter」などは、実際の業務でも頻繁に使われるライブラリです。Python本体の記述方法と合わせて、使い方を身に着けておきましょう。

R
Rは学術分野の統計解析で使用されていた言語ですが、近年は民間企業でも導入されるようになりました。統計解析に必要な機能を複数備えており、大量のデータを効率よく解析することができます。こちらもPythonと同様に、「dplyr」や「stringr」といった拡張パッケージ(ライブラリと同義)と合わせて学びたいところです。

SQL
SQLは、DB操作用の言語として国際標準化されているため、DBの種類(MySQLやRDBMS)に関わらず使用できる汎用性の高い言語です。データサイエンティストは、頻繁にデータ検索・抽出・操作を行うため、基礎レベルのSQL構文は必ず身に着けておきましょう。

統計解析用ツール
ITエンジニアとしての経験がある場合は、プログラミング言語よりも手法やツールの知識を補強すべきです。特に、SPSSやSASなどは統計解析用ツールとして広く使われているため、こういったツールの使い方を学習してみてください。

基礎数学に関する知識
統計学、線形代数、微積分、確率など基礎数学に関する知識も必須です。これらは大学数学レベルに該当するため、文系人材であれば無理に独学を目指さず、資格試験やスクールなどの活用も視野に入れてみてください。

ちなみに、データサイエンティストの必須知識である数学(統計学、確率、モデリング)や情報処理、機械学習などの知識は、独学でも習得は可能です。ただし、独学ではつまずきや誤解を解消しにくく、モチベーションが保ちにくいというデメリットがあります。

そのため、できればスクールや資格試験を活用しながら知識の習得に努めるとよいでしょう。主な学習方法は以下となります。

データサイエンティストになるための勉強方法

書籍
データサイエンティスト養成読本 登竜門編(高橋淳一 他、Software Design plus)
データサイエンティストになるための基礎知識を幅広く紹介しています。RやPythonなどのインストール方法から解説しているため、プログラミング未経験者であっても読み進められる内容です。エンジニア未経験者向けの入門書になり得るでしょう。

改訂2版 データサイエンティスト養成読本(佐藤 洋行 他、Software Design plus)
データ分析に重点を置いた入門書です。RやPythonを用いて、実際のデータ分析を進めるための手法・ツールなどが紹介されています。

データサイエンティスト養成読本 機械学習入門編(比戸 将平 他、Software Design plus)
機械学習に重点を置いた入門書です。機械学習に必要な考え方や手法が網羅的に紹介されているほか、代表的な機械学習用のツール、予測モデルの構築事例などもまとめられています。ただし、内容の理解にはプログラミングに関する知識が必要です。したがって、完全な未経験者を想定した書籍ではないことに注意が必要です。

完全独習 統計学入門(小島 寛之、ダイヤモンド社)
統計学の手法や基礎知識(分散や標準偏差など)が解説されている書籍です。初級~中級レベルの知識を丁寧に順を追って解説しているため、学びなおしにも適しています。エンジニア経験者が統計学を学ぶ場合にもおすすめできる書籍です。

スクールによる学習
データサイエンティスト志望者向けのスクールは、現時点では数が少ないものの、少しずつ増えてきています。特に汎用プログラミング言語であるPythonを使った機械学習が学べるコースは、IT業界での経験が統計やモデリングなどに結び付けられるため、未経験者にもおすすめできるコースといえるでしょう。

DataMix
約半年かけてデータサイエンティストのエントリーレベルに相当する技術を身に着けられる「データサイエンティスト育成コース本講座」のほか、Pythonプログラミングやデータ分析についてのオンライン講座なども開講しています。

キャリアパスの具体的な構築手順

未経験者がデータサイエンティストを目指す場合、こうした学習方法と合わせて、具体的なキャリアパスについても知っておく必要があります。ここでは、タイプ別のキャリアパスについて一例を紹介します。

エンジニア出身の場合
エンジニア出身者の場合は、Pythonを使った機械学習・ディープラーニングの経験を積みながら、「エンジニア寄りのデータサイエンティスト」を目指す方法が一般的です。ちなみにこのタイプは「機械学習エンジニア」と呼ばれることもあります。したがって、まずは機械学習エンジニアの求人に応募し、統計学などを学びながらデータサイエンティストを目指すという方法が考えられるでしょう。

非エンジニアの場合
エンジニアとしての経験は持たないものの、マーケターやアナリスト、コンサルタントといった職種で分析やレポーティングの経験があれば、「ビジネス寄りのデータサイエンティスト」を目指す方法が良いでしょう。ビジネス寄りのデータサイエンティストは、技術的な要素よりも、課題抽出・仮説立案などビジネス的な要素に注力します。まずは、それまでの経験をもとにジュニアレベルのデータサイエンティストとして転職し、徐々に技術的なスキルを高めてみてはいかがでしょうか。

未経験者が狙うべき企業は?
上記どちらの場合でも、データ分析サービスを提供する企業や、AIソリューション系のプロダクトを提供する企業に的を絞って転職活動を行いましょう。また、所属企業の社内プログラムや公募制度の中に、データサイエンティスト養成に関するものが無いかもチェックしてみてください。

3. データサイエンティストに求められるスキル

ここでは、データサイエンティストに求められるスキルを解説します。必要なスキルはデータサイエンティスト協会が定義しており、大きく以下3つに集約されます。

求められる3つのスキル

1. ビジネス力…課題背景を理解した上で、ビジネス課題を整理し、解決する力
2. データサイエンス力…情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力
3. データエンジニアリング力…:データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力
 
「サイエンティスト」という名称から「研究」「追求」「発見」を連想しがちですが、実際には企画職やマネージャー職と同じように、ビジネスに直結したスキルが求められます。
 
もちろん、2番目の「データサイエンス力」にあるように、専門的な知識も必要です。ただし、知識の体系化や深化が目的ではなく、「データから企業を成長させるヒントを見つけ出す」のが仕事です。

データサイエンティストのレベル別スキル

また、データサイエンティストは、そのスキルレベルに応じていくつかの段階があります。以下、その一部を紹介します。

1. 初級レベル(見習いレベル)
・基本統計量(平均、中央値など)の知識があり、指示されたデータから、抽出・グラフ作成を正しく行える
・表計算ソフト(Excel) や 簡易データベース(Access)等のツールを用い、目的に応じた処理をすることができる

2. 中級レベル(独り立ちレベル)
・学術分野で使われる統計解析手法(SPSS/SAS/R等)が使える
・第三者からの指示が無くてもサンプル抽出と内容の確認ができる
・データクレンジング、分布、単回帰やP値の概念を理解し、活用できる
・大規模なファイルシステム、データベースにアクセスし、大量の構造化データを処理できる(表計算ソフトや簡易データベースで処理できない規模に対応できる)

3. 上級レベル(棟梁レベル)
・多変量解析の概念を理解し、活用できる
・機械学習、自然言語、画像処理のアルゴリズムを理解し、適切に活用しながら問題解決を行える
・モデルを構築、実装できる
・分析のためのデータシステム設計(フォーマット、取得蓄積仕様等)ができる
・問題設定に応じた新規データマート設計ができる
・構造化データ/非構造化データを問わず、分析システムを設計できる
・構築したモデルを実装できる
・データ分析を作ったシステムを自身で構築できる

中級レベル以上は、かなり専門的な知識・スキルが求められる一方、初級レベルは比較的ハードルが低い点に注目です。日常的にデータ集計や簡易データベース・グラフ作成を行っていた経験があれば、初級レベルの一部はクリアできているといえそうです。また、未経験者向けの内容ではないためここでは述べませんが、データサイエンティスト協会の定義では、「業界を代表するレベル」というものもあります。
 
※参考:データサイエンティスト協会「スキルセット、定義」

4. データサイエンティストを目指す際に役に立つ資格

データサイエンティストのスキル習得に役立つ資格もいくつかあります。特に以下の4つはデータサイエンティスト協会が推奨しており、未経験からデータサイエンティストを目指す際に役立つでしょう。

統計検定®
一般財団法人 統計質保証推進協会が主催する検定で、統計学に関する知識を評価する統一試験です。5段階の級と2つの資格によって試験が別れており、習熟度に応じた検定が受けられます。

情報処理技術者試験
IPA(情報処理推進機構)が主催するITに関連した資格試験です。習熟度や分野別に試験が分かれています。データサイエンティストを目指すなら「基本情報技術者試験」「データベーススペシャリスト試験」などが役立つでしょう。

アクチュアリー資格試験
日本語では「保険数理士」や「保険数理人」とも呼ばれます。アクチュアリー試験では、1次試験の「数学」が確率、統計、モデリングといったデータサイエンティストの必須知識を磨くのに適しているといえるでしょう。

DB系資格ORACLE MASTEROSS-DB
SQLを習得するため、メジャーなデータベース系の資格も取得しておきたいところです。特に、オラクル社製のDBに関する資格であるORACLE MASTERや、OSS製のDBに関する資格であるOSS-DBなどがおすすめです。

5. まとめ

この記事では、データサイエンティストの概要や年収、仕事内容、求められるスキル、未経験から目指す方法を解説しました。データサイエンティストは、IT、数学、機械学習など複数の専門知識が必要な職業であり、目指すには多くの努力が必要となるでしょう。
 一方で、経済産業省が養成に力を入れるほど将来性が期待されている職業でもあります。最近では徐々に学習環境が整ってきているので、興味がある方はデータサイエンティストへの転身を検討してみてはいかがでしょうか。

ITエンジニア・Webクリエイターの転職ならレバテックキャリア

レバテックキャリアはIT・Web業界のエンジニア・クリエイターを専門とする転職エージェントです。最新の技術情報や業界動向に精通したキャリアアドバイザーが、年収・技術志向・今後のキャリアパス・ワークライフバランスなど、一人ひとりの希望に寄り添いながら転職活動をサポートします。一般公開されていない大手企業や優良企業の非公開求人も多数保有していますので、まずは一度カウンセリングにお越しください。

転職支援サービスに申し込む

また、「初めての転職で、何から始めていいかわからない」「まだ転職するかどうか迷っている」など、転職活動に何らかの不安を抱えている方には、無料の個別相談会も実施しています。キャリアアドバイザーが一対一で、これからのあなたのキャリアを一緒に考えます。お気軽にご相談ください。

「個別相談会」に申し込む

内定率が高い

関連する記事

人気の記事

スキルアップ記事トップへ

データサイエンティストの求人・転職一覧

無料サポート登録簡単30秒

【厚生労働省】職業紹介事業許可番号(13-ユ-308734)

  • STEP1
  • STEP2
  • STEP3
  • 次のstepで入力すると返事が来る!
  • プロフィール入力すると返事が来る!
  • ご希望の条件を選択してください

    ご希望の勤務形態

    必須

    ご希望の勤務地

    任意

  • プロフィールをご入力ください!必須入力項目はこのページで終わりです。

    氏名

    必須

    氏名かな

    必須

    生年月日

    必須

    電話番号

    必須

    メールアドレス

    必須

  • スキルシート・ポートフォリオをお持ちの方はアップロードしてください

    スキルシート

    任意

    提出しておくことで
    迅速なご紹介が可能に!

    職務経歴書

    ドラッグアンドドロップ or ファイルを選択 選択されていません

    履歴書

    ドラッグアンドドロップ or ファイルを選択 選択されていません

    スキルシートを確認しています...

    スキルシートを確認しています...

    ※ファイルは5MB以下で対応するファイル形式 ? でアップロードしてください
    Microsoft Office .xls .xlsx .doc .docx .ppt .pptx
    KINGSOFT Office .xls .xlsx .doc .docx .ppt
    iWork .numbers .pages .key
    LibreOffice .ods .odt .odp
    OpenOffice .ods .odt .odp
    その他 .pdf

    ポートフォリオURL

    任意

    ?

    ポートフォリオとは主にクリエイターの方が自己PRのために過去の作品や制作実績をまとめた作品集の事です。

    ポートフォリオをWeb上で公開されている方はそのURLを、データでお持ちの方は作品データをアップしたURLを入力してください。

    ※データをアップされる場合は、保存期間や容量制限の少ないGoogleドライブを推奨しています。

    その他ご要望

    任意

  • 下記の内容をご確認いただき問題ないようでしたら、送信してください

    プロフィール入力すると返事が来る!

    • ご希望の勤務形態 必須

    • ご希望の勤務地 任意

      第一希望:
      第二希望:

    • 氏名 必須

    • 氏名かな 必須

    • 生年月日 必須

    • 電話番号 必須

    • メールアドレス 必須

    • 職務経歴書 任意

    • 履歴書 任意

    • ポートフォリオURL 任意

    • その他ご要望 任意

    個人情報の取り扱い 」と「 利用規約 」に同意の上、 『同意して登録する』 ボタンをクリックして下さい。

プライバシーマーク

レバテック株式会社は「プライバシーマーク」使用許諾事業者として認定されています。
個人情報の秘密は厳守します。ご入力いただいた情報は許可を頂くまで求人企業に公開することはありませんので、ご安心ください。

申し込みに関するご注意
以下の方は弊社の事業基盤、求人動向から、ご提案のご連絡までお時間をいただく可能性があります。ご了承ください。
IT業界、または希望職種が未経験の方
レバテックキャリア対象エリア以外での勤務地、また在宅での作業を希望される方