データサイエンティストは、ビッグデータを活用して価値を創造する仕事です。将来の予測が難しいVUCA時代を生き抜く組織には、データを活用し、課題の発見や解決策を見出す体制づくりが求められます。需要が高まるデータサイエンティストの仕事内容はどのようなものか、また、データサイエンティストを目指すにはどのようなスキルを身につければよいのでしょうか。必要なスキルや、その習得方法などを解説します。
目次
データサイエンティストとは?
データサイエンティストとは、データ収集・分析によってさまざまな課題に対する知見を見出し、ビジネスに貢献するプロフェッショナルのこと。肩書自体は2008年頃に登場しましたが、データの収集・分析によってビジネスの課題を解決する仕事はそれ以前から存在し、事業企画部やコンサルティングファームが担っていました。しかしITイノベーションによって、対象となるデータ量の肥大化やデータ収集・分析方法の高度化が進むと、より専門性の高い人材が求められるようになり、データサイエンティストの需要が生まれました。
データサイエンティストに向いている人は?
データサイエンティストに適性のある人は、どのような共通点を持っているのでしょうか。代表的な3つを取り上げます。
1. 情報収集が得意
優れたデータサイエンティストは、高い情報収集能力を持っています。ウェブAPIやWebスクレイピング、IoT機器など、複数の収集手法を使いこなしながら効率的にデータを収集できる人は、データサイエンティストに向いているでしょう。仮説と照らし合わせながら上質なデータを収集し、データサイエンスの精度を高められれば、なお理想的です。
2. 論理的思考力がある
直感や憶測で分析を行うと、データサイエンスの成功率は高まりません。筋道を立てて作業し、常に整合性を保ちながら仮説を裏付ける必要があるため、論理的思考力のある人が向いています。
3. 数字に強く、数学的思考力がある
プログラミングによって計算処理を行うとしても、その背景にある数学的な理論を理解している必要があります。長時間、数字と向き合っても苦にならない人は、データサイエンティストの素養があるかもしれません。
AIエンジニアやデータアナリストとの違い
データサイエンティストと混同されやすい職種として、AIエンジニアやデータアナリストがあります。それぞれどのような違いがあるのか見ていきましょう。
-
【AIエンジニア】
データ解析やAIシステムの開発・実装に携わる -
【データアナリスト】
エンジニア型/データ収集・分析を行い、高度な解析を担う
コンサル型/データ収集・分析を行い、ビジネス戦略を提案する -
【データサイエンティスト】
データ収集・分析を行い、ビジネスの課題解決に取り組む
AIエンジニアの専門領域は人工知能の活用に関する研究開発です。主な仕事として、AIを扱い、システムを構築します。一方、データサイエンティストはあくまでツールの一つとしてAIを活用し、ビジネスの課題解決を目指す仕事です。AIエンジニアがシステムをつくる側で、データサイエンティストはシステムを使う側という点が異なります。
データアナリストとデータサイエンティストは、データの収集・分析のプロフェッショナルである点で共通しています。両者の違いは担当する仕事内容です。データアナリストは、データの収集・加工・分析を行い、その結果をもとにビジネス戦略を提案します。一方、データサイエンティストは機械学習におけるモデル作成などのデータサイエンス領域を担い、データの収集・分析をビジネスの課題解決まで結びつけるのが仕事です。
データサイエンティストにとって、データの収集・分析はあくまで手段であり、目指すべきゴールはビジネスの課題解決という点が異なります。
データサイエンティストの仕事内容
データサイエンティストは、ビッグデータを活用し企業戦略や商品開発、業務改革など、さまざまな課題解決に貢献します。仕事内容は、社内データサイエンティストとして従事する場合と、クライアントに対してサービスを提供する場合があります。業種によっても異なりますが、大まかな仕事の流れは下記の通りです。
まずプロジェクトを立ち上げたのち、業務担当者にヒアリングします。その結果を受けて、課題の洗い出しと仮説の立案を行います。社内に蓄積されたデータを使用する場合、管理者にヒアリングを行ってデータを確認・取得しますが、データ収集から行う場合もあるでしょう。データの前処理とモデリング、分析によってデータを可視化しながら、有意なデータ項目を整理します。仮説の検証や施策の提言はもちろんのこと、施策後の振り返りと改善もデータサイエンティストの仕事です。提言後の運用や業務設計を見据え、現場をサポートする必要があります。
例えばメーカーの商品開発に携わる場合、「消費者ニーズ」「競合他社リサーチ」「投資リスク」「CSRへの取り組み」などさまざまなテーマが考えられます。業務担当者と打ち合わせの上、プロジェクトテーマに沿ってデータ収集・分析を行います。具体的な業務内容の一例を取り上げましょう。既存の商品が顧客ニーズの変化に合致していないという課題を発見した場合、ビッグデータからターゲット層の情報を抽出し、検索行動(Webの閲覧履歴)などを基に潜在ニーズを見出します。また、生産性に対する課題を発見した場合、機械学習を用いて品質不良発生の予測モデルを構築する業務などが考えられます。
【将来なくなる?】データサイエンティストの需要は高い
ビジネス界においてビッグデータは新たな価値を生む資産であり、活用の重要性は高まるばかりです。ビッグデータを高速で分析できるAIに取って代わられ、データサイエンティストの仕事がなくなるのではないか、という声もあります。確かに、データ収集や分析は、AIに代替されていく可能性があるでしょう。
しかし、分析結果から価値を見出し、課題解決に向けて活用するプロセスは、いまだ人間にしかできない領域です。データサイエンティストにとって、AIは頼れるパートナーと位置づけるべきでしょう。
ビッグデータの活用が重要視されるにともない、データサイエンティストの需要も高まっています。厚生労働省の職業情報提供サイト「job tag」によると、2022年度、データサイエンティストが属する職業の全国有効求人倍率は2.77倍。データサイエンティストは将来性のある花形職種であり、高い収入を見込めるでしょう。
データサイエンティストになるには?必要なスキルセット
データサイエンティストに求められるスキルセットとは、「データエンジニアリング力」「データサイエンス力」「ビジネス力」の3つ。ITとビジネスの双方に精通するとともに、クリエイティビティが求められます。また、従事する業種の専門知識も必要になってくるでしょう。
「データエンジニアリング」に関するスキル
データサイエンティストにとって、データを「整備」するデータエンジニアリング力が仕事の根幹になります。「データの倉庫」を意味するDWH(データウェアハウス)を構築し、データを有効活用するための基盤を整えます。
防御(ITセキュリティ)の理解・対応力
組織にとってサイバー攻撃は最大の脅威であり、ITセキュリティの知識が求められます。従来の情報セキュリティには、CIA(機密性・完全性・可用性)の3要素が求められていましたが、昨今、新たに真正性・責任追跡性・否認防止・信頼性という4要素が追加されました。
データサイエンティストは、7要素を意識しながらセキュリティ対策を行う必要があるでしょう。多角的なログ分析や、ツールを活用したセキュリティ可視化によって、安全な運用プロセスを構築します。機械学習によって未知の攻撃を検出し、セキュリティソリューションのスケールアップを図ることも可能でしょう。
プログラミング能力
データエンジニアリングの分野では、主にPythonやR言語、SQLなどのプログラミング言語を用い、データパイプラインの作成や分析が行われています。特に、汎用性が高くAIに関するライブラリも充実しているPythonは、習得しておくべきでしょう。
実装・運用する力
データを収集・加工してデータ分析基盤を構築するだけでなく、実際に運用する能力も求められます。データ分析基盤の構築は、手段より目的に主眼を置き、ゴールを見据えた設計を行わなければ、利用価値のないものができあがってしまいます。BIツールなどを駆使してデータをビジュアル化し、インサイトが得られるような運用を実現しなければなりません。
「データサイエンス」に関するスキル
収集・加工したデータを分析して価値を見出すデータサイエンス力によって、課題解決への道筋をつくります。そのためには、情報処理や統計学、AIなどの幅広い知識と、それを使いこなすスキルが必要です。
基礎数学を理解し活用する力
データの挙動をモデル化して規則性を見出す数理統計学や、AIのアルゴリズムを理解するための線形代数など、基礎数学はデータ分析のバックボーンとして理解しておく必要があります。基礎数学の知識は、データの分析や検証などあらゆるフェーズで活用できます。
データを解析する技術力
データ解析技術は日進月歩で進化しており、幅広い技術に対する知見が求められるでしょう。一般的に用いられている手法として、大量のデータから有益なデータだけを抽出するアソシエーション分析や、データをグルーピングするクラスター分析、樹形図を作成して説明変数を明らかにする決定木分析(デシジョンツリー)などが挙げられます。機械学習やディープ・ラーニングの最新動向にもアンテナを張りながら、データを多面的に処理する技術を磨く必要があるでしょう。
非構造化データを効果的に取り扱い分析する力
ExcelやCSVのような構造化データのみならず、規則性のない非構造化データを分析する場面もあるでしょう。近年、IoTデバイスによって動画、ログデータ、画像、音声などあらゆる非構造化データが収集され、その有用性に注目が集まっています。
これまでは、データサイエンティストが多大な労力を割いて非構造化データの構造化を行ってきましたが、近年では自動で構造化するソリューションが開発されています。今後、データサイエンティストにはより高度な分析手法が求められるでしょう。
データを理解し検証する力
分析データを鵜呑みにすると、誤った提言を行う結果になります。データサイエンティストはデータを的確に理解し、因果推論の考え方を用いて原因と結果の関係性を検証しながら、正しい傾向を導き出す眼力が必要です。AIのパターン認識を活用し、データの傾向を明確化するスキルも有用でしょう。
「ビジネス」スキル
データサイエンティストは、分析結果をビジネスの課題解決手段に変換するスキルが求められます。
ビジネスの理解とアプローチ能力
組織や市場の現状を理解する力があると、データサイエンティストとしての価値はより一層高まります。組織のブランド力や市場シェア、人材など、組織のリソースを正しく把握できる能力は大きな強みです。また、分析結果の有用性を伝え、ビジネスマネジメントに活用してもらうためには、ロジカルシンキングやコミュニケーション能力が役立つでしょう。
ビジネス課題解決力
組織の課題を見抜くイシュー思考と、課題の背景を洞察し言語化するスキルが求められます。課題解決に向けた立案を行う際は、KPIなど具体的な数値目標が必要です。さらに、目標設定後、プロジェクトを効率的に推進するマネジメント能力があると、意思決定のスピード化を図れるでしょう。
データ課題解決力
データ課題解決力とは、データの収集・分析、提言までの一連のフローに対し、ビジネス視点を持って取り組める力のこと。データ分析を通して組織の課題を見つけ出す能力や、データの中から課題解決に寄与する傾向を特定する能力に秀でた人は、問題解決型データサイエンティストとして需要があります。
データサイエンティストに役立つ資格
データサイエンティストを目指す人は、どのような資格を取得すると就職を有利に運べるでしょうか。下記に取り上げます。
データサイエンティスト検定
データサイエンスに特化した民間資格で、2021年にスタートしました。現在は、見習いに求められるリテラシーレベルの検定(DS検定)が実施されており、初心者向けの検定と位置づけられています。2022年11月実施回の合格率は、約42%でした。
統計検定
全般的な統計の知識が問われる、民間の統一試験です。中学数学レベルの4級から大学専門課程レベルの1級まで、5つのレベルに分かれています。2021年6月の試験結果によると、合格率は4級約73%、3級約76%、2級約34%、準1級約24%でした。
情報処理技術者試験
IT技術者が広く活用できるよう、経済産業省が実施する国家試験です。合格すれば、情報処理技術者として一定以上の水準を満たしていることが認定されるため、IT技術者の登竜門と位置づけられています。データサイエンティスト志望者は、「基本情報技術者試験」やその上位資格である「応用情報技術者試験」、データベースのプロフェッショナルとして認められる「データベーススペシャリスト試験」を目指すとよいでしょう。
データベーススペシャリスト試験
データ分析基盤を構築するエンジニアを目指す人向けの国家試験です。近年の合格率は13%〜17%という狭き門ですが、合格すればデータベースに関する高度な知識とスキルを実証できます。就職やキャリアアップを目指す人にとっても、取得メリットの大きい資格といえるでしょう。
アクチュアリー資格試験
アクチュアリーとは金融分野に特化した数理のプロフェッショナルです。データを収集・分析し、将来予測を行うという点は、データサイエンティストと共通しています。データサイエンティストの仕事に有用な資格として、データサイエンティスト協会も取得を推奨しています。科目は、「数学」「会計・経済・投資理論」など。全科目に合格するには最短2年を要します。
データサイエンティストの将来性は?見据えるキャリアパス
データを活用しビジネス課題を解決するデータサイエンティスト自体希少価値の高い存在ではありますが、そこからのキャリアパスにはどのようなものがあるでしょう?今後注目されるキャリアとしては、機械学習エンジニア、データに強みを持った経営コンサルタント、マーケティング領域に強いデータサイエンティストなどがあります。
AI(機械学習)エンジニア
機械学習エンジニアは、AIを扱い、予測モデルやシステムを構築する仕事です。機械学習とは、コンピュータに命令とデータを与えて機械の知能を向上させる分野のことですが、機械学習エンジニアの仕事はそれらの機能を統括します。
求められる知識・スキルとしては、Pythonなどのプログラミング言語や機械学習ライブラリの知識、開発環境の構築スキル、データベースやクラウドの知識などが必要になります。
データサイエンティストと必要なスキルが似通っていますが、機械学習エンジニアはシステムを「作る側」、データサイエンティストは「使う側」であると理解すると良いでしょう。
データに強みを持った経営コンサルタント
ビジネスにおける課題解決のためにデータを活用するデータサイエンティストですが、領域を広げ、企業の経営課題を解決する経営コンサルタントとしてキャリアを積んでいくことも可能です。
新たにビジネスモデルや経営戦略などの知識を身に着け、データに基づいた企業の目的達成のための仮説立てや対策立案を行っていきます。
デジタルマーケター
「データドリブンマーケティング」という手法が一般化してきていますが、じつはデータサイエンティストがマーケティング領域で活躍する機会が増えています。
データ分析の結果をマーケティングKPIや施策などに反映させることで、その精度を向上させていきます。
さらにはAI(機械学習)技術を巧みに使うことで、成功パターンを予測し成果を最大化させるようなマーケティング手法もデータサイエンティストであれば可能になります。
データを活用する先端IT領域で活躍しつづけよう
データサイエンティストは、組織や社会の発展に貢献できる仕事であり、課題を解決した時の達成感は何にも代えがたいものでしょう。しかし、幅広い専門知識と高いスキルが求められるため、ハードルの高い仕事であることも否めません。データサイエンティストには「データエンジニアリング力」「データサイエンス力」「ビジネス力」の3つのスキルが必要です。未経験から学べる専門教育や養成講座、資格取得などを通じて学びを深め、データサイエンティストを目指してみてはいかがでしょうか。記事で紹介しているキャリアパスも参考にしてみてください。
「Neuro Dive」が描くデータサイエンティストの未来
経済産業省の試算によると、日本国内のIT人材は2030年までに40万人~80万人規模で不足する見通しです。特にAIや機械学習といった先端IT人材が多く不足するといわれています。そんな先端IT領域に特化した就労移行支援事業所「Neuro Dive」では、発達障害者に向けた専門的な学習プログラムを実施し、日本の未来を支える人材を育成しています。
利用者が希望する職種に応じて、習得すべきスキルや伸ばすべき能力を可視化し、効率的な学習を推進。特に、ビジネス視点が求められるデータサイエンティストの育成には、機械学習やプログラミング、分析などの専門領域はもちろん、それらのスキルを実務に役立てるためのビジネススキルの醸成を重視しています。
Neuro Diveメソッドを通じてスキルを磨いたデータサイエンティストが、多方面で新たな地平を切り拓くパイオニアとなるよう、日々、人材育成に取り組んでいます。
発達障害のある人が「データサイエンティスト」に向いている理由
発達障害の人は、「興味関心のあることに対する集中力」「論理的思考」「知的好奇心」に恵まれたケースが多いといわれます。また、パソコンなど機器類の操作が得意だという特性も指摘されています。これらの特性はすべて、データサイエンティストの適性に紐づくものです。もちろん特性には個人差があり一概にはいえませんが、発達障害の人は特性を活かしながらデータサイエンティストの分野で活躍する可能性があります。
【事例】データサイエンティストを目指して就業した方の体験談
Neuro Diveで学び、データサイエンティストの道を目指すM.Mさんの就職事例を紹介します。うつ病でITエンジニアの職を離れたM.Mさんは、4年間の療養を経て、再就職を目指してNeuro Diveに通所されました。学習レベルの高さに戸惑いながらも、「IT技術者不足が叫ばれる中、データサイエンスの知識とスキルは武器になるに違いない」と確信し、学習を進めます。その結果、日本を代表する総合化学メーカーに就職し、データサイエンティストの道を歩み始めました。
データサイエンティストになりたい!を支援する「Neuro Dive」
自身の特性を活かしながらデータサイエンティストを目指すには、専門分野に精通するITアドバイザーや支援員と学びを深められる、就労移行支援事業所の利用を検討してみるのもおすすめです。Neuro Diveでは、就職準備性講座で自己理解を深め、準備・訓練・就活の3ステップで就職を目指せるのが特徴です。「データサイエンスなどの分野を学んでみたい」という方は、Neuro DiveのWEB説明会にご参加ください(毎週木曜日もしくは土曜日に開催中)。