トレーニング予約 お問い合わせ

データサイエンスとは

機械学習、AIが世の中に浸透し始めたことで、同時に注目を集めているデータサイエンス

この記事では、データサイエンスについて紹介していきます。

データサイエンスとデータサイエンティスト

データサイエンスとは、データを用いて科学的に有益な知見を引き出す学問であり、統計学と情報科学が融合した学際的な分野の科学です。

データは、現代では情報通信技術や計測技術の進展により、取得されるデータの量および種類は膨大なスケールになっていることからこうしたデータはビッグデータと呼ばれます。

データサイエンティストは、この多種多様なデータを分析し、自社の手掛ける事業に役立つ情報を提供することが業務であると考えられています。

昨今では、EBPM(Evidence based policy making:証拠に基づく政策立案)という言葉に代表されるように、政府サイドでもデータ分析を政策立案の基礎とすることを提起しており、データ分析の重要性と需要は官民問わず高まってきています。

データサイエンスで重要なこと

データサイエンスは一見難しい統計分析やモデルを使うことである、と思われる傾向があります。

しかし、データサイエンティストには以下の3要素が重要です。

  1. リテラシー:データを読み解く力
  2. 手法への理解:モデルや統計分析への理解と伝達力
  3. 演算スキル:実際の計算力

近年では、無料で使える統計計算ソフトの R や Python などのアプリケーションが充実していることから、これまでは大きなハードルであった演算スキルの問題は解消されつつあります。

そのため実際は、 Python などのライブラリを使っているだけで、自身をデータサイエンティストと勘違いする人も少なくありません。

このようなデータサイエンティストは経験や能力を職場で十分に活かせない、または、こうしたデータサイエンティストを採用・育成してもうまく管理することができない、といった状況が頻発しています。

上記のようなミスマッチを避けるためには、3要素を全て兼ね備えたデータサイエンティストとなる必要があります。

データについて

データの種類

データサイエンティストを料理人で分析を調理と例えると、まず必要なことはデータという素材への理解です。

データの種類を簡単に分類すると、質的データ(Qualitative data)量的データ(Quantitative data)になります。

質的データとは、性別や嗜好など分類や種類が区別されたデータのこと、量的データとは、重さや価格などの数値の大小に意味を持つデータのことを示します。

測定間隔による分類

記録・実験・観測によって得られたデータがどのような間隔で集計されているかによって、さらに分類をすることができます。

データが飛び飛びの値、例えば整数値しかとらないようなデータを離散的データ(Discrete data)と呼びます。

契約人数、故障回数などは、1、2など整数値によって集計されることから離散的データに該当します。

一方で、離散的データとは異なり隙間が無いようなデータを連続的データ(Continuous data)と呼びます。

こちらの事例として、収益率や重さなどが連続的データに該当します。

測定方法による分類

どのように測定するかでデータを分類することもできます。

ある対象のデータを一定期間毎に記録して、集計されるものを時系列データ(Time series data)と呼びます。

ここでは、時間経過によってどのように変動するかに関心があり、過去の変動を考慮した時系列モデルによって分析が行われます。

例えば、1秒毎に計測した株価の推移などが挙げられます。

次に、時点を固定して、複数の対象を計測したものを横断面データ(Cross section data)と呼びます。

2021年の都道府県の失業率、2021 年の自動車メーカーの売上高などが、この分類に含まれます。

最後に、複数の対象を定期的に計測し、集計したものをパネルデータ(Panel data)と呼びます。

パネルデータに対しては、パネルデータモデルという統計モデルによって分析されるほか、多変量解析と呼ばれる手法によって分析が行われます。

まとめ

データサイエンスの概要について紹介しました。

当社が開催しているデータサイエンティストの養成講座は、リカレント教育やリスキリングを念頭においています。

数学の基礎から学び直したい人はもちろんのこと、座学だけでなく実践的な研修・講座を重視している人、データサイエンティストの国際資格を取得したい人は、受講を検討されてはいかがでしょうか。

Get Your Certification

各種トレーニングについては
以下のリンク先よりお申し込みください。