データサイエンティストは社会に大きな影響を与える存在!仕事のやりがいや必要スキルとは?

データサイエンティストは社会に大きな影響を与える存在!仕事のやりがいや必要スキルとは?

データサイエンス学の第一人者である中西崇文先生に、データサイエンティストの仕事内容や将来性、仕事の魅力について、お話をうかがいました。

AI(人工知能)やビッグデータなどのテクノロジーにおいて、近年注目されているのが「データサイエンティスト」の存在です。

データサイエンティストは、膨大なデータを収集・分析し、活用方法を見出す仕事であり、情報化社会において重要な役割を担う仕事といえるでしょう。

データの活用ニーズが高まり、データサイエンティストの需要もここ数年で急速に伸びました。しかし実際にどのような仕事をしているのか、具体的な部分はあまり知られていません。また、データサイエンティストに必要なスキルとは、どのようなものなのでしょうか。

この記事ではデータサイエンティストの具体的な業務内容や将来性、仕事の魅力について、データサイエンス学の第一人者である中西崇文先生にお話をうかがいます。

(インタビュアー・サクラサクマーケティング株式会社CTO山崎好史)


中西 崇文(なかにし・たかふみ)

中西 崇文(なかにし・たかふみ)/武蔵野大学データサイエンス学部データサイエンス学科長
2006年3月、筑波大学大学院システム情報工学研究科にて博士(工学)の学位取得。同年より情報通信研究機構 研究員、2014年より国際大学グローバル・コミュニケーション・センター(GLOCOM)准教授・主任研究員、2018年4月より武蔵野大学工学部数理工学科准教授を経て、2019年4月より現職。
国際大学グローバル・コミュニケーション・センター(GLOCOM)主任研究員、デジタルハリウッド大学大学院客員教授も務めるかたわら、機械学習などをはじめとする人工知能技術をコアとしたシステムの研究開発やそれらのビジネス、サービスの立ち上げを目的とした企業連携研究プロジェクトを多数推進中。
専門分野は、データマイニング、ビッグデータ分析システム、感性情報処理。おもな著書に『稼ぐAI 小さな会社でも今すぐ始められる「人工知能」導入の実践ステップ』(朝日新聞出版)、『シンギュラリティは怖くない:ちょっと落ちついて人工知能について考えよう』(草思社)などがある。

データサイエンティストの今

データサイエンティストの今

データサイエンティストになったきっかけ

――まずは、中西先生がデータサイエンティスト(※)になったきっかけを教えていただけますか?

※データサイエンティストとは、蓄積されたビッグデータを分析し、分析結果から導かれた手法を活用することで企業に貢献する職業です。

中西崇文(以下、中西)私はもともと感性情報処理といって、情報学において人間の感性をどう扱うかという研究をしていました。その研究をしているなかで、膨大なデータを分析し、人間の行動や感情を明らかにしていくことの面白さに気付いたのです。

例えば、企業が実施したアンケートデータを分析すると、「こういう行動をすると商品が売れる」「インターネット上でこういう記事を読んだ人は購入することが多い」といったことがわかります。感性情報処理とは、本来であればなかなか読み取ることのできない人間の行動や感情が、データ分析によって解明していきます。

――少し前まで、データサイエンティストという言葉は耳にしなかったように思います。データサイエンティストという職業が誕生したのは、最近でしょうか?

中西 データサイエンティストが注目されるようになる前から、データを用いて物事を明らかにしていく研究は進められていました。ただ一般的に、データエンジニアリングやデータマイニングと呼ばれていたので、データサイエンティストという呼称は比較的新しいものだと思います。

――データサイエンティストと、データエンジニアリングやデータマイニング(※)などは、ただ名前が異なるだけなのでしょうか?

※ データエンジニアリングは、膨大なデータを分析するためにデータの整理や管理を行ったり、複雑で大規模なデータが活用できるよう情報基盤の構築や運用を行ないます。

データマイニングは、さまざまな方法を用いて蓄積したデータの分析を行ない、「経営上の課題をどのように解決していくべきか」に対するヒントを見つけ出すための機能です。

中西 データサイエンティストとそれまでの時代では、大きく異なる部分が2点あると考えています。

1点目は、ビッグデータの存在です。従来よりもたくさんのデータを収集できるようになってきた、ということですね。

2点目にはデータのリアルタイム性です。従来のデータマイニングやデータエンジニアリングは、時間をかけて集めたデータを用いることが多く、時には数年に1回といったペースで集約したデータを対象として分析するということもありました。それが近年、センサーデバイスの廉価化、高機能化、データ蓄積環境の高性能化により、時々刻々とリアルタイムに生成されるデータを対象として取得・分析することが可能となってきたのです。

この2つがデータサイエンティストの特徴ともいえるでしょう。

データサイエンティストの仕事内容

――データサイエンティストはかなり業務範囲が広いイメージがありますが、実際どのような仕事をされているのですか?

中西 業務範囲はかなり広く、SQL(※)を使ったデータ抽出・選択、統計や機械学習を用いたデータ分析、データ分析に基づく戦略立て改善提案は、すべてデータサイエンティストの仕事です。データに関する仕事は、根拠を示してわかりやすく説明することが重要になります。それこそがデータサイエンティストの仕事ともいえるでしょう。

※SQL(Structured Query Language)は、リレーショナルデータベースを操作するためのコンピュータ言語です。

これまでは、勘やコツに基づく説明でも相手を納得させることができましたが、現在はそれだけでは相手の信用を得ることが難しくなってきています。ビジネスの中で発生したデータを分析し、その分析結果に基づくエビデンスが求められています。

データサイエンティストはデータに基づくエビデンスを示すために、「データを使用できる状態にする」「データを選択する」「データの前処理を行う」「データで分析する」「機械学習などのアルゴリズム(一定の計算方法)を使って判別する」といった作業を行ないます。こうした作業のすべてが業務範囲に含まれるといえるでしょう。

ただし、データサイエンティストは、データを分析するだけではありません。重要なのは「エビデンスを求めている人に対して、きちんと説明をする」ことなので、プレゼンテーションやコミュニケーション能力も必要となります。

データサイエンティストのおもな仕事

1.データを使用できる状態にする

2.データを選択する

3. データの前処理を行う

4. データで分析する

5. 機械学習などのアルゴリズムを使って判別する

6.データに基づくエビデンスを示す(戦略立て・改善提案)

――これらの仕事を全部一人で進めていくのでしょうか?

中西 先述したようにデータサイエンティストは業務範囲が多岐にわたるので、私はチーム単位で動くことが基本だと考えています。

データサイエンティストを名乗っている方のなかには、一人ですべての業務をこなす方もいらっしゃいます。しかし、これらの仕事をすべて一人でこなせるスーパーマンのような人材は、かなり少数なのではないかと思います。

チームメンバーは必ずしもデータサイエンティストだけで構成されているとは限りません。

データサイエンティストの仕事は、まず「どういうことをやりたいのか?」というヒアリングから始まり、実際にデータを分析するための前処理をして、分析をしていきます。実装する際はフェーズによって必要な技術が異なるため、データサイエンティストのなかには、データの分析・実装で活躍するAIエンジニアなど、エンジニア寄りの方も多く存在しています。

日本におけるデータサイエンティストの状況

――日本におけるデータサイエンスの活用状況は、世界的に見て遅れているのでしょうか?

中西 IT業界のなかで、全体的に日本は遅れているという話をよく耳にします。データサイエンスの分野でも、たしかに日本は遅れ気味だという意見はあります。

しかし私は、「データサイエンスの分野は、日本はこれから非常に伸びる可能性がある」と考えています。

なぜなら、日本はすでにデータを取得してビジネスに活かすという文化が成立しています。例えば、日本には多くの工場が存在していますが、それぞれの工場の性能も良く、機械にセンサーを設置してデータを収集することはできているのです。

データの活用状況は十分ではないかもしれませんが、「データを使う」という土壌自体は準備ができている。今ある土壌を大切にしながら、データをビジネスに活用する文化を育てていくことで、日本が世界に並ぶストーリーもありえると思います。

データサイエンスと聞くと「大手企業を対象にした華々しい仕事」というイメージを抱く方が多いのですが、中小企業の持つデータというのも非常に利用価値があります。そういったデータにも注目し、社会の中でデータを活用する文化を醸成していくことで、日本もデータサイエンスにおいて世界に通用するレベルに到達するのではないでしょうか。

たしかに、現在オープンソースなどは海外のものが多いため、「また日本は出遅れた……」と感じる方もいるかもしれません。しかし日本は、応用を考えることは決して弱くないと思っています。「今あるものを工夫する」ことで、日本はまだまだ世界で活躍していけると考えています。

未来のデータサイエンティスト

未来のデータサイエンティスト

5年、10年、20年の未来の働き方

――AIなどのIT技術が進歩すると、一部のエンジニアの仕事がなくなることが懸念されています。今後のデータサイエンティストの将来性はどうお考えでしょうか?

中西 データサイエンティストは必要とされ続けると思いますが、コーディング(※)のような作業はなくなるかもしれません。

※ コーディングとは、プログラミング言語といったコンピュータ言語の語彙や文法に従い、コンピュータが処理・解釈できるコード(code:符号)列を記述する作業です。

近い将来、データサイエンティストだけではなく、一般の方にとってもデータサイエンスは身近なスキルになると考えています。WordやExcel、PowerPointのように、誰もが仕事をするうえでデータサイエンスの能力が必要となるというイメージです。

例えば、日本では「私の経験ではこうだから」と言われると、エビデンスを確認せずに「それでいきましょう」と即答することが多く見られます。誤解を恐れずに言うと、その理由として、これまでの日本国内のビジネスにおいては、同じ言語、同じ文化で育ってきた人々同士でのコミュニケーションで主であったからだと思われます。しかし、グローバル化が進み、異なった言語、異なった文化のさまざまなバックグラウンドを抱える人が集まる場でのコミュニケーションでは、「あなた個人の経験ではなくエビデンスを示してください」と常に求められるのです。

今後、社会のダイバーシティ化(多様化)が進むと、何事においてもデータに基づいたエビデンスを示して説明する義務が発生していくはずです。少し極端な言い方をすると、「データサイエンスの素養がないと仕事ができない」という状態になる可能性もあります。

これからの時代は、データサイエンティストが「データサイエンスにおける、より高度な専門家」としての位置づけとなり、一般の方もデータサイエンスの素養を当然のように身に付けるようになっていくと考えています。

――常にデータに基づいたエビデンスを求められる社会では、従業員への負担も大きくなっていきそうですね。

中西 たしかに大変な部分もあるでしょう。でも、現状から変化するという意味ではとても大切なことだとも思います。さまざまな人が集まって多くの意見が出てきて、新しいものが生み出されていく。これまでは「ツーカー」で感じ取っていた職場でも、エビデンスを示して説明が求められる環境になっていくはずです。

仕事で求められる説明では、論理的・数学的である必要があります。説明内容がデータに基づいていないといけない、という世界になっていくと思います。

未来のデータサイエンティストが社会に与える影響

――近い将来、一般の方も当然のようにデータサイエンスの素養が必要になるということですが、専門家であるデータサイエンティストが担う役割も変化するのでしょうか?

中西 そうですね。さまざまな分析手法を熟知していて、「こういうデータのタイプだったら、こういう分析をすれば結論が出る」ことを理解し、それを実行するのがデータサイエンティストの役割になるでしょう。

一般の方々もデータサイエンスの素養は必要とされますが、それは「自分の分野においてデータを分析するなら、こういう感じになる」ことを知っている、というレベルです。

データサイエンティストは、多種多様な分野の人間とかかわりながら仕事をしていくことになるので、「この分野では、この方法で分析すると非常に良い結果が出る」といった幅広く、より高度な知見が求められます。

――未来のデータサイエンティストは、社会に大きなインパクトを与える存在になると考えると、データを扱う際の倫理観なども今以上に問われるようになるのでしょうか?

中西 データに関する倫理については、アカウンタビリティ(説明責任)が求められると思います。

先ほどお話したように、データサイエンティストの仕事は「データ分析をして終わり」ではありません。収集されたデータも、そのまま使えるわけではありません。まず、データを分析できる状態にするためにクレンジングという作業をします。不要なデータやイレギュラーなデータを取り除き、ようやく分析の段階に進むことができるのです。

データサイエンティストが手掛けたものは、社会全体が注目します。みなさんはデータサイエンティストにエビデンスを求めているので、データサイエンティストが出した結果は非常に重要な責任が発生します。

そのため、結果だけを提示して説明がないのは片手落ちです。データ分析の技術も大切ですが、データサイエンティストは分析結果をクライアントに丁寧に伝えるのも仕事です。データを扱う以上は「なぜその結果が出たのか」を、しっかりとした倫理観をもって、クライアントに対してわかりやすく説明する必要があります。

データサイエンティストを目指す人に向けて

データサイエンティストを目指す人に向けて

データサイエンティストの楽しさ

――データサイエンティストの仕事をしていて、どんなときに楽しさややりがいを感じますか?

中西 それまで人間ではわからなかった部分が見えてきたり、データは少しでも新しい発見があったりすると、非常にうれしく感じます。

例えば、大企業の場合は売り上げが1%だけでも改善すると、何億という結果が出ることもあります。改善したパーセントは少なくても、実際の数字ではすごい数です。そういうロマンがあるのは、データサイエンティストならではだと思います。

――では、反対にデータサイエンティストの仕事をしていて「つらい」と感じることはありますか?

中西 データ分析をする前段階である、クレンジングの作業は非常に大変です。これはデータサイエンティストであれば、みなさんが経験のあることです。

データを分析して結果が明らかになったとしても、クライアントがその結果を信じて行動してくれない場合もつらいですね。ときには、「その結果が出るのは当たり前」と言って終わらせる人たちもいます。

その業界において当たり前といわれることは、5年10年と長い歳月をかけて、ようやく気付くことができるものです。

しかし、データサイエンティストは、数日、数ヵ月程度の分析でその結果にたどり着くことができます。そのことをまず、すごいと思ってほしいという気持ちはあります。

ただ、当たり前という認識がクライアントと同じになったところがスタートで、そこからどう分析していくか、がネクストステップです。

――企業がデータサイエンティストを迎え入れて成功するためには、どのようなことが必要でしょうか?

中西 「トップが覚悟をもって改革を推進すること」と「現場に対して十分に説明して理解を得ること」が不可欠です。

データによって課題解決のための提案をしても、トップが覚悟を持ってそれにともなった施策を打たなければ、現状は打破できません。

また、現場への説明と理解がないままに改革を推進しようとすると、社内で反発が起きて改革自体、失敗する可能性があります。社内データを集めようにも、データが上がってこない環境になってしまいます。

このように改革には会社全体で協力する必要があるので、データサイエンティストからきちんと現場の方に説明することが大切です。これも、先ほどのアカウンタビリティですね。

データサイエンティストに必要な能力

――これからデータサイエンティストを目指す場合、まずどのようなことから始めればよいのでしょうか?

中西 データサイエンティストが一番使うのがPythonやRの知識なので、そういった学習は重要ですね。数字も扱うので、線形代数・微積分・統計あたりの知識も必要です。ただ、これらの知識をイチから真剣に学ぼうとすると何年もかかってしまいます。

私は「まず実践を積む」ことがすごく大事だと思います。無責任な発言に感じるかもしれませんが、ある程度の知識を身に付けた時点で、実際の現場に飛び込んで、自分でデータ分析をやってみる。

実戦で結果を出すことがすごく大切だと考えています。

数学知識や機械学習、アルゴリズムなどは、ずっと学び続けなくてはいけないものです。学びには、終わりはありません。だから、最初から完璧な知識を身に付けたデータサイエンティストになろうとするのではなく、まずは現場に飛び込んでしまう。エンジニアという職業全体にいえることですが、この姿勢がとても重要ですね。

データサイエンティストに求められる能力
・Python・Rの知識/線形代数・微積分・統計などの知識
・数学知識や最新の機械学習、アルゴリズムを学び続ける姿勢
・現場に飛び込む勇気

――データサイエンティストとして現場で経験を積む際の注意点はありますか?

中西 まずは実際にデータのあるところで、“生きたデータ”を扱える環境に行くことをおすすめします。

データサイエンスをやっている企業の中には、ただ機械的な作業を受けているだけというケースもあります。転職先を探す際は、「その企業がどのような実績があり、何のデータを扱っているのか」「自分はどのようにコミットできるのか」という視点を持つとよいでしょう。

データサイエンティストとしての知見を活かせる現場で働くことで、データを扱ったという実績もできます。そうして実績を積み重ねていけば、より大きな舞台に上がっていくこともできるでしょう。

――データサイエンティストが特に必要とされている業界はあるのでしょうか?

中西 これからは、どこもかしこもそうなるのではないかと思います。「必要とされない業界なんてない」という状況になるのではないでしょうか。

近年は、データサイエンス人材を社内で育成する企業も増えてきています。例えば、マーケティングに携わっているエンジニアの方などは、データサイエンティストの仕事と非常に近い位置にいます。そういった方々がデータサイエンスを学んで、その道で成功したというケースは少なからず存在します。

今後、データサイエンスに必要な分析手法は徐々にコモディティ化(※)していきますし、オープンソースなども公開されています。そういったものを活用すれば、データサイエンティストを自社で育てられる環境を整えることも可能です。

※コモディティ化とは、ある商品の普及が一巡して汎用品化が進み、競合商品間の差別化が難しくなり、価格以外の競争要素がなくなることです。

――例えば、自社でデータサイエンス人材を育てるとなった場合、注意すべき点はありますか?

中西 「事例を調べるだけの部署にしない」ことです。データに関する部署をつくると「弊社と似た事例を今集めている段階です」と言われるケースが多くあります。

しかし、企業がやるべきことは事例の収集ではありません。その企業の課題を発見し、些細な論点でもかまわないので、とにかくデータを分析してみる。スモールスタートでよいので、課題を見つけてデータ分析するということを進めていかなければ、状況を変化させることは難しいと思います。

データサイエンティストになろうとしている人に向けて一言

――最後に、これからデータサイエンティストを目指す方に向けてメッセージをいただけますか?

中西 データサイエンティストという仕事に注目し、これから目指したいという方は、しっかりとアンテナを張っていて素晴らしい方だと思います。きっと、これからの時代を牽引して、社会をより良くしていく人材の一人になれるのではないでしょうか。

データサイエンティストとして知識を学び続けていくことは非常に大切です。しかし、一番重要なのは実践することです。ぜひ「まずは一歩、実践の場に足を踏み入れる勇気」を持っていただきたいと思います。その一歩の勇気が、いずれ社会を変えることにつながるはずです。

まとめ

今回は、データサイエンスの第一人者である中西先生にお話をうかがいました。

中西先生は、データから「人間の感性」に関する情報を抽出し、それを表現する手法の研究を進めています。人間の感性とデータサイエンスを掛け合わせることで、より豊かな生活や新たな価値を創造するという試みです。

データサイエンスに対して、ただ機械的に処理を進めるだけの仕事というイメージを抱いている方も多いかもしれません。たしかに、そうした「泥臭い」作業もたくさんあります。しかし、その先には、企業や社会の抱える課題をいかに解決するかという、非常にやりがいのある目的が存在しています。

データサイエンティストには、あらゆる分野の知見、分析手法の知識、コミュニケーション能力が求められます。データサイエンティストを目指す場合はこれらのスキルを身に付けることも大切ですが、なにより「まずは現場に飛び込むこと」が重要だと、中西先生はアドバイスしています。

データサイエンスをはじめ、IT業界では次々と新しい技術が生まれています。そのため、学ぶことに終着点はありません。データサイエンティストとして活躍していくためには、常に学びながら、実戦経験を積むことが大切です。

転職先を探す際は、データサイエンスの知見を活かせる環境があるのか、「生きたデータ」に触れることができるのか、といった点に着目してみるとよいでしょう。

掲載日:2022/01/20

登録拠点登録拠点

パソナ

パソナテックは全国9拠点にて、転職相談・お仕事紹介・各種イベント・セミナーを実施しています。

ページトップ