E2D3インタビュー

転職支援サービス「レバテックキャリア」では、エンジニア・クリエイターの皆様の
技術の発展をサポートするため、イベントや勉強会のスポンサー活動をしております。
ここでは勉強会を主催された方のインタビューを紹介しています。

転職支援サービスをご希望の方はこちら

  • IT・Webの転職・求人TOP
  • 富士通データキュレーター小副川氏が目指す「『E2D3』がデータ探索的な会話のハブになる未来」

「E2D3」で誰もがデータ可視化を利用可能になった先にあるものとは?富士通データキュレーター小副川氏が目指す「『E2D3』がデータ探索的な会話のハブになる未来」

  • このエントリーをはてなブックマークに追加

プロフィール
小副川健氏(オソエカワ タケシ)
筑波大学大学院修了後、立教大学にてポスドクとして化学と数学の学際領域の研究に従事する。2012年に富士通株式会社に入社し、データキュレーターとしてデータ分析に携わる。大学や勉強会での講演やWeb媒体への寄稿など、社外活動も精力的に行う

Excel内でデータのビジュアライズを実現するソフトとして、注目を集める「E2D3」。オープンソースプロジェクトでもある「E2D3」には、多種多様な人々が参画している。 

レバテックキャリアでは、そんな「E2D3」のプロジェクトメンバーのインタビュー企画を実施。第3回となる今回は、E2D3のグラフ作成を担当する小副川健氏に話を伺った。 

富士通のデータキュレーターとして、ビジネスの最前線でデータ分析を行う小副川氏。プロの目から見た、「E2D3」がもたらす恩恵とは? 

ポスドクから富士通へ、日々勉強を続ける姿勢を持ち続ける

—小副川さんが富士通に入社された経緯を教えてください。

以前は立教大学でポスドク(博士研究員)をしていました。次のステップを考えていたときに、以前から親交のあった富士通研究所の先生に「事業部で数学者を募集しているので、応募してみないか」とお誘いいただいたのがきっかけで、中途入社しました。

大学院で専攻していたのは、数学のなかでも計算機代数という分野で、計算科学に近いことをやっていました。

 —入社されてからは、どのようなお仕事をされているのですか?

ひとことで言うと、ビッグデータ活用のデータコンサルティングですね。お客様のデータをお預かりして、業務に活かせる知見を取り出すというものです。

具体例を挙げると、小売業の来店予測です。“何人来るか”というマスの予測ではなく、ID付きのPOSデータを活用して、“この数式の結果がいくつ以上の人は雨の日でも来店する”といったような指標を作りながら、一人ひとりの行動予測をする仕組みを作るといった仕事をしています。


筑波大で博士号を取得後、立教大のポスドクを経て、富士通へ入社した経緯を話す小副川氏


—とっても興味深いお仕事ですね。他にはどういった事例がありますか?

弊社の事例でよくお伝えするのは、糖尿病罹患の予測ですね。「この人は来年、糖尿病になりそうだ」ということが分かれば、その人の注意を喚起し、糖尿病を回避することにつながります。

そういった予測をする場合は、一般的にヘモグロビンA1cと空腹時血糖を指標として医師が判断するのですが、実際には個人の人となりを見て精度を上げている部分があるんです。

我々が行う場合は、ヘモグロビンA1cと空腹時血糖に加え、他の血液検査のデータや健康診断のデータも合わせて、機械学習を用いて分析します。そうすることで、ヘモグロビンA1cと空腹時血糖だけを用いるよりも高い精度で予測できるようになるんです。「医師の属人化したノウハウをも、機械学習が拾っている」というのは、データ分析を行う意義の一つですね。

また、「別の用途で採取したデータを他の用途に活用している」という点も大事なところです。今のビジネス事情ですと、データを取ることにもコストがかかるため、すでにあるデータの別の活用法を探すこともデータ分析の役割と言えます。

—E2D3のプロジェクトに興味を持たれたのは、普段のお仕事でもExcelを使っていらっしゃるからなのでしょうか?

いえ、実はあまり仕事でExcelは使わなくて。結構、重いイメージがありましたし、私はCUIのほうが好きなので、むしろ新人たちには「うちではあまりExcelは使わないよ」と言っていたくらいです(笑)。ただ、逆にD3.jsはもともと大好きで注目していましたし、今も仕事で使っています。

そういえば、E2D3代表の五十嵐さんと初めてお会いしたのは、私が運営に携わっているFacebookグループ「Data Visualization Japan」のイベントだったのですが、そのとき私が講演したのが、ちょうどD3.jsの話でした。 

—小副川さんはE2D3以外にも、ジョインされているコミュニティーがあるのですね。

はい。自分の腕が頼りのエンジニアなので、自分のネタをなるべく増やすためにも、社外の活動も積極的にするようにしています。

先ほどお話しした「Data Visualization Japan」はすでに1,000人規模のコミュニティーになっていますが、そこでたまにミートアップや勉強会を開いていますし、「Code for Japan」という一般社団法人の関連団体「Code for Tokyo」のメンバーにもなっています。 

今はメンターをやることのほうが多くなりましたが、昨年度はハッカソンにもよく出ていて、いろいろなところで受賞させてもらいました。そういった活動を通して得た情報は、会社のチーム内でも共有するように努めています。情報を確実にキャッチアップしたいという意識は、常に持っていますね。

—どういった情報をキャッチアップしているのでしょうか? 

注目している技術としては「React.js」ですかね。頻繁に移り変わるものなので、何とも難しいところではありますが。あとは仕事でPythonをよく使っていて、まだ私の周りでは2系を使っている人が多いのですが、次第に3系へ移行している空気を感じていますね。

それと学会にも出入りしていて、「実務の話をして欲しい」と招待講演に呼ばれることもよくあります。データ分析にはアカデミックな知識も求められるため、そうした場でお互いに必要な情報を交換できるのはありがたいですね。

—なるほど。社外活動に積極的に参加される以外には、どのように情報をキャッチアップされていますか? 

当然ながらニュースサイトやSNSを巡回することはしていますが、“すごい人のやり方を見る”というのが、最も確実で効率の良い方法だと思いますね。E2D3では竹内さんがプログラミングされているところを横で見ているだけでも、すごく勉強になります。


「自分の腕が頼りのエンジニア。情報は確実にキャッチアップしていたい」と小副川氏は語る

—データ分析をされる上で注目している手法などはあるのでしょうか?

色々とやっていますが、はやりのディープラーニングにも、もちろん取り組んでいます。ディープラーニングでいうと、最近では画像分析の精度が高いという話はよく聞く一方で、それ以外の分野ではあまり振るった話を聞かないのではないでしょうか。これはディープラーニングの内部で使う構造で、画像データの分析に向いた、良く知られた構造があるからです。他のデータだとなかなかいい構造が見つからないのが現状ですが、どのようにビジネスにつなげていくかはよく考えています。

あとは、データのクレンジングや加工などの前処理を重視していて、色々と苦労しているのでなんらかのブレイクスルーがほしいと感じています。

例えば、センサー機器が拾ってくるデータは、そのままでは分析しにくい汚いデータであることが多いのですが、これを自動でクレンジングしてくれる仕組みがあればいいなとは思っています。これも人間は目で見てできることなので、いつかはコンピューターが自動的にやれるようにできるといいですね。

Excelのユーザー数とD3のインタラクティブ性によってもたらされるインパクト

—小副川さんがE2D3に関わるようになった経緯を改めて教えていただけますか?

先ほどお話したイベントでE2D3代表の五十嵐さんに出会って、そこで五十嵐さんが大学の先輩だということを知って、いろいろ話しているうちに「何か一緒にやりたいよね」と言っていただいて。その後「 E2D3を始めるから、一緒にやろう」と声をかけてもらいました。  

最新版はE2D3 Ver.0.6なのですが、私はVer.0.2の頃からグラフを作るところで関わっています。

—アプリケーションとしてE2D3にはどんな強みがあると思いますか?

やはりExcelはユーザーが多いというのが、圧倒的な強みでしょうね。そこにインタラクティブなグラフが作れるというD3.jsのインパクトを掛け合わせることで、探索的にデータを見られるようになるということが、非常に大きいと思います。 

—例えば、E2D3を使って作ったグラフを見せていただくことはできますか?


E2D3で作られたグラフの例。市バスの停留所がマッピングされている※

これが以前、名古屋のイベントの際に作ったグラフです。名古屋は市バスの停留所のデータを公開していますので、それをマップタイルにプロットして、D3.jsのボロノイグラフに当て込みました。各地点からの最寄のバス停を分割して表示しています。Excelでデータを間引いたり、まったく別の緯度・経度のデータに入れ替えれば、簡単に商圏の分析などに応用することもできるんですよ。
※背景地図はOpenStreetMap © OpenStreetMap contributors, CC-BY-SA

—E2D3で今後予定されている機能などはどういったものがあるでしょうか?

あくまで予定ではあるのですが、世界各国のジオ系のデータをビジュアライズできるようにしたいと考えています。ジオ系のデータは技術的にビジュアライズのハードルが高いのですが、ニーズも高いんです。そのため、あらかじめ国ごとの地理データとセットでビジュアライズできるようにしておけば、ユーザーからいい反応がもらえるんじゃないかなと考えています。

E2D3に集う“すごいエンジニア”たち

—E2D3の活動に参加されてみて、どういった印象をお持ちですか?

「すごいエンジニアが集まっているな」という印象です。日本一のCTOに選ばれた竹内さんをはじめ、すごいエンジニアの人たちが普通にいるわけですから。そういった方々の技を間近に見ることができて、良い刺激をもらえますし、どういった勉強をすれば良いのか、手がかりをもらえることが非常に大きいです。

例えば、SVGをPNGにうまくレンダリングするのはなかなか難しく、自分ではすごく適当に作ったもので妥協していたのですが、 E2D3 で竹内さんがすごくエレガントに実装しているのを見て、ヒントをもらったりしました。

メンバーみなさんの「E2D3にコミットしたい」という意識が高いので、一緒に活動していて、気持ちが良い。そんなレベルの高い方たちが集まっているので、E2D3は活動がすごく活発だな、という印象を持っています。


「E2D3には、“すごいエンジニア”たちが集まっている」と話す小副川氏

—E2D3の活動で得られたものは、お仕事にも活かされていますか?

そうですね。E2D3で可視化のプログラミングに慣れたことで、仕事はスムーズになったと思います。あまり仕事と区別していることはないですね。同じ人間がプログラミングしているわけなので、相互にとって良い影響が出ているのではないでしょうか。これからも今のように、お互い良い刺激を与え合えたら、と思っています。

—E2D3でデータの可視化を行う人が気をつけたほうが良いポイントはありますか?

E2D3には凝ったグラフのテンプレートが多いので、どうしてもそういったものを使いたくなると思うのですが、まずはミニマルなものから始めるようにしてほしいです。グラフでミスリーディングを生むケースが多いので。

ありがちな例としては、区間を区切ってデータの数を表示させるヒストグラムのグラフを作ったときに、区切り方を誤って極端に偏ったグラフになってしまうことです。そういったことがないよう、私が仕事でグラフを作る際には、個人の感性でブレが生じる余地を排除してデザインするよう、常に心がけています。

会議の中心に、可視化したデータを据える時代に

—データ可視化によって生まれるメリットを教えてください。

分析者でなくても、データを見て話ができる場を作れるところですね。実際に、社内用のデータ可視化ツールを作って、プロジェクトに関わる人なら誰でもデータを触れるようにしているのですが、ミーティングの時間も短くなりますし、一段深い質問が出てくるようになったと実感しています。分析者ではないフロントの人間も「納得感が全然ちがう」とみんな口を揃えていますよ。

ミーティングで可視化されたデータを目の前に出されると、誰しも何かしら言いたくなるものです。「これは男女別になっていないけど、男性だけにしたらどうなるの?」といった感じですね。

我々としては、わかりやすくなるように良かれと思って、見せるべき数字を絞って出すこともあるのですが、他の人たちからすると「全部見たい」となるのは当然の心理なので、分析者以外もデータを触ることができるメリットは大きいと思います。

—データサイエンティスト以外の方がデータ分析にチャレンジする際に、何かアドバイスをいただけますか? 

私がよく言うのは、「一度は生データを見てください」ということですね。全部でなくてもいいので、一部だけでも開いて見てほしいです。すると、年齢のフィールドに「−200」歳と入っているようなことが、普通にあるんです。人間が入れたデータは間違いだらけですし、故意に誤ったデータを入れることもありますから。そのまま分析すると、大変なことになります。盲目的にデータを信用してはいけません。

こうした場合には、年齢のカラムでヒストグラムを書いてみるだけでも、「−200」歳の人がいるというエラーを見つけることができますので、そうやって少しずつデータに慣れてもらえればいいかと思います。

—E2D3を使って、今後どのようにデータの可視化をしてもらいたいですか? 

E2D3はデータを探索的に見ながら会話をするためのハブになる可能性があると思っていますので、会議中にE2D3を操作して、みんながデータを見ながら話を進められるようになると、いいですね。


E2D3には“データを見ながら会話する”ためのハブになる可能性が秘められている(小副川氏)

—最後に、小副川さんの今後の展望をお聞かせください。

様々な場面において、これまでのような鶴の一声だけで決めるのではなく、議題に関連するデータを集めてグラフを描いて、「あなたの言っていることはこうですから、こういった案の方がいいです」と、合理的な意見が言い合えるような空気になるよう、データ活用の考え方を普及させたいと思っています。

  • このエントリーをはてなブックマークに追加

転職・求人・採用情報を探す

プライバシーマーク

レバテック株式会社は、
「プライバシーマーク」
使用許諾事業者として
認定されています。

職業紹介優良事業者第1402022(01)号
1402022(01)

レバレジーズ株式会社は、
職業紹介優良事業者として認定されています。