【読了時間:約 10分

 ディープラーニングはどのように応用されているのだろうか

昨今、人工知能技術にブレイクスルーをもたらしたアルゴリズムとして、ディープラーニングを巡る研究開発競争が激化しています。

GoogleやFacebookがディープラーニングを研究するスタートアップ企業を買収していたり、数多くの研究者がディープラーニングを用いた研究成果を発表している現在の状況ですが、具体的にどのような分野へと応用されているのか、広い視点から理解する機会は少ないのではないでしょうか。

別の記事では、ディープラーニングというアルゴリズムについてそのイメージをつかむことに重点を置きました。(『ディープラーニングとは何なのか?そのイメージをつかんでみる』)

本稿では、ディープラーニングを用いた応用研究の状況について、その研究成果を発表した論文の著者関係から構成されるネットワークを分析することで、理解していきたいと思います。

 

 ディープラーニングの応用事例

ディープラーニングが革新的なアルゴリズムとして認識され始めたのは、2012年のIRSVRCという画像認識のコンペティションでした。たくさんの画像をコンピュータに分類させ、その精度を競う大会で、ディープラーニングを活用したトロント大学のヒントン教授率いるチーム(“SuperVision”)が2位以下に圧倒的な差をつけて勝利したのです。

下に示す図は画像認識の誤差率を示しています。ディープラーニングを用いたSuperVisionが2位以下を圧倒しています。

convolutional-neural-network-cv-5-638

(SlideShare,ConvolutionalNeuralNetwork@CV勉強会関東, より引用)

このように画像認識の分野から有名になったディープラーニングですが、他の分野への応用についてはどうでしょうか。本来ディープラーニングはあくまでもデータを分類するためのアルゴリズムの一つなので、応用分野は非常に多岐にわたっています。

例えば、音声認識分野においてはGoogleの音声検索やiPhoneのSiriなどが代表例です。

また文章解析への応用も盛んです。特に文章から感情を予測する感情分析での研究が精力的に行なわれています。

IBMが開発する人工知能のWatsonやソフトバンクのPepperにも感情分析のシステムが搭載されており、人とのコミュニケーションを取ることが出来る人工知能の実現に一歩一歩近付いてきています。

さて、事例としては様々なものを挙げることが出来ますが、先述したように本稿ではもう少し大きな視点、論文ネットワーク分析というマクロな視点でディープラーニングを概観していきましょう。

 

 ディープラーニングに関する論文著者で作るネットワーク

deeplearningnetwork3

今回、2015年に発表されたディープラーニングに関する論文のデータ約2000件を用いてネットワークを構築しました。ネットワークの各点が論文を書いた人の名前で構成されており、点同士は一緒に論文を書いたことがあれば繋がります。

もう少し細かく説明していきます。

networkex4

(『論文の引用・共著関係から何が分かるか?— ネットワーク分析手法からのアプローチ—』,杉山,を参考に作成)

著者を点として表現しています。そして、ある論文が複数の著者によって執筆されていれば、共著者どうしを線で結びます。

つまり他の点とたくさん繋がっていればいるほど、その人の影響力は非常に高い、ひいてはその人の研究分野に関する注目度が高いと考えて問題ないでしょう。

さて、2015年現在、影響力の大きいディープラーニングの応用分野はどのようなものでしょうか。論文執筆者の研究分野を基にネットワーク上で分類を行ったのが次の図です。クリックで拡大いたします。※1

(またパソコンでご覧の方はこちらのリンクから実際にネットワークを操作することが出来ます。是非ご利用下さい。)

categorize4

図に示したように医学・生物学分野は比較的同じ領域の著者同士が繋がっている傾向にありますが、対照的にコンピュータ科学・人工知能分野は様々な領域に飛び飛びで存在していて、学際的な研究が進んでいることを感じさせます。

また他の分野として、社会科学や分野横断型科学の分野が10%前後存在していることが確認できました。

 

 今後注目される可能性が高い研究内容を予測する

では、その中でも今後有望視される可能性が高い分野とはどこでしょうか?

この項では、それを予測してみたいと思います。

今回は、(分析対象とするディープラーニングもその一部である)機械学習を用います。中でも、教師あり学習という手法を用いました。

あらかじめ正解例を学習させてデータを分類する教師あり学習ですが、今回は正解例として、ネットワーク上において影響力が強い、または弱い点に関するデータを用いています。※2

つまり、ネットワークの構造的に中心にあることを示す指標が上位5%の論文執筆者を”影響力の強い著者”、下位5%を”影響力の弱い著者”として正解例を作成し、それを用いて分類することで「今はまだ影響力は強くないが、今後強くなる可能性が高い著者」を探し出せないかと考えたのです。

コンピュータに学習させるパラメータは、各点がネットワークの構造的にどんな特徴を持っているかを示す指標を用いました。

次の図はどの点を正解例に使ったかを示しています。赤色の点は使わず、水色の点を正解例にしました。

training6

この正解例を用いて教師あり学習を行い、分類させたのが次の図です。

classmodify6

黒い点は無視できる点を示しています。緑色の点は影響力が強い正解例として用いた点であり、少ないですが水色の点が今回注目すべき「今後影響力が強くなる可能性が高い」点です。

 

 ディープラーニングはどのような分野に応用されていくのだろうか

先ほどの結果から、「今後影響力が強くなる可能性が高い」と判断された著者が書いた論文をまとめて表にしてみました。クリックで拡大いたします。※3,※4

paper7

これら論文のカテゴリ分布は次のようになっています。

papercategory

最も多いのはやはりコンピュータ科学となりました。コンピュータ科学の内訳は次の通りです。

papercategory2

対してこの区分の中で最も論文数が少なかったのは学際科学という分野でした。しかし、この分野において投稿された論文が非常に興味深かったので、本稿ではその論文の内容について詳しく見ていきたいと思います。

 

 ディープラーニングの理論を交通シミュレーションに応用する

Xiaolei Ma,Haiyang Yu, Yunpeng Wang, Yinhai Wangの四人が執筆した論文のタイトルは” Large-Scale Transportation Network Congestion Evolution Prediction Using Deep Learning Theory”(ディープラーニング理論を用いた大規模交通ネットワークにおける渋滞の発展予測)というものです。

me3

(共著者の一人であるXiaolei,Ma氏。北京航空航天大学副教授。)

従来の交通シミュレーションにおける渋滞予測は、主に数学的な方程式などによって行われていたのですが、その方法では実現できるモデルの規模に限界があるとされてきました。また幾つかの仮定を置いてモデルを作らなければ予測がそもそもできないという状況にあったのです。

この論文では、その限界を克服するためにディープラーニングの理論を応用しています。そして今まで難しいとされていた大規模交通シミュレーションにおいて渋滞予測を非常に高い精度で実現することが出来たと報告しています。

explain

大規模な交通ネットワークを構築することで、より精度の高い渋滞発生のメカニズムや予測を行うことが出来る様になるだろうと述べているこの論文は、個人的に非常に興味深いと思います。

 

 ディープラーニングの先に広がる世界

ディープラーニングはまだ、人工知能分野から遠い人々の間では「何だかよく分からないけど最近よく聞くバズワード」という認識に留まっているかもしれません。

しかし、2015年時点で既に2000件もの論文が投稿されている状況を考えてみても、ディープラーニングは一過性にしてはあまりにも大きいムーブメントを巻き起こしています。

松尾先生は様々な媒体からのインタビューの中で考えを述べていますが、どの記事でも共通して「ディープラーニングがもたらす可能性の広大さ」について語っています。

“現状はまだ、画像から特徴量を抽出することに成功したに過ぎません。いずれは現実世界からも特徴量を抽出することができるように、行動と結び付き、言葉と結び付くと予想されます。

人間が他の動物と比べて圧倒的に賢くなったのは、言葉があるからです。だからこの『言葉と行動』のフェーズが、人工知能研究の『関ケ原』になるだろうと踏んでいるんです”

(「エンジニアは今すぐディープラーニングを学べ」松尾豊氏が見据える、日本がシリコンバレーを追い越す日【連載:匠たちの視点】)

今後、画像認識の次にディープラーニングが革命を起こす分野、研究者は一体どうなるのでしょうか。

今最も盛り上がっているディープラーニングについて、様々な形で理解を深めて頂ければと思います。

[参考文献]

Credoをフォローする