ヘタレ投資家ヘタレイヤンの読書録

個人投資家目線の読書録

ディープラーニング 学習する機械 ヤン・ルカン、人工知能を語る

ヤン・ルカン 訳・小川浩一 監訳・松尾豊 講談社 2021.10.21
読書日:2022.6.4

畳み込みのルカンと呼ばれるディープラーニングの第一人者が、ディープラーニングのたどってきた道、その原理、そしてAIの未来について、自分自身の研究の軌跡を振り返りつつ語りつくす本。

2010年代の初めにディープラーニングという言葉が流行り始めた頃、その内容をなにかの雑誌で読んでいて、わしは困惑した。1990年代にはやったニューラルネットワークと何が違うのか理解できなかったからである。わしにはまったく同じものに見えた。1990年代にだって、多層のニューラルネットワークはすでにあったし、さらにはネットワークの重みを計算するための誤差逆伝搬法も畳み込みニューラルネットワークもあった。では1990年代と2000年代ではいったい何が違うのか。

というものの、わしはこの分野と特に関わり合いはなかったので(笑)、疑問には思ったが、それ以上深く調べることなく今日まで至っていた。この本を読むと、ディープラーニングという言葉を考えたのはなんとルカン本人(とその仲間)で、なぜそんなことをしたかというと、ニューラルネットワークという言葉がネガティブな印象を持たれていたので、再び関心を集めるために新語を考えた、と自分で書いているではないか。

あれま。そんな芸能人みたいな話が科学の世界でもあるとは。改名したらブレークするのなら、科学の世界にもネーミングに姓名占いが必要なんじゃないの?(笑)

それにしても、1990年代に一世を風靡したニューラルネットワークがなぜか受け入れられず、AI業界は3回目の冬の時代を迎え、ほとんど内容が変わっていないのに2010年代にはブレークするなんて、かつてはいったい何が悪かったのか、ルカンでなくても教えてよっていいたくなる。

しかし、たぶん、答えはインターネット+スマートフォンだ。

1990年代では学習のための教師用画像を集めることすら一苦労だった。猫の画像の学習をしようと思っても、手に入る教師用画像は数百枚が限度だっただろう。だが、2000年代に、特にスマホによってインターネットに画像があふれたことは、教師用の画像に困らなくなったばかりか、それらの画像を分類する必要が生じたことになる。教師用画像の供給と画像認識の需要との両方が一気に発生したということだ。

さて、本書の内容だが、さすがに画像認識の第一人者の本ということもあって、むちゃくちゃ分かりやすい。ふつうは一般人向けの本ということになると、数式は避けるものだが、ルカンはまったく忖度なしに数式も、それを計算するプログラムもぶち込んできている。

でも、正直に言ってニューラルネットの基本的な数学はそれほど難しくはない。誤差逆伝搬法の説明でちょっと合成関数の微分が入ってるけど、それ以外は驚くほど簡単な計算式でニューラルネットワークはできているのだ。計算は難しくはないのだ。それを並行してたくさん行うことが重要なのだ。

そういうわけで非常に分かりやすい。というか、人文系の本を読んでいるよりもはるかに明確で、ストレスがないと言っていいくらいだ。どこまでが数学的にきちんと説明がつくのか、どこから経験則なのか、明確に書かれてあるから、本当にノーストレスである。エンジニア系の本は本当に分かりやすいと思う。

なので、ディープラーニングの限界も明確だ。当たり前だが、ニューラルネットワークは画像など入力されたものを学習した範囲で振り分けているだけで、なんら新しい知識を生み出しているわけではない。ディープラーニングをしている人で、ここから人間以上の新しい知性が生まれるなどと思う人は皆無だろう。がっかりするくらいに、限界がはっきりしている。

まあ、ディープラーニングで判断した内容をメタ的に再度判断するメタ・ニューラルネットワークが発達すると、意識に近いことができるのかもしれない。メタが何段階も必要になるかもしれないが…。人間のように因果関係を含んだ物語的な判断ができるようになるためには、本人が言っているように「世界モデル」が必要となるのだろう。

わしは2045年にシンギュラリティが本当にくるかどうか楽しみにしているのに、なんかこのままでは来ない気がしてちょっと危機感を持っていますので、現状のディープラーニングを越える、何かを待ち望んでいます。

こういうAIの展望についてもルカンは述べているが、驚くほどその見解は楽観的だ。

面白いことにルカンは人間を含む動物に意識があるのは頭脳の能力に限界があるからだという。能力が足りないので、すべてを考えることができず、どれかに集中する必要があるから意識というものがあるというのだ。機械のAIなら複数のことを一度に考えられるようになり、人間のような単一の意識ではなく複数の意識を持つようになるという。なるほどね。

でもまあ、ニューラルネットワークがルカンが生きているうちに花開いて、チューリング賞もとれて本当に良かった。なかなかこうは行かないからね。

***メモ***
ディープラーニングの言葉について。なお、本に書いてある言葉でなく、独断的な理解に基づいていますので、ご承知おきください。
(1)多層ニューラルネットワークディープラーニング
入力された複数の信号を重み付けして足し合わせて、その結果で出力が変わる人工のニューロン回路を何段階か重ねたもの。少なくとも3層で、入力層、特徴抽出層、出力層がある。

(2)誤差逆伝搬法
ニューラルネットワークを教育して各ニューロンの重み付けの数値を変化させる計算方法。出力層から入力層に逆方向に計算していくのでこの名前がある。

(3)畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)
特徴抽出のための技術のひとつ。周辺のデータを足していく(加重平均)。例えるなら、画像データならば、対象をはっきり見るのではなく目を細めて対象をぼんやりと見る感じに相当。これは対象の特徴を掴むには細かいところがはっきり見えるよりも、全体的にぼんやり見えたほうが判断しやすいということを示している。なお、ルカンが言うように、ボケた画像なので、位置ずれの悪影響も抑えられる。

★★★★☆

 

にほんブログ村 投資ブログへ
にほんブログ村 本ブログ 書評・レビューへ