ディープラーニングと知能の本質は「画像」なのか?

第8回で山本一成さんは「現在の人工知能は、プログラマ自身が書いた部分だけでなく、人工知能が自分で学習した部分の両方からできている。プログラマからの卒業を果たしつつある状態だ」と言いました。しかし、さらに今後は「科学からも卒業する」とのこと。これはいったいどういうことでしょうか。

 今回は、ディープラーニングのマルチモーダル化を実現させるかもしれない、興味深い最新の動向を紹介しておきます。

 それは、「言語の処理も画像としておこなう」という手法の登場で、これが最近少なからず賛同者を増やしているようなのです。

 そのしくみを簡単に解説するのは非常に難しいので泣く泣く省略しますが、驚くことに、このアプローチが意外とうまくいくようなのです。

 この手法の評価が高いのには、大きな理由があります。それは、ここまで何度か言及したように、ディープラーニングは画像の処理が最も得意だからです。

 ですから、言語であれ何であれ、なんとか画像と結びつけることができたなら、それは一気にディープラーニングの得意な対象になり、人間を超えてしまえるのです。

 そして、画像は非常に多くの情報を表現することができます。どんなものでも画像にできれば、「縦と横の関係」として表現できるのです。そして縦と横の関係は、距離的なものだけでなく、時間的な近さすら表すことができます(数学のグラフは、距離も時間も表現できましたね)。

 ここからは完全に私の想像ですが、さらに議論を進めると、もしかしたら「知能とは画像である」と言うことすらできるかもしれません。

 考えてみれば、私たちがふだん脳内で見ているのは、3次元を2次元にした画像だと言うことができます。逆に、1次元の数字の列をわざわざ手間をかけて2次元の画像(グラフ)にして解釈したりもします。

 つまるところ、人間は2次元の画像にできるものしか認識できないのではないでしょうか。だから私たちは4次元の世界を認識できない、ということも考えられます。

 また、人間の目は脳の付属物などではなく、目があったから脳が進化したという話もあるようです。人間の眼球と脳との密接につながりは、「画像が知能の本質」であることの証拠なのかもしれません。

還元主義的な科学からの卒業
この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
人工知能はどのようにして「名人」を超えるのか?

山本一成

2016年、電王戦で5戦全勝した将棋AIポナンザ。開発者である山本一成さんは「知能とは何か?」「知性とは何か?」ということを何度も自問することになったそうです。そうすることで、逆に人間の知能がクリアに見えてきたと言います。この思考の結...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

Sinnichio 人間と同じでディープラーニングが得意なのは画像ってのは興味深い。 7ヶ月前 replyretweetfavorite

nazenazeboy "ですから、言語であれ何であれ、なんとか画像と結びつけることができたなら、それは一気に 7ヶ月前 replyretweetfavorite

issei_y 囲碁もそしてPonanzaの場合もCNNで行うのがいいみたいですね。 CNNは画像以外に適用範囲がないではなく、逆に問題領域をいかに画像にするかがポイントだと思います。 https://t.co/PHyg0Lc6n6 https://t.co/A0dtqG1pcC 8ヶ月前 replyretweetfavorite

deep_labman これは必読! 8ヶ月前 replyretweetfavorite