このくらいは知っておくべき、今どきのAIの話

僕の今どき(ここ数年)の人工知能との出会いは
まず東大の松尾豊教授(最初知り合った時は准教授であった)である。
当時会社を辞められるなら学生に戻って弟子入りしたい、くらいの感銘を受けた。
なのでこの記事は奥山の勝手な記事であるが、松尾さんにインスパイアされている。

人工知能(Artificial Intelligence:AI)といえば、まずは奥山的にはエミーである。
(え!?古すぎて誰もわからんか。。。40年前?のゲームです)
言うまでもなく知能などは備えていなくて、
問いかけたことを内部のデータベースに照会して
あらかじめインプットされている返答をする、というシンプルなものである。
人工知能!という甘美な言葉の響きに分岐ルーチンなどをプログラム的にあれこれしたらもっと人間らしく・・・などと色々当時中学生の奥山は考えたものである。
でもそれはプログラムでしかないのであって、
この考え方の延長線では考える人工知能にはならない。
世間の当時のブームもそういう意味で驚きの後の落胆として早々に冷めていった。。。

次に人工知能の言葉を聞くのは2000年前後。
おぉ、、、最近のことのように思えても、もう20年前のことなのか。
エキスパート型AIと言われるもので、松尾さんに言わせると「大人のAI」。
専門的な情報を全てデータベースにインプットしておき、
問い合わせ・質問によってその最適解を「計算して導き出す」。
「路線検索」「最短ルート」などで普通に日常お世話になってるやつである。
このタイプのAIは「最適解を算出するプログラムが組まれていること」と
「全てのデータがあらかじめ正しくインプットされている」ことを
前提として処理速度の速いコンピュータらしく、「答えはこれです!」と
人間では不可能なスピードで答えを示す。
用途は限定されるものの今でももちろん使われている。
ではこれは「人工知能」と言えるのか?う〜〜ん。
計算式(考え方)は人間が作ってやらないといけないし、
データも逐一アップデートしてやらないといけない。
人工知能というよりは「目的特化型の高級計算機」だよねぇ。。。
ということで、なくなりはしていないが、こちらもブームは少し下火になっていく。

現在、世間で話されている人工知能(AI)というのは
ここまでの話とは全く考えの違うものである。

そもそもはコンピューターによる「画像認識」力を、
どうやって向上させるかということに話が始まる。
画像認識はコンピュータの苦手とするものであった。
リンゴの写真を見ると、「これはリンゴだ」と人間には大体わかる。
腐っていても、半分にカットされてても、ウサギさんになってても、
大体わかるのである。(笑)
「画像認識が苦手」というコンピュータの特性は
「操作しているのがコンピュータではなく、画面に向かっている人間」である判別として、
なりすましや機械による連続接続などの防止をするために今も利用されている。
(横断歩道のある写真を選べ、とか字がグニャグニャに書かれている画像をみて
なんと書かれているか入力しろ、などというやつね)
セキュリティに使われるぐらい「コンピュータには画像はわからんだろう」だったのである。

この画像認識の向上を図るべく多くの研究開発が進められ、
またそれを評価するコンテストなども開かれてきたのだが、
度肝を抜いたのが、2012年にGoogleが発表した「Googleの猫」。
それまでは「猫」の画像をなんとか判別させようとして
「猫ってのはね、耳があって、ヒゲがあって、足が4本で、尻尾があって。。。」と
詳細に特徴づけを定義し、それによってなんとか判別させようとしてたのだが、
そういうアプローチではなく、人間の脳、ニューロンに似た曖昧な判定構造を作り、
それに対して猫の画像をこれでもかと死ぬほど(10万点を超える)示して、
よくわからんなりに「これも猫!これも猫!」とコンピュータにインプットし、
「正解!」「間違い!」と答えだけ示し続けたのである。
ただ猫の写真を見せて、猫だよ、猫だよ、と言い続けたのである。
何度も何度も繰り返すうちに、初めは当然判別することができるわけもなく
何がなんだかわからなかったものが、だんだん「猫ってこんな感じ?」と
コンピュータの「画像データを見て猫を判別する精度が上がっていった」のである。
人間が行ったのは脳組織に似た(とても簡単な)ニューラルネットワークの構造設計をし、
あとは画像を死ぬほど放り込んで、イエス、ノーと答え合わせをし続けただけ。
あらかじめ何か特徴をプログラムしたわけではないし、
コンピュータが何をどう論理化させて「猫だ」と認識するのかは
ブラックボックスでわからないままなのだが、
ともかく猫を認識する精度は見せれば見せるほど上がっていき
足が無かろうが、後ろ向きだろうが、肉球だけだろうが「猫だ!」と
コンピュータが判別するところまで行き着いてしまったのである。
猫ってなんなのかを教えないでわかんないまま、
死ぬほど見せ続けたら判別できるようになった、、、
現在のAIの基礎となる「深層学習(Deep Learning)」の夜明けである。

今ではこの画像認識法も物体認識や人間の顔認識などに普通に使われています。
(スマホの写真アルバムなどで勝手に人物毎に分類したりしてくれてるのとか。)
ちなみにコンピュータがどうやって判定してるかという中身は「今も当然わからない」まま、「なんとなくだが、すごい精度で」判定するのである。現在ではこの認識精度は最早、人間をはるかに上回っている。帽子かぶってサングラスして上底の靴を履いてスカート着てる奥山さんでも見つけてしまうのである。(そんな格好はしないけど。(笑))

さらに。

この画像認識の学習を動画や連続した画像として示し、
行動をとった場合、それが正解だったか不正解だったかを
同様にスコアリングして学習させていく。。。
(「なんとなくだけど、この後は右?」「ぶぶー、左でした〜!」という答え合わせ。
スコアリング。正しい行動には得点。ほめてやる。)
こんなことを続けた結果、何も教えてないのにコンピュータが「ブロック崩し」の達人がなってしまったのです。人間よりゲームが上手い。
「強化学習(Reinforcement Learning)」という。

現在AIと言われるものはこれらの「深層学習」と「強化学習」を組み合わせた
「深層強化学習」というものである。
「じっくり、とことん、繰り返し繰り返し教え込んでいく」と、すごいことになるのである。
空っぽなところから学習し経験して、知識を身に付けさせるのだ。
松尾さんに言わせると、知らないことを知らないなりに吸収してすごいことになっていく
「子供のようなAI」
なのだそうだ。

人間の脳に似たニューロン構造のモデルに画像認識、行動スコアリング
の「学習」を行うことによって、「曖昧だが確かだと思う最適アウトプット」を
コンピュータが出し始め、最早、多くの分野でそれは人の出す答えよりも
速く、正確になりつつある。

漆塗り職人や高所作業の鳶職、棚田の田植え、
長い経験の中での習熟を要する複雑なもの、なかなか人間が習熟できないもの。
特にこういったものほど人工知能に置き換わっていく有用性が高く、
面白くも取り組みたいものだそうである。
レベル4と言われる自動運転技術も、この文脈の中にある。

書ききれないので、
学習型AIの課題、投資・金融に対しての適用性、などはいずれ。
今回は昨今の「AI」と言われるものの基本理解ということでお許しいただきたい。

(2021/11/15 奥山記)

参考:
松尾豊氏
https://ja.wikipedia.org/wiki/松尾豊
ディープラーニング
https://ja.wikipedia.org/wiki/ディープラーニング
深層強化学習(DQN)
https://ja.wikipedia.org/wiki/DQN_(コンピュータ)
強化学習したコンピュータによるブロック崩し
www.youtube.com/watch?v=HOoUuPsP0Bs

11961 pageviews at this page since 2021/11/12 ( 774198 total page access)

 

1件のコメント

  1. なつかしい です
    えみーが じんこうちのうってこと いしきして いませんでした
    あまずっぱい おもいで です

    じんこうちのう そのもの では ありませんが
    ばびるにせい に でてくる ばべるのとう が ぼくに とっては
    さいしょの じんこうちのう との であい です

    さいぼーぐ009 にも ちのうしか もたない ぶらっくごーすと が
    いましたね

    AIぞくへん たのしみに しています

    ばいばい

かめやまん へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA