無能の極み

人工知能が書いた書籍「賢人降臨」発売 あえて無校正、「AIの未来感じて」

 福沢諭吉の「学問のすすめ」と新渡戸稲造「自警録」を、ディープラーニング(リカレントニューラルネットワーク)で零に学習させた上で、「若者」「学問を修め立身」など5つの“お題”を与え、文章を創作させた。

 作品は、原典とほぼ同じ文が続くが、文の構成や順序が変わっていたり、同じことを繰り返すなど、お題に合わせて変化した部分があるという。あえて校正・校閲を行っていないため、乱れた文章もあるが、「現時点での技術がどのレベルかを読者に知っていただくためにも、あえて間違いの訂正はしていない」という。



無能の極みと言うほかない。

「若者もあり、あるいは才智|逞《たくま》しゅうして役人となり商人となりて天下を動かす者もあり・・・」
「学問を修め立身分を用うるの理あり。・・・」
「世界を制する者ははなはだ少ない。・・・」
「成功とはなんぞまらぬことである。・・・」
「人とは何を示すものでない。いつぞそういう者でもよい。・・・」


この文を出力したプログラムは、全くその文の意味を理解していない。

簡単な言葉でいい。プログラム(システム)自身が理解している言葉を出してみよう。

tag : 人工知能

「コネクトーム」を読んで



コネクトームとは「脳の全神経細胞ネットワーク地図」。

コネクトームには、部位コネクトーム、ニューロン・タイプ・コネクトーム、ニューロン・コネクトームの3つがあり、最初の2つは誰でも同じような接続性を持っているが、ニューロン・コネクトームは他の誰とも異なる唯一無二の存在。人間のコネクトームは遅くとも二十一世紀末までには得られるだろうとのこと。
これだけのことを書くのに、400ページ以上を費やす時間があったら、とっとと仕事をしてくれ。

tag : コネクトーム

「意識はいつ生まれるのか」を読んで



統合情報理論 基本命題:

ある身体システムは、情報を統合する能力があれば、意識がある。


第一の公理:

意識の経験は、豊富な情報量に支えられている。つまり、ある意識の経験というのは、無数の他の可能性を、独特の方法で排除したうえで、成り立っている。いいかえれば、意識は、無数の可能性のレパートリーに支えられている、ということだ。


第二の公理:

意識の経験は、統合されたものである。意識のどの状態も、単一のものとして感じられる、ということだ。ゆえに、意識の基盤も、統合された単一のものでなければならない。


第一第二の公理を組み合わせた命題:

意識を生み出す基盤は、おびただしい数の異なる状態を区別できる、統合された存在である。つまり、ある身体システムが情報を統合できるなら、そのシステムには意識がある。


本の帯に「利己的遺伝子以来の衝撃!」とあり、大いに期待したが、大雑把な理論に思え残念だった。意識が成立するための条件ではなく、意識が成立するためのメカニズムやクオリアなどのハードプロブレムに言及してほしかった。

tag : 意識

アルファ碁のアルゴリズム

大船渡 碁石海岸(2016/03/12撮影)

goishi_01.jpg

googleのブログ(AlphaGo: マシンラーニングで囲碁を)にアルファ碁の仕組みについて以下のようにあった。

囲碁において、可能性のあるすべての指し手に対して探索木を割り当てる従来の AI 方式は通用しません。今回の挑戦を始めるにあたり、私たちはモンテカルロ木探索とディープニューラルネットワークを 組み合わせた AlphaGo (アルファ碁) というシステムを新たに開発しました。このシステムは、碁盤自体を入力と見立て、その情報を数百万のノードからなる 12 層構成のニューラルネットワークで処理します。1 つ目の「ポリシーネットワーク」が次の手を決定し、もう 1 つのニューラルネットワーク「バリューネットワーク」が勝者を予測します。


実装は大雑把に以下のような感じであろうか。

・「碁盤自体を入力」ということは、白/黒/なしの3種類、361が入力。
・ポリシーネットワークでは、敗者の各指し手直後の盤面を入力にして、勝者の指し手が出力になるようにネットワークを学習。
・バリューネットワークでは、両者の盤面全てを入力し、その勝ち負けを予想するように学習。
・対局時は、ポリシーネットワークの出力の上位候補複数とバリューネットワークの結果を使って、モンテカルロ木探索を行い勝率の高い指し手を選択。

原始モンテカルロ碁では、単純にランダムな着手によってプレイアウト(終局まで対局をシミュレーション)していたため弱かった。
それを改良したのが、ゲーム木探索とモンテカルロ法を融合した「モンテカルロ木探索」(勝率の高い着手により多くのプレイアウトを割り当て、プレイアウト回数が基準値を超えたら一手進んだ局面でプレイアウトを行う)。
しかしアルファ碁では終局まで行わず、途中まででもバリューネットワークで結果を予測できる。それにより探索できる幅が広がる。

Wiki(コンピュータ囲碁)には、

囲碁は将棋などに比べて最善手と次善手、三番手の差が小さく一本道の攻防が少ないという特徴から、ランダムなプレイを多数回行って勝率を調べることで形勢を評価することが可能である。…モンテカルロ碁の弱点として、死活やシチョウなど「正解手順はたった一つでかつ長手順だが、正解手順とそれ以外の手順に極めて大きな結果の差が生じるような」手順を見つけにくい点がある。

とある。ここにアルファ碁の弱点があるのかもしれない。

またgoogleブログに、

私たちは、このニューラルネットワークを、囲碁の達人たちによる 3,000 万を超す指し手を用いてトレーニングし、57% の確率で次の手を予測することが出来るようになりました。(AlphaGo 以前の記録は 44% でした。) しかし、私たちの目標は棋士の真似をさせることではなく、コンピューターが名人と競い、勝てるようにすることです。 そこで AlphaGo は、自らのニューラルネットワーク間で幾千もの対局を行い、強化学習と呼ばれる試行錯誤を繰り返しながらコネクションを調整、自ら新たな戦略を学び取りました。


とある。囲碁の達人たちの棋譜を学習後、ネットワーク間で対戦。その際一方はポリシーネットワークが出した指し手以外を稀に出力。ポリシーネットワークが出した指し手以外の方が勝った場合は、それも学習に使っているのではないか。

モンテカルロ木探索のランダムな差し手を、学習したニューラルネット(ポリシーネットワーク)に置き換え、評価関数もニューラルネット(バリューネットワーク)に置き換える。さらにネットワーク間の対戦で未知の差し手を発見するのがアルファ碁の正体ではなかろうか。

やはり賢くなったのはソフトではなく、プログラムを実装した人間(何が賢くなったのか)という感想にかわりはない。

強さではなく賢さ(AlphaGoの衝撃)とは何かを窮めたい。

tag : アルファ碁 コンピュータ囲碁

人工知能が成長するために何が必要か

生命体はなんらかの欲求にしたがって、自己を保持し成長している。その欲求の基本的なものは自己保存の欲求(食欲など)と考えられる。人の場合、その自己保存の欲求が金銭欲や名誉欲などに発展?する。

人工知能が成長するためにも、なんらかの欲求が必要と思われる。その候補として知識欲が考えられる。知識が増えると人工知能は欲求が満たされる(報酬)。しかしただ知識が増えるだけでは知能とはならないだろう。

新しく獲得した知識が正しいか正しくないかを判断し、判断できない場合はなぜ判断できないのか、判断に不足の情報は何かを追求する(疑問を持つ)積極的行動によって知識を獲得(疑問の解決)した場合、より大きな報酬を得ることにより、人工知能は本当の知能を備えることができるだろう。

しかし「疑問を持つ」という機能には、記憶、比較、常識的知識などそれ以前に解決しておかなければならない機能が山のようにある。

tag : 人工知能

新着図書情報

2017年8月発売

2017年4月発売

2016年11月発売

2015年10月発売
にほんブログ村
にほんブログ村 科学ブログ 脳科学へ
広告
最新記事
お勧めの本
カテゴリ
カレンダー
08 | 2017/09 | 10
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
プロフィール

sai

Author:sai
宮城県出身。寅年生まれ。おうし座。B型。左利き。赤緑色盲。たそがれのプログラマー。

リンク
RSSリンクの表示
最新トラックバック
検索フォーム
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
月別アーカイブ