スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

AlphaGoの衝撃

AlphaGo: マシンラーニングで囲碁を

DeepMind(google)やFacebookがすごい囲碁ソフトを作っているという噂は聞いていたが、DQN(DeepMind)がエアホッケーやブロック崩しには強くても、パックマンは苦手と聞いて、囲碁は難しいだろうとたかをくくっていたが、こんなにも速く名人並みの実力を実現するとは衝撃的だった。

今回の挑戦を始めるにあたり、私たちはモンテカルロ木探索とディープニューラルネットワークを組み合わせた AlphaGo (アルファ碁) というシステムを新たに開発しました。このシステムは、碁盤自体を入力と見立て、その情報を数百万のノードからなる 12 層構成のニューラルネットワークで処理します。


またまたディープラーニングの実力を見せ付けられた。

私たちは、このニューラルネットワークを、囲碁の達人たちによる 3,000 万を超す指し手を用いてトレーニングし、57% の確率で次の手を予測することが出来るようになりました。(AlphaGo 以前の記録は 44% でした。)


人ならばせいぜい、10回 × 一年365日 × 30年 = 109、500回程度の訓練しかできないと思うので、生物としてのハンディがある。

ここらで強さを競うのではなく、新しいゲームのルールを少ない試行回数で獲得するような新たな挑戦をしてみてはどうだろうか。
バックプロパゲーションのような膨大な試行回数を必要とするアルゴリズムではなく、即時マッピング的なアルゴリズムでなければ勝つことはできないであろう。
スポンサーサイト

tag : アルファ碁 コンピュータ囲碁

新着図書情報
2013年11月発売
2013年6月発売
にほんブログ村
にほんブログ村 科学ブログ 脳科学へ
広告
最新記事
お勧めの本
カテゴリ
カレンダー
12 | 2016/01 | 02
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31 - - - - - -
プロフィール

sai

Author:sai
宮城県出身。寅年生まれ。おうし座。B型。左利き。赤緑色盲。たそがれのプログラマー。

リンク
RSSリンクの表示
最新トラックバック
検索フォーム
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
月別アーカイブ
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。