特徴抽出

コンピュータと人間の記憶の違い」という記事で、記銘(符号化)という過程では、人間の場合「特徴を抽出して記銘される」と書いたが、コンピュータもプログラムによっては特徴抽出を行う。

例えば音声認識のプログラムは、音声波形データを周波数分解し、それからフォルマントなどの特徴を抽出し、最終的にはテキストデータとして(保存すれば)記憶する。このようなプログラムは知的な感じだが、コンピュータ処理では例外的で、ほとんどのプログラムは特徴抽出とは無縁であろう。

人間の記憶は、すべて特徴を抽出して記銘される。特徴抽出しなければ、すぐに人間の記憶システムはパンクしてしまう。その抽出される特徴はダイナミックに更新される。例えば赤ん坊は、サルの顔を区別することができるが、徐々に区別ができなくなる。逆に大人は、サルの顔を通常区別できないが、動物園の飼育係のように何度も見ることによって、区別することができるようになる。

抽出される特徴がダイナミックに更新される要因としては、"主体にとっての区別の必要性"と"出現頻度"などが考えられる。"出現頻度"だけでは特徴の抽出は不完全になる。

"出現頻度"をプログラムで扱うことは容易いが、"主体にとっての区別の必要性"は容易ではない。如何にしてプログラムに"主体にとっての区別の必要性"を実装すべきか。


関連記事:
コンピュータと人間の記憶の違い
漢字が書けなくなった

tag : 特徴抽出 記憶 主体

コンピュータと人間の記憶の違い

記憶の過程の分類で、コンピュータと人間の(宣言的)記憶の違いを纏めてみた。

記憶の過程コンピュータ人間
記銘
(符号化)
・正確に記銘される
・音声や画像はサンプリングして記銘される
・音声や画像は圧縮される場合もある
・正確に記銘されない
・特徴を抽出して記銘される
・他の記憶と関連付けて記銘される
保持
(貯蔵)
・変化しない・関連する他の記憶の記銘とともに変化する
・長期間想起されないと忘却されることがある
想起
(検索)
・正確な手がかりがないと想起できない
・間違うことはない
・曖昧な手がかりでも想起できる
・間違うことがある

記銘時に他の記憶と関連付けされるということは、記銘される記憶Aを手がかりとして、関連付けされる記憶Bが想起されているということである。
保持の間、記憶Aは新たな記憶Cの記銘とともに変化するため、正確に想起できるとは限らない。
心理学的に記銘、保持、想起という過程に分類されているが、すべての過程で記銘と想起が同時に遂行されている。

記銘と想起が一体化した記憶のアルゴリズムの開発が、「人工知能の課題」克服への第一歩になるのではないだろうか。

tag : 記憶 記銘 保持 想起

人工知能の課題

下記引用のように、人工知能実現のために最も重要と思われる、記憶、学習、記号化といった脳のメカニズムはまったく分かっていないと諦め、その部分は棚上げにしているのが問題であり、課題である。

言語と知能—言語はどのようにして創られたか?—


 言語の発展史の上で最も重要な出来事は、原始概念の形成と原始言語の生成という初期の出来事と、それが発展していった結果、記号化が行われたことの二つである。前者はニューロンによる情報変換の機能、後者は情報記憶の機能という、生物に固有の生体機能の中の異なる情報処理機能に立脚している。このうちニューロン機能については(相対的には)多くのことがわかってきて、モデル化されるまでになっており、その知見に基づいて第一の論点である原始概念・原始言語について論じることができる。一方、記号化と記憶の機構は今日、脳科学や神経科学などで重要課題とされているが、同じ生体機構であるニューロンでの情報処理に比較して、いまだ全くといってよいほど解明されていない。そのため言語の進化的発展のプロセスをモデル化することによって理解する試みの中で、この部分は空白である。この前後で概念と言語の処理方式は全く異なるが、機構がわからないままに、記号化の過程は不問のまま、記号化後の言語の議論をするほかない。本書においても残念ながらこの記号化部分のモデル化はできないままである。



ミンスキー博士の脳の探検 ―常識・感情・自己とは―


 今日においても、脳の記憶の痕跡をどのように作るのか、そして後々、その記憶をどのように引き出し≪再生≫するのかについては、いまだにほとんど解明されていない。個々の脳細胞の振る舞いについては、現時点で多くの知見が得られているが、これらの細胞がどのように組織化され、過去の出来事に関する記憶を表現し、そしてより大きな構造になるのかについては、極めてわずかのことしか示されていない。さらに、私自身の内省についても、これらのプロセスに関する詳細は説明されていない。私たちが一般に言えることは単純であり、自分の身に起こったことを≪覚えている≫ということである。(P331)



脳に宿る心―認知科学・人工知能から神秘の世界に迫る


 6.1節では、μエージェントはを与えられたものとして議論を進めた。当然のことながら一つのμエージェントは、いくつもの神経細胞の回路で構成されている。長い人生を通じて神経細胞の生成、消滅がどのようにμエージェントの生成、消滅にかかわるかは、考えておかなければならない問題である。神経細胞は、小児期に他の細胞の分裂、分化によって増殖し、成人ではそのような活発な増殖は起こらないと言われている。生成された神経細胞は、軸索を伸ばして他の神経細胞と結合し、次第に回路を構成していく。μエージェントについても成長と学習が進むにつれて内部の回路構成ならびにデータの蓄積が進むものと推定できる。しかしながら、具体的な成長・学習過程は明らかではない

テーマ : 意識・認識・認識論
ジャンル : 学問・文化・芸術

tag : 人工知能 認知科学 ミンスキー 記憶

常識を如何に実装すべきか

ミンスキー氏、最近の人工知能研究を批判 2003年5月15日

 「水は濡れている」や「火は熱い」といった概念は、人工知能の研究者たちにとって扱いにくい分野だとされている。これについてミンスキー氏は、完全自律型の考える機械を作るという壮大な挑戦を投げ出しているとして、研究者たちを非難した。


 残念なことに、1980年代の人工知能の研究者たちにとって最も一般的だった方法は行き詰まったと、ミンスキー氏は言う。法律や医薬などの厳密に定義された分野で専門的知識を蓄積した、いわゆる「エキスパートシステム」は、ユーザーからの問い合わせに対して適当な診断や書類、抜粋などを引き出すことができたが、一方で、ほとんどの子どもが3歳までに理解するような概念すら学習できなかった。

 「エキスパートシステムで種類の異なる問題を扱うには、システムを最初から作り直さなければならなかった。常識が蓄積できなかったからだ」とミンスキー氏は述べた。

 ミンスキー氏が、総合的常識の推論システムの構築という壮大なプロジェクトに取り組む唯一の研究者として挙げたのが、ダグラス・レナート氏だ。レナート氏は『サイク・プロジェクト』で、常識のベースとして100万以上のルールの詳細な入力を指揮している。



とミンスキー氏は「常識が蓄積できなかった」ことが、人工知能が未だ成功していない原因に挙げている。
そして有望な研究として『サイク・プロジェクト』をあげているが、

人間並みの人工知能をみんなで育てよう(上) 2000年9月 5日
人間並みの人工知能をみんなで育てよう(下) 2000年9月 6日

マッキンストリー氏は、膨大な数のマインドピクセルを蓄えれば、ジャックは人間の思考を模倣できるようになると考えている。そのためにジャックはいったいいくつのマインドピクセルを必要とするか、マッキンストリー氏にもはっきりとはわからないが、おそらく1億以上だろうと推測している。

この人工知能理論は――全く信じられないとは言わないまでも――空想的だと思う人のために、マッキンストリー氏は、それを説明する簡単な方法があると述べる。マッキンストリー氏はこの人工知能理論を、コンピューターの世界で毎日使われている、データ圧縮というプロセスに喩えるのだ。

大きな音楽ファイルをMP3などのフォーマットで小さく圧縮し、それを復元する際には、近似と推論が用いられる。コンピューターはファイル内にあるデータを調べ、必要なものを取り出し、データを関係づけることによって残りを推論で導き出す。

マッキンストリー氏は、数億個のマインドピクセルは、人間の精神をコンピューター的に「圧縮」したものと見なせると考えている。そうすれば、ちょうどMP3プレーヤーが、欠けているデータを近似的に推定することで圧縮ファイルを復元して音を再生するように、ジャックも、思考するよう命じられたときには、必要なマインドピクセルを「補充」することによって人間の思考に近いものを導き出せるだろうというのだ。

もちろんそのプロセスは、この説明よりもはるかに複雑だ。

「理論は確立されているし、技術もしっかりしている――あとは時間の問題だけだ」とマッキンストリー氏は述べる。

だが、長期にわたって人工知能プロジェクト『サイク』(Cyc)を進めているダグ・レナート氏は、マインドピクセル・プロジェクトに懐疑的な目を向ける。

レナート氏は、ジャックを詳しく検討したことはないとしながらも、この世界には1ビットの「真か偽か」の命題があまりに多くありすぎ、ある程度たくさん集めたところで意味のあるものにはならないと語る。

レナート氏は、「『空は赤くない』という命題まで入れておかなければならないのだろうか」と問い返し、ジャックは、そのデータベースの中に「青」以外のすべての色について「偽」とする命題を保存しておかなければならないだろうと示唆する――これは間違いなく、膨大な数になる。

「例えば小学校4年生の子どもが宿題をするのに必要な真偽問題に限ってみても、それらをすべて蓄積しておくには、この宇宙の原子の数では足りないということに、マッキンストリー氏は気づくことになると思う」とレナート氏。

だがマッキンストリー氏はこの意見に反論し、ある程度十分な数のマインドピクセルが与えられれば、ジャックは「もし空の色が青ならば、それ以外の色ではない」と推論できるようになると言う。

マッキンストリー氏はさらに、サイクが採用している知識の蓄積法は非常に非効率的だと批判する。サイクは、知識の専門家を集め、「アブラハム・リンカーンがゲティスバーグにいたのなら、彼の足もそこにあった」式の、常識的な命題を入力させるやり方をとっている。



ミンスキー氏も、マッキンストリー氏のマインドピクセル・プロジェクトも、レナート氏のサイク・プロジェクトも、真か偽かの命題(それだけではないかもしれないが)を外部から知識を組み込む方式で人間の思考の模倣の実現を目指しているが、それ(だけ)で知能や常識が備わるとは私には思えない。

またマッカーシー氏も外部から知識を組み込む方式をさらに進歩させたいと考えているように思える。

人工知能の第一人者J・マッカーシー氏に聞く--AI研究、半世紀の歴史を振り返る 2006年7月13日

--次に目指す大きな目標は何ですか。

 コンテクストを考慮した常識と推論の定式化をさらに進歩させていきたいですね。これは私が長年に渡って取り組んできたテーマであり、私以外にも取り組んでいる人が何人かいます。この研究はDARPAも支援しているのですが、アイデアが不足していて人間の知能に到達するレベルには至っていません。



しかし常識は外部から組み込むものではなく、主体に獲得させるものではないか。
では如何に獲得させるのか。脳の記憶のメカニズムを参考にしたい。

たとえば「同じ」などという概念は、外部から組み込むのは、そもそも無理ではないだろうか。
「AとBは同じ」という知識を外部から組み込んでも「AとCは同じ」かどうかはわからない。
Aの特徴とB(またはC)の特徴が一致している(あるいは共通点が多い)かどうかを判別する操作と、その結果の認識が「同じ」という概念であり(「同じ」という概念には比較操作や認識も含まれる)、その概念を理解するには、その概念の操作や認識を主体に獲得させるしか方法はなく、主体の外部に存在するもので説明(組み込み)できるとは思えない。
これを実現するには脳の記憶のメカニズムだけでは足りない。ワーキングメモリのデータ操作のメカニズムが必要だ。

tag : 常識 ミンスキー マッカーシー CYC

新着図書情報
2013年11月発売
2013年6月発売
にほんブログ村
にほんブログ村 科学ブログ 脳科学へ
広告
最新記事
お勧めの本
カテゴリ
カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
プロフィール

sai

Author:sai
宮城県出身。寅年生まれ。おうし座。B型。左利き。赤緑色盲。たそがれのプログラマー。

リンク
RSSリンクの表示
最新トラックバック
検索フォーム
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
月別アーカイブ