スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

人工知能「東ロボくん」 東大を断念

人工知能「東ロボくん」 東大を断念

これまで順調に成績を伸ばしてきた東ロボくんですが、教科書などの情報と検索技術によって正解にたどりつく世界史などは得意な一方、文章の意味を理解して、問題文を読み解く「読解力」がなかなか向上しませんでした。このため国語や英語などの科目では、今後の成績向上に限界があり東大合格の水準にあたる偏差値70以上にまで成績を上げることは現在の技術では難しいと判断したということで、ことしで東大合格は諦め、“進路変更”を決めました。


早めに諦めたのがせめてもの救いだ。

新井教授は「有名私立大学に合格できる自信は出来た。東ロボくんはこのあたりで“浪人”を終わりにして合格した大学に入学するのがよいのではないかと思う。今後、人工知能の社会への導入は必至で、人間が人工知能に勝るのは読解力だ。人工知能に負けない子どもたちを育てる教育を提案する研究に力を入れていきたい」と話していました。


しかし次の目標がよくない。

東ロボくんの東大受験から見える人間と人工知能の違いについて「入試問題を解くには文中に書かれていない情報も利用する必要があるが、人間は問題文に書かれたことだけでなく、常識のような知識も利用して問題を解いている。今後、人間が意味を理解するレベルに人工知能を近づけるには、人間の常識をはじめとした教科書に書かれていない知識をどのように習得し、習得した知識を目の前の問題とどのように関連づけられるかという技術が必要だ。


そう、これをやるべきなのだ。

関連記事:
10年後に人工知能が東大に合格?
「ことばの意味を理解」とは?
スポンサーサイト

tag : 東ロボ

人の自然言語処理

人の自然言語処理

・先にイメージあり

人は言葉を覚える前に、通常その実体のイメージが脳内にある。そのイメージと言葉が結びつく(シンボルグラウンディング)ことにより、言葉を操ることができる。


・イメージの無い言葉は覚えられない

子どもの脳内にはまだ難しい概念のイメージは無く、ある難しい言葉を聞いてもそのイメージが脳内に無いのでグラウンディングできない。


・知っている言葉から新しい言葉を獲得する

子どもが成長するに従って、知らない言葉を聞くと周りの大人にその意味を尋ねる。聞かれた大人は、子どもの知っている(と思われる)言葉を使ってその言葉の意味を説明する。そのとき子どもの脳内に、これまで知らなかった言葉のイメージができるとともに、言葉がグラウンディングされる。


・観察・学習によって言葉を獲得する

また直接的に大人に聞かなくても、観察によりイメージと言葉のグラウンディングができるようになる。さらには自分の興味に従って学習することによっても、脳内にイメージを生成し新しい言葉を獲得する。



コンピュータの自然言語処理


テキストの文書から、形態素解析(単語の分割)、文節統合・構文解析(係り受け)、語義曖昧性解消、固有表現抽出、照応・共参照解析、述語項構造解析(述語とその格要素の同定)、モダリティ解析などを行う。
人の自然言語処理とは全く違う方式でのアプローチであり、最終的には意味の理解を目指している。


人の自然言語処理との違いを認識して、このアプローチで目的が達成できるかどうかをじっくり考えてみるべきである。

tag : 自然言語処理 シンブルグラウンディング 言語

「ことばの意味を理解」とは?

人工知能 400大学で合格圏内に 2013年(平成25年)11月23日

記事要約:

東京大学合格を目標に、国立情報学研究所などが中心となって開発を進めている人工知能「東ロボくん」が、大手予備校のセンター試験の模試を初めて受験し、900点満点中387点を獲得して、全国およそ400の大学でA判定を獲得する成績を収めました。

どうやって問題を解く

例えば、歴史では、質問文にあることばの中から「邪馬台国」といった固有名詞やそれに関係がありそうな「統治」や「人物」といった単語をキーワードとして選び出し、複数のキーワードが教科書の中で最も多く出現する場所を段落の単位で探し当て、最も関連性が高い文章を4つの選択肢の中から見つけ出し正解として回答します。
一方、数学では、東ロボくんのプログラムは、日本語の質問を数式に変換してその意味を正確に理解したうえで問題を解こうとします。

人工知能研究の現状と課題

人工知能の研究は、60年以上前から行われていますが、16年前の1997年、IBMのコンピューター、「ディープブルー」がチェスの世界王者に勝ち、また去年、IBMの大型コンピューター「ワトソン」が、歴代最強のクイズ王に圧倒的な強さで勝利しました。日本でも、ことし3月、将棋のソフトが現役のプロ棋士に勝利しました。

しかし、今の人工知能にとって極めて難しいのは、ことばの意味を理解することです。例えば、ことばの言いかえや要約をするといったことができません。「東ロボくん」は、ことばの意味をより正しく理解できる次世代の人工知能を目指そうと開発が進められていて、数学などの科目では質問の意味をある一定の範囲まで正しく理解して問題を解くことに成功しています。
「東ロボくん」の研究開発チームのリーダーで国立情報学研究所の新井紀子教授は、「ことばの意味を理解し、言いかえや要約にも対応できる人工知能が開発できれば、インターネットの検索エンジンなど、身の回りのコンピュータープログラムがすべて大きく進化する。人間の働き方など社会に大きな変革をもたらす技術で、東ロボくんの開発を進めることがこの分野で世界をリードすることにつながる」と話しています


皮肉に聞こえるかもしれないが、人工知能開発の反面教師としておもしろい記事である。



例えば数学では、日本語の質問を数式に変換してその意味を理解し、問題を解くことができます。しかし、問題文が長くなると理解が不正確になり間違うことが多くなるということです。このため、質問文が短い「数学I・数学A」や、あらかじめ記憶した知識を引き出して問題に答える日本史や世界史では比較的高い得点となりましたが、国語や英語など、質問の文章がより長く、あいまいな表現が多く含まれるものになると、正しい答えを出せなくなるということです。


そもそも何をもって「意味を理解」と言っているのであろうか。正解できれば「意味を理解」したと定義しているように思える。


このプロジェクトのリーダーで国立情報学研究所の新井紀子教授は、「人のことばの意味を理解できる次世代の人工知能が出来れば、人の働き方など社会は大きく変化する。長期的な目で開発を進め、世界をリードする人工知能に育て上げたい」と話しています。


果たして「意味を理解」に向かって開発を進めているかどうか疑わしいが、そもそも「意味を理解」を目標にすべきであろうか。「意味の獲得」を目標にすべきではないだろうか。「意味の獲得」即「意味の理解」と私は考える。


「東ロボくん」は今回、受験した7つの科目それぞれについて違う解き方をしています。これは、東ロボくんのプログラムが科目ごとに分けられて、それぞれ別の研究者が開発を進めているためです。


まず7つの科目の識別くらいできなければならない。また7つの科目以外でもそこそこ解答できるように作るべきである。


質問文にあることばの中から「邪馬台国」といった固有名詞やそれに関係がありそうな「統治」や「人物」といった単語をキーワードとして選び出します。


関連のあるキーワードをどうやって選び出すのか。人で手で定義するのであればプロジェクトに先はない。統計的に選んでも足りない。


そのうえで、東ロボくんは、選び出した複数のキーワードが教科書の中で最も多く出現する場所を段落の単位で探し当てます。そのうえで、探し出した段落と最も関連性が高い文章をセンター模試の4つの選択肢の中から見つけ出し正解として回答します。


人は100%の確信をもって解答できる。この方法では(ワトソン君でもそうだが)100%の確信はない。


東ロボくんの中には、日本語をコンピューターの言語に訳すための辞書があらかじめ入っています。試験でよく出てくる「実数」といった名詞や、「が」や「を」といった助詞をこの辞書を使って翻訳し、その意味や文の中での役割を数式で表せるようにしたうえで、問題を解いていくのです。


このような内部に辞書を持つ方式で「意味を理解」しようとする試みが無駄に終わるのを、研究者はいつになったら理解できるのか。


ことばの意味を理解し、言いかえや要約にも対応できる人工知能が開発できれば、インターネットの検索エンジンなど、身の回りのコンピュータープログラムがすべて大きく進化する。人間の働き方など社会に大きな変革をもたらす技術


これは確かだと思う。しかし「ことばの意味を理解」とは何かを、真剣に考えることが先であろう。
そして東大合格は、真の目的に対して遠回りだったことに気づくべきである。


関連記事:
「10年後に人工知能が東大に合格?」

バーチャル・セラピスト

米軍が開発する「バーチャル・セラピスト」

米国防高等研究計画局(DARPA)は、兵士のPTSD治療に活用するため、アニメキャラのバーチャル・セラピスト『SIM Sensei』の開発を進めている。相談者の顔の表情や動作、発話を分析して的確に応答できるものだ。


米国防高等研究計画局(DARPA)の研究チームは、相談者の「顔の表情や動作、発話を分析することで」心理学的症状を実際に検知できる、高精度の分析ソフトウェアと、3Dレンダリングによるバーチャル・セラピストを組み合わせたいと考えている。『The Sims』のキャラクターたちに、『ELIZA』(イライザ)をミックスしたようなものをイメージしてもらうといい。[ELIZAは1966年に開発された有名なプログラム。来談者中心療法のセラピストを装って、患者の言葉を質問に変換してオウム返しするようになっている]



おそらくイライザに毛が生えた程度ではないかと推測する。
大量データを蓄積・分析し、的確に答えるというシステムには限界がある。その限界とは知識の範囲外には対応できないことである。
では知識を増やせばいいのかといえば、それにも限界があり、実時間での応答ができなくなる。
第一の問題点は、知識(データ)の量ではなく、知識を獲得する仕組みがないことである。

tag : ELIZA イライザ

チューリングテスト

人工知能がチューリングテストを突破する日は近いか

上記の記事によると「チューリングテストを突破する最初のコンピューターの核となるコードが、すでにできていると思える」そうである。

フランス国立科学研究センター(French National Center for Scientific Research)の認知科学者であるロバート・フレンチは、4月12日付けのScience誌に寄稿したエッセイのなかで、「情報技術に関する2つの革命的な進歩により、チューリングテストが再び現役に復帰する可能性がある」と記している。「この進歩のひとつめは、動画配信から完全な音声環境、カジュアルな会話、さらにあらゆる分野に関する専門文書まで、大量の生のデータを利用できる下地ができているということ。そして、ふたつめはこれらの豊富なデータを収集し、体系付け、処理する高度な技術が出現していることである」(フレンチ氏)


大量のデータを利用できるようになったのは確かであるが、それを処理する高度な技術はまだまだと思う。



チューリングテストの発案者のアラン・チューリング自身は、それをチューリングテストとは呼んでいない。チューリングテストという言葉を知っている人は多いが、その論文を読んだ人は少ないであろう。「マインズ・アイ」にその論文が収録されているので、興味のある人はどうぞ。そのほか人工知能に関する哲学的論文が盛りだくさんの本である。

チューリングテスト同様に名前は聞いたことがあるが、実際の論文を読んだことがないものにドナルド・ヘッブの「ヘッブ則」がある。記事「行動の機構――脳メカニズムから心理学へ」にも書いたが、この本は最近岩波文庫で復刻された。

あの「Googleが選ぶ20世紀の名著100選」を再審してみたら」という記事によると、20世紀に出版された「文系学術書」の被引用数の多い順100に、この本が入っている(2007年:59位、2010年:29位)。

tag : チューリングテスト アラン・チューリング

新着図書情報
2013年11月発売
2013年6月発売
にほんブログ村
にほんブログ村 科学ブログ 脳科学へ
広告
最新記事
お勧めの本
カテゴリ
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
プロフィール

sai

Author:sai
宮城県出身。寅年生まれ。おうし座。B型。左利き。赤緑色盲。たそがれのプログラマー。

リンク
RSSリンクの表示
最新トラックバック
検索フォーム
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
月別アーカイブ
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。