2011年度 人工知能学会 全国大会 3日目(6/3)

「記号創発ロボティクスとマルチモーダルセマンティックインタラクション (2)」

■Spoken Interface for Correcting Phoneme Recognition Errors in Learning of Unknown Words

実験では音声の未知語を、対話をとおして平均3回、最大7回で認識できたそうである。部分訂正も行える。この方式で大規模言語モデルを構築できるのかどうか興味深い。

■指示詞と普通名詞が混在している中での意味獲得

指示詞(実験では「これ」「それ」) としての意味を獲得してるとは、とても思えなかった。

■回帰モデルに基づく言語・非言語指示パターンによる移動ロボットのための制御則の獲得

研究の意義が不明であった。

■ロボットの語意獲得のためのユーザの発話分類

 本研究では,ロボットに音声命令を与える際のユーザの発話を,以下のように分類した.この分類を,機能での発話分類と呼ぶ.
●命令発話:行動を命令する発話
●訂正発話:間違っている行動を訂正させる発話
●評価発話:行動に対しての評価をする発話
●描写発話:行動を構成する概念を描写する発話
●フィラー
さらに命令発話と評価発話とフィラーについては,ロボットの行動への評価を基準として,以下のように分類する.この分類を,評価での発話分類と呼ぶ.
●肯定的発話:直前の行動に対する肯定的な評価を含む発話
●否定的発話:直前の行動に対する否定的な評価を含む発話


この分類の妥当性に疑問を感じる。

■神経力学モデルによるロボットの言語・運動の統合的認知

"記号接地問題"に対して

本研究で提案する言語-運動統合認知モデルでは,モータ値の時系列からなるロボット動作パターンと文字系列からなる文の相互連想を行う.モデルは行為パターンを自己組織化する感覚‐運動系RNN (Sensory-Motor RNN)と,言語を自己組織化する言語RNN 群(Language RNNs)が少数のニューロンを介して相互作用することで,相互連想を実現する.


というアプローチ。さらに入力の最小単位が単語から文字単位にし(実際的になる)、SOMを使って文法的知識も獲得するというもの。
記号接地は意味理解の最初の大きなハードルで、クリアしなければならないものであるが、意味理解の次の段階(あるいは同時?)は、どれを記号接地する(記憶する)のかという問題があると思う。

■運動と自然言語の統計的推論を用いた運動データベースの設計

データの数は確か6万と言っていた。

■オントロジーアライメントに基づくヒューマンロボットインタラクション

 本稿では,新たに人間の動作世界を表現する【姿勢オントロジー】を構築し,ロボットの動作オントロジーに関連付けることにより,Wikipediaオントロジーに基づく対話の中で,動作レベルでも双方向コミュニケーションが可能なシステムを提案する.


前の発表もそうだが、人手でデータを作ってという方式には興味がそそられない。

■倒立二輪型移動ロボットによる人間の動的動作模倣のための身体部位マッピング

倒立二輪移動ロボットと人間の蹴球動作は、あきらかに違うので・・・以下省略。

「知的対話システム」

■対話ロボットのマルチエキスパートモデルRIMEの拡張性向上による柔軟な対話行動制御の実現

 各エキスパートは,発話を理解するための知識や行動選択をするための知識を持ち,サブタスクの遂行の状態を内部的に保持している.たとえば,「天気予報に関する質問を理解する」エキスパートであれば,理解の途中結果などが内部状態として保持されている.


と似たような発想で前にいた会社でもやっていたが、ものの見事に玉砕した。健闘(検討?)を祈る。

■アクション継続長制御を用いたPOMDPによる対話制御

 我々の目標は,対話データから対話(行動) 制御を自動的に獲得することである.行動制御を自動的に学習する手法として,POMDP (Partially Observable Markov DecisionProcess)[Sutton98, Russell03] が近年注目を集めている.POMDP は,ある状態下でシステムが行動するアクションに対して報酬を定義し,将来,最も多くの平均報酬が獲得できるアクションを選択するモデルである.


使える対話制御は挨拶くらいと思われるので、使えない。

■対話エージェントのための発話候補絞り込み

発話の種類を記述するためのタグであるSWBD-DAMSL(Switchboard Discourse Annotation and Markup System of Labeling) タグ[Jurafsky 97] を内容ごとにまとめた簡易DAMSL タグ

Statement 意見・説明
Question 質問
Tag Question 付加疑問文
Understand 相槌・了解
Response 同意・拒否
Commit 提案・遂行
Advice 指示・命令
Thanking 感謝
Apology 謝罪
Greeting 挨拶
Admiration 感嘆
Others その他(独り言,引用など)


そもそも、このタグによる分類の妥当性が高くなければ、意味が無い。

■対話からの話者のプロフィール情報自動獲得

DAMSLタグに加え、自己開示発話/非自己開示発話の分類の妥当性が・・・

■英語のリズムを教えるコミュニケーションロボットを目指して

他にすることが無いのだろうか。

■思考喚起型対話におけるユーザ対話意欲の分析

同上。

■ペット型ロボットを想定した知識処理利用の雑談型自由対話システム

デモを見て、述語知識という形式では、すぐに破綻すると思われた。

■質問応答と自発的発話の組み合わせによる複数人会話活性化戦略

MC 「正解です.ロビスケは何か好きな映画はあるの?」
Robot 「僕はねタイタニックが好きだったなあ.」
MC 「誰か好きな俳優さんはいるの?ロビスケ」
Robot 「(A)僕の好きな女優はねオードリーヘップバーンだよ.(B)ローマの休日はいい映画だよね.」
(一同歓声)
図2: 活性化した会話例


通所介護施設の実験において,ロボットの特定の発話が参加者の興味を引き,場が活性化される様子が観察された.その会話の例を図2 に示す.ロボット(Robot)の発話「僕の好きな女優はね,オードリーヘップバーンだよ.ローマの休日はいい映画だよね.」の直後に歓声が上がった.直前の司会者(MC)の質問は,ロボットの好きな俳優が誰か問うものであり,俳優の名前を回答したことで要求は満足された(図2 の(A)).ロボットはその情報に加えてその俳優に関連する映画について発話した(図2 の(B)).この発話は参加者が意図しなかったものである.文脈を踏まえた上での意外性のあるこの発話が場を活性化させたと考える.


映像を見た限り、ロボットが「オードリーヘップバーン」と答えただけでも、十分老人達には受けたと思われ、研究の前提・根拠に疑問を感じた。

■ラダリング対話エンジンの商品問い合わせへの適用

この発表には無かったが、「ラダリング対話エンジン(ラダサーチ)」の対話例をネットで見たことがあり、10年前に私が実装した旅行検索対話と対話制御、回答文パターンなど全てが酷似しているのに驚いた。この分野の進歩の遅々としていることを実感。
関連記事

tag : 2011年度 人工知能学会 全国大会 AI 記号接地

コメントの投稿

非公開コメント

新着図書情報
2013年11月発売
2013年6月発売
にほんブログ村
にほんブログ村 科学ブログ 脳科学へ
広告
最新記事
お勧めの本
カテゴリ
カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
プロフィール

sai

Author:sai
宮城県出身。寅年生まれ。おうし座。B型。左利き。赤緑色盲。たそがれのプログラマー。

リンク
RSSリンクの表示
最新トラックバック
検索フォーム
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
月別アーカイブ