スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

過去の確率

形態素解析にしても音声認識にしても、統計的に後に来る単語の確率(未来の確率)は使われるが、後の単語から見て前の単語の確率(過去の確率)というものは使っていない。
処理的に負荷が大きいが、役に立つかもしれない。

あっと言う間
   ↓
あっと言う間 首相?(未来の確率ゼロ、過去の確率もゼロ)
   ↓
麻生?    首相?(過去の確率はゼロではないが、音響的に不適合)
   ↓
鳩山     首相!(過去の確率があり音響的にも適合)
   ↓
鳩山     首相 の 評判 は

と書いたが、juliusの第2パスは、後ろ向きのN-gramで探索を行そうである。知らなんだ。

Julius は第1パスは left-to-right, 第2パスでは逆に入力終端から始端に向かってright-to-left に探索を行う.このため,第1パスでは通常の前向き (left-to-right) の 2-gram,第2パスでは後ろ向きの N-gram がそれぞれ必要となる.前向き,後ろ向きのどちらか一方のみを与える,あるいはそれぞれのパス用に両方のN-gramを指定することもできる.

前向きと後ろ向きの両方の N-gram を与えた場合,第1パスで前向きの2-gram が適用され,第2パスで後ろ向きの N-gram が適用される.与えられた前向き N-gram に 3-gram より長い N-gram がある場合,その中の 2-gram のみが用いられる.内部でインデックスを共有するため,前向きN-gramと後ろ向き N-ramは同一の学習コーパスから学習され,語彙およびカットオフ値も同一である必要がある.

どちらか一方の N-gram のみを指定した場合,与えられたモデルと逆向きの探索パスでは,ベイズ則にしたがい算出した逆向き確率が用いられる.前向き N-gramのみの場合,第1パスではその中の前向き2-gram を用い,第2パスではベイズ則にしたがって後向き確率に変換した確率が用いられる.逆に後ろ向き N-gramのみを指定した場合は,第1パスではその中の後ろ向き2-gramをベイズ則により前向き2-gram確率に変換した値を用い,第2パスでは後ろ向きN-gram をそのまま適用する.

関連記事

コメントの投稿

非公開コメント

新着図書情報
2013年11月発売
2013年6月発売
にほんブログ村
にほんブログ村 科学ブログ 脳科学へ
広告
最新記事
お勧めの本
カテゴリ
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
プロフィール

sai

Author:sai
宮城県出身。寅年生まれ。おうし座。B型。左利き。赤緑色盲。たそがれのプログラマー。

リンク
RSSリンクの表示
最新トラックバック
検索フォーム
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード
月別アーカイブ
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。