.\" Title: mkbingram .\" Author: .\" Generator: DocBook XSL Stylesheets v1.71.0 .\" Date: 02/11/2009 .\" Manual: .\" Source: .\" .TH "MKBINGRAM" "1" "02/11/2009" "" "" .\" disable hyphenation .nh .\" disable justification (adjust text to left margin only) .ad l .SH "名前" mkbingram \- バイナリ N\-gram 変換 .SH "概要" .HP 10 \fBmkbingram\fR [\-nlr\ \fIforward_ngram.arpa\fR] [\-nrl\ \fIbackward_ngram.arpa\fR] [\-d\ \fIold_bingram_file\fR] {output_bingram_file} .SH "DESCRIPTION" .PP mkbingram は,ARPA形式の N\-gram 定義ファイルをJulius用のバイナリN\-gram ファイルに変換するツールです.あらかじめ変換しておくことで,Juliusの起 動を大幅に高速化できます. .PP Julius\-4より,N\-gram は前向き,後ろ向き,あるいは両方を指定できるよう になりました.mkbingram でも,どちらか一方だけでバイナリN\-gramを作成するこ とができます.また,両方を指定した場合は,それら2つのN\-gramは一つのバ イナリN\-gramに結合されます. .PP 前向きN\-gramのみが指定されたとき,mkbingram は 前向きN\-gramだけからバ イナリN\-gramを生成します.このバイナリN\-gramを使うとき,Julius はその 中の 2\-gram を使って第1パスを行い,第2 パ スではその前向き確率から後向 きの確率を,ベイズ則に従って算出しながら認識を行います. .PP 後向きN\-gramのみが指定されたとき,mkbingramは後ろ向きN\-gramだけからバ イナリN\-gramを生成します.このバイナリN\-gramを使うとき,Julius はその 中の後向き 2\-gram からベイズ則に従って算出しながら第1パスの認識を行い, 第2パスでは後向き N\-gramを使った認識を行います. .PP 両方が指定されたときは,前向きN\-gram中の2\-gramと後向きN\-gramが統合され たバイナリN\-gramが生成されます.Juliusではその前向き2\-gramで第1パスを 行い,後向きN\-gramで第2パスを行います.なお両 N\-gram は同一のコーパス から同 一の条件(カットオフ値,バックオフ計算方法等)で学習されてあり, 同一の語彙を持っている必要があります. .PP なお,mkbingram は gzip 圧縮された ARPA ファイルもそのまま読み込めます. .PP バージョン 3.x 以前で作成したバイナリN\-gramは,そのまま 4.0 でも読めま す.mkbingram に \fB\-d\fR で与えることで,古いバイナリ形式 を新しいバイナリ形式に変換することもできます.なお,4.0 以降の mkbingram で作成したバイナリN\-gramファイルは3.x 以前のバージョンでは 使えませんのでご注意ください. .SH "OPTIONS" .PP \fB \-nlr \fR \fIforward_ngram.arpa\fR .RS 3n 前向き(left\-to\-right)のARPA形式 N\-gram ファイルを読み込む .RE .PP \fB \-nrl \fR \fIbackward_ngram.arpa\fR .RS 3n 後ろ向き(right\-to\-left)のARPA形式 N\-gram ファイルを読み込む .RE .PP \fB \-d \fR \fIold_bingram_file\fR .RS 3n バイナリN\-gramを読み込む(古いバイナリ形式の変換用) .RE .PP \fB \-swap \fR .RS 3n 文頭記号 と文末記号 を入れ替える. .RE .PP \fIoutput_bingram_file\fR .RS 3n 出力先のバイナリN\-gramファイル名 .RE .SH "EXAMPLES" .PP ARPA形式の N\-gram をバイナリ形式に変換する(前向き+後ろ向き): .sp .RS 3n .nf % \fBmkbingram\fR \-nlr 2gram.arpa \-nrl rev\-Ngram.arpa outfile .fi .RE ARPA形式の前向き 4\-gram をバイナリ形式に変換する(前向きのみ): .sp .RS 3n .nf % \fBmkbingram\fR \-nlr 4gram.arpa outfile .fi .RE 古いバイナリN\-gramファイルを現在の形式に変換する: .sp .RS 3n .nf % \fBmkbingram\fR \-d old_bingram new_bingram .fi .RE .SH "SEE ALSO" .PP \fB julius \fR( 1 ) , \fB mkbinhmm \fR( 1 ) .SH "COPYRIGHT" .PP Copyright (c) 1991\-2008 京都大学 河原研究室 .PP Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) .PP Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 .PP Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム .SH "LICENSE" .PP Julius の使用許諾に準じます.