Julian 形式の文法を SAPI XML 文法に変換するスクリプト 2002/09/12 Takashi Sumiyoshi (sumiyosi@kuis.kyoto-u.ac.jp) ■このプログラムについて この Perl スクリプトは、Julian 用に書かれた .grammar, .voca 形式のファイルから、SAPI XML 形式へ変換するスクリプトです。 ■実行方法 プログラム内部で、iconv という変換プログラムを利用しているため、 別途 iconv プログラムが必要です。 引数なしで実行することで、簡単な使い方が表示されます。 % ./gram2sapixml.pl 引数には変換する .grammar, .voca ファイルのファイル名から拡張子を 除外したものを指定します。 例えば ../sample_grammars/vfr/vfr.{grammar,voca} をコンバートする 場合は、次のようにします。 % ./gram2sapixml.pl ../sample_grammars/vfr/vfr これにより、vfr.xml というファイルが ../sample_grammars/vfr/ に上 書き作成されます。 引数には複数のファイル名を指定でき、それらは逐次変換されます。 作成されるファイルは UTF-8 エンコーディングです。 ■補足 変換は、元ファイルの文法の非終端記号と終端記号(単語カテゴリ名)を ルールに変換するという単純なものです。 元ファイルの .grammar の構造をそのまま保持するため、.grammar に おける正順での左再帰記述がそのまま .xml に反映されます。 したがって、変換後 .xml に含まれる左再帰性の解決は手作業で行わなけ ればいけません。 また、実際にSAPIアプリケーションで使う場合には、プロパティを指定す るなど、手作業での修正が必要です。