gram2sapixml.pl — 認識用文法を SAPI XML 文法に変換するスクリプト
gram2sapixml.pl
[prefix
...]
gram2sapixml.pl は,Julius の認識用文法ファイル (.grammar, .voca) から
Microsoft SAPI XML 形式へ変換するスクリプトです.
prefix
には,変換する .grammar, .voca ファイルのファイル名から拡張子を除外したものを指定します.複数指定した場合,
それらは逐次変換されます.
入力文字コードは EUC-JPを想定しています.出力ファイルは UTF-8 エンコー ディングです.コード変換のため内部で iconv を使用しています.
左再帰性については手作業による修正が必要です.元ファイルの .grammar の構造をそのまま保持するため,.grammar における正順での左再帰記述がそのまま .xml に反映されます.したがって,変換後 .xml に含まれる左再帰性の解決は手作業で行わなければいけません.
変換は,元ファイルの文法の非終端記号と終端記号(単語カテゴリ名)をルールに変換するという単純なものです.実際にSAPIアプリケーションで使う場合には,プロパティを指定するなど,手作業での修正が必要です.
内部でコード変換に iconv を使用しています. 実行パス上に iconv が無い場合,エラーとなります.