まえがき

Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンである.数万語彙の連続音声認識を一般の PC 上でほぼ実時間で実行できる.また,高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの音声認識の各モジュールを組み替えることで,様々な幅広い用途に応用できる.

エンジンの中心部は,組み込み可能なライブラリの形で提供されており,一般アプリケーションに音声認識機能を組み込めるよう設計されている.また,プラグインを使って機能拡張することも可能である.Julius は言語非依存であり,対象言語の音響・言語モデルさえあればその言語の認識器として動作することができる.

Juliusはオープンソースソフトウェアであり,ソースコードを含めて誰でも無償で入手することができる.ライセンスは商用も可能としている.

Julius の開発目的は,近年の音声認識技術進展の成果を一般に広く公開すること,および,共通のプラットフォームを提供することによって音声関連の研究やアプリケーション開発を広く促すことである.最初のバージョンは 1996 年に公開され,それ以来,音声認識技術の進歩へのキャッチアップや機能追加, リファインなどのために現在も開発が継続的に行われている.

Julius の研究・開発に関わっている主な機関は以下のとおりである.コンタクトは,Julius のオフィシャルの管理者ML へメールを送るか, あるいは各機関や作者に直接問い合わせてもよい.


Copyright (c) 1991-2010 京都大学 河原研究室
Copyright (c) 1997-2000 情報処理振興事業協会 (IPA)
Copyright (c) 2000-2005 奈良先端科学技術大学院大学 鹿野研究室
Copyright (c) 2005-2010 名古屋工業大学 Julius開発チーム

Web ページはhttp://julius.sourceforge.jp にある.Julius の配布のほか,解説文書やチュートリアル,ソースコードのリファレンスデータベース,および開発者が情報交換できるWebフォーラムがある.開発途中の最新版のスナップショットも CVS で入手可能である.Web フォーラムではバグ情報や更新情報,QAなどの全般的な情報がやりとりされており,一読をお勧めする.

Julius の名前の由来については,"Japanese Utterance Listening, Indexing and Understanding System" の頭文字をとったという説と,"Dictation"(口述筆記)→ "Dictate"(動詞:支配する)→ "Julius Caesar" (ジュリアス・ シーザー)→ "Julius" という連想から名付けられたという説がある.表記については,初期のころは文献ごとにゆれが見られ,"JULIUS" とすべて大文字で表記される場合もあったが,現在は "Julius" が正式な表記であるとされている.日本語での発音は「ジュリアス」「ジュリウス」「ユリアス」「ユリウス」など諸説あるが,開発チーム内では「ジュリアス」が用いられている.バー ジョン 3.x までは文法を用いるバージョンが "Julian" と別名で呼ばれていたが,バージョン 4 で Julius に統合・吸収された.

この文書は,音声認識エンジン Julius のトータルリファレンスである.インストールから音声入力の仕様,各モデルの具体的仕様,オプション一覧,ライブラリ・プラグインの解説などが書かれている.本書が読者の助けになれば幸いである.