.\" Title: adintool .\" Author: .\" Generator: DocBook XSL Stylesheets v1.71.0 .\" Date: 10/02/2008 .\" Manual: .\" Source: .\" .TH "ADINTOOL" "1" "10/02/2008" "" "" .\" disable hyphenation .nh .\" disable justification (adjust text to left margin only) .ad l .SH "名前" adintool \- 音声波形データの記録・分割・送信・受信ツール .SH "概要" .HP 9 \fBadintool\fR {\-in\ \fIinputdev\fR} {\-out\ \fIoutputdev\fR} [\fIoptions\fR...] .SH "DESCRIPTION" .PP adintool は,音声波形データ中の音声区間の検出および記録を連続的に行 うツールです.入力音声に対して零交差数と振幅レベルに基づく音声区間検 出を逐次行い,音声区間部分を連続出力します. .PP adintool は adinrec の高機能版です.音声データの入力元として,マイク 入力・ 音声波形ファイル・標準入力・ネットワーク入力(adinnet サーバー モード)が選択できます.Julius の \fB\-input\fR オプションも 使用可能で,プラグイン入力も選択できます. .PP 出力先として,音声波形ファイル・標準出力・ネットワーク出力(adinnet ク ライアントモード)が選択できます.特にネットワーク出力(adinnet クライ アントモード)では, julius へネットワーク経由で音声を送信して音声認識 させることができます. .PP 入力音声は音声区間ごとに自動分割され,逐次出力されます.音声区間の切 り出しには adinrec と同じ,一定時間内の零交差数とパワー(振幅レベル) のしきい値を用います.音声区間開始と同時に音声出力が開始されます.出 力としてファイル出力を選んだ場合は,連番ファイル名で検出された区間ごと に保存します. .PP サンプリング周波数は任意に設定可能です.録音形式は 16bit, 1 channel で,書き出されるファイル形式は Microsoft WAV 形式です. 既に同じ名前のファイルが存在する場合は上書きされます. .SH "OPTIONS" .PP Julius の全てのオプションが指定可能である.指定されたもののうち, 音声入力に関係するオプションのみ扱われる.以下に,adintool の オプション,および有効な Julius オプションを解説する. .SS "adintool specific options" .PP \fB \-freq \fR \fIHz\fR .RS 3n 音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) .RE .PP \fB \-in \fR \fIinputdev\fR .RS 3n 音声を読み込む入力デバイスを指定する."mic" でマイク入力, "file" でファイル入力, "stdin" で標準入力から音声を読み込む. ファイル入力の場合,ファイル名は起動後に出てくるプロンプトに対 して指定する.また,"adinnet" で adintool は adinnet サーバー となり,adinnet クライアントから音声データを tcp/ip 経由で 受け取る.ポート番号は 5530 である("\fB\-inport\fR" で変更可能). .sp 入力デバイスは,そのほか Julius の "\-input" オプションでも指定可能 である.その場合,プラグインからの入力も可能である. .RE .PP \fB \-out \fR \fIoutputdev\fR .RS 3n 音声を出力するデバイスを指定する."file" でファイル出力, stdout で標準出力へ出力する.ファイルの場合,出力ファイル名は オプション "\fB\-filename\fR" で与える.出力ファイル 形式は 16bit WAV 形式である. また,"adinnet" で adintool は adinnet クライアント となり,adinnet サーバへ取り込んだ音声データを tcp/ip 経由で 送信できる.送信先ホストは "\fB\-server\fR" で指定する. ポート番号は 5530 である("\fB\-port\fR" で変更可能). .RE .PP \fB \-inport \fR \fInum\fR .RS 3n 入力が adinnet の場合 (\-in adinnet),接続を受けるポート番号 を指定する.指定しない場合のデフォルトは 5530 である. .RE .PP \fB \-server \fR [host] [,host...] .RS 3n 出力が adinnet の場合 (\-out adinnet),送信先のサーバ名を指定する. 複数ある場合は,カンマで区切って指定する. .RE .PP \fB \-port \fR [num] [,num...] .RS 3n 出力が adinnet の場合 (\-out adinnet),送信先の各サーバのポート番号 を指定する.指定しない場合のデフォルトは 5530 である. \fB\-server\fR で複数のサーバを指定している場合, 全てについて明示的にポート番号を指定する必要がある. .RE .PP \fB \-filename \fR \fIfile\fR .RS 3n ファイル出力 (\fB\-out file\fR) 時,出力ファイル名を 与える.デフォルトでは,検出された音声区間検出ごとに, "\fIfile.0000.wav\fR" , "\fIfile.0001.wav\fR" ... のように区間ごとに連番で 記録される.番号の初期値は 0 である(\fB\-startid\fRで 変更可能).なお,オプション \fB\-oneshot\fR 指定時は 最初の区間だけが "\fIfile\fR" の名前で保存される. .RE .PP \fB \-startid \fR \fInumber\fR .RS 3n ファイル出力時,記録を開始する連番番号の初期値を指定する.( デフォルト:0) .RE .PP \fB \-oneshot \fR .RS 3n 最初の音声区間が終了したら終了する. .RE .PP \fB \-nosegment \fR .RS 3n 入力音声の音声区間検出(無音による区切りと無音区間のスキップ)を 行わない. .RE .PP \fB \-raw \fR .RS 3n RAWファイル形式で出力する. .RE .PP \fB \-autopause \fR .RS 3n 出力が adinnet の場合(\-out adinnet),音声区間が終了するたび に入力停止・動作停止状態に移行する.出力先の adinnet サーバか ら動作再開信号がくると音声入力を再開する. .RE .PP \fB \-loosesync \fR .RS 3n 出力が adinnet (\-out adinnet)で複数の出力先サーバへ出力している 場合,動作停止状態から動作再開信号によって動作を再開する際,adintool は すべてのサーバから動作再開信号を受けるまで動作を再開しない. このオプションを指定すると,少なくとも1つのサーバから再開信号 がくれば動作を再開するようになる. .RE .PP \fB \-rewind \fR \fImsec\fR .RS 3n 入力がマイクのとき,停止状態から動作を再開するとき,停止中から 持続して音声入力中だった場合,指定されたミリ秒分だけさかのぼって 録音を開始する. .RE .SS "Concerning Julius options" .PP \fB \-input \fR {mic|rawfile|adinnet|stdin|netaudio|esd|alsa|oss} .RS 3n 音声入力ソースを選択する."\-in" の代わりにこちらを使うことも できる(最後に指定したほうが優先される).esd やプラグイン入力が 指定可能である. .RE .PP \fB \-chunk_size \fR \fIsamples\fR .RS 3n 音声入力の処理バッファ(フラグメント)のサイズ.値はサンプ ル数.(default: 1000) .RE .PP \fB \-lv \fR \fIthres\fR .RS 3n 振幅レベルのしきい値.値は 0 から 32767 の範囲で指定する. (default: 2000) .RE .PP \fB \-zc \fR \fIthres\fR .RS 3n 零交差数のしきい値.値は1秒あたりの交差数で指定する. (default: 60) .RE .PP \fB \-headmargin \fR \fImsec\fR .RS 3n 音声区間開始部のマージン.単位はミリ秒. (default: 300) .RE .PP \fB \-tailmargin \fR \fImsec\fR .RS 3n 音声区間終了部のマージン.単位はミリ秒. (default: 400) .RE .PP \fB \-zmean \fR .RS 3n 入力音声ストリームに対して直流成分除去を行う.全ての音声処理の の前段として処理される. .RE .PP \fB \-smpFreq \fR \fIHz\fR .RS 3n 音声のサンプリング周波数 (Hz) を指定する.(default: 16,000) .RE .PP \fB \-48 \fR .RS 3n 48kHzで入力を行い,16kHzにダウンサンプリングする. これは 16kHz のモデルを使用しているときのみ有効である. ダウンダンプリングの内部機能は sptk から 移植された. (Rev. 4.0) .RE .PP \fB \-NA \fR \fIdevicename\fR .RS 3n DatLink サーバのデバイス名 (\fB\-input netaudio\fR). .RE .PP \fB \-adport \fR \fIport_number\fR .RS 3n \fB\-input adinnet\fR 使用時,接続を受け付ける adinnet のボート番号を指定する.(default: 5530) .RE .PP \fB \-nostrip \fR .RS 3n 音声取り込み時,デバイスやファイルによっては,音声波形中に振幅 が "0" となるフレームが存在することがある.Julius は通常,音声 入力に含まれるそのようなフレームを除去する.この零サンプル除去が うまく動かない場合,このオプションを指定することで自動消去を 無効化することができる. .RE .PP \fB \-C \fR \fIjconffile\fR .RS 3n jconf設定ファイルを読み込む.ファイルの内容がこの場所に展開される. .RE .PP \fB \-plugindir \fR \fIdirlist\fR .RS 3n プラグインを読み込むディレクトリを指定する.複数の場合は コロンで区切って並べて指定する. .RE .SH "ENVIRONMENT VARIABLES" .PP \fB \fR\fB\fBALSADEV\fR\fR\fB \fR .RS 3n (マイク入力で alsa デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "default". .RE .PP \fB \fR\fB\fBAUDIODEV\fR\fR\fB \fR .RS 3n (マイク入力で oss デバイス使用時) 録音デバイス名を指定する. 指定がない場合は "\fI/dev/dsp\fR". .RE .PP \fB \fR\fB\fBLATENCY_MSEC\fR\fR\fB \fR .RS 3n Linux (alsa/oss) および Windows で,マイク入力時の遅延時間をミ リ秒単位で指定する.短い値を設定することで入力遅延を小さくでき るが,CPU の負荷が大きくなり,また環境によってはプロセスやOSの 挙動が不安定になることがある.最適な値はOS やデバイスに大きく 依存する.デフォルト値は動作環境に依存する. .RE .SH "EXAMPLES" .PP マイクからの音声入力を,発話ごとに "data.0000.wav" から順に記録する: .sp .RS 3n .nf % \fBadintool\fR \-in mic \-out file \-filename data .fi .RE 巨大な収録音声ファイル "foobar.raw" を,音声区間ごとに "foobar.1500.wav" "foobar.1501.wav" ... に分割する: .sp .RS 3n .nf % \fBadintool\fR \-in file \-out file \-filename foobar \-startid 1500 % enter filename\->foobar.raw .fi .RE ネットワーク経由で音声ファイルを転送する(区間検出なし): .sp .RS 3n .nf (sender) % \fBadintool\fR \-in file \-out adinnet \-server \fIreceiver_hostname\fR \-nosegment (receiver) % \fBadintool\fR \-in adinnet \-out file \-nosegment .fi .RE マイクからの入力音声を Julius へ送信して認識: .sp .RS 3n .nf (sender) % \fBadintool\fR \-in mic \-out adinnet \-server \fIreceiver_hostname\fR (receiver) % \fBjulius\fR \-C ... \-input adinnet .fi .RE .SH "SEE ALSO" .PP \fB julius \fR( 1 ) , \fB adinrec \fR( 1 ) .SH "COPYRIGHT" .PP Copyright (c) 1991\-2008 京都大学 河原研究室 .PP Copyright (c) 1997\-2000 情報処理振興事業協会(IPA) .PP Copyright (c) 2000\-2008 奈良先端科学技術大学院大学 鹿野研究室 .PP Copyright (c) 2005\-2008 名古屋工業大学 Julius開発チーム .SH "LICENSE" .PP Julius の使用許諾に準じます.