音楽とかソフトとか

fransing ver.0.3を上げました→ダウンロード

変更は下記一点のみです。

- (追加) 保存できないフォルダを選択した場合、実行できないようにした。

スポンサーサイト

PageTop
English version of setParam ver. 3.0-b140204 is now released. Almost all message has translated to English.

Download


setParam is a free tool for configuring oto.ini of UTAU voicebank.

Screenshot of setParam


For example, you can use following functions..
- make oto.ini automatically (CV / VCV)
- view various panels:
  * waveform
  * spectrogram
  * F0(pitch)
  * power
- various play functions:
  * partial play between two parameters
  * pre-utterance check play
  * test synthesis play
- alias batch conversion
- Undo / Redo of operations


Almost all translation is by Mia Naito (@mianaito). I am thankful to him.


Following sentences are a simple manual that is excerpted from README in zip file.

<< Simple Operation Guide >>

[ auto setting parameter ]

You can try to use automatic parameter setting functions. Although these functions are not perfect, they would help you. I hope your operation will become easier by using them.

Auto setting tools are available from 'tool' menu. Or, tools dialog window is shown when you open a wavefile folder.

[ setting parameter by hand ]

Following keys are available on waveform panel.

F1 ... utterance start position. ('left blank' or 'left offset')
F2 ... cross fade length between the wav and preceding wav ('overlap')
F3 ... onset position ('onset' or 'pre-utterance')
F4 ... end of consonant ('consonant')
F5 ... start of amplitude declination ('right blank' or 'right offset')
space ... play sound
control-space ... play sound between 'F1' and 'F5'
F6 or down arrow ... next wav
F7 or up arrow ... previous wav
F8 ... play for checking 'pre-utterance'
F10 ... play synthesized speech
F11 and F12 ... time zoom (horizontal zoom)
control+s ... save oto.ini file

Following mouse operation are available on waveform panel.

parameter name dragging ... shift parameter
wheel down ... move to next or previous wav
shift-wheel ... time scroll (horizontal scroll)
control-wheel ... time zoom (horizontal zoom)
control-shift-wheel ... vertical zoom for waveform, spectol, power, F0

dragging horizontal border ... vertical zoom for waveform, spectol, power, F0
right click ... popup menu

Following mouse operation are available in parameter table

right click ... popup menu
dragging ... select regions for copy, paste and so on

Following keys are available in parameter table

arrow ... move cell
control-c ... copy
control-v ... paste
control-i ... duplicate the row
control-d ... delete the duplicated row
control-s ... save oto.ini file
control-f ... search
control-n ... search next
control-N ... search previous
control-m ... parameter change by rule
shift-space ... play
control-space ... play sound between 'F1' and 'F5'
control-v ... paste

you can change values directly in parameter table.

In fact, setParam has more operation & functions. However, it's difficult to describe all in English for me. So please discover and enjoy various functions.

<< License >>

setParam is destributed under GPL license.
setparam is using Tcl/Tk, snack and SPTK.
Please see Licenses folder to check each licence term.



Btw, English version of OREMO (that is recording software for UTAU voicebank) is also preparing now..

PageTop
setParam ver.3.0-b140204を上げました→ダウンロード

本バージョンより、英語版のzipも配布します(Release note is here)。「setParam-english-バージョン番号.zip」が英語版、「setParam-バージョン番号.zip」が日本語版です。

<主な変更点>

- (修正) 自動推定時にエラーが出る問題(3.0-b140119実装時に混入したエラー)を修正した。
- (修正) オーバーラップまたは固定範囲を変更したときに、特定条件下でのアンドゥ処理でエラーが起きる問題を修正した。

- (変更) 単独音自動推定についての変更:
 * 発話中とみなされる時間長のデフォルト値を0.1秒から0.05秒に変更した。
 * 右ブランク推定について、既存方法に加え、平均パワーを超える位置を末尾から中央へ向けて探し、そこが既存方法での位置より右側ならそちらを採用するようにした。
 * 固定範囲の推定について、既存補法に加え、先行発声~右ブランク間がもし0.6秒以上であれば、先行発声と固定範囲との間は最低0.1秒空けるようにした。
 * オーバーラップ推定対象を前方一致で調べるようにした。また推定対象リストをesitimate-ovlPattern.txtから読むようにした。

- (変更) 連続音自動推定の設定窓で、自動補正のON/OFFに連動して関連パラメータ入力の有効/無効を切り替えるようにした。
- (追加) ヘルプから公式webページにアクセスできるようにした。
- (追加) 連続音自動推定で、ファイル名に"_"が含まれる場合の動作を選択できるようにした。選択肢は以下の3つ。
 * 無視する (デフォルト)
 * 1モーラ分の休符とみなす
 * 1モーラの区切り記号とみなす

今回はエラー修正と英語版を出すことが主な動機だったのですが、思いの外変更を加えてしまいました。
以下機能詳細です。


<修正2件>

1件目は前回のバージョンで混入したバグです。前回の自動推定は使い物になりませんので差し替えをお願いします。2件目のバグはレアなケースでしか起きません。



<単独音自動推定についての変更>

(右ブランク値推定について)
 これまでの推定では固定範囲~右ブランクの間が短くなり過ぎる印象を受けたため多少変更しました。(この間隔が短すぎるとブザーのような平坦な音になる恐れがあります)。これまでの方法では、音の中央から末尾に向けてパワー値の揺らぎが一定値を超える所まで移動し、停止した所を右ブランクとしていました。これに加え、末尾から中央に向けてパワー値が中央付近の平均パワー値を超える位置まで移動する作業も行い、二つの停止位置のうち、より右側の方を右ブランク値として採用することにしました。

(固定範囲推定について)
 音によっては先行発声位置の後でもしばらく発音が変化するようなケースがあります。例えば「きゃ」といった拗音を含む音で先行発声を「きゃ」の「い」の所に設定した場合、その後発音が「い」から「あ」に変化するはずです。固定範囲は通常「きゃ」の「あ」の部分に入る所に設定した方が良いと思います。

 これまでの推定方法では、音の中央から先行発声に向けてパワー値の揺らぎが一定値を超える所まで移動し、停止した所を固定範囲としていました。しかしこの方法は前述の発音変化をうまく検出できるとは限りませんので、先行発声値=固定範囲値のようなことも起きます。

 そこで、これまでの方法に加え、先行発声~右ブランク間がもし0.6秒以上空いていれば、先行発声と固定範囲との間は最低0.1秒空けるようにしました。

(オーバーラップ推定について)
 オーバーラップ推定では、推定対象音であれば、左ブランク~先行発声間を指定した割合で分割した位置に付けます。推定非対象ではオーバーラップ=0としています。

 この推定対象音のチェックを前方一致で調べるようにしました。例えば対象音に「うぃ」がある場合、「うぃ.wav」や「うぃ↑.wav」などが対象に入ります。またもし対象音に「う」とだけ書いた場合「う.wav」や「うぃ.wav」「うぃ↑.wav」などが対象に入ります。

 推定対象音は結構な数になりますので、外部ファイルにデータを置くことにしました(esitimate-ovlPattern.txt)。カスタマイズしたい場合はこのファイルをテキストエディタで編集して下さい。同ファイルは単独音推定のダイアログ窓からも開けます。ファイル内では推定対象音を空白または改行刻みで列挙して下さい。


<ヘルプから公式webページにアクセスできるようにした>

アップデートチェック用としてデフォルトのブラウザで開くようにしてみました。


<連続音自動推定でのファイル名内の"_"の動作について>

 「_きゃ_きゅ_きょ.wav」のようなwavファイルがあったとき、冒頭の"_"は連続音を表す記号となりますが、残り2つを一モーラ分の休符とする収録方法(「きゃ(休み)きゅ(休み)きょ」と発声する)がありました。そこでsetParamではver. 2.0-b111007からこの収録方法に対応した自動推定を行うようにしていました。

 一方、海外の連続音音源で、モーラを"_"で分かち書きする例があると聞きました。例えば「_きゃきゅきょ.wav」を「_kya_kyu_kyo.wavと書き表すようです。この収録方法の場合"_"は休符ではないので先の方法だと正しく自動推定できません。

そこで連続音自動推定のダイアログ窓で、"_"の取り扱い方を選択できるようにしました。選択肢は以下の3つです。

 * 無視する (デフォルト)
 * 1モーラ分の休符とみなす
 * 1モーラの区切り記号とみなす

連続音自動生成の
(ダイアログ窓。右下に選択肢を付けました)

前者の収録法であれば2番目、後者の収録方法であれば3番目を選ぶと良いと思います。

PageTop