音楽とかソフトとか

原音設定を自動で行うプログラムのコアな部分が出来ました。検証はこれからです。

自動設定は、私が知っているかぎりでは既に2つ(UTAU作者の飴屋さんが作られたもの、どなたかがsnackで作られたもの)が公開されていると思います。多分これらの仕組みは、設定対象の音の特徴を抽出し、何らかの規則に基づいて各パラメータの場所を適切に決定していくものだろうと思います。

今回作っているものは、原音設定済み音源のパラメータを設定対象音源に転写するものです。設定済み音源と設定対象音源の間でDTW(Dynamic Time Warping)をかけて時間軸の対応をとり、設定済み音源のパラメータ時刻を対象音源側の時刻に変換します。

<ToDoと補足メモ>
・精度検証

 精度検証はほとんどやっておらず、「おっ動いた動いた!」という段階です。

・GUI部分の実装

 今はコマンドライン上で動いています。

・検証動画デモ

 以前上げた曲からustをそのまま再利用してみようと思います。

・exe化

今回は実装を楽にするために、フリーのライブラリやツール(snack、sox、SPTK)、自分の使い慣れたプログラミング言語(perl)等を複数組み合わせました。面倒のないのようにexe化して配布したいと思っていますが、無駄にサイズの大きなソフトになるかもしれません。

また各ツールが再配布OKか確認しないと。

あと、当初はOREMO-2.0に組み込むことを考えていましたが、自動設定はparamMapper(仮)という別ソフト、手動設定はOREMOにした方が良いのかなと思いました。

-----
検証中の連続発声についてはまた後ほど。。
スポンサーサイト

PageTop

コメント


管理者にだけ表示を許可する