音楽とかソフトとか

最近いろいろ上げていただいていてありがとうございます。とりあえず一つだけ。。これは一昨日からかなりツボに入ってます。



最近NHKでYMOの再放送を見たり松本隆がよく出てきたりしてちょうど80年代な気分だったのですが、このアレンジはかなり80年代な感じでした。コードも改良されていて、繰り返し聴いても飽きないです。

それで何度か聴き返していると坂本龍一~槇原敬之辺りのことをなぜか連想しました。うろ覚えですがエレピやシンセパッドの雰囲気とかが坂本龍一の80年代の曲にあったような気がします。槇原敬之は、、なぜ出てきたんだろう??

メインボーカルの方の声も好きです。失礼な表現かもしれませんが、うまいとか下手とかではなくて生粋のボーカリストじゃない人が歌ってるような味が出てる気がします。

なんというか、正統派のボーカリストだと歌唱法か何かで消してしまう不安定さみたいな諸刃の剣みたいな成分が多分あって、普通それがあると曲が成り立ちづらいのですが、うまく当てはまるととても良い感じになるわけで。。などと考えたり書いたりしながらリピートしています。

----
OREMOはそのうち更新します。私的メモ:
・setParamにエイリアス検索機能を付けるとか
・左ブランク位置を変更したら他4モーラの左ブランクの位置も変更するとか

スポンサーサイト

PageTop
OREMOには短所や限界がありますので、内容と対策をまとめておきたいと思います。音源作成する際にOREMOを使うかどうかも含めて参考にしていただければと思います。


<長所>

まずOREMOの最大の長所は、「とり直しが簡単にできること」です。次点に「wavファイル名を入力しなくて良いこと」が来ると思います。「スペクトルやF0を簡単に見られる」というのもありますが、後述するように、自動収録の場合には表示しない方が良いため魅力半減かもしれません。


<基本的な開発方針>

OREMOの開発方針は以下の動画の冒頭で上げたように、「手軽さ」「気軽さ」「簡単さ」を優先すること、としています。


このコンセプトは、OREMOが必ずしも「本格的な」音声録音ソフトを目指していないことを意味しています。もちろん本格的な使用に耐えうるソフトになってくれれば有難いですし、モモ連続音のテスト収録では一定の成果に貢献できたと思いますが、開発の上で万事うまくいくことはなく、判断に迷ったら「手軽さ」を優先したいという気持ちです。

また、OREMOには以下に述べるように根本的な限界があります。この事情も「本格的な」ソフトを目指せない大きな理由です。


<OREMOの短所、限界>

  • OREMO の動作は遅いです。

    作者のプログラミング能力の問題もあると思いますが、そもそも使っているプログラミング言語(Tcl/Tkというインタプリタ言語)自体が遅いです。

  • オーディオインタフェース周りへの対応が最新ではありません。

    OREMOではsnackというライブラリを使って録音や再生、波形表示などを行っています。snackは手軽さ(波形表示、スペクトル表示、再生、録音、保存などがコマンド1行でできます)という点で非常によくできたライブラリと思いますが、最新版は2004/12/1のものであり、それ以降バージョンアップされていません。

    現状では、例えばガイドBGM付き収録のとき、DirectSound経由で録音すると落ちた、という不具合報告をいただいています。その方の場合BGM無しの録音ではうまくいくそうなので、再生と録音を同時に行うと何か不具合が生じるのかもしれません。

  • 収録音にPC動作音が混入する可能性があります。

    これは必ずしも OREMO に限ったことではありませんが、一応挙げておきます。



<対策等>

トラブル回避のために以下のことを試して下さい。

  • 以下の要領で、なるべくPCに負荷をかけないようにする。

    • OREMOでは波形のみ表示すること(F0やスペクトルなどは非表示にすること)。
    • なるべく他にソフトを起動しないこと。
    • 常駐ソフトはなるべく切ること。
    • 遅い保存メディアを使わないこと(USBメモリなどは×)。


  • 落ちる場合はオーディオI/O設定をいじってみる。

    「オプション」→「オーディオI/O設定」で設定窓を開き、入力デバイス、出力デバイスを別のものに切り替えてみて下さい。文字化けするデバイスもあるかもしれませんが、表示上の仕様です(多分漢字コードの処理の問題)。

    デバイス変更後は必ず「適用」か「OK」を押して下さい。

  • ガイドBGMを代えてみる。

    これは今のところガイドBGMを自作したり選べる方に限った対応策です。

    OREMOの自動録音では「録音停止」や「下矢印キー押(wav保存)」の処理が入る度にCPUやディスクに負荷がかかります。これは推測なのですが、一つ一つのイベントの間隔が短いと最悪ソフトが落ちるのかもしれません(例えば、まだwavファイルを書き込み終えていないのに次の録音開始イベントが入るとか)。

    一つ一つのイベントの間隔を長くとったガイドBGMを使えば落ちなくなるかもしれません。

  • OREMO以外のソフトを使う。

    現状ではいくつか準備が必要かもしれませんが、わぶでばや(私はよく知りませんが多分wavez)などの切り出しソフトを利用すれば、OREMOを使わずとも自動収録できるはずです。

    1. 長いBGMを用意し、WindowsMediaPlayerなどの一般的な再生ソフトで再生する。
    2. AudacityやSoundEngineFreeなどの音声編集ソフトで録音を行う。
    3. 最初に発声した時刻を調べる。
    4. 最初の発声時刻に沿って、波形切り出しソフトの切り出し設定ファイルを準備する。
    5. 波形を切り出す。

    今のところ手順4.が面倒そうですが、誰かが一つ準備すればだいぶ楽になる話のはずです。つまりガイドBGMとExcelファイルを用意しておき、手順3.で調べた時刻をExcelのセルに一箇所入力すると、切り出し設定ファイルを生成できる、といった流れです。

    時間と需要があれば、わぶでばのラベルファイルをExcel(csv)対応にしたり、サンプルを準備してみたいのですが。。

PageTop
OREMO ver.2.0-b090822を公開しました→こちら
なお、何回かアップロードに失敗したので、'09/8/23 9時以前にダウンロードされた方がいらっしゃいましたら再ダウンロードをお願いします。

主な変更点は以下のとおりです。

  • (修正, setParam) 一覧表の値に挿入・削除したときカーソルが末尾に飛ぶバグを修正。ただし現状でも一部うまくいかないときがあります(同じ文字が連続しているときにBackspaceを押した場合。Deleteを押した場合のカーソル位置にいきます)。
  • (修正, setParam) 一覧表タイトルのファイル名表示が更新されない場合があったので修正。

  • (変更, setParam) 全パラメータをマイクロ秒精度にした。
  • (追加, setParam) 右ブランクの負の値に対応。
  • (追加, setParam) オプションメニューで右ブランクの正負を切り替えられるようにした。
  • (追加, setParam) オプションメニューで左ブランク変更時の他パラメータのふるまいを切り替えられるようにした。
  • (変更, OREMO) リストスクロールで2つ先の音が見えるようにした。
  • (追加) 初期化ファイル(setParam-init.tclなど)を生成できるようにした。

以下詳細です。

<右ブランクの負の値に対応>

連続音のoto.iniでは、右ブランク値を負にすることで左ブランク位置からの相対位置を表すようになっていますが、これまでのsetParamでは非対応だったため、右ブランク位置を正しく表示していませんでした。

本バージョンから一覧表の右ブランク欄に負の値を入力した場合に対応しています。

また、波形窓でF5を押した場合(マウス位置に右ブランクを持ってくる場合)、値を正にするか負にするかをオプションメニューで切り替えられるようにしています。

「オプション」→「右ブランク値の表現方法」を選ぶと、次のいずれかを選択できます。
  • 「ファイル末尾からの時間(正の値で表現。UTAU v0.2.43以前用)」
  • 「左ブランクからの時間(負の値で表現。UTAU v0.2.45beta版以降用)」

その際に、例えば既に正の値で右ブランクをいくつか設定済みの状況で、負の値に切り替えた場合は以下の窓が出ます。
setParamで右ブランク値を負に切り替えた場合

  • 「左ブランクからの時間に変換する」を選ぶと、現在の右ブランクの位置を左ブランクからの相対位置で再計算します。そのため一覧表上の数値は変わりますが、位置は変わりません。
  • 「符号を-にする」を選ぶと、現在の一覧表上の数値に-を付けます。そのため位置が変わることになります。
  • 「変更しない」を選んだ場合は、既存の右ブランク値については何もしません。


負から正に切り替えた場合も同様の窓が出ます。

<左ブランク値変更時のふるまい>

これまでのsetParamでは、左ブランク値を変更した場合、先行発声などの他のパラメータの位置が変わらないように数値を再計算していました。つまり各パラメータの位置は変わりませんが数値は変わります。

連続音のoto.iniをいじる場合は、逆に数値を変えずに位置を変えたいことがよくあります(左ブランク値のみを変更したい)ので、その切り替えができるようにしました。

「オプション」→「左ブランク値のふるまい」を選ぶと次のいずれかを選択できます。
  • 「左ブランクの数値を変更したとき、他の数値は変えない(位置がずれる)」
  • 「左ブランクの数値を変更したとき、連動して他の数値も変える(位置がずれない)」

後者がこれまでのsetParamの動作です。前者を選ぶと、左ブランク値を変更しても他のパラメータの数値は変わらず位置を再計算するようになります。UTAU本体の原音設定エディタと似たふるまいをします。

ただし、ややこしいですが、右ブランク値が正の場合(ファイル末尾からの時間で右ブランクを表現している場合)は、左ブランク値を変更しても右ブランク値および位置は変わりません。左ブランクの変更に連動して右ブランク位置を再計算させたい場合は右ブランク値を負の値に設定して下さい。


ごちゃごちゃとややこしく書いてしまいましたが、要するに連続音のoto.iniをいじる場合は以下の設定にするのがおすすめです。
  • 「オプション」→「右ブランク値の表現方法」→「左ブランクからの時間(負の値で表現。UTAU v0.2.45beta版以降用)」を指定。
  • 「オプション」→「左ブランク値のふるまい」→「左ブランクの数値を変更したとき、他の数値は変えない(位置がずれる)」を指定。

さらにこういった設定を起動する度に行うのは面倒なので以下の機能を追加しました。

<初期化ファイル(oremo-init.tcl、setParam-init.tcl)の生成>

「ファイル」→「現在の設定を初期化ファイルに保存」を選ぶと、現在の設定を初期化ファイルにまるごと保存することができます。次回起動時には現在の設定状況が反映されます。

<リストスクロールで2つ先の音が見えるようにした>

自動録音時に、次に発声する音を事前に読めるよう、スクロールのふるまいを変更しました。横幅が短くて読めない、という場合はリストボックス上でctrl+ホイールスクロールして横幅を十分広げて下さい。

----
最近文がややこしくなってきていると思う今日この頃です。前よりも推敲せずに書いてる気がします。分かりづらかったら申し訳ないです。

PageTop
OREMOの自動録音機能について説明した動画を上げました。一ヶ月くらい前に作ってそのままにしていたものなので、内容は既に最新ではありませんが。。



動画前半の本編はこのブログに以前書いたことの一部の要約です。

後半のオマケではMMDを使って遊んでみました。自動録音の方がより楽しんで録音できそうだというデモのつもりで作りましたが、書いていないこともあったと思うのでここで補足します。

・単独発声も自動録音すれば原音設定が楽になります。まず先行発声の値をすべて同じ値にできます。さらに、まったく未検証なのですが、うまくいけば次のようなことができるんじゃないかと思います。

既存の単独発声音源から、しっかり原音設定してある音源のoto.iniを持ってくる→先行発声の欄のみ書き換える→微調整して原音設定終了。

・ガイドBGMを聴くことで、音叉などを聴かなくても音の高さを特定できるようになります。

・うまくBGMを選べば声の表情を付けやすくなると思います。にぎやか系BGMとかしっとり系BGMとか。

・このデモでは短めに3回単独発声して小休止が入る、という作業を繰り返しますが、設定ファイルはExcelで作りました。繰り返し1回分を作って後はコピー&ペーストして1曲分にする要領です。後で、参考にExcelファイルやwavをアップロードするかもしれません。

・ぐるぐる大航海が少しだけ入ってます。

・聴き直して思いましたが、この手のガイドBGMなら、先行発声の設定が適切かどうかチェックするときも楽しくなるかもしれませんね。私も聴いていていくつかタイミングがずれているのがあるなと思いました。

----
(追記)

ガイドBGMと設定ファイル、設定ファイル作成用のExcelファイルを置きました。
http://www.divshare.com/download/8240243-97c

・ガイドBGM→G#-140bpm-long.mp3
・ガイドBGM設定ファイル→G#-140bpm-long.txt
・設定ファイルを生成するためのファイル→G#-140bpm-long.xls

一曲分の設定ファイルを作るとなると結構な行数になってしまいますが、実際は同じパターンの繰り返しになるはずなので、添付したxlsファイルのように作れば、最初のパターンを作った後は必要なだけコピー&ペーストを繰り返して設定ファイルを作れます。

後はcsv形式で保存してファイル名をBGM名.txtにすれば設定ファイルになります。

BGM自体はボツにしたものですが、動画の最後にあるボツ理由を許容した上でなら使えないこともありません。もしかすると発声時間の短さが致命的かもしれませんが、そのときは10分位で取れるテストだったということでご容赦下さい。

PageTop
Windowsが遅いなと思い、再起動したらブルースクリーンが出て起動しなくなってしまいました。バックアップは数ヶ月前に取ったきりだったので、これは大変なことになったと頭が真っ白に。。OREMOなどのソースはUSBメモリにも入れているので大丈夫だったのですが。

ネットでいろいろ調べると、chkdskすれば起動するケースらしいことが分かり、どうにかWindows起動ディスクで起動させてchkdskをかけ、無事起動するようになりました(起動ディスクもフロッピーではうまくいかなかったりしました)。そのchkdskをかけたりバックアップを取ったりする間、現実逃避気味に久々にぼーっと動画を見ました。その中からいくつか書きます。


ちょっと前にupされた動画です。PV仕立てで音源配布されてますが、何よりPVがかわいいです。色んなキャラクタがぴょこぴょこ出てきます。


キャプテンミライさんにも使っていただけました。これも音源配布ですが、リミックスがすごく素敵です。好きだなぁと思いつつアスキーの記事を読むとハルメンズ~あがた森魚まで好きなジャンルが一緒でした。


こちらは全部UTAUで作られたみたいです。パーカッションが普通にパーカッションになってるのですが、どうしてるんでしょう。ボイパ音源かなぁ。。


聴いていた状況が状況なだけに、これは沁みました。ケトラPさん版のときも思いましたが、この曲は生演奏の方が映えますね。


なんと、mia子さんが歌って下さいました。うまいなぁ。最後のアドリブの辺りもこの方らしいなぁとちょっと思いました。また、この曲は息継ぎする場所がないなぁと改めて思ったりもしました。


こちらも普段はUTAUユーザのカステラの人Pさんが歌われています。この方といえば空想マインドが好きです↓。ブレイクが耳に残ります。



YouTubeではQuickListでさっとリストを作ってautoplayingできる機能があることを最近知りました。作業BGMとして使う場合にはとてもありがたい機能です。ニコニコ動画にも実装されないかなぁ。

PageTop
耳のあるロボットの唄の配信開始がいつ頃になるのか担当の方にうかがってみたところ、今のところ9月5日を予定されている(ただし制作の都合では遅れる可能性もあり)とのことでした。

もうしばらくお待ち下さいませ。

PageTop
最近、「あいうえお~」と連続発声した音声を連続音と呼ぶのに対し、「あー」、「いー」と個別に単独発声した音声を「単音」と書いているのを色んな所で見かけるようになりました。

でも言葉の使い方が何かひっかかるので改めて確認してみたらやっぱりマズかったです。

 単音=英語辞書に載っているような発音記号一文字を意味する。
    例えば、「"か"は[k][a]の2つの単音で構成される」といった使い方をする。

なお、「単独発声」という言葉はOKです。そういう表題の論文が検索ヒットしましたので。
「連続音声」もOKです。

ですので、せめて「連続音」、「単独音」とでも表記しておかないと、後々困ったことになると思います。例えば英語音源の発音について議論するときなど。。

PageTop
うわーソラだっ!!



動画説明文がすごく的確でした。連続発声収録に興味のある方はぜひご一読を。。それにしても良い声です。

--------
多分ソラの中の方は一人で全部をこなされたことと思います。

モモの場合は複数人で作業していますが、これまでがどんな感じだったかというのを個人的な視点で書いておこうと思います。反省点も書きますので、今後チームを組んで連続発声収録をするような場合の参考になれば幸いです。

1.収録前

スタジオ入りする前には、録音がうまく行くように色々話し合いました。
そこで色んな面白いアイデアが出てきて今回の形になりました。

(反省点・注意点)
この段階では音声が無い以上誰もが見込みや想像で話さざるをえません。そこで各自が独自に色々と考えを巡らせたのは良かったのですが、考えを止められなくて頭でっかちになりすぎる時期はあったかもしれません。多分参加メンバーが多くなるほどこの傾向は強くなるだろうと思います。

でも本当は、「一回ですべてを網羅した完璧な収録などできない」、と思っちゃう方がだいぶ楽だと思います。モモでは、とりあえず実際にやれる範囲をテスト録音してチェックして、徐々にバージョンアップしていくという方向性になりました。(少なくとも1回目はテスト録音と割り切って、本番録音は2回目以降に行う)

多分我々のような素人がやるにはこの方向性が現実的なんだと思います。

なので中の人には、より良い発声を心がける集中力だけでなく、再収録もどんとこい!という根気が必要だろうと思います。

2.収録後

収録後は実際に合成音を作ってチェックしたりすることになります。
モモは現在この段階なので、これから先のことはまだ書けません。

でも、正直、飴屋さんが検証動画を出されて沢山の動画コメントを拝見したとき、今回の収録が本番収録ということでもOKなんじゃないか、という気にすらなりました。

今は、「テスト収録でこれだけ良くなった。次回収録ではもっと良くなるかも!?」というポジティブな感覚しかないです。(初収録前は、もっと地味な改良になるかも、と思ったりもしてました)

なので、個人的には「1.収録前」の自分に対して「必要以上に悩むな。とりあえず取ってから悩め」とアドバイスしたいです。

その他

モモ音源のチームはすごくうまく機能していて、参加できてとても良かったなと思っています。うまく機能できている理由はなんだろう、と自分なりに考えてみましたが次のことに行き着きました。

  • 中の人が常に明示的に最終決定権を持つこと(権利を使うかどうかは別として)。
  • 中の人以外のメンバーはサポーターであること。
  • 上記2点についてメンバー間のコンセンサスが取れていること。

これは結構大事な気がします。なので、中の人をサポートする人は、いかにして中の人への負担を和らげるかという視点も常備しておいた方が良さそうです。

良い音源作りは中の人の負担増につながる可能性もあります。でも中の人があまり無理すると、逆に良い音源にならなくなると思います(喉を痛めたり休憩が取れなかったり気が進まなかったり・・・)。

音源作りはUTAUが生んだ新しい遊びだと思います。その感覚も常備しておいた方が良いかもしれません。

--------
以上、ごく個人的な視点でこれまでを振り返ってみました。

PageTop
連続発声音源は検証中の段階なのですが、音魂屋さんなどが公開されて対応早いなぁと思っています。他の人でも収録が出来てる様子なのでソフト的には問題ないかなと思ったり、とりあえず連続発声収録に必要な最低限の情報は外に出ているんだろうと思ってホッとしたりもします。

ただし、UTAU、音源、OREMO共に検証中ということで、互いの仕様に沿っていないものを公開していることもいくつかあります(この状況はしばらく続くかもしれません)。そのため音源を入手したもののそのままではUTAUベータ版でうまく動かせない場合もあるようです。

とりあえず現状で思いつくトラブル状況と対応法を2つ書きます。

<連続発声音源を入手したけど原音設定されてなくてoto.iniが無かった場合>

その音源が、モモと同じ収録リスト・ガイドBGMを使って収録したのであればモモのoto.iniをコピーすればOKのはずです。(これが自動録音を使うメリットの一つです)

<連続発声音源を入手したらファイル名が「_あいうえお.wav」ではなく「あいうえお.wav」などだった場合>

OREMO ver.2.0-b090803を使って以下の作業を行ってください。

  1. setParam ver.2.0-b090803 を起動する。
  2. 保存フォルダを連続発声音源に指定する。
  3. 「ツール」→「wavファイル名先頭に「_」を追加」を選択する。
  4. 注意書きが出るので確認して「実行」を押す。

これで各wavファイル名の先頭に「_」が付きます。

----
なお2.0-b090803では、右ブランク値が負の場合に対応していません。次の更新で対応します。

PageTop
OREMO ver.2.0-b090803を公開しました→こちら

主に、UTAUの連続発声音源の仕様への対応です。まだ完全ではありませんが、クリティカルな部分にいくつか対応しました。

<主な変更点>
  • (修正, setParam) oto.iniの内容と保存フォルダが不一致の場合に生じるバグを修正。
    バグ修正


  • (変更, setParam) 一覧表窓のキーバインドを以下のように変更。
    • wavファイル再生をspaceからctrl+pに変更。
    • wavファイルの左右ブランク間再生をctrl+spaceからctrl+alt+pに変更。
  • (追加, setParam) 波形窓でも上記ctrl+p, ctrl+alt+pを使えるようキーバインド追加。
    連続発声音源のエイリアスで空白文字を利用するため。space=再生だと空白を入力できない。


  • (変更, OREMO) デフォルトで「録音後のDC成分除去」をしないように変更(オプションメニューで有効にできます)。
    自動録音の際にPCに負荷をかけないようにするため(あまり負荷がかかるとBGMが一瞬止まることがあります)。


  • (追加, setParam) ツールメニューに「DC成分の一括除去」を追加。
    自動録音でDC成分除去をしない代わりに、setParamで、保存フォルダ内の全wavファイルからDC成分を一括除去できるようにしました。


  • (追加, setParam) ツールメニューに「wavファイル名先頭に「_」を追加」を追加。
    連続発声のwavファイルは「_」で始める仕様になりそうですが、前バージョンのOREMOの連続発声では「_」を付けていませんでした。なので、保存フォルダ内の全wavファイル名の先頭に「_」を追加する機能を付けました。

    なお、既に「_」が付いているファイルは無視しますので2回実行したりしても問題ないです。


  • (追加, OREMO) 連続発声用ガイドBGMのMIDIファイルを添付。
    前バージョンから添付しているガイドBGMのMIDIファイルを添付しました。収録キーをF4以外にしたい場合は、このファイルを編集して音の高さを変えてwav化し、BGM設定ファイルを調整すればOKです。もちろん他のwavファイル、mp3ファイルなども使えますが設定ファイルを一から作るのが面倒な場合には使えるかなと思います。

    いずれはデフォルトで数曲ガイドBGMを用意しようとも思いますが、とりあえず優先度が低いです。


  • (追加, OREMO) reclist-renzoku.txtの変更(発声を5モーラに統一。先頭に「_」を追加)
    きりが良いように全部5モーラにしました。また、連続発声なので先頭に「_」を付けました。

    ただし、このリストは予備テストのつもりで作ったものですので「きゃきゅきょ」などの拗音の連続発声が入っていません。飴屋さん版のreclistには入っています。


  • (追加, OREMO) 音名リスト、発声タイプリストでctrl+wheelすると横幅が変わるようにした。
    連続発声だと縦長のリストの横幅が狭かったために、次に来るフレーズが何なのかが全部見えませんでした。なので横幅を伸ばせるようにしました。

    ただし、ちょっと動きがおかしい場合があります(横幅を伸ばしつつ一緒に縦スクロールしてしまう現象が起きることがある)。操作で復旧できる問題なのでそのままにしています。OREMO起動後にすぐ横幅変更すれば問題ないと思います。



あと次回以降の更新でやりたいこととしては、、

  • 自動録音のoto.iniの自動生成。パラメータ値が分かればexcelでさくっとできそうな機能ですが、あった方が楽かなと思います。
  • 単独発声用ガイドBGMの準備。

PageTop
再生数の伸びにびっくりしつつ、、

今回の連続発声音源についてももももPさんなどが既にブログで解説(図もあり)されていますが、一応私も少し書いてみます。

これまでのUTAUでは「か(/ka/)」「さ(/sa/)」などの「子音-母音」の音を一つの塊として合成処理を行っています。一方今回の場合、UTAUは「あか(/aka/)」「いか(/ika/)」などの「母音-子音-母音」を一つの塊として合成処理を行っています。

例えば「かお」という声を作る場合、これまでのUTAUでは「無音-か」と「無音-お」をつなげていました。これだと、両者をクロスフェードさせた場合、間に「あ("か"の/a/の部分)」と「お」を同時に発声した波形ができてしまいます。クロスフェードさせなかった場合、唇の形が瞬間移動したような波形ができてしまいます。

一方今回の場合は「無音-か」と「あ-お」をつなげます。両者をクロスフェードさせた場合、「あ」と「あ」とをクロスフェードさせますのでつなぎ目が目立たなくなります。

これは必ずしも新しいことをしたわけではありません。朗読音声合成や音声認識では当たり前にやられている方法をUTAUに持ってきています。YAMAHAのvocaloidでも「呪文」の収録をしていますが、これも一般的な音声合成用コーパスの作成と同じと思われます。

------

ここからは私個人の「こうなったら良いな」と何となく思っていることです(実現はだいぶ先の話かもしれません)。

朗読音声合成では、呪文の読み上げではなく通常の日本語文を読み上げていれば合成用データが出来上がります。大雑把に言うと「本を読んでたら合成用音源ができちゃった」といった状態です。

その点で今回のような収録方法は必ずしもベストとは言えない、と個人的には思っています。

呪文を歌い上げるやり方は、必要な音声を無駄なく収集できるためコストパフォーマンスの面ではベストです。特に声優さんなどのプロの方を起用した場合、お金が発生しますから呪文の方が恐らく安く作れます。

しかし呪文を歌っていて楽しいと思えるかどうかは人次第かなと思います。vocaloid関連に興味があって声優さんのインタビューなどを読んだ方ならすんなり収録できるかもしれませんが、何も知らない歌い手さんだったら、いきなり呪文を収録するとなると面食らうかもしれません。

しかもUTAUの場合、基本的にお金が発生しません。なので、その分楽しさでカバーできないものかなぁと思ったりしています。そうなると最終的には、「自分の好きな歌を何曲か歌ってたら音源できちゃいました」というのが理想なのですが、すぐにはそうもいきません。

そんなことも考えながら OREMOのガイドBGMを実装しました。カスタマイズ可能にしてありますので、BGMのmp3ファイル・録音のタイミングを書いた設定ファイルがあればひとまず自分の好きなBGMを使って収録できるはずです(その準備の手間が問題ですけど)。

OREMOの当初の開発姿勢は簡単・気軽に音源作成できることなので、なるべくなら楽しさを感じられる収録支援になれば良いなと思います。

しかし現状では、より高品質な音源・より多くの人に使いたいと思ってもらえる音源にするには、その人の声の良さだけでなく、自分なりに頑張って試行錯誤すること(またはその意気込み)が必要、というのも事実だろうと思います。再収録もどんとこい!みたいな。今回の収録でも1回目のテイクは丸ごとボツになったのですが、それでも藤本さんは「1回目は良い練習になった、感じをつかめた」といったことを仰っていたように思います。

PageTop
飴屋さんが上げられた連続発声の「けんか別れ」についてですが、連続発声デモとしてではなく楽曲、動画について書いていませんでした。



今回の動画ではコーラスが追加されていますが、以前低音PさんがKAITO版で付けて下さったものをベースにして、さらに飴屋さんの追加パート分+アレンジ、私の追加パート分が混じってできています。上記の動画はその低音Pさん版です。また、飴屋さんは(データ渡し~mp3作成までの時間を考えると)ほぼ即興に近い状態でコーラス追加やコーラスワークのアレンジをされたのではないかと思います。

絵も同様で、ももももPさんが描く話になってから完成まで一日もかかっていないはずです。私はつい猫に目が行ってしまいます。


飴屋さんにお渡しした曲データは以下に置いてあります。
http://www.divshare.com/download/8043686-283

必要そうなものを色々詰め込んだため(オケデータ(新旧)、サユ版ustファイル、REAPERプロジェクトファイル)、ファイルサイズが約80MBあります。またオケデータなどはflac形式で圧縮してありますので、wav形式に戻す必要があります。やり方はこのページの最下部に書いてあります。

PageTop
音源作成について、モモの藤本さんがこちらの記事で少し概要を書かれています。

UTAUでの使い方説明は飴屋さんがこちらの記事からたどれるようにされています。

また、デモ動画のコメントを見てふと思ったのですが、とても大変そうだという誤解を避けるために取り急ぎ少し補足します。

・収録量は以前より増えます(連続発声だけで音源作成するか、連続発声+従来の単独発声で作成するか結論は出てませんが、いずれにしても増えます。デモ動画は後者です)。

・原音設定は以前よりすごく簡単になります。例は飴屋さんのブログのこちらの画像を見て下さい。同じ値が縦にずらっと並んでたり、同じパターンの繰り返しだったりします。このやり方は従来の単独発声でもできそうです。

・OREMOを使った場合、録音時の操作量は以前より減ります(自動録音)。

なので、これらを総合すると必ずしも大変にはなっていないというのが私の理解です。

PageTop
しばらく前から桃音モモの藤本さん達と一緒に、連続発声(「あいうえお~」といった発声)を使った音源作成をさせていただいていましたが、飴屋さんが実際に合成音を作って下さいました。ぜひお聴き下さい。これまでのUTAU合成音と違った印象に聴こえるのではないかと思います。



音をつないでるな、という感じがしなくなったのではないかと思います。

やるべきこと、やりたいことはまだいくつかありますが、ひとまず、次期UTAU + 連続発声音源でこの品質が出せるようになるはずです。。


なお、モモMLで話していますが、今回の取り組みについては「モモすげぇ」で終わるのではなく、他の音源も同じ品質に上げられるようにしたいと話しています。なので、何か収録説明ドキュメントなり説明動画を作りたいなと話しています。それを見て他の音源製作者の方も同様の手順を踏めば上記デモ曲と同品質の音源を作れます、みたいな状況になると良いなと思っております。

その一環でOREMOの操作方法の説明やプログラム改良もおいおいと。。。

PageTop