音楽とかソフトとか

Fransingの動作テストその2です。今度はダリアさんの歌唱wavをお借りしました。ありがとうございます。


元になったwavは、ダリアさんが以下の歌ってみた動画制作時に録音されたものです。聴き比べてみるとどの辺がどう違うのかが分かって楽しいのではないかと思いますので、ぜひ。


そして原曲は酒乱Pさん、オケとustはピアプロからお借りしました。ありがとうございます。この曲は他にもUTAUカバーや歌ってみた動画がありましたので、ぜひ「幸せの国_二番地」タグで



以下雑感です。

(雑感1)
聴いてみた印象としては、従来のUTAU合成音と人の声を混ぜたような?不思議な感じがしました。

(雑感2)
開発中に寄り道しているようですが、最終的には音楽を聴きたい/作りたいのだ、という点からすると、この作業や使い方は寄り道ではなく真っ当な筋道なのかもしれません。この一連の作業は今のところ楽しいので、当初の目的であった”呪文を読む代わりに歌って音源を作る”という使い方・遊び方・考え方以外の何か楽しいものが隠れてないかなあと思ってしまいます。それは、歌声音源はじゃじゃ馬音源になりやすそうという見通しがあるからでもありますが。

(雑感3)
一つは、UTAUを音声補正ツール的なものとして使ったらどうなるか、という視点で聴き比べてみるのも良いのかもしれません。でも音声補正ツールだと思うと投稿カテゴリを「音楽」にするか「歌ってみた」か「VOCALOID」か更に混乱しそうですwまた、現状ではUTAU音源感が音色に混じるので、それをどう捉えるかについては一考の余地があるかと思います(AutoTuneの位置づけと同様に味わいやエフェクトと捉えるか、音源や合成法に要改善点があると捉えるかなど)。「歌ってみた」の人にとってのUTAUは何だろう、とか。。

(雑感4)
動画中の重複番号のついた音符のところはほとんどが”じゃじゃ馬”だった部分です。それらの部分についてはSHIFT+右クリックで音を変えて収まりの良いものと入れ替えました。最近のUTAUではあまりやらなかった作業だなあと思いました。思えば初期テト音源では「あ↑」や「あ3」などを同じやり方で選んでいました。

ただ、この"じゃじゃ馬"というのは、「合成がうまくいかない音」なのか「表現が合わない音」なのかで意味合いが違ってきます。これまでテストした限りではどちらの音も混じっていると感じました。後者の場合はある意味原石です。歌声音源はただの"じゃじゃ馬音源"ではなく、"汎用性が低い代わりに原石が転がっている音源"かもしれません(←前向き!)。

スポンサーサイト

PageTop
ツール公開と同時の方が良いのかもしれませんがデモデータが出来ましたので現状報告で上げておきます。



<はじめに>

現状のUTAU音源制作では「あいうえお~」などと念仏を詠唱するかのようなやり方で音声収録します。このやり方の長所は、効率的に全モーラを網羅できること、それなりに安定した発声の音源になりやすいこと、原音設定がしやすいことだと思います。逆に短所としては、(個人差はあると思いますが)、収録していて楽しくない、声の演技表現を入れ辛く棒読みになりがち、といったところかと思います。

この短所を解消する一案として歌声を音源化することが考えられます。端的には好きな歌を歌っているとそれが音源になるというアプローチです。このやり方の長所・短所は既存手法の長所・短所と逆になり、効率が悪い反面楽しさや表現の入れやすさなどのメリットが出てくると期待されます。実際には既存の音源を拡張する形で歌声音源を追加することになるんじゃないかなあと思います(歌のみではどうしても収録されない音が出てきてしまうので)。

歌声が音源になるというとSinsyを思い出しますが、類似のアプローチをUTAUのフレームワークでもやってみよう、やったらどんな声になるだろう、といったこと等に今回興味を持ってテストしています。大元のきっかけは8月にアシスPさんとtwitterでその辺のやり取りを少ししたことだったと記憶しています。


<Fransing>

歌声wavを音源化するにはwav分割ツールが必要ですのでFransingというツールを作ってみています。このツールを使って下図の流れで音源を作ります。
処理の流れ


歌のwavとそのustをfransingに入力すると各音符位置に従ってwavが分割されます。oto.iniも生成しますが現状では全面的に手修正が必要と思って下さい。私が試したときは、発声タイミングと音符位置がぴったりのことはあまりなく、ほとんどの音がばらつくようでした。また既存の連続音収録のように各音の長さが均一でないので、その点でもいつもより神経を使う印象でした(私はsetParamの範囲指定再生、発声タイミング試聴、スペクトルを頼りにしました)。原音設定師さんの腕の奮い所かもしれません。


<テスト>

ツールがひとまず動くようになったのでどんな音になるのかテストしてみました。テストにあたって、梟音キリィ等の中の人をされているCaparo Ululaさんから「耳のあるロボットの唄」の一番を3パターン(normal、 strange、weaker)の歌い方で歌ったwavを頂きました。ありがとうございます。

これらのwavを使って下記2種類のテストを行いました。

まず、以下の音デモ3つは、歌声wavをfransingに通して分割し、原音設定を手修正し、再度「耳~」を歌わせたものです。UTAUでの調声は「おま☆かせ」のみ、合成エンジンはTIPS、リバーブなどのエフェクトは未使用です。

fransing demo(クローズドテスト) by nwp8861

なお、このテストでは元歌唱で歌った歌を再度歌わせているので本来の環境よりも有利な条件下での結果といえます。つまり機械学習系でいうところのクローズドな評価であり、理想的な状態であればこの品質にまで近づける、といった目安になります(通常はこれより品質が下がります)。

私感ではweakerは人間っぽいなあと思いました(思わずオケをスズナリさん版にしてしまいました)。normalとstrangeではうまく合成できない音もありじゃじゃ馬音源"になりそうでもありますが、どちらも歌い方のクセや表現の違いは聞き分けられそうだなあと思いました。


次のテストです。

実環境下でテストするには「耳~」とは別の歌を歌わせる必要があります(機械学習系でいうところのオープンな評価)。しかし「耳~」の一番のみではデータが少なく簡単にテストできません(一番のみで178モーラのデータが収集されますが中には重複もあります)。

そのため連続音音源としてのテストではないのですが、折角なのでれんたんじゅつ的な原音設定をして単独音音源も作ってみました。単独音では51種類のモーラを使えるようになったので、それらのモーラのみで強引に歌詞らしいものを作って別の曲を歌わせてみました。
fransing demo(オープンテスト) by nwp8861

クローズドに比べるとやはり品質は下がっています。合成がうまくいっていない音で同じ音が複数選べる場合は最良に聴こえるものを選びましたが不自然さが目立ちます。ここでも総合的にはweakerがアラが少なめで良さそうです。抑揚を抑える表現なので安定するのかもしれません。normalとstrangeについてもクローズド同様"じゃじゃ馬音源"感がありますが何だか生き生きとして歌っている感じがするのが良いなと思いました。


<まとめ>

以上が現状の結果です。今回の結果はまだ一つ目なので、他の歌を音源にしたらまた違う結果が出て面白いかもしれません。また例えば、もっと遅い曲で音源化すれば"じゃじゃ馬音源"にならないんじゃないか(「耳~」は180BPMです)とか、原音設定次第でもう少し良くなるんじゃないか、長い音符の声を優先して使うと良いのかなとか、考えるところは他にもあります。最終結果ではないのでこれを聴いて次はどうしようかなあと考えたりしています。

fransingはあと少しいじりたい箇所があるので修正次第アップロードしたいと思います。ただ、今はsetParamの方をいじっているのでその後の作業になるかもしれません。どちらも近日中に上げられたら良いなあと思っています。

それではひとまずこの辺で。。

PageTop
なにぶん移り気なもので、ニューウェーブ/ポストパンクからうって変わって、今度は友部正人さんの「朝の電話」を打ち込んでみました。



以下、方々に寄道しつつ「朝の電話」について書いておこうと思います。

友部さんの活動のことを短く要約するとどうしても70年代の人ということになってしまい、代表曲も「にんじん」収録の「一本道」ということになるのではないかと思います。でも私が聴き始めたのは随分後の2000年代に入ってからです。元々は奥さんの方がファンで、ライブについて行ったり、アルバムを聴かされて良いなあと思って聴き始めた具合です。そんな経緯なので70年代のアルバムはまだあまり聴いておらず、専ら近作の方に思い入れがあります。

「朝の電話」は2005年のアルバム「Speak Japanese, American」に収録されている曲です。この年の春に、友部さんと同じく70年代から活動していたフォークミュージシャンの高田渡さんが亡くなっており、この曲はその事について歌われています。原曲では友部さんの声&ギター&ハーモニカにロケット・マツさんのピアノが絡み合うというどこまでも柔らかく無駄の無い構成です。(冒頭部分の試聴ページはこちらにあります)。当時のライブでは一人で演奏されることも多く、更にシンプルになって音の隙間が心地良かったです。

ライブといえば、高田さんを最後に見たのは島根だったと思います。高田さんや友部さん以外にもエンケン、鈴木茂、大塚まさじその他の大物が出揃ったライブで、これは行かねば!と奥さんと島根までトンボ帰りしました。高田さんは普段どおりのスタイル、友部さんは確か一人、トリのエンケンはアンプの山で爆音を出していたような気がします。

話を戻して今回の動画では記憶だけで打ち込んでみましたが、終わった後で原曲を聴き返してみると私が打ち込んだものはBPMが10近く速くなっていました。そこで原曲と同じ速さまで落としてみたのですが、私の打ち込みアレンジでは音の隙間がどうもさまにならず、結局当初のテンポに戻しました。フォークはテンポや音程のずれ具合も大切な要素だったりするので難しいなと思いました。

また後半にかけて主にサックスの音色で高田渡さんの代表曲「生活の柄」(アルバム「ごあいさつ」収録)のメロディを混ぜ込んでみました(馴染むように少し変えたりはしていますが)。理想では、段々「生活の柄」が副旋律で入ってきて、歌が「君はまだそこにいる」で終わるとメインメロディが「生活の柄」に置き換わるような流れになると良いなと思っていました。今回一番やりたかったのはこれだったので、自分では割と満足です。ミックスや調声はまだまだですが。

ボーカルは前回と同じく桃音モモです。単独音柔らかめと連続音を併用したものを使いました。「東京ガール」カバーのときもそうでした。モモというか藤本さんといえば、ウィスパーで読んだ単語素材集のデモコンテンツが手が込んでいて面白かったです→こちら。AUTOを選ぶとずっとループして心地良いです。

ついでに更に話を飛ばしますが、ムーンライダーズが来年から無期限活動休止に入ります。「解散」ではなく「休止」という表現ですが、年齢的に6人でアルバムを作るのは今回が最後なのかなと思いました。年上のミュージシャンのファンになっていると、いずれは先に逝かれるなあという意識が多少あるので「ショック!!」といった心象ではありませんが感慨深いなあと思います。今回の動画を作っているときの知らせだったので、自分の中では多少なり「朝の電話」とリンクするものがありました。でも、もしあえて友部さんの作品とリンクさせるのなら「すばらしいさよなら」の方が良いかなあと思います。いつかはさよならをしなくちゃいけないという歌です。

と、何とか友部さんの話に戻したところで終わります。

PageTop
The Condensersのアルバムからもう一曲。音的にはポストパンクではないとも思えますがそんなものです。

Keep on by nwp8861

一曲目を短時間で録音したThe Condensersは数日後に再びスタジオに入って二曲目の録音を開始しますがそこでトラブルが発生します。キーボードのGrahamが途中で7拍子を入れ始めたのです。Defauccoは当然これに猛反対しスタジオを飛び出してしまいます。

なぜDefauccoはそのような行動に及んだのか。数年後、Defauccoはこのときのことについてこう証言しています。「ああその頃は確かに悩んでいたし今も解決していない。でも気づいたんだ、この悩みは珍しくないと。もしすべての事柄がマッチョと鳥皮の2種類に分類されるとしたらパンクは間違いなく鳥皮だ。」

結局、しばらくしてDefauccoはスタジオに戻りました。そしてGrahamが今度は3拍子を入れそうな気配を察し、それを拒絶するかのように密室的なテープループを付けて曲を終わらせました。

PageTop