音楽とかソフトとか

私は音源の中の人ではなく、動画製作者やOREMO開発者といった立場の人ということになりますが、動画製作者ではなくOREMO開発者という立場から中の人に対してずっと前から思っていることがあります。あまりまとまらず、何を言いたいのか分かりづらいかもしれませんが、とりとめもなく書いておきます。

まず、音源作りは楽しみの一つとして成り立つものですよね?だとすると、その楽しみたい!という願望は収録について考えている段階でも既に何割か達成されている状況であると認識しています。この楽しみ方は、飴屋さんのブログにあったようなパラダイムシフトの一部だったら良いなとも思います。

OREMOやわぶでば等は、別に使役的、使命的な何かのために作っているわけではなく、そういった面白そうな遊び方の支援になれば良いなと思って作っています。もちろん使命的な考えの下で使ってはいけない、ということではありません。そういう考えの方が自分にとって良いと思うのならそれで良いと思います。

さらに、音源作りは考えようによっては将来の自分のためにもなるかもしれません。

以前このブログにも少しだけ書きましたが、自分の声をデジタル保存しておくというのは、「声のアルバム」を保存しておくことでもあるので、将来、何かのきっかけで過去をなつかしむ際に使えるデータになるかもしれません。

また話を飛躍させると、喉頭ガンやALSなどの病気で喉を摘出して自分の声を出せなくなった患者が音声合成を使って自分の声を取り戻す、といった話が10年近く前にニュースでも取り上げられていました。音楽の話ではなくなりますが、そういう予想外な副産物にもなりえると思っても良いと思います。


一方、今度は動画製作者の立場で考えると、動画製作者は基本的に使い手側の発想で感想、評価、コメント、リクエスト、アドバイス、要求などを出したりすることになると思います。文字のみのやり取りでは、文表現のしようによっては感想が評価に見えたり、アドバイスが要求に見えたりすることもあろうかと思います。

また、いろいろと話が大きくなってくるとすべてを包括させるのは大変なことなので、どこか妥協することになりますが、最終的にどう妥協するかの取捨選択は中の人の気持ち次第かなと思います。上述したように、「音声収録は中の人の楽しみなんだ」ということを、中の人には忘れないでいて欲しいなぁと思います。

以上のことが当たり前のことであれば良いのですが、念のため文章にしてみました。

スポンサーサイト

PageTop
paramMapperの精度検証しました。UTAU本体のもの、以下の動画で公開されていたもの、paramMapperの3つで、同じustファイル(「ひらひら」で作ったust)をwav化して聴き比べました。



結果としては、上記動画のソフトが現状一番良いと感じました。paramMapperは特に先行発声の位置の誤差が大きく、そのままでは使えないクオリティでした。

転写元のファイルを取り替えると転写結果も変わりますが、それって結局トライ&エラーしないといけないことになるので、なんだかなーとも思いました。

公開するとしたら、先行発声は転写でなく規則的に付けた方が良いだろうと思いました。

ともかく勉強になりました。DTWは別のことにも利用してみるつもりだったので、今度はそれを試そうと思います。そっちも公開できる品質になるかどうか分からないですが、どんな音になるのかワクワクです。

PageTop
原音設定を自動で行うプログラムのコアな部分が出来ました。検証はこれからです。

自動設定は、私が知っているかぎりでは既に2つ(UTAU作者の飴屋さんが作られたもの、どなたかがsnackで作られたもの)が公開されていると思います。多分これらの仕組みは、設定対象の音の特徴を抽出し、何らかの規則に基づいて各パラメータの場所を適切に決定していくものだろうと思います。

今回作っているものは、原音設定済み音源のパラメータを設定対象音源に転写するものです。設定済み音源と設定対象音源の間でDTW(Dynamic Time Warping)をかけて時間軸の対応をとり、設定済み音源のパラメータ時刻を対象音源側の時刻に変換します。

<ToDoと補足メモ>
・精度検証

 精度検証はほとんどやっておらず、「おっ動いた動いた!」という段階です。

・GUI部分の実装

 今はコマンドライン上で動いています。

・検証動画デモ

 以前上げた曲からustをそのまま再利用してみようと思います。

・exe化

今回は実装を楽にするために、フリーのライブラリやツール(snack、sox、SPTK)、自分の使い慣れたプログラミング言語(perl)等を複数組み合わせました。面倒のないのようにexe化して配布したいと思っていますが、無駄にサイズの大きなソフトになるかもしれません。

また各ツールが再配布OKか確認しないと。

あと、当初はOREMO-2.0に組み込むことを考えていましたが、自動設定はparamMapper(仮)という別ソフト、手動設定はOREMOにした方が良いのかなと思いました。

-----
検証中の連続発声についてはまた後ほど。。

PageTop
自戒あるいはごく私的な備忘録として。

学生のときに先生から「もっとサーベイ(調査)しなさい」と指摘されたことを思い出しました。
まったくおっしゃるとおりで、技術的に楽しそうなことがあると、ろくに先行研究を調査せずに自分で解決法を考え始めて、結局車輪(しかもデコボコ)の再発明をするかその途中で挫折する経験が何度もあります。でも、そうなるとうすうす気づいていてもなかなか自制できません。

なぜそうなってしまうのか、理由を自分なりに考えてみると以下の2つが思い当たりました。

・なぞなぞに置き換えると、出題する側より考える側の方が楽しいんだもん(なぞなぞの答えを考える前に答えを見たら台無しじゃないか)、という考え方。

・一般的に、より良好な解決を得るためにはより難しい手法を使いがち→その難しい手法を短時間で理解できる頭の良さを持ち合わせていない。

結局は個人の才能の問題なんでしょう。同時に、その頭で考えて作り上げた自作の車輪はデコボコで結局使い物にならない事が多いということも不思議ではありません。

で、今わくわくする主にソフト的な問題が目の前に転がっていて(しかも複数)、頭の中はそのことで一杯なのですが、どうしたことか、以前の自分に比べると少しはサーベイしています(それでも十分なサーベイ量かどうかはさておき)。実際はサーベイ中に早く手を動かしたくてうずうずするので、実装してみたり調べ物をしたりのサイクルですが、自分でもちょっと不思議です。しかしまだ途中なので、結局いつもどおりのやり方で行ってしまうのかもしれませんしボツになるかもしれませんが、願わくばデコボコの小さな車輪ができますように。

ついでに音楽的なサーベイ(というか備忘録)も一つ。先日ニール・イネスの言葉をふと思い出し、どこで読んだものだったか知りたくなって本棚をあさりました。
いつの日か、"Rutle"という言葉は英語で動詞になってくれればいいな、と思っているんだ。"Rutleする"とは、尊敬する人をコピーすること、という意味の動詞として使ってほしいね。
---- ニール・イネス、ストレンジ・デイズ、第9号, 2000年5月号、pp.100、(株)音楽出版社
他の雑誌でも同様のことを言っていたかもしれませんが、今回はこの一冊を発掘して久々に読み返しました。Thank you Neil.

PageTop
少し前から空き時間の息抜きにちょこちょこと作業していましたが、ページの見た目を変えました。

タイトルの元画像はセリさんが描いて下さった「とどけもの」のイラスト@pixivです。
http://www.pixiv.net/member_illust.php?mode=medium&illust_id=4097153


許可をいただいて数箇所を切り取って横長にコラージュしました。色んな要素の詰まった絵なのでなるべく取り込もうと努力したものの、切り取りの境界が見えるぞ、だとか、テトが中央よりちょい右にいるやん、といったツッコミ所は私の不徳のいたす所であります。また老執事の姿も見えません。ぜひ原画をご覧下さい。

「とどけもの」の源流に平沢師匠がリンクしているように、この原画のテトの仁王立ちは「妄想代理人」のオープニングにリンクしているのだ!と勝手に想像しています。

両端の背景の模様はインドの伝統模様ですが、もうちょっとどぎつい配色の方がそれっぽかったかなと思います。

----

「けんか別れ」のカラオケ投票についてですが、現在担当の方にお手続きしていただいております。早ければ今週末には投票開始になると思います。

PageTop
OREMO ver. 2.0-b090613を公開しました→ダウンロード

<主な変更点>
  • (修正) oto.iniのエイリアス読み込み/保存に対応。
  • (追加) oto.ini(原音パラメータファイル)の読み込み/保存時にファイル名を指定可。
  • (追加) 音名リスト上で「SHIFT+ホイールスクロール」すると、リストの長さを変更。
  • (修正) コマンドライン起動オプションの変更と追加。
      -saveDir 保存フォルダ ... 保存フォルダを指定する。
      -script tclスクリプト ... 起動時に実行するスクリプトを指定する。

<説明: oto.ini周り>
oto.iniを読み込んだり保存したりする際にエイリアスの項目を無視して処理していたため、エイリアス設定のあるoto.iniをOREMOでいじって保存するとエイリアスが消えるバグがあったので、修正しました。ご連絡ありがとうございました。

<説明: 音名リスト上でのSHIFT+ホイールスクロール>
一度に沢山見えた方が良いかなと思ってつけました。本当は、波形を拡大したら自動的にリストの長さも伸びるようになって欲しいのですが、うまく実装できてません。

<説明: コマンドラインオプションの変更>
一つ前のバージョンでコマンドラインオプションを付けましたが、文法を作り変えました。-scriptは付属のソースコード(oremo.tcl)を読まないと使い物にならないので、多分オレ専用的な機能になってしまうと思いますが、結構強力なオプションです。Tcl/Tkのwishでできることは何でもできてしまいます。

今回は特に以下のことを想定して実装しました。

テキストエディタに以下の文をコピペし、init.tclというファイル名で保存する。

;# 変数設定
set v(saveDir) z:/example ;# 保存フォルダを指定する
set startup(readRecList) 0 ;# 起動時にreclist.txtを読まない
set startup(readTypeList) 0 ;# 起動時にtypelist.txtを読まない

;# プロシージャ実行
makeRecListFromDir ;# 保存フォルダから音名リストを作成する


これで OREMO.exe -script init.tcl とすると、保存フォルダをzドライブの/exampleに変更し、そのフォルダから音名リストを自動的に作成します。

OREMOを何度も終了&起動するような場合に、最初の初期設定を自動化できるので楽です。コマンドラインって何?という方にとっては楽ではないかもしれませんが。。

PageTop
最近は慢性的にどたばたしていて、書き漏れがあるかもしれませんが。。

とりあえず、本題の前にボーカル無しBGMでも。先月途中まで作って以来放置中です。

「ころころ」(ダウンロード→http://www.divshare.com/download/7631244-065)

最初のメロディが何かに似ている気がしますが思い出せません。80~90年代にありがちなメロディだとは思いますが。。あと、ヘッドホンで聴いた方が良いと思います。

--------

ここから本題です。
OREMO開発版 ver.b090611 を公開しました→ダウンロード

<主な変更点>
  • ファイルメニューに以下の項目を追加。
    • 音名リストの読み込み
    • 音名リストの保存
    • 発声タイプリストの読み込み
  • 「c」を押すと、wavファイルをリロード。
  • コマンドラインでの起動オプション(「OREMO.exe 保存フォルダ」で起動時に保存フォルダを指定できる)。

<説明(音名リストの保存について)>

機能追加のリクエストがあったので実装してみました。リクエスト内容を読み違えたかもしれませんので、もし内容が違ってたりしたらお知らせ下さい。

想定している使い方: 指定したフォルダの内容から音名リストファイルを作る
    [手順]
  1. 「オプション」→「動作切替」→「保存フォルダにあるwavファイルからリストを生成する」
  2. 「ファイル」→「音名リストの保存」

<説明(「c」を押すと、wavファイルをリロード)>

想定している使い方の例: wavファイルビューア的な使い方。
    [手順]
  1. OREMOの保存フォルダを設定する。
  2. UTAU等の各種ソフトでwavファイルを保存する際に、1. の場所に保存。
  3. 「c」を押して表示内容を更新。

UTAU等で作成した合成音の波形やスペクトルを見ながらトライ&エラーしたい、といった場合に使えます。個人的には最近重宝してます。話題がそれますが、OREMOをベースにして波形ビューアソフトを作るのも良いなと思ったりしました。

<説明(コマンドライン起動で保存フォルダを指定)>

これは通常は関係ないと思います。個人的な需要で追加しました。文法は今後変更するかもしれません(oremo.exe -savedir dirnameとかに)。

--------
<その他>
・「けんか別れ」がリアルタイムリクエストにエントリー依頼されていたので担当の方にご連絡しました。
・おかげさまで本棚に大事な家宝が一冊増えました。

PageTop