忍者ブログ

[PR]

2024年05月17日
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

快適に「声」を聴かせるための一手間

2015年10月12日
ごきげんよう、bot作成者です。
前回に続き、今回も月刊人力ボカロ合宿に寄稿させて頂きます。しつこい?すみません。

この記事ではbotの呟きに登録しているネタの中から、UTAU式人力をするうえでおさえたほうが良い(であろう)ポイントをピックアップします。

注意点
・著者が台詞から抽出する人力歌唱をしていた都合、台詞切り出しが中心となります。歌から切り出すものはやったことがないのでわかりません。下記が当てはまるか分からないので前もってご了承ください。
・技術事項なので初心者というよりは、UTAUの扱いに慣れている方や「手間がかかってもきれいに歌わせたい」という人向けの記事になっています。
・著者が人力で活動していたのが三年近く前なので方法が古いor効率の悪いことが考えられます。
・著作権を侵害するような活動である都合、ユーザーを増やそうという意図はありません。あくまで「始めちゃった人に方法を教える」程度です。

「声」を聴かせるためのポイント
1.明らかに人間の声ではない音はノイズと思うこと
ノイズには種類があり、UTAU初心者の方にはどれがノイズかというのを判別するのは難しいかもしれません。私も未だによくわかっていません。
そこで、ここでは人間の声に聴こえない耳障りな音=ノイズとしております。音を伸ばすときゅるきゅるなる音、ウィーンとなる音は大抵ノイズです。
私自身、UTAUを使った人力音源の調声はノイズを無くすことから始まるものであり、「っぽさ」はそれを経て初めて出ると思います。

2.一つの音を一つの音符で歌わせられないものと思うこと
台詞が特にそうなのですが、一つ一つの音が非常に短くなる傾向があります。
UTAUエディタで歌わせるということは、短い音を無理矢理引き延ばすことになります。そのため、何もしないで歌わせると高い確率で異音を発します。
状態の良い音が確保できているなら良いのですが、なかなかそうもいかないものです。普通にUTAUエディタに置いただけで機械音が目立つようならばフラグで誤魔化すか音符を二つに分割したほうがいいです。

一つの音符を二つか三つに分割する場合は、母音結合をしたうえでエンベロープは交差させましょう。UTAUエディタ右上のエンベロープを操作するボタンを使うと良いです(ただし「!」マークが出たらエンベロープエディタを開いて正規化ボタンを押しましょう)
エンベロープが交差していると音がダブらないで聞こえるので、面倒かもしれませんが音符を分割した時とセットで行うようにしましょう。

3.き、ち、く、つ、ふ、す等の「無声子音」に気を付けること
まず適当なフレーズを喋ってみて下さい。上に挙げたような音はしっかり発音していないことが多いです。台詞からの切り出しに特に言えますが、そういうものに母音が無いのがザラです。
そのため、普通にエディタに置いただけだと耳障りになりやすいです。
また、母音が無いということもあり原音設定で失敗しやすいので耳障りだなと思ったら見直してみてください。子音がくどすぎるなと思ったら左ブランクでカットするのも手です。

4.原音設定は定期的に見直すこと
3で挙げた無声子音もそうですが、発音・発声がおかしい時は原音設定を直すと解決されるということがあります。(例:伸ばした時に違う発声になる音は右ブランクでカットする)
また、さ行の発声が遅れているのが多い傾向があります。これは先行発声が手前過ぎるのが原因です。子音と母音の間かその少し前を狙うとよいです。スペクトラム機能も使いながらやってみてください。
人力音源ばかりは自力で原音設定をしなければならないのですが、きちんと歌わせるための基本的な作業ですので気になったら見直す習慣を付けましょう。

5.破裂音には(基本的に)オーバーラップを設定しない
主にか、た、ぱ行とそれに準ずる拗音に対して言えるのですが、そのような音には基本的にオーバーラップは設定しません。やはりこれも適当なフレーズを喋ってみると分かりますが、他の音と違って前の音とのつながりがありません。
そのため、これらの音に過度のオーバーラップが設定されていると滑舌の悪い印象になりますのでそれを踏まえた上で原音設定しましょう。
因みにこのオーバーラップ、設定の目安が分からないという声をよく聞くので私個人としての目安でお答えしますが「オーバーラップ=前の音との距離」とすると分かりやすいかと思います。先行発声が短いならオーバーラップをマイナス20~40に設定すると良いと思います。

6.出来るだけ声の表情を揃える
揃っていたほうが自然だからという理由ですね。表情がバラバラだと音MADのような様相を呈します。それはそれでという感じもありますが、ばらつきが多すぎると切って繋いでいる感じが露骨になるのです。
声の表情が統一されているのがいいにこしたことはないのですが、一音のアクセントに違う表情の声を入れるのは有効です。

7.な、ま、や、ら行の音の繋がりを滑らかにするように心がける
これ、結構気になるポイントです。声がきれいでも音のぶつかりが目立つと聴き心地がよろしくないです。
対処法ですが、原音設定であらかじめオーバーラップを適度に設定した上でUTAUエディタの右上にあるエンベロープを交差させるボタンを押すor原音のプロパティでSTP値を設定することが考えられます。

連続音が分かる方は上記の音+母音同士の繋がる音だけ連続音にしてみるのも手です。少なくとも、これらの音の滑らかさは単独音より優れています。

補足 ブレスについて
息している音を発声の直前やフレーズとフレーズの間などで使用すると生々しさが演出出来て良いのですが、これの使い方が惜しい人が結構いらっしゃると思ったので補足します。
私個人としては「息継ぎとしてのブレス」と「気配としてのブレス」かあると思っております。声と違って微かな音なのであまり音量が低いと聴こえるか心配になるお気持ちはわかります。しかし、息の音の主張が強すぎると逆に不自然になります。
上記を踏まえた上で猫の呟きで推奨しているブレスの使い方を挙げます。
・BRE値は高めに設定する。息継ぎなら90以上あってもいい(低すぎると機械音が目立って息っぽくなくなるため)
・音量は歌声より低めにする。息継ぎ、気配では良い良いBRE値が異なる。
・歌声ではないのでmod値は上げても良い。

私自身、ブレスの使用が不得意なのであまりためにならないかもしれません。
これに限ったことではないですが、人間の歌声や話し声を聴き込んで参考にするのが良いと思います。

以上、botの呟きより重要そうなものを抜粋した記事でした。
上記に限らず、UTAU式人力に関係ありそうなことは割りと浅く広く取り扱っておりますのでこれからもUTAU式人力をする人の飼い猫botをよろしくお願いいたします。
PR

人力特化でフラグを語る

2015年03月10日
生成時オプションや、音符のオプションで設定出来るものをあくまでも「人力歌唱」をする時の目線で紹介します。

モジュレーション(mod)
ピッチの曲線をどのくらい再現するかというものですが、慣れない方はmod0にすれば音痴にならないと覚えておいていいです。0にするとピッチが平坦になるので音階に忠実にはなります。
元の声の個性を活かしたいと思ったら少しずつ数値を増やすと良いです。この辺りは個人の好みもあるので、自分の耳で確かめてみて下さい。
因みに未設定だと100です。原音のピッチそのままです。普通に歌わせて音痴だと思ったらモジュレーションをいじっていなかったということが割とよくありますので確認しておきましょう。

BRE(Bとも)
ブレスです。初期設定は50ですが、基本設定から変更可能です。0に近いほど声がクリアになり、100に近づくと声がザラザラします。90代後半はもはや声じゃありませんが、子音だけの音や息の音には有効です。
UTAU音源使う時は0に設定する方が多いですが、人力歌唱(特に台詞からの抽出)の音源にBRE0を設定すると声がキンキンする傾向があるので適宜調節して下さい。

flags
※難しい説明は省くのできちんと知りたい方はリンクで掲載しているページを参照して下さい。

H
一言でいうと声を曇らせるフィルターです。UTAU音源ではキンキンする声の音源に使われることが多いです。
これは人力音源にはかなり有効で、声のザラザラする成分を抑えられます。H20~30くらい全体に設定するだけで調声が幾分楽になります。
ただし、あまり大きな数値を設定すると機械音は抑えられるものの声が曇りすぎてしまうのでクリアだと感じられる範囲で止めておくのが良いです。コーラスのように、目立たないものなら逆に70くらいに設定しておけば楽出来ます。ただし、それでも不快な機械音はどうしようも無いので直しましょう。

Y
子音部分のブレス成分を調節するとか言われるものです。デフォルトは100ですが、0に近づけるほど子音が強調されて滑舌がよくなるとされております。
UTAU音源の使用時にはBRE0Y0は鉄板の設定ですが、人力音源でやるとキンキンするので避けたほうが良いです。
ノイズ成分が強調されるからとか理由は幾つか推測出来ますが、Y0にするときゅるきゅるした音が出やすくなります。子音と母音に音符を分割しても解決できません。
これを設定する場合は自分の耳で限度を決めると良いでしょう。

C
高音でキンキンするのを抑えるフラグです。人力音源となるとキンキンしやすくなる傾向があるので有効です。

h
子音以外にかかるブレス成分を調節する機能です。数値を大きくすると声を掠れさせられます。表現を増やす程度に覚えても良いでしょう。

t
音程を半音の10分の1単位で調節する機能です。+か-で設定します。普段はあまり使いませんが、mod値を大きくした音符に使って音程を補正するという使い方もありますのでおまけ程度に。

g
ボカロでいうジェンダーファクターにあたるものです。数値を大きくすると声が太く男性的に、マイナスに設定すると声が若く女性、子供のようになります。
高音でマイナスして裏声っぽさを出したり、低音で増やすことで音が汚くなるのを多少カバーしたりするという使い方が出来ます。
 | HOME |