さえの音響・音楽教室

音響・音楽系の話やボイスチェンジャーの情報まとめてくよ!

かわいい喋り方(やってみた)

f:id:saeokuri:20191215043704p:plain おはよう!!! ( ᐢ˙꒳​˙ᐢ ) 小栗さえだよ~~~!!

ボイチェンアドベントカレンダー14日目!
かわいい喋り方について!実践編です!

adventar.org

「かわいい」とは何なのか、我々はそのなぞを探るべくアマゾンの奥地へ向かった……(๑¯ω¯๑).+*

かわいい喋り方について調べてまとめて実践してみたので、かわいいなって思ったら是非取り入れてみてください!

諸注意

今回の記事は理論だった文献や裏付けなどの無い、主観や経験則、通説などのまとめになります!

「かわいいと捉えられやすい特徴、仕草」についての解説になるので、「女性らしさ」や「良いコミュニケーションの取り方」についてではないです。

今回は動画です!

わりとフワフワした内容で実例がないとわかりづらい記事になってしまったため、実録動画を用意しました!!

youtu.be

以下の文章は動画の内容と一緒です。

かわいいについて

男性視点でのかわいい女性視点でのかわいいが異なるのは有名ですね!
最近は特にかわいいの範囲がどんどん多様化している気がするので、今回使うかわいいは以下のどれかの特徴を持つものと考えてください( ᐢ˙꒳​˙ᐢ )

  • か弱さ:華奢な印象、守りたくなるような印象
  • 柔らかさ:丸み、包容力、安心感のある印象
  • 幼さ:活発さ、無知っぽさ、純粋さ

かわいい喋り方

かわいさの演出にも色々な方法があります!
自分の好みや特徴にあった方法を試してみましょう。

ピッチを高めにする

声のピッチが高いと陽気で元気な印象を与えられます!
かわいいなと感じた人のピッチを真似てみると良いかもしれません!

ゆっくり喋る

ゆっくり喋るだけで落ち着いた雰囲気や安心感が出るらしいです。
「間を置く」とは違って、一音一音丁寧に発音する感じです。

抑揚や緩急をつける

女の子は男の子に比べて文章の抑揚や緩急が大きく、言葉のイントネーションを男性より強調するという傾向があるそうです! また会話中の最低音と最高音の幅(ダイナミックレンジ)が男性より広いという特徴があります。

明るく嬉しそうに喋る

明るく喋るだけで元気でかわいい印象がつけられます。
実際に笑顔を作り、口角を上げると喋りやすいです。

眠そうな声、ふわふわした声

息漏れを強くしてゆっくり喋ることによって、ふわふわした声を作ることができます。
語頭の発音を弱く曖昧にし、さらに喋るスピードを遅くすることによって眠たそうな声にすることもできます。

舌足らず

活舌や発音を不完全にすることで、舌足らずで幼い印象を与えることができます。
聞き取りにくくなるのでほどほどにしましょう!

簡単な方法としては子音のある音を母音で喋ることによって、元の単語を認識できる範囲で滑舌を悪くできるようです。
「し」を「ち」に変えたり、「る」を「りゅ」に変えたりなど、近い音に変換する方法もあるみたいです。

鼻声

鼻声もかわいい印象を与えることがあります。
な行やま行の発音がしにくくなり、滑舌が悪くなるので注意です。(舌足らずより聞きにくいっぽいです)

鼻をつまむのではなく、喉の鼻腔へつながる部分を意識的に閉じて空気の流入を止めると自然な鼻声に聞こえます。

声区による印象

「声区」とは歌唱における発声方法の違いのことです。ここでは会話に使えるもののみを紹介します。
殆どの人は普段チェストボイス(胸声)で喋っていますが、声の特徴的な人はチェストボイス以外の発声を使ってることもあります。

チェストボイスの発声

地声感の強い自然体で喋りやすい声区です。
喉への負担が少ないので、息が続かなかったり喉が痛くなりがちな人はチェストボイスをニュートラルな発声方法にすると良さそうです。

エッジボイスを使った発声

声門を意識的に閉じて空気の振動を多く作る発声方法です。
エッジボイスで鼻声を出すとハムボっぽく聞こえます。

歌唱では部分的にエッジボイスを取り入れることで、言葉に感情を入れたり表現力の強化に使うことができます。 ボーカルフライという歌唱技術で、バラード曲などによく合います。

ウィスパーボイスをつかった発声

声門閉鎖を意識的に弱く不完全にし、息を大量に流して気息的な音を多く出す発声方法です。囁き声や息漏れ声とも言われます。
繊細さやセクシーさ、エロティックさに繋がる声区です(by Wikipedia)。
チェストボイスと混ぜる(声区融合する)ことができ、息漏れの量によって印象が変わります。

性質上声のボリュームが小さくなり、聞き取りづらくなってしまうので注意が必要です。

ミックスボイスを使った発声

チェストボイス(地声)とファルセット(裏声)を混ぜる(声区融合する)ことによって、聞こえの良い芯のある裏声を出すことができます。
声の強さを保ちつつ裏声のような高音域を出すことができるので、男性の歌唱でよく使われます。 ナレーションやアナウンサーなど聞き取りやすさを重視する職業の方も使うことがあります。

喋り方によっては中立的な声に聞こえる特徴があり、対人の会話で使うとよそよそしかったり、関心が薄そうという印象を与えてしまう可能性があります。

言葉に関する特徴

かわいい印象を与える言葉選びや反応、表現方法についてです。

感嘆詞やリアクション、感情表現を増やす

感嘆詞は「わ!」「え!」など、感情に連動して発声される言葉です。
表情や感情を豊かにすることによって素直さや子供っぽさを出せます。

反射的にできるようになると強いですが、普段の生活に支障が出ることも。。

語尾の特徴づけ

語尾に特徴をつけて丸みを出したり活発さや幼さを出せます。
多用すると煩がられたり聞き取りづらくなることもあるので、適切な頻度で使いましょう!

  • 単語の区切りや語尾を伸ばす
  • 単語の区切りや語尾を跳ねる(!をつけるイメージ)
  • 単語の区切りや語尾のピッチをあげる
  • 「ね」「よ」「だよ」などの語尾をつける

言葉を丁寧にする(美語化)

「お」や「ご」をつけることで言葉が柔らかくなります。

「仕事→お仕事」、「眠い→おねむ」

表現をぼかす

単語をぼかしたり、情報量を削ることで柔らかい表現になります。
正しく伝わらないこともあるので注意しましょう!

「記事を書く→かくやつやる」、「S(南)の方で銃声聞こえた→みぎから音した(FPSで怒られるやつ)」

擬音語、幼児語

言葉を擬音語や幼児語に変えて幼さを出す方法です。

「雨降ってる→雨ザーザー」、「眠くなってきた→ねむねむなった」

方言

方言を喋る女の子はかわいい!
かわいい方言のある地域出身の方は是非使ってみてください!

news.livedoor.com

地元の方以外はエセと呼ばれてしまう可能性があるので注意??

かわいいとの向き合い方

録音、録画して聞いてみよう!

自分の声を録音して聞いてみるのはとても大事です!思った通りに喋れてないなんてことは当たり前に起きます( ;ᵕ; )
なかなか気が進まないとは思いますが、気づきや発見は沢山あると思うので、録音して聞いてみる習慣をつけましょう!

見て聴いて感じたかわいいを真似するのが正義!

文章から学ぶのもよいですが、やっぱり自分で見て聴いてかわいいとかこうなりたい!と思ったものを分析したり、真似る方が納得感もあり習得しやすいと思います。 新しい分野を開拓してみたり、お気に入りの声優さんや役者さんなどを参考にして、自分の感性にマッチしたかわいいを作っていきましょうᐠ( ᐛ )ᐟ

自然にできるようになろう

わざとらしかったり一貫性がなかったりすると不信感が出てしまいます。
日常的に使ったり自分のなりたいキャラクターをしっかりとイメージして、自然と使えるよう訓練していきましょう!

役に入り込むための方法として、「スタニスラフスキー・システム」という演劇界では有名な演技理論があるようです。

スタニスラフスキー・システム - Wikipedia

おわりに

これ以外にもかわいい喋り方のコツはいっぱいあると思います!

かわいい人がかわいいだけじゃなくて、かわいくなりたい人がかわいくなれる世界を目指していきたい! ⸜( ‘ ᵕ ‘ )⸝⸜

次回はボイチェン系の解説に戻って「DAWの使い方」について解説したいと思います!お楽しみに〜〜

www.youtube.com

twitter.com

海外のボイチェン情報も調べてみよう

f:id:saeokuri:20191215173105p:plain おはよう!!! ( ᐢ˙꒳​˙ᐢ ) 小栗さえだよ~~~!!

ボイチェンアドベントカレンダー12日目!
海外(外国語)のボイチェン情報の調べ方についてです!

adventar.org

最近はGoogle翻訳の精度が上がって、外国語のページを一括翻訳するだけでも割と読める文章が出てきます。
日本にない情報もたくさん見つかるので、恐れずにいろいろ調べてみましょう!

今回は外国語での検索の仕方や海外のボイチェン事情について紹介してみようと思います!

英語のオススメ検索ワード

英語でのおすすめの検索ワードを紹介するよ!

voice changer(changing)

検索設定を英語にしておけば、voice changerボイスチェンジャーを検索できます。
日本語設定で検索するときは voice changingvoice changer software とすると英語の記事がヒットしやすくなります。

voice feminization(feminizing)

声の女性化という意味の検索ワードになります。MtFや両声類の方向けの情報が見つかるかと思います。
voice translation だと「音声翻訳」という意味になるので注意!

voice transgender(MtF/FtM

声の性転換に関する情報が見つかるかと思います。

中国語のオススメ検索ワード

中国語で検索したい場合はこちら!

变声器

ボイスチェンジャーの中国語訳です。

八美肉

中国語で「バ美肉」のことです。日本文化が輸入されたっぽい。

女性化声音

日本語で言う「女声」に対応する検索ワードです。

共振峰

フォルマントの中国語です。

海外のボイチェン

海外にももちろんボイチェンユーザーはいます。
最近だとVRChatでボイスチェンジャーを使った動画がたくさん見つかります!
バ美肉(バ美声)VTuberもまだまだ数は少ないですが出てきているようです。

Voice Trolling

海外では、ボイスチャットボイスチェンジャーを使って騙す遊び(Voice Trolling)の動画が多いみたいです!
「可愛い声」を調べるときは Anime VoiceやLoli Voice、Girl Voice などがよく使われていました。日本の影響すごい(๑¯ω¯๑)

⬇️の中国の方のボイスチェンジとかすごいかわいいです!(weiboは中国で普及しているTwitterのようなサービスです)

https://www.weibo.com/tv/v/HDN4Rh4cR?fid=1034:4394833427776530

海外の情報を調べてみて

海外のボイチェン文化

調べてみた感じでは、ボイスチェンジャーでの女性化についてはまだまだ日本の情報が多いようです。

使われ方についても日本文化の輸出のような形が多かったので、ボイチェン先進国なんだなと感じました。
海外向けにも情報発信していくとかなり喜ばれそうですが、日本で言うバ美声やボイチェン(かわいい女の子になるためのボイスチェンジ)に相当する検索ワードはまだ無いようなので、ワーディングは少し工夫する必要がありそうです。

海外で使われているボイスチェンジャー

日本では情報はあまり無いですが、海外ではVOICE MODというボイスチェンジャーがシェアを伸ばしているようです!
Discordに対応しているようなので、Voicemeeter Bananaなどの仮想ミキサーを入れずに通話ができそうです。

www.voicemod.net

女性用の設定はPro版で使えるようです。
以下がPro版のサンプル動画ですが、プリセットが豊富で使いやすそうですね。

www.youtube.com

海外は音声学的な研究資料やMtFFtM)についての情報が豊富

学術的な資料や情報が欲しい場合には外国語で調べると新しい情報が見つかる事があります。
またMtFなどについても日本にない情報が外国語サイトにたくさんあるので、日本の外にもアンテナを広げてみましょう!

例えば以下の資料ですが、「声変わり前の子供の声について、基本周波数(ピッチ)の性差は無いがフォルマントの性差があるために少年の声と少女の声は区別可能である」と言った面白い研究資料などが見つかったりします。

journals.plos.org

おわりに

今回は海外のボイチェン事情やアンテナの貼り方について解説しました!

ボイチェンはまだまだニッチな分野かと思うので、日本に届かない海外の情報がたくさんあります。
自ら情報を探しに行くことで新しい発見がたくさん得られるので、ぜひ海外にもアンテナを広げてみてください!

次回は「かわいい喋り方」について解説してみようと思います!お楽しみに〜〜!

www.youtube.com

twitter.com

声のしくみ

f:id:saeokuri:20191215174257p:plainおはよう!!! ( ᐢ˙꒳​˙ᐢ ) 小栗さえだよ~~~!!

ボイチェンアドベントカレンダー10日目!声の仕組みとかについて解説してくよ!

adventar.org

今回はボイスチェンジャーの話ではなく、地声を女性に寄せるための仕組みと方法について紹介します。
両声類を目指す人にも必要な知識になるので、地声を鍛えたい人は要チェック!

諸注意

声楽で扱われる用語の定義は音楽ジャンルなどにより大きく揺れており、統一が図られていません。(「JPOPの世界ではこう解釈しています」みたいな)
ネットで見つかる記事や動画で出てくる「鼻腔共鳴」や「ミックスボイス」などの単語はその人その人で定義が違うという前提で捉えると混乱せずに済むのでお勧めです。
みんな適当なことを言っているわけではなく、定義が統一されないから皆困っているのです。(๑-﹏-๑)

今回はそのような定義揺れの大きいキーワードは極力省いて、解剖学や音響学の定義を借りて説明しようと思います。

発声の仕組み

人間の声は肺から空気が送られ、声帯により咽頭音源(voice source)が作られ、声道と口腔や鼻腔などの共鳴腔によって音色が形作られます。
管楽器で言えば、声帯はリード、声道などの共鳴腔は楽器のボディ(共鳴体)にあたります。

声のピッチ

ピッチ(音高)は主に以下の要素などで決まります。
特定の器官(声帯など)の動きだけで決まっていないということが重要です。

  • 呼気の圧および速さ
  • 声門閉鎖の強さ、声帯の薄さ
  • 共鳴腔(声帯)の形状(広さ、長さ)

女性や子供の場合は声道(共鳴腔)が男性より短く、高いピッチが出しやすい構造になっています。 (高音を出すための筋肉が発達しているとかではないです)

共鳴腔が狭くて短いほど高音が出やすいというのは、管楽器をイメージしてもらえればわかりやすいかと思います。

声 - Wikipedia

声のフォルマント

声のフォルマントは共鳴腔の形で決まります。
基本的に共鳴腔が広く長いほど低周波が増幅されやすく、狭く短い方が高周波が増幅されやすくなります。声の野太さと首の長さには相関があるようです。

声道が短くて狭い女は男性に比べ、第一フォルマントが12%増、第二フォルマントが17%増、第三フォルマントが18%増と、高周波帯になるほど増幅された波形になります。

これはリサンプリング(3日目の記事で書いています)によって声の波形を縮めた場合に、同じように高周波になるほど増幅されやすくなる特性と一致しており、リサンプリングによる性別変更に近いフォルマントシフトが行える原理になります。

参考:歌声の科学

歌声の科学

歌声の科学

 

発声に関わる筋肉

発声に関わる筋肉の一部を紹介します。
以下の文献を参考にしています。

福島県立医科大学医学部耳鼻咽喉科学講座 - 喉頭の臨床解剖 https://www.jstage.jst.go.jp/article/jibiinkoka/112/2/112_2_86/_pdf/-char/en

声帯緊張筋

声帯緊張筋と呼ばれる輪状甲状筋は、声帯を緊張させて高音を出すときに使う筋肉です。

輪状甲状筋を収縮させると甲状軟骨を動かし、結果的に声帯を薄く伸ばす方向に操作します。
声帯が薄く伸びると呼気による振動がしやすくなり、咽頭音源の周波数が高くなります(つまり高音が出ます)。

声門閉鎖筋群

発声音のアタック(明瞭さ)などに関わる筋肉です。
声門閉鎖筋群には、甲状披裂筋、外側輪状披裂筋、披裂筋があります。

声門閉鎖筋群を鍛えてアタックの調節が正しくできると発声が聞き取りやすくなり、滑舌も良くなります。
また甲状披裂筋は地声感(チェストボイス)を高めるときに使う筋肉です。

フォルマントに関わる筋肉

男性が女性のフォルマントに近づくには、声道を短くする必要があります。
しかし声道とは音源の発生場所である咽頭(声帯)から舌根あたりまでの空洞の名称で、声道に対応する筋肉があるわけではありません。

そこで声道を短くするアプローチとして、以下の筋肉を使い咽頭を持ち上げるという方法が取れます。

  • 茎突舌骨筋(Stylohyoid muscle)
  • 茎突咽頭筋(Stylopharyngeus muscle)
  • 顎二腹筋(Digastric muscle)

一般的には発話や歌唱に必要な筋肉ではなく、主に嚥下(ものを飲み込む動作)を補助する筋肉となるので、日本語での詳しい解説やボイトレの記事などは見つからないと思います。

以下の文献(英語)にて仕組みとトレーニング方法について解説されています。

Shortcut to female voice

長くなるので、こちらの詳しい和訳は別記事にまとめようかと思います。

声区について

声楽には声区という概念があり、地声感の強いチェストボイス(というか地声のこと)、裏声と言われるファルセット、地声感を保ちつつ高音を出すヘッドボイス、喉を鳴らしながら発声するエッジボイス、チェストボイスとファルセットの声区を融合させたミックスボイスなどがあります。

声区は歌唱法の話なので、女声とはあまり関係がありません。
例えば、一般的な女性はミックスボイスを使って発音しているわけではなく、ピッチとフォルマントの高いチェストボイスで発音しています。

女声になるためにミックスボイスは必要?

ミックスボイスを「声区融合を使いアタック感のある裏声を出す発声方法」と定義するならば、必須ではありません。
フォルマントを変えずに地声感のある高音を出す形になるため、「中性的な声」や「少年声」がゴールになります。

ミックスボイスをマスターして、上記のフォルマント変化まで加えることができれば、「済んだ芯のある女性の声」になると思います。

女声に一般的なボイトレは有効?

高音を出すために輪状甲状筋を鍛えるトレーニングは有効です。
腹式呼吸や滑舌のためのトレーニング、ピッチ調整など歌唱技術に関わるトレーニングは必須ではありません。

フォルマントを変化させるためのボイストレーニングは一般的なボイトレにはおそらく存在しないため、性転換に関するキーワードで調べてみることをお勧めします。(今後の記事で取り上げてみようかと思います)

おわりに

男性がピッチを高くするためには、声道の長さというハンデを補うレベルで輪状甲状筋を鍛える必要があるので、実はかなりの筋肉を必要とします!
またフォルマントを上げるための声道を短くするアプローチも、咽頭を常に無理やり持ち上げるという方法になるので、こちらも相当な筋肉を必要とします。

完璧な女声を手に入れたとき、首回りの筋肉はムキムキになってる可能性が高いですね?⸜(๑’ᵕ’๑)⸝?

www.ymm.co.jp (特に女声とは関係ない書籍です)

次回は「吐息感や息遣い」について解説したいと思います!お楽しみに〜〜

www.youtube.com

twitter.com

ボイスチェンジャーの遅延

f:id:saeokuri:20191215175005p:plain おはよう!!! ( ᐢ˙꒳​˙ᐢ ) 小栗さえだよ~~~!!

ボイチェンアドベントカレンダー8日目!「ボイスチェンジャーの遅延」の回です!

adventar.org

ボイスチェンジャーを使っていく上で切っても切れない関係になる遅延。
色々な原因で遅延は発生するので、どのような部分で遅延が発生しているのかを覚えておくと原因の切り分けに役立ちます!

人間の聴覚と遅延(レイテンシ)

通常、人間の発音は骨伝導により1ms程度の時間で鼓膜に届きます。 ボイスチェンジャーなど音声信号処理を行い、20ms以上のレイテンシが発生してしまうと遅延を感じられるようになってきます。 さらに遅延が大きくなり50msを超えてくると、遅延聴覚フィードバックという発話阻害効果が現れてきます。

遅延聴覚フィードバック - Wikipedia

またカラオケなど歌を歌う場合は会話より許容値がシビアになり、3~5ms以下のレイテンシーでないとうまくタイミングを取れなくなってしまいます。

楽器類のレイテンシーは声の時とはまた異なり、遅延に関する要件は声より緩くなるそうです。
(楽器で耐えれるレイテンシーでも声では耐えられないことがある)

遅延の原因になるもの

無線接続による遅延

Bluetooth

Bluetoothで使われているA2DPというプロファイルは0.2秒程度の遅延があります。

またBluetooth機器で採用されているコーデックによっても遅延が前後します。「AAC」や「aptX」が採用されているものが遅延に強いコーデックのようです。

無線の親機と子機が離れていたり障害物があると遅延も大きくなるので注意しましょう。

赤外線通信

製品は少ないですが赤外線通信のマイク、ヘッドフォンはBluetoothに比べて遅延が大分少ないので、試してみるとよいかもしれません。

A/D、D/A変換

オーディオインターフェースが搭載するADC[デジタル-アナログコンバータ]およびDAC[アナログ-デジタルコンバータ]が、アナログ信号をデジタル信号に(またはデジタル信号をアナログ信号に)変換する際の遅延です。
高品質なA/D-D/A変換エンジンを持つオーディオインターフェースを導入することによって改善します。

低レイテンシを目指したADC「AK557x」のインタビュー記事なども見てみると面白いです。

「ADC」がハイレゾの未来を拓く? 旭化成が目指す“究極”の音。レコードで聴き比べも - AV Watch

オーディオバッファ(IN/OUT)

オーディオインターフェースを導入している場合、オーディオバッファサイズが選べます。
バイスのオーディオバッファサイズを小さくすると負荷が高くなる代わりに遅延が小さくなり、大きくするとシステム負荷が下がり安定する代わりに遅延が大きくなります。

発生する遅延は計算可能で、バッファサイズ/サンプリングレートとなります。
例えばバッファサイズを96sampleにし、サンプリングレートを96kHzにした場合。64/64000=0.001secの遅延が発生します。

オーディオドライバ

オーディオドライバによっても遅延が発生します。
基本的にはASIO対応のオーディオインターフェイスを使っておけばOKです。

推奨ドライバー(低遅延)

非推奨ドライバー

  • WDM: Windows標準のドライバ
  • MME: WDMより古いドライバ
  • DS(DirectSound): ゲーム用のドライバ
  • asio4all: ASIOドライバのない機器向けの互換ドライバ

ボイスチェンジャーレイテンシー

ボイスチェンジャーによっても一定の遅延が発生します。 以下に低遅延のボイスチェンジャーをまとめたので試してみてください。
(PCスペックや環境に寄ってしまうので具体的な数値は記載していません)

遅延の少ないボイスチェンジャー

スタンドアロン
プラグイン

遅延の大きいボイスチェンジャー

ハードウェアは遅延に対して最強

VT-4などのハードウェアボイスチェンジャーは上記の問題を殆ど無視できるので、遅延に対してはとても強いです。

入力を分岐してモニタ用にハードウェアボイスチェンジャーを使っているような方もいるようです。 少し手間ではありますが、相性はいいが遅延が大きいボイスチェンジャーを使いたい場合などにはいいかもしれません!

おわりに

ボイスチェンジャー自体の遅延についての話が多いですが、オーディオインターフェースの有無やデバイスの設定でも大きく変わります。
遅延の原因はいろいろあり原因の特定は難しいですが、1個1個確認していけば改善可能なものも多いので、あきらめずに追及していきましょう!

次回は「声区と声区変換」について解説したいと思います!お楽しみに〜〜

www.youtube.com

twitter.com

ボイチェンのための音響知識

f:id:saeokuri:20191215175707p:plain おはよう!!! ( ᐢ˙꒳​˙ᐢ ) 小栗さえだよ~~~!!

ボイチェンアドベントカレンダー6日目!「ボイチェンに関わる音響知識」の回です!

adventar.org

ちゃんとした音響の知識を持っておくと、機器が故障しにくくなったり、正しいノイズ対策ができたり、音質が上がったりといいことずくめです!

マイクレベル・ラインレベル

アナログケーブルを流れる電流にはマイクレベル・ラインレベルという種類があり、これを理解せずに音響機器を接続をすると音が流れなかったり、機器が故障したりします。

マイクレベルはマイクのコイルから流れてくる微弱な電流で、ラインレベルと比べると約1000倍もの電圧差があります。(ダイナミックマイクでもコンデンサマイクでも同じです)
このためマイクレベルの入力ジャック(穴)にラインレベルの出力を流し込んだりしてしまうと、爆音が流れたり故障などの原因になります。 逆にラインレベルの入力を受けるジャックにマイクレベルを繋いでも、1/1000の電流しか流れて来ないので音が鳴らない(極端に小さい)ということになります。

ジャックにMICと書かれていたらマイク入力、LINEと書かれていればLINE入力を想定したジャックとなっていますので、接続する前に確認しましょう!
またラインレベルには一般機器用規格(-10 dBV)のプロ機器用規格(+4 dBu)の違いがありますので、こちらも確認しておきましょう。

www.shure.com

バランス伝送

オーディオケーブルにはバランスドなケーブルとアンバランスドなケーブルがあります。
バランスドなケーブルはノイズに強い代わりに高く、アンバランスドなケーブルはノイズに弱い代わりに安いという特徴があります。

基本的には電流が微弱なマイクレベルの接続にはバランスドなものを、ラインレベルの信号が流れるケーブルはアンバランスドなものでもOKです。
バランス伝送に対応していない機器ではバランスドなケーブルを刺してもバランス伝送には(ノイズに強くは)なりませんが、音は問題なく流れます。

仕組みを知りたい方はこちらが参考になります。

ケーブルのバランスとアンバランスってどう違うの? - おとてく

インピーダンス

オーディオ業界ではケーブルに流れている電圧と電流の比のことをインピーダンスと言います。
流れる電流が少ないほどインピーダンス値が高くなり、ローコストな反面ノイズの影響を受けやすいです。

インピーダンスが高い信号をインピーダンス値の低い入力に入れてしまうと電圧の損失が発生してしまい、音声の歪みや高音域が篭るなどの症状が出ます。(音声信号は電圧の強弱でつたえるため)

主にギターの入力だったり、ミキサーを挟んだり、ライブなど複数スピーカー出力を伴う複雑な音声ルーティング(配線)をするときに考慮するものです。
シンプルな構成のボイスチェンジャー運用ではほとんど意識しなくてOKです。

オーディオ端子の種類

一般的なオーディオケーブル端子には以下の規格があります。

RCA

一般に民生用機器でよく使われます。色分けはただの判別用なので、色による特性の違いはありません。
赤白はステレオ用で、黒がモノラルとなります。

赤緑青のコンポーネント端子とも互換性があります。

Amazonベーシック RCAオーディオケーブル 1.2m (2RCAオス - 2RCAオス)

Amazonベーシック RCAオーディオケーブル 1.2m (2RCAオス - 2RCAオス)

  • 出版社/メーカー: Amazonベーシック(AmazonBasics)
  • メディア: エレクトロニクス
 

フォーン・標準プラグ

音響機器の接続によく使われる規格です。
標準プラグと呼ばれる6.3mmのものと、ステレオミニプラグと言われる3.5mmのものが多いです。

モノラル用(2極)のケーブルをステレオ用(3極)のジャックに刺すとモノラルになってしまうので注意。

XLR

ライブステージなどプロ向けのバランス接続が前提となる場面でよく使われる規格です。
ボイスチェンジャーではコンデンサマイクに使用されます。

高価ですがロック機構がついていたり、接続時のノイズが抑制されるなど高機能です。

ノイズ

音声接続に関するノイズには以下のような種類があります。

ホワイトノイズ

一般に「シャー」と聞こえるノイズ。
アンバランスドなケーブルから発生したり、機器の接触不良から起こります。

ピンクノイズ

一般に「ザー」と聞こえるノイズ。
音響測定や人工的に作られてることが多いため、自然には発生しにくいです。

ハムノイズ

一般に「ビー/ブー」と聞こえるノイズ。
グランドループと呼ばれる、電源周りの接続からくるノイズです。

結線がループしていたり、USB給電を使用していると発生することがあります。

おわりに

今回の内容はボイスチェンジャーだけではなく、普通の配信をする方にも役に立つ知識になります。
何を買ったらいいかわからない人、ノイズなどで困ってるという人の助けになれば嬉しいです(◦ˉ ˘ ˉ◦)

次回は「ボイスチェンジャーの遅延」について解説したいと思います!お楽しみに〜〜

www.youtube.com

twitter.com

ボイチェンのためのオーディオインターフェース

f:id:saeokuri:20191215180557p:plain おはよう!!! ( ᐢ˙꒳​˙ᐢ ) 小栗さえだよ~~~!!

ボイチェンアドベントカレンダー5日目!「オーディオインターフェース」の回です!

adventar.org

まだ持ってない人向けの情報や、持ってるけどよくわからない人のためにQ&A形式で解説していきます!

オーディオインターフェースってなに?

かなりざっくりとした説明になりますが、ボイスチェンジャーを使う上でのオーディオインターフェースとは、 音響機器の接続や品質をいい感じにしてくれるものという理解でOKです。
ボイスチェンジャーに必須というものではなく、高品質なボイスチェンジや配信を行いたい人が買うものと行った感じです。

ZOOM USB3.0 オーディオインターフェイス UAC-2

ZOOM USB3.0 オーディオインターフェイス UAC-2

  • 発売日: 2015/04/30
  • メディア: エレクトロニクス
 

私が使っているオーディオインターフェースです!
低遅延に特化したものを使っています。

お値段どれぐらいのがいいですか?

10,000円〜30,000円ぐらいのものを買うと良いです。
10,000円以下であれば普通のUSBマイクなどと大して変わらなく、30,000円以上のものは楽曲制作系の機能が強化されていくためです。

インターフェースは多い方がいいの?

普通に使う分にはマイクの入力端子1つ、ヘッドフォン出力1つだけで十分なので、IN/OUTの端子数はあまり気にしなくて良いです。 弾き語りなどをしたい場合は、ボイチェン用のマイクと楽器の入力で2入力が必要になります。

Hi-z(ハイインピーダンス)はギター用、MIDI端子はMIDI機材用の端子になるので、ボイチェン用ならば必要ありません。
FireWireは残念ながらあまり普及しなかった少し前の規格なので、USBまたはThunderbolt接続のものにしましょう。

オーディオインターフェースのコントロール(ボリュームコントロールなど、様々なつまみのこと)が多いものは便利ではありますが、ボイスチェンジャーを使うためだけならほぼPC上で操作できてしまいますので、そこまで高機能でなくても良いと思います。

音質はよくなるの?

⬇︎のような理由でよくなるとおもいます!

  • より高品質なマイクが使えるため、低ノイズ、高解像度(はっきりとした音)で録音できる
  • PC標準のものと比べて高品質なインターフェースに変わることよりノイズが少なくなる
  • PC標準のものと比べて高品質なA/D-D/A変換になるため録音および再生の音質が良くなる

遅延は少なくなる?

⬇︎のような理由で少なくなるとおもいます!

  • 高速なオーディオドライバが導入できることにより遅延が少なくなる
  • オーディオバッファサイズを変更することにより遅延が少なくなる
  • PC標準のものと比べてA/D-D/A変換が高速に行えるため、遅延が少なくなる
  • USB3.0など高速なインターフェースが使えるため遅延が少なくなる

コンデンサーマイクを使ってみたい

コンデンサーマイクを使うなら、XLRコネクタとファンタム電源に対応しているものを選びましょう!

ファンタム電源って何?

コンデンサマイクを動かすための電源です、48Vと高い電圧が書かれていますが、これは昔の規格を引きずっているだけで、実際は電圧も電流も対して消費しないようです。一般的な5VのUSBバスパワーでも問題なく動作します(マニュアルの注意事項にも書かれていないので大丈夫そう)。
ダイナミックマイクにはファンタム電源は必要ないですが、ノイズや故障の原因になり得るので切っておいた方が良いです。

またファンタム電源など電源系をONにする際は「突入電流」という大きな負荷や爆音が発生し、聴覚障害や故障の原因になるので関連するボリュームはOFFにしましょう!

USBバスパワーって使っていいの?

最近はUSBバスパワー駆動のオーディオインターフェースが多いですが、もしノイズが気になるようであれば、USBバスパワーではなくAC給電にすることをお勧めします。USB給電のノイズによって電気信号の質が変わることはないという意見もありますが、送信パケットにエラーが出ると復元の負荷や送り直しによる遅延が発生してしまいますので、影響がないとは言い切れません。
またUSB接続を多用しているPCの場合、電力が足りなくなった場合にデバイスが停止したり、処理が不安定になる場合があります。

オーディオバッファってなに?

PCにデータを送るまでの待ち領域です。 スムーズな音声信号処理を実現するためには、決まった周期でスムーズに音声パケットを送る必要があります。 (A/D変換処理が完了でき次第、矢継ぎに送信してしまうと送信間隔にムラができ、プツプツしてしまいます) そのためA/D変換が終わった後のデータを一時的に溜めておく場所が必要になり、この領域のことをオーディオバッファと言います。

オーディオバッファが潤沢なほどスムーズにデータ送信はできますが、その分遅延が発生してしまうため、 データがプツプツ聞こえない範囲でオーディオバッファを小さくすることで、遅延を抑えることができます。

バッファサイズを小さくするとCPUの負荷は上がりますので、プツプツしない&遅延を感じない程度のバッファサイズにするのが一番良いと思います。

オーディオドライバはどれがいいの?

ASIO対応のものを選んでおけばOKです。(音楽業界のスタンダードです)
asio4allはASIOドライバーのないオーディオインターフェイスをASIO対応にできるソフトのことで、ASIOではないので注意してください。

サンプリングレートはどうすればいいの?

サンプリングレートはアナログ音をデータ化する時の時間軸の細かさのことを言います。44.1kHzであれば、22.05kHzまでの周波数の音を損なわずにデータ化できます。人の可聴域は20kHzが限界なので、22.05kHzまでの音をデータ化できれば十分という意味で44.1kHzというサンプリングレートが一般的になっています。

FtMボイスチェンジャーであれば全体の周波数帯を下げる処理が行われるので44.1kHz以上のサンプリングレートでも意味がありそうですが、MtFボイスチェンジャーであれば22.05kHz以上の高周波をデータ化できてもあまり意味がないため、44.1kHzの設定で十分かと思います。
もし歌ってみたなどで音声を加工したりする場合は96kHzで録ってみてもよいかもしれません。

44.1kHzと48kHzは音楽業界と映像業界の標準の違いです。録音だけなら44.1kHz、配信など動画で使う場合は48kHzにするなどにしておけば良いと思います。

ビット深度は?

ビット深度はアナログ音をデータ化する時の音量軸の細かさのことを言います。16bitと24bitで大きく違いが出るのはノイズの聞こえ方(S/N比)です。 ノイズが気になる場合はビット深度を24bitにしてみると改善する場合があります。

付属ソフトって使えるの?

DAWを持ってない方はぜひ付属ソフトも気にしてみてください!

プラグイン形式のボイスチェンジャーを使うためにはDAWなどのホストアプリケーションが必要なのですが、オーディオインターフェースプラグインが利用可能なエディションのDAWが付属されている場合があります。音楽制作には機能不足なエディションの場合が多いのですが、ボイスチェンジャープラグインを動かすためだけなら十分なので、以下のようなプラグインに対応しているDAWが付属しているオーディオインターフェースを選ぶと良いと思います。

プラグインに対応している有料DAW

おわりに

今回はボイスチェンジャーを使うためのオーディオインターフェースについて解説しました!
品質を求めるとPC直つなぎのUSBマイクやヘッドセットマイクから卒業する日は来ると思うので、購入に迷ったらぜひ参考にしてみてください!

次回は「音響設備のはなし」について解説します!お楽しみに〜〜

www.youtube.com

twitter.com

ピッチ、フォルマントとは??

f:id:saeokuri:20191215182200p:plain おはよう!!! ( ᐢ˙꒳​˙ᐢ ) 小栗さえだよ~~~!!

ボイチェンアドベントカレンダー4日目!「ピッチ、フォルマントとは??」の回です!

adventar.org

今回は実用的なワザとか検証ではなくて、お勉強がメインの話になります!

声のお話

ピッチってなに??

ボイスチェンジャーにおけるピッチとは、声の基音(一番強く鳴っている周波数)のことです。

一般的な男性の地声の基音は-1282.8Cent、女性の地声の基音は-23.3Centとなっています。(CentとはHzとは異なる音高の単位です) その差は1259.5Centで、男女の地声はちょうど1オクターブ(1200Cent)離れていると言えるようです。

声の高さの実測調査/愛知学泉大学

つまり「意識して高めに出した地声+ボイチェン」で基音を1オクターブ上げることができれば、女性のピッチになったと言えます!

ですがこれだけでは女性のピッチになっただけで、女声には聞こえません。
次に説明するフォルマントというものも、声の男女差に大きく影響しています。

フォルマントってなに??

ボイスチェンジャーにおけるフォルマントとは、声質(男性らしさ、女性らしさ)になります。 この仕組みを正しく理解するためには、音声学のフォルマントを説明する必要があります。

音声学の世界ではフォルマントとは、音の各倍音(整数次倍音成分)の大きさ(特性)ことを指します。 人間の声には倍音が含まれており、基音と基音の整数倍の周波数帯が大きく鳴っている波形になります。

その大きく鳴っている周波数帯を低い方から順に第一フォルマント、第二フォルマントと名前を付けたものの集合がフォルマントになります。
音楽の世界ではフォルマント特性のことを音色と呼んだりもします。

人間の声とフォルマントの関係性

第一フォルマントと第二フォルマントは発音の母音(a/i/u/e/o)を決定づける要素となります。 そして第三フォルマント以降の成分は発音には影響しませんが、男女差やそれぞれの人の声の特徴を形作ると言われています。

フォルマントに関する性差については、男性より女性の方が約18%ほど高く、成人男性と子供を比べると子供の方が30数%ほど高くなるという研究結果があります。 ボイチェンにおける妥当なフォルマントの設定値が10~30%であることでも裏付けられそうです。

歌声の科学 - Google ブックス

ピッチ、フォルマント以外の声の性差について

ボイスチェンジャーで設定可能なピッチとフォルマント以外にも、声に関する男女の性差は以下のようなものがあります。

  • イントネーション(抑揚)、感情の起伏
  • 語彙力、表現力、文法
  • 間の取り方、呼吸
  • 感嘆やリアクション
  • ボディーランゲージ(表情、しぐさ)

今回は詳しく説明しませんが、こちらの要素を女性らしく寄せるだけでも雰囲気が大きく変わります。 男性感の残る喋り方も味はありますが、その分声自体の女性感に大きく依存することになるので、双方のバランスを取っていくとよさそうです。

ピッチシフト/フォルマントシフトって何をしてるの?

ここではピッチシフト、フォルマントシフトに使われている技術の概要を説明します! 使われている技術の概要だけでも知っておくと、うまくボイチェンが効かない時に原因の予測ができたりするかもしれません。

ピッチシフトやフォルマントシフトは、以下の音声変調技術の組み合わせで実現しています。

リサンプリング

リサンプリングとは元の音声を線形に補完してサンプル数を変えることです。

サンプル数を変えたデータを元の再生サンプリングレートで再生することで、ピッチを変化させることができますが、同時に再生速度も変わってしまいます。
波形を拡大縮小するような変換になるので、高周波成分ほど振幅が増幅されてフォルマントも連動して上がってしまいます。

タイムストレッチ

タイムストレッチとは、音程(ピッチ)を変えずに音声の尺を伸ばす処理のことです。 タイムストレッチには、SOLAを使う方法とフェーズヴォコーダを使う方法などがあります。

SOLA

SOLAは細かい単位で波形をコピーして全体の尺を稼ぐ方法です。

例えば「あいうえお」という音声を「ああいいううええおお」とコピーすることで音声尺が2倍になります。

ピッチを高く変更する場合は、時間当たりのコピーの間隔を増やせばよいです。
リサンプリングのように波形を縮小しているわけではないので、フォルマント成分の比率は変わりません。

実際の音声データは滑らかな波形なので、「あいうえお」のように綺麗に複製できません。 そのためいかにコピーする起点/終点をうまく見つけるか、コピーしたつなぎ目を滑らかにするか、複製の間隔をこまかくするかといった点で、品質に差が出てしまいます。 また処理の品質を上げると、必要な処理は増えて処理遅延が発生するので、遅延やCPU負荷との戦いにもなります。

TD-PSOLA
TD-PSOLA(Time-Domain Pitch Synchronous Overlap and Add: 時間領域ピッチ同期重畳加算

タイムストレッチ、ピッチシフトのアルゴリズム

PSOLAによる女声変換の実演

フェーズヴォコーダー

フェーズヴォコーダーPhase Vocoder)は細かく分けた音声ごとに特徴を抽出して、それに対して数学的な変換をかけるという方法です。

  1. 入力信号にSTFT(短時間フーリエ変換)をかけて、周波数と振幅の組という特徴データを得ます。
  2. 特徴データを変調します。
  3. 変調した特徴データをISTFT(逆短時間フーリエ変換)で音声信号に直します。

Pitch Shifting and Time Dilation Using a Phase Vocoder in MATLAB - MATLAB & Simulink - MathWorks 日本

フェーズヴォコーダーのタイムストレッチは基音の推定などが不要なため、SOLAに比べて多重音声に強いという特徴があります。

従来フェーズボコーダーでのピッチシフトはリサンプリングのようにフォルマント成分も変わってしまいましたが、2017年にフォルマント構造を維持した高速な処理についての論文が出たようです。もう実用化されているのかな?

https://www.isca-speech.org/archive/Interspeech_2017/pdfs/2028.PDF

また今年の10月に、50年間にわたり解明されてなかった逆高速フーリエ変換がついに解明されたらしいので、更なる高速化に期待です!

50年来の信号処理に関する謎が解かれる、逆高速フーリエ変換がついに一般化 | fabcross for エンジニア

おわりに

ということで、今回はピッチとフォルマントに関するお話しでした!
音声学や音響学の話になってちょっと大変だけど、ボイチェンやるなら知ってるに越したことはないはず!

詳しく知ろうとすると数学とかプログラミングの話が出てきて沼ってしまうので注意です。 記事書くために調べ直してたら大変だった.. (๑°ㅁ°๑)

次回は「オーディオインターフェース」について解説してみるよ!お楽しみに!

www.youtube.com

twitter.com