2018/11/12

イマーシブ・サラウンドの概要と、快適な環境構築

イマーシブ再生環境を構築する方法


「イマーシブ・サラウンド」という言葉を耳にしたことがありますでしょうか?

映画館やライブコンサート、VRのオーディオに使われる、この「イマーシブ」という言葉は、英語では「Immersive Surround」と表記します。

「Immersive」とは「没入」という意味になり、つまり、「Immersive Surround」は、「没入型サラウンド」と訳すことができます。



では、「没入型サラウンド」とはどのようなサラウンドなのか……?
言葉にすると、例えば、下記ような説明になるかと思います。

「リスナーを包み込むような立体的な音により没入感を提供するサラウンドの手法」

今までの5.1chや7.1chというサラウンドは、平面にリスナーを「囲む」ようにスピーカーを配置しますが、「イマーシブ・サラウンド」は、5.1chや7.1chに加え、さらに上層にもスピーカーを配置し、リスナーを「包み込む」ようにスピーカーを配置し、今までのサラウンドに比べ圧倒的に高い臨場感を演出することが可能です。

なお、立体音響、3Dサラウンド、Spatial Audioなど様々な呼び名がありますが、基本的に全て同義語となります。




イマーシブ・サラウンド、3つの「方式」                     


次に、イマーシブ・サラウンドの方式について簡単に説明をします。

一言に「イマーシブ・サラウンド」と言っても、実は、大きく分けて以下の3種類の「方式」があり、それぞれ長所と短所があります。




1. チャンネルベース


事前に想定される出力チャンネルの数に合わせた形で音声をあらかじめ制作し、それぞれのチャンネルを対応する各スピーカーから再生する方式。 チャンネルベースは別名「心理音響モデル」と呼ばれることがあり、収録を行なった場所(コンサートホールやライブ会場など)の音場をそのまま再現したい場合に効果的で、いわゆる “聴かせるための音”=音楽の再生に向いていると言えます。


2. オブジェクトベース


音源に「位置情報」を持たせ、各スピーカーからどのような音を出すかというパンニング情報をリアルタイムに計算(レンダリング)して再生する方式。例えば、ヘリコプターの音、車のクラクションと言った、動きを伴う映画の効果音に対して有効となり、それぞれの音を「オブジェクト」として捉え、それぞれのオブジェクトがどのように動き、音量がどのように変化するかというデータ音声情報に含ませ、再生時には、アンプなどの機器側で、スピーカーの位置や数にあわせて最適なレンダリングを行い再生するため、再生時のチャンネル数=スピーカーの数に依存しない制作が可能だが、制作時にはDolby AtomosやAuro 3Dと言った特定のフォーマットを使いエンコードを行い、再生時には、それぞれのフォーマットに対応した AVアンプなどが必要になる。なお、オブジェクトベースは、純粋な音楽コンテンツの再生よりは、映画の効果音など音が空間を移動するような表現に向いていると言われています。

3. シーンベース(Ambisonics)

リスナー=マイク位置を取り巻く、その空間全体の物理情報を記録再生する方式。一般的にはAmbisonics(アンビソニックス)と呼ばれることが多く、Ambisonicsに対応した特殊なマイクを使い、その空間のアンビエンス全てを録音し、その音声情報を制作時に自由に動かす(回転させる)ことがでるフォーマット。その為、VRなどの音響に使われることが多い方式となります。


イマーシブ・サラウンドの主なフォーマット                     



イマーシブ・サラウンド市場には、現状、いくつかの標準フォーマットが存在しています。ここでは、主な3種のフォーマットをご紹介いたします。


*上記の他に「DTS:X」というオブジェクトベースの規格もありますが、ここでは説明を割愛いたします。




1. NHK 22.2ch


3種のフォーマットの中で最もチャンネル数の多いフォーマットがNHK22.2です。このフォーマットでは、チャンネルベースが基本の考え方になります。

このフォーマットは3層構造となっており、下層はフロントのみの3.2ch、中層はBack Centerを含む10ch、そして上層は8chに天井中央にTop Center (Voice of God)と呼ばれる天頂スピーカーという構成になっています。

このフォーマットで再生環境を作る場合、当然22.2チャンネル、つまり24チャンネル分の出力を持つオーディオ・インターフェイスが必要です。一般的なオーディオ・インターフェイスの場合24チャンネルの出力を持つものは大変少ない為、MADIやDanteなどのマルチチャンネルの伝送方式を使い、それぞれに対応したDAコンバーターを使うのが一般的です。

おすすめのインターフェイス:



おすすめのDAコンバーター:

M-32 DA Pro (MADI)




2. Dolby ATMOS3. Auro 3D


NHKの22.2chフォーマットの再生環境を構築するのは、スピーカーの数も多い為、どうしてもハードルが高くなってしまいますが、Dolby ATMOSやAuro 3Dなどで使われている、5.1.4(ごーてん、いちてん、よん)や7.1.4(ななてん、いちてん、よん)と言ったスピーカー配置であれば、少し機材を買い足したり、または、現在お手持ちの機材を応用したりすることで、比較的簡単に再生・制作環境を整えることができます。

そして、この5.1.4や7.1.4というスピーカー配置は、イマーシブ・サラウンドの再生・制作に置いてもっともポピュラーなものとなります。 

簡単に説明しますと、既存の5.1chのサラウンド、または7.1chのサラウンドに対して、上層のレイヤー(Top Layer)に4つのスピーカーを足したスピーカー配置となり、チャンネル数は、それぞれ、5.1.4 = 10ch 、7.1.4 = 12chとなります。


5.1.4 フォーマット                                              7.1.4 フォーマット

Auro 3DもDolby ATMOSも上記よりスピーカー数の多いフォーマットが存在しているのですが、一般的にイマーシブ・サラウンドによる「没入感」を再現するためには、この5.1.4もしくは7.1.4というスピーカー配置が最低限必要になり、現在、家庭にてイマーシブ・サラウンドを体験する為に発売されているAuro 3D、Dolby ATMOS対応のAVアンプも、基本的にこれらのスピーカー配置を「基本」としている為、5.1.4もしくは7.1.4のスピーカー配置でイマーシブ・サラウンドの再生・制作環境を構築することは非常に理にかなった選択と言えると思います。

さて、では、この5.1.4もしくは7.1.4という再生環境をどのような機材構成で構築するのが良いのかという部分についてお話しいたします。

まず、22.2chフォーマットの再生環境構築の際にご紹介した、インターフェイスとDAを使うパターンで考えてみましょう。ただ、今回は、24chも必要がない為、一般的な16chのDAが1台あれば良いため、22.2chに比べ機材のコストもケーブルの本数も少なくてOKです。


おすすめのインターフェイス:


Fireface UFX+ (MADI)

DIGIface Dante (Dante)

おすすめのDAコンバーター:







スピーカーとオーディオインターフェイスの接続方法                   


ここまで読み進めていただき、勘の良い方ならきっと下記のように思われたと思います。

「この5.1.4もしくは7.1.4というスピーカー配置の場合、必要なチャンネル数は、10chもしくは12chなので……上手にやりくりすれば、UFX1台でできるのでは???」


答えは……


はい。できます。上手にやりくりすれば、UFX1台でイマーシブ・サラウンドの再生・制作環境を作ることは可能です。

となります。

では、どのように「上手にやりくり」すれば良いのでしょうか?
答えはズバリ、「ヘッドフォン出力」を使う!です。



RMEのオーディオインターフェイスに搭載されているヘッドフォン出力は、通常のライン出力としてもお使いいただる為、背面にある1~8chの出力に追加して、2系統のヘッドフォン出力=4chを足して、合計で12chの出力が可能となります。

下記は、Fireface UFX IIのマニュアルからの抜粋となります。

ーーーーーーーーーーーーーーーーーーーー

Fireface のチャンネル 9 ~ 12 はフロント・バネルに 1/4"TRS ジャックで配置されています。これらのチャンネルは、他のライン出力と同じコンバーターを使用するので、技術仕様のデータも同じです(118 dBA SNR)。

ハードウェアベースのリファレンス・レベルが 2 つ用意されています(TotalMix の出力チャンネル [Settings] > [Level] で設定、High または Low)。High は他のチャンネルの設定 Hi Gain に相当し、Low は -10 dBV(上の表参照)でデジタル・フル・スケールで+4 dBu に相当します。このように、これらは高品質のライン出力(アンバランスですが)としても使用可能です。


Phones 出力をライン出力として使用する場合、TRS プラグ⇔ RCA フォノプラグ、もしくは TRS プラグ⇔ TS プラグのアダプターが必要となります。

ピンの割り当ては国際標準に準拠します。左チャンネルを TRS ジャック / プラグの tip に、右チャンネルを ring に接続します。
ーーーーーーーーーーーーーーーーーーーー


これらのケーブルはその形状から通称「Yケーブル」と呼ばれており、ケーブルを自作しなくても販売店などで購入することが可能です。

そして、実際のオーディオ・インターフェイスとスピーカーの接続は、下記のようになります。


5.1.4フォーマット(ヘッドフォン有り)

7.1.4フォーマット

この接続方法で使用可能なRMEオーディオ・インターフェイスはこちら:







この際、Fireface UFX IIとUFX+のMain(1-2ch)は、XLR端子となっており、その他のチャンネルに比べ高いレベル(+24dB)で出力ができる為、注意が必要です。

またFireface 802でも背面のTRS出力とヘッドフォン出力は若干出力レベルが異なりますので、各出力チャンネルにて同じレベルが出力されるように調整をする必要が有ります。






AVアンプと一緒に使う方法                     



イマーシブ・サラウンドの制作環境を構築するに辺り、制作用のソフトウェア(DAWソフトウェアなど)からの再生をオーディオ・インターフェイスを通じてスピーカーから再生することはもちろん必要なのですが、同時に、実際にその制作中のコンテンツをエンドユーザーがどのような機材を使い鑑賞するのかを考え、その環境と同等の環境も同時に構築し、制作中の音源が、エンドユーザーの環境でどのように聞こえるのかを確認する必要が出てきます。

具体的には、すでに発売されているブルーレイなどのイマーシブ・コンテンツを、Dolby ATMOSやAuro 3Dに対応したAVアンプを使って再生し、そのコンテンツを調査研究する必要もあるかと思います。つまり、同じスピーカーを使い、制作中の音(オーディオ・インターフェイスの再生)とAVアンプ、両方の音を切り替えながらモニターできる環境が必要となるわけです。


では、ブルーレイ・プレイヤー、オーディオ・インターフェイス、イマーシブ対応のAVアンプ。この3種の機材をどう接続するのが良いのか?

下記のようにオーディオ・インターフェイスをアナログで12チャンネル、AVアンプのアナログ入力に接続し、同時にブルーレイ・プレイヤーなど民生の再生機をHDMIケーブルでAVアンプに接続し、AVアンプでPCの再生とブルーレイ・プレイヤーの再生を切り替えることができれば一番良いのですが、AVアンプの機種によっては、アナログ入力のポートがAVアンプ側に十分な数用意されておらず、オーディオ・インターフェイスからの出力をアナログでAVアンプに12チャンネル分接続することができなかったりします。





例えば、ATMOSとAuro 3D両方に対応したAVアンプとして、マランツの「AV8805」が有りますが、この機種においても、アナログの入力自体は7.1ch(8ch)までしかなく、ハイトの4チャンネル分のアナログ入力がないため、その分をどう接続するのか……という部分が問題となります。

  
マランツの「AV8805」のアナログ入力部




この問題は、UFXを高品位なデジタル・ミキサーとして使うことで解決します。

RMEのオーディオ・インターフェイスをお使いのユーザーの皆さんであればすでにお馴染みかと思いますが、インターフェイスをPCに接続すると立ち上がってくるミキサー・ソフトウェア「TotalMix FX」を使い、Top Layerの4chのみ、AVアンプからではなく、UFXから直接出力するように接続行うことにより回避することができます。

もちろん、AVアンプからのアナログ出力を全て一旦UFXで受けて、全てのスピーカーを直接UFXに接続するという環境を構築する事もできますが、そうしてしまうと、入力も出力も全て使い果たしてしまうため、PCでの録音作業、ミキシング作業に支障が出てしまいます。このセットアップは、あくまでもPCにて通常の音効作業を行いつつ、同時にAVアンプを通してブルーレイ・プレイヤーを聞くといった用途の為のセットアップとなりますので、UFXのアナログ入力はできるだけ空けておく前提で下記のように配線を行います。

下図の緑色の線の部分、AVアンプのハイトチャンネル用のアナログアウトを、UFXのアナログインプットにそれぞれ接続します。そして、UFXのヘッドフォンからの出力は、ハイト用のスピーカーへと接続。具体的には、下記のような接続となります。


ここで肝になるのは、TotalMixでのルーティングの組み方となります。

Software Playbackの9~12chは、もちろん、Hardware Outputの9~12chにルーティングするのですが、同時に、AVアンプのTop Layer 4ch分のアナログ出力を受けているUFXのHardware Input 1~4chもHardware Outputの9~12chにルーティングする必要があります。

文字にすると判りにくい為、チャートにしてみました。これで少しは判りやすくなったかと思います。

TotalMixのルーティングがあまり得意でない方は、下記よりTotalMixのWorkSpace Fileをダウンロードして読み込んでいただく方法もありますので、是非ご活用ください。

※Fireface 802用WorkSpace Fileは現在準備中です

いかがでしたでしょうか。

このブログは特に、ゲームのサウンドに携わるエンジニアやクリエーターのみなさまには、いくらか有益な情報になったのではないか思います。 

ゲームの業界だけに留まらず、今後ますます需要が高まることが予想されるイマーシブサラウンド。 RMEは、その柔軟なTotalMix ミキサーと正確な再生、また、MADIやDante/AVBといったデジタル伝送フォーマットにより、今後もハイレゾフォーマットでのマルチチャンネル再生をサポートしてゆきます。また、イマーシブサラウンド、アンビソニックス、バイノーラルと言った、エンジニアやクリエーターのみなさまが「今」必要としているな情報も、引き続きご紹介してゆく予定です。