本サイトでの Cookie の使用について

Shibuya 03-3477-1776
Umeda 06-6131-3078

«Works

Author

ROCK ON PRO

渋谷:〒150-0041 東京都渋谷区神南1-8-18 クオリア神南フラッツ1F     03-3477-1776     梅田:〒530-0015 大阪府大阪市北区中崎西2-2-1 東梅田八千代ビル1F    06-6131-3078

【MIL STUDIO技術解説】MIL誕生に寄せて〜鑑賞から体験へ 選択から多様の未来へ〜

チャンネルが少なくなければできないことがある。チャンネルが多くなければ分からないことがある。
オーディオの世界を支配するチャンネルとはいったい?


【技術解説】MIL誕生に寄せて〜鑑賞から体験へ 選択から多様の未来へ〜
中原雅考(株式会社ソナ / オンフューチャー株式会社)


📸 株式会社ソナ / オンフューチャー株式会社
中原 雅考 氏

芸術と工学の融合

スタジオと同じ音で作品を聴いてもらいたい。原音忠実再生といった希望は、多かれ少なかれ音響コンテンツ制作者にとっての願いだと思います。しかし、そのためには、ユーザーもスタジオと同じような環境にスピーカーを設置して作品を試聴しなければなりません。今や時代は多様化し、ユーザーの試聴環境は2chかサラウンドかといった単純な選択肢ではなくなっています。ともすれば、この作品はこのように聴いて欲しいといった制作者の強いこだわりが、ユーザーに対しての不用意な圧力になってしまうかもしれません。本来、作品には自由な表現が与えられるべきだと思いますが、オーディオでは、2ch、5.1ch、7.1.4chなど再生チャンネルの形式によって異なる流儀が要求されてしまいます。そのような制限は、工学が芸術を支配しているような関係にも見えてしまいます。

素晴らしい技術をもったエンジニアがスタジオでつくり出す音は最高です。その素晴らしさを多くのユーザーに伝えたいと思い、スピーカーの設置方法、調整方法、部屋の音響のことなどを様々な場面で伝えてきました。しかしそれは、ユーザーにとっては「高級な鮨屋で食べ方を指導されながらおいしさを味わっている」ような世界かもしれません。どうやら、今一度オーディオと出会った頃のユーザー体験に立ち返る必要がありそうです。工学による芸術の制限を緩和すべく、より一層の芸術と工学の融合を目指して…

誰もが気軽に良さの分かるオーディオ再生とは?
作品やユーザー(聴取者)が主役になるためのオーディオとは?

「モノ」「ステレオ」

「モノ」や「ステレオ」といった用語をよく耳にしますが、正確には、再生側は「モノフォニック」と「ステレオフォニック」、受聴側は「モノラル」と「バイノーラル」ということになります。「立体音響=ステレオフォニック」「非立体音響=モノフォニック」ですので、オーディオの再生環境としては、「ステレオ」か「モノ」かの二種類しかありません。音響機器用語としては「2ch=ステレオ」として使用されることもありますが、一般的には2chも5.1chも7.1.4chも22.2chも全て「ステレオ(立体音響再生)」です。それを片耳で受聴すれば「モノラル」となります。両耳で聴いていて非立体音響の場合は、「モノフォニック」ということになります。

音場のゴール「4π」

モノフォニック(非立体音響)の1ch再生から始まったオーディオ再生は、やがて2chの時代を迎え、ステレオフォニック(立体音響)となります。以後、サラウンドと呼称される5.1chや7.1ch、イマーシブと呼称されている3D再生環境まで全てステレオ再生ということになります。同じステレオの仲間で何が異なっているかというと、再現音場領域ということになります。リスナーから見た左右方向の角度を方位角、上下方向の角度を仰角と呼びますが、2chの時代ではL-R間の方位角60°が再現音場だったのに対して、5.1chや7.1chのサラウンドでは(原理上は)360°に再現音場が拡張されます。

では3Dのイマーシブではどうでしょう。

その前に… 角度の単位ですが「度(°)」の他に「ラジアン(rad)」を覚えていらっしゃいますでしょうか。ラジアンは半径1の円の円弧の長さで表す角度の単位です。ラジアンで角度を表現すると、360°は2π、60°はπ/3 ということになります。
3Dの角度はこのラジアンを拡張したステラジアン(sr)を使用します。ステラジアンでは、半径1の球の表面積で角度(エリア)を表すことになりますので、全ての方向、すなわち全周は4πということになります。従って、360°は全方向を表してはおらず、4πsrが本当の全方向ということになります。

半径rの円周の長さ = 2πr
半径rの球の表面積 = 4πr2
(*編注:4πr二乗)

現在のところ、Auro-3D、Dolby Atmos、DTS:Xなどの商業メディアのイマーシブには下方チャンネルがありません。ということで、これらの再現音場領域は北半球の2πとなります。一方、8K/4K放送の音声フォーマットの22.2chやソニー360 Reality Audioなどは前方に下方チャンネルを持っていますので、2 πがちょっと拡張されて2.3π程度の再現音場ということになります。

オーディオは現在2πをちょっと超えたところまで来ていますが、世の中には4πより広い音場はありません。4πが音場のゴールです。我々は、今、音場のゴール直前にいるということになります。


📸 再現音場領域の広さの違い:2ch L/R, サラウンド, 4πイマーシブ

この世はすべて4πステレオ

上図は、1箇所の音源(〇(赤)全指向性スピーカー)から音が発生してから0.1秒間の間に〇(緑)の場所に到来する音、すなわち部屋の反射音の様子をスタジオで測定・解析した結果です。たった1つの音源(〇(赤))から放射された音が、0.1秒間という僅かな時間にも様々な方向からの音を連れてきていることが分かります。

この様々な方向からの音、すなわち4πの音が、音源の「実存感」を与えてくれます。例え音源がモノ(1つ)の場合でも、我々の日常は4πステレオです。4πステレオがきちんと表現されてこそ、音源のリアルな実存感(そこにある感じ)が表現できるということになります。

「SBA」「OBA」「CBA」

自然界の音は、無限の数の音源がシームレスに繋がっている4πの音場です。これをそのまま録音して再現する手法をシーンベースオーディオ「SBA」と呼びます。例えば、Ambisonicsなどはそのような手法の一つです。1次のAmbisonics(FOA)では、全周4πの全ての音を4chの信号として、高次のAmbisonics(HOA)、例えば7次のAmbisonicsでは全周4πの全ての音を64chの信号として記録して再現します。この時、4chのFOAと64chのHOAでは再現精度の違いはありますが、どちらも音場の再現領域は4πであって、チャンネル数による再現エリアの違いはありません。

次に、4π音場をSBAで収録する代わりに個別の音源素材を使って、すなわち有限の数の音源で4πの音場を構成することとしましょう。音源は有限となりますが、音場はチャンネル制限のない4πです。すなわち、4π空間の任意の場所に複数の音源を配置することで立体音響再現を行います。このような手法をオブジェクトベースオーディオ「OBA」と呼び、音源を布置するパンナーをオブジェクトパンナーと呼びます。オブジェクトパンナーでパンされた音は、Ambisonicsなどのシーンベースの信号か、Dolby Atmosの7+4=11chや22.2chの22chなどのチャンネルベースの信号として出力されることになります。例えば、シーンベースを軸にコンテンツ制作する場合は「オブジェクト→シーンベース」のパンナーを、チャンネルベースを軸にコンテンツ制作する場合は「オブジェクト→チャンネルベース」のパンナーを利用することになります。パンの行き先の違いはありますが、いずれにしても制作者は変換先のチャンネルのことは気にせずに4π空間に音を配置することになります。

立体音響の最終的な出口は複数個のスピーカーとなりますが、今のところ、それぞれのスピーカーの音量差を利用して立体音響再生を行っているケースがほとんどかと思います。この最終出口であるスピーカー、すなわちチャンネルに向かって直接パンすることで立体音響作品を制作する手法をチャンネルベースオーディオ「CBA」と呼びます。制作現場においては最も馴染みの深い手法ではないでしょうか。オブジェクトパンナーもチャンネルパンナーもどちらも空間に音を布置するパンナーですが、チャンネルパンナーは、LRパン、LCRパンなど、パンの方向に対して明確にチャンネルの存在が意識されています。すなわち、このチャンネルだけに音を割り当てたいといったことが可能なパンナーとなります。
我々の世界は「SBA」ですが、オーディオは「CBA」。「OBA」はその中間に位置しているといった感じでしょうか。

鑑賞から体験へ、選択から多様へ

我々が日頃接している自然界の音は「SBA」です。すなわち、「チャンネルフリー4π」の世界です。このような自然な音場は、音のプロでなくても誰にでも「分かる」ことのできる音場です。一方、オーディオによる音場再現は、このような4πの世界をチャンネルという境界で分断し、またその一部を切り取って再生している世界です。2ch LRと7.1chサラウンドでは切り取る空間の大きさが違いますが、どちらも4πをある大きさの額縁に切り取って鑑賞していることになります。

鑑賞というからには、スピーカーの置き方、聴く位置、部屋の条件などの整えるべきマナーが存在します。それらを極めることで、見えるものが多くなってきます。いわゆる通の世界です。好きな世界ではあるのですが、若者にはオーディオの世界が(良い意味でも)「盆栽の世界」の様な感じに映っているかもしれません。この盆栽的世界観から脱却すると、オーディオにもより一層の広い世界が広がるのではないでしょうか。「鑑賞」するオーディオから「体験」するオーディオへ。「選択」された通の人たちの世界から、誰にでもわかる「多様性」に満ちたオーディオの世界へ。鍵は「チャンネルフリー4π」が握っています。

人間EQ

三次元の方向情報を得ようとすると、物理的には4つのセンサーが必要となります。二次元の方向情報でも3つのセンサーが必要です。しかし、人間には2つのセンサー(耳)しかありません。そのため、物理的には左右方向の音像しか把握できないということになってしまいます。左右検知の手がかりにしているのが、音源から放射された音が左右の耳へ到来する際のレベル差「ILD」と時間差「ITD」です。しかし、ILDとITDだけでは、左右は区別できても前後の識別はできません。ましてや全ての場所においてILDもITDも同じ値となる正中面上の音源の位置は、全て識別できないことになります。

ところが人間は、耳だけではなく自分の体を使って音源知覚のハンディキャップを克服しています。音が耳に入射する過程で、音は耳介や顔の形の影響を受けます。すなわち、自分の耳や顔の形状によるEQが施されます。さらに、肩からも遅延した反射音が到来してくるので、それもEQとなります。このような「人間EQ」は、音の到来方向によって特性が変化します。我々は「人間EQ」による特性変化を利用することで、たった2つの耳で三次元の音源方向情報を識別することができています。

この「人間EQ」を「頭部伝達関数」とか「HRTF」とか「HRIR」などと呼んでいます。耳・顔・肩の形状が異なれば頭部伝達関数も異なりますので、みなさん自分専用の人間EQを持っています。従って、これを使って音源方向を認識する能力は、最初から人間のDNAにプログラムされているものではなく、自分の体をつかった日々の学習によって一人一人が身につけた能力ということになります。

パンニングの効かない世界へようこそ

左右方向の音像定位に関しては、パンニングによるファンタム音像の生成が有効的であることは多くの方が経験されていると思います。左右の音量差を与えることによってILDをあやつり、音像定位を操作できるためです。さて、高さ方向に関してはどうでしょうか。高さ方向の音像知覚に対しては、ILDもITDもほとんど役にたちません。音像の高さを知覚するためは「人間EQ」を呼びおこすことが必要となります。

この「人間EQ」は、音源の高さが変わると変化します。そのおかげで音源の高さの違いを識別できるのですが、換言すれば、異なる高さのスピーカーからの音をミックスしてもその中間の「人間EQ」が合成されるとは限らないということになります。つまり、高さ方向にはパンが効かず、2つのスピーカーの中間の高さにファンタム音像が生成される保証は無いということになります。

ということで、自然な4π音場再生を実現するためには、高さ方向に対して出来る限り多くのスピーカーを配置する必要があるということになります。例えばMILでは、床下も含めて高さ方向に5レイヤー(仰角-41°, -20°, 0°, +20°, +34°)、そして直上と直下にもスピーカーを配置し、合計62chで4π音場を構築しています。


📸 MILのスピーカーレイアウト:方位角12方向×高さ方向5レイヤー+直上+直下

どれだけのスピーカーがあれば…

さて、4π音場の再生にはMILの62ch再生で十分なんでしょうか。音源の方向弁別閾「DL」(どの程度の小さな角度まで音源方向の違いを知覚できるか)をホワイトノイズを音源として調べた実験結果によると、パンの効かない正中面に対しては、最も粗い感度の真上付近でも20°の違い、最もシビアな正面方向では3°の違いまで人の聴覚は識別できるということになります。実験結果の平均を参考にすると、任意の高さに音源を定位させたければ、耳の高さから頭上にかけて4°から16°の間隔でスピーカーを配置する必要がある、ということになります。

ということで、人の音の方向弁別閾を満足するような4π音場再生、すなわち4π空間の好きな音源を配置し確認しながら作品を制作するためには「ものすごい数のスピーカーが必要」ということになります。これは現実的には無理なので、各団体やメーカーが数少ないスピーカーでイマーシブ再生するならこの位置ですよと、それぞれのフォーマットを旗揚げしているのが現状になります。

はたして「少ない数のスピーカーで任意の高さに音像を定位させること」は本当に無理なんでしょうか?ファンタム音像を利用する従来のオーディオ工学では無理ですが、波面合成などの音場再現技術なら可能性が残っていると思われます。作品をチャンネルやフォーマットの縛りから解放し、自由な4π空間といったキャンバスを提供するためには、音場再現技術とコンテンツ制作手法の融合が鍵になってゆくと思います。

「4πチャンネルフリー」マスター音場

音場のゴールはただ一つ「4πチャンネルフリー」ですが、現在のオーディオは様々なチャンネル派閥に分かれています。そして、複数の流派に対応しようとすればするほど、どんどんスピーカーの数が増えることになります。そうであれば、最初からチャンネルに縛られない「4πチャンネルフリー」をスタジオのマスター音場としてはいかがでしょう?特定のチャンネルフォーマットにとらわれない、全てのチャンネルフォーマットを受け入れて変換する4πハブです。特定フォーマットにおける究極の作品制作をターゲットとするのでは無く、作品表現とユーザーの多様性に対応するスタジオ、それがMILです。

スピーカーとは?

「鑑賞」の世界
ボーカルが生々しく聴こえる、楽器のディテイルが聴き取れるなど、そのような観点からスピーカーを試聴評価する機会は多いと思いますし、オーディオの誌面でもそのような試聴評価がしばしば見受けられます。音源素材そのものをパンナーでスピーカーへ直接振り分け、ハードもしくはファンタムで音像を再現する立体音響再生では、確かにスピーカーは音源の代替品としての存在だといえます。例えば、センターチャンネルにダイアログを振り分けることが多い人にとっては、声の再現能力が高いスピーカーがセンタースピーカーとして優秀なスピーカーということになるかもしれません。

ハード定位やファンタム定位による立体音響再生は、スピーカー設置などの「作法」や音像の捉え方などの「聴能力」が聴き手に要求されます。つまり、絵画を鑑賞するような感じでコンテンツと向き合う「鑑賞」の世界をオーディオ通の人たちへ提供する世界です。この場合、スピーカーの価値は、単体でいかに音源を忠実に再現できるか、すなわち音源再生装置としての能力だといえるでしょう。

「体験」の世界
多くの人にオーディオの魅力を分かって頂くためには、音場の一部を切り取って「鑑賞」して頂くよりも、4π音場の自然な世界を「体験」して頂く方が良いかも知れません。その場合、スピーカーは、もはや音源の代替ではなく仮想の壁を模倣するデバイスということになります。そこでは、音源はスピーカーの中には存在しておらず、スピーカーによってつくり出された音場の中に存在することになります。従って、音場再現においては、主張せず気配を殺すことのできるスピーカーが良いスピーカーだということになります。音源の存在を主張する時代から、チームワークとしての協調性が重要な時代へと、スピーカーの価値観も変遷の時期を迎えています。


📸 MILの音場を再現するスピーカーチーム

4πのその先へ …4/3π

4πが音場のゴールだと述べました。MILはゴールなんでしょうか?

4πは全方向(全周)をカバーしており、死角はありません。しかし、 方向情報は完璧でも、そこには距離情報がありません。すなわち、4πだとドーム(球)の表面だけで、球の内側(中身)が空っぽなのです。確かにリバーブなどをうまく使えば、音源の距離感を演出することはできます。しかし、本当の音源距離を再現するためには、球の内部に明確な音源が再現されている必要があります。スピーカーの位置で常に一番大きな音がしているようでは、歩き回ると直ぐに嘘の音源であることがバレてしまいます。

リアルな音場表現は、球の表面だけでは無くその内部に存在します。表面積4πから体積4/3πの音場再現へとMILの修行は続きます。

半径rの球の表面積 = 4πr2(*編注:4πr二乗)
半径rの球の体積 = 4/3πr3(*編注:4/3πr三乗)


MILのような数のスピーカーのスタジオは現実的では無いと思われるでしょうか。では何個のスピーカーなら現実的でしょうか。Dolby Atmosなら7.1.4ch? それとも9.1.4ch? いや11.1.6ch? 11.1.6chなんて誰も家で聴いていないから7.1.4chがベスト? OBAやSBAにおいては、どのチャンネル数がベストかといった答えはありません。スピーカーの数が多いほど、作品の音像定位を正確に確認できるということになります。どの程度正確に音場を把握する必要があるかで、スタジオの再生チャンネル数を決定する時代になってくるのだろうと思います。そうなるまでは、チャンネルフォーマットごとに作品の表現方法を工夫するという芸術と工学の関係は続くのだろうと思います。

【LINK】MIL STUDIOシステム解説

MIL STUDIOシステム解説


 

*ProceedMagazine2022号より転載

SNSで共有
*記事中に掲載されている情報は2022年09月01日時点のものです。