Shibuya	03-3477-1776
Umeda	06-6131-3078

«Solution

Author

前田洋介

［ROCK ON PRO Product Specialist］レコーディングエンジニア、PAエンジニアの現場経験を活かしプロダクトスペシャリストとして様々な商品のデモンストレーションを行っている。映画音楽などの現場経験から、映像と音声を繋ぐワークフロー運用改善、現場で培った音の感性、実体験に基づく商品説明、技術解説、システム構築を行っている。

映画音響技術の基礎解説

NEW!Media 2025年01月16日

映画のダビングとテレビにおけるMAは、同じくコンテンツ制作における音声の最終仕上げの段階となるが似て非なるもの。システム的な違いではなく、音響的な部分や視聴環境に求められる事柄の差異となると奥深く、全容を把握するためには整理整頓が必要だ。ここでは映画音響におけるXカーブ、センタースピーカー、ウォールサラウンド、フィルムに対するサウンドトラックといった、様々な特殊要素を技術的な側面から紐解いていきたい。

MA、ダビング、空間の違い

テレビの番組制作のためのMA室、昨今では配信番組など映像に音声を付けて仕上げる幅広い用途で活用されるスタジオだ。ここに求められるファクターは、音の正確性、解像度ということになるだろう。制作されたコンテンツはどのような環境で視聴されるかはわからないため、作品として100点満点の解答はないとも言えるのだが、そんな中でもMA室はリファレンスとなる環境であることが求められる。できる限り正確な音の再生を行うために、周波数特性、音の立ち上がり、強弱の再現、それらを実現するための吸音処理や反射音のコントロールなどを行い、音響設計をしっかりと行った環境を作り上げ、そこで作業を行うこととなる。

それでは、映画音響の仕上げに使われるダビングステージはどうだろうか？映画館での上映を前提に音響の仕上げが行われるダビングステージ。この空間に求められる要素は、どんな映画館で上映されたとしても再現がしっかりと行われるサウンド、ということになるだろう。映画館には上映用の規定があり、音圧に関しては-20dBfs = 85SPLという規定となる。そして、スクリーンの裏に設置されるL,C,R chのスピーカーに対しては、Xカーブと呼ばれる周波数特性に関わるカーブが存在する。ダビングステージはこれらを再現したスタジオであることが求められる。

また、映画館という大空間での再生を前提とするため、大空間での再生の再現というのも重要だ。MA室であれば、遠くても3ｍ程度に設置されるスピーカーが、ダビングステージでは大きな部屋ともなると10mもの距離になる。そして、部屋が広いということは、直接音と間接音とのバランスがニアフィールドとは明らかに違った環境となる。ニアフィールドであれば、直接音が支配的にはなるが、10mも離れたスピーカーでは間接音も含めてその空間のサウンドになることはご想像いただけるだろう。

とはいえ、映画館ごとに間接音の状況は異なる。ダビングステージとしての最適解は、大空間らしいサウンドを保ちつつ、解像度、レスポンス、特性などの担保を行うという、相反した要素をはらむものになる。間接音があるということは、周波数や位相に対しての乱れが必然的に生まれる。リフレクションが加わるということはそういうことだ。ルーム・リバーブ的な要素が含まれると想像いただければイメージしやすいだろうか。その具合の調整がまさに音響設計の腕の見せどころだろう。スピーカーから飛び出したあとの音響建築的な部分での話になるため、機器の電気的な調整だけでは賄いきれないところ。まとめて言い換えれば、この間接音のコントロールがダビングステージのサウンドにおいて重要になるということだ。

Xカーブに合わせた空間調整

小空間で仕込んだ音を、大空間で再生したときに生じる差異。特に高域の特性の変化に関しては100年前にトーキーから光学録音へと映画が進化したころから問題視されている。アカデミーカーブ、Xカーブと言われるものが、まさにそれへ対処するために生み出されたものである。SMPTE ST-202としてその後標準化されるのだが、これらのカーブの求めるところとしては、測定機での周波数特性と聴感上の周波数特性を合わせるということがそのスタート地点にある。

この映画館における音響特性に関する研究は、まさにJBLとDolbyの歴史そのものでもある。再生機器側の性能向上、収録されるマスター音源のテクノロジー、それらの相互に及ぼしあう影響を、これまでの作品の再生とこれから生み出される作品の再生それぞれに対して最適なものとする100年に渡って継続されてきた歴史であり、この部分も興味深いストーリが数多く詰まっている。中でもDolbyの果たす役割は大きく、ノイズリダクションに始まり、フォーマットの進化、マスター音源の進化など、必然性を持って映画のサウンドフォーマットが形作られ継承されている。

スクリーンの透過特性（スクリーンの裏に置かれたスピーカーの高域成分は、サウンドスクリーンだとしても高域減衰が生じる）、低域よりも高域のほうが距離減衰量が大きいことによって、スピーカーから視聴位置が遠いために生じる高域減衰、空間が広いため間接音による干渉などにより生じる高域減衰。様々な要素によりダビングステージの容積に起因する高域減衰というものは、一般的なスタジオと比較しても多く生じる傾向にある。これは、映画館においても同様であり、その再現を求められるダビングステージでも同じように特性の変化が生まれる。

ダビングステージのスイートスポットにおける特性を測れば、当たり前のように高域の減衰した特性が出現する。しかし、これを電気的にフラットにしようとすることは間違いである。なぜなら、直接音に関してはスクリーンの透過特性、距離減衰の影響は受けるものの、ある程度フラットな特性が担保されているためである。反射音、間接音に起因する高域減衰（位相干渉等によるもの）を含めた特性をもとにフラットな特性を狙ってしまうと、結果的に高域が持ち上がった特性を作ることになってしまう。冒頭でも述べたように、大空間における直接音と間接音のバランスに依っており、大空間になればなるほど間接音の比重が大きくなり、高域が下がってくるということである。

お気付きかもしれないが、スイートスポットにおけるフラットな特性を電気的に補正して作ってしまうと、直接音としては高域の持ち上がった特性になるということである。これは、スイートスポットを離れた、特にスクリーンに近い位置での視聴時に顕著となる。直接音が支配的であり、高域の持ち上がったサウンドをダイレクトに聴いてしまうため、視聴体験に大きな影響を及ぼすことになる。

このような高域の持ち上がった特性とならないように、高域をロールオフしたターゲットカーブを設定し、それに合わせた音響調整を行うようにするのが、Xカーブに合わせた調整ということになる。厳密には劇場の座席数に応じたターゲットとなる周波数特性のカーブが設定されており、座席数の少ないものでは高域の減衰量が少なく、多くなれば減衰量が大きくなる、そのようなターゲットとなる特性が提示されている。

これらのターゲットカーブに関しては、ぴったりに周波数特性を合わせ込むということではなく、スピーカー単体としてフラットな特性で出力した際に、スクリーンや部屋などの影響を受けた上でターゲットカーブに収まっているかどうかを確認するところがあくまでもスタートポイントである。言い換えれば、許容誤差の範囲内に収まっているのであれば、それは想定通りの結果であり、それ以上の補正を行う必要はないということでもある。

小空間における映画作品の仕上げに関しては各所ご意見もあるところだろう。大空間における音響再現が行えていないということは確かにあり、それによって再現性が低いというご意見ももっともである。しかし、上記のようにXカーブの成立を紐解いて見ていくと、フラットな特性で作られた音源が空間の大小にかかわらず、ある一定の聴こえ方をするためのターゲットカーブ、とまとめられる。その視点から考えれば、フラットな特性を持ったスタジオで仕上げられた作品であれば、大空間に持っていったとしても一定の基準内での聴こえ方が担保されているので問題ないとも捉えることができる。

ただし、スクリーンの透過特性という物理的なフィルター分に関しては、やはり考慮する必要があると筆者は考えているが、どちらの意見も間違いではないし、ダビングステージといっても数多の映画館すべての再現となるわけではない。完璧な答えを得ることは難しいが、プロフェッショナルの仕事としてどこまでの再現を求めるのかという尺度になるのだろう。そして、これらのことを理解していれば、より良い作品、そしてバランスを作ることができるということでもある。

100年以上の歴史から、映画の音響に関するセオリーはできあがっている。こちらのほうが良いと言っても、一朝一夕に変わることができない過去との互換性や、大空間での平均化された視聴体験に対しての担保など要素を多彩に含んだテクノロジーの結晶体である。だからこそ映画というエンターテイメントのフォーマットは普遍的なものとして歴史を超えて受け継がれ、エンターテイメントの一つの形として存在し続けている。

映画の必須要素、センタースピーカー

次はセンタースピーカーについてを取り上げる。センタースピーカーはITU基準の5.1chにもあるので、それとは何が違うのかということからお話を進めたい。

映画におけるセンタースピーカーは、映画のサウンドトラックが登場した当初から存在する。その当時はモノラル再生環境、センタースピーカー1本からのスタートしたためである。映画館におけるセンタースピーカーが非常に重要であることは、ニアフィールドでのステレオミックスを中心に行っていると、なかなか気が付かないかもしれない。ステレオ作品であれば、センター定位はファントム・センターとして形作られる。しかし、映画館での視聴を想像して欲しい。きっちりとL,Rチャンネルのスピーカーの中心線に座ることができればよいが、1席でも左右にズレてしまうとファントムで作ったセンター定位はズレてしまう。

ハード・スピーカーでのセンターチャンネルがあることで、劇場内どの席からでもスクリーン中央からのセンター定位を感じることができる。これが劇場におけるセンタースピーカーの重要性のほぼすべてと言っても過言ではない。そのため、映画サウンドトラックの進化の歴史は、モノラルの次は3ch（L,C,R ch）、そして初のサラウンドであるアナログ・マトリクス・エンコードを活用したDolby SR（L,C,R + Sround）、そしてDolby Digital （5.1ch）、Dolby Atmosへと進化している。順を追って見ていくと、センターチャンネルを中心に左右へ広がっていったということがおわかりいただけるのではないだろうか。

このようなことから、映画においてセリフの基本はハードセンターである。よほどのことがない限りこのセオリーを外すことはない。画面に二人登場人物がいるので少し左右にパンを振って、ということを思いつくかもしれないが、前述の通りでファントム定位を使用すると劇場に足を運んだユーザーは着席する座席の位置によって定位が変わってしまう。

そうであれば、やはりファントムではなくハードセンターで再生をする。これは、映画における普遍的なものとして受け継がれている。Dolby Atmosになりオブジェクトという新しい技術が採用され、ギミックとして左右の壁面からも点音源として再生を行うということが可能となり、これを活用した作品も見受けられるが、ストーリーテリングを行うダイアログに関しては、やはりハードセンターは外せない。これまでのチャンネルベース・ミキシングの手法を踏襲したうえで、オブジェクト・ミックスがあるというDolbyの判断は正しいと感じている。劇場での再生を念頭においたミックスだからこその要素となるわけだ。

皆さんは、そのセンターチャンネルがどこに設置されているかご存知だろうか。スクリーンの裏にあるため通常は目にすることのないスピーカーではあるが、その名の通りスクリーンのちょうど中心に設置されている。高さ方向としては、スピーカーの音響軸を高さ方向に3等分した上端から1/3の位置というのが設置基準である。高さ方向に関しては素直にスクリーンの中央とイメージしてしまうところかもしれない。なぜ1/3になったのかという理由を解説している文献を探すことはできなかったのだが、すべての客席に対して音を届けるために高さが必要であったとか、サラウンドスピーカーとの高さを揃えようと考えるとこれくらいがちょうどいいなど様々な推測がある。

ちなみにではあるが、サラウンドスピーカーはスクリーンバックのL,C,Rchと音響軸的に平面に収まるように設置されている。壁面のサラウンドスピーカーの並びをそのまま伸ばしたあたりに、スクリーンバックのスピーカーの音響軸があるということだ。逆に言えば、壁面のサラウンドスピーカーの設置位置は、スクリーンサイズによって上下するということでもある。スクリーンが大きければ音響軸は高くなり、サラウンドスピーカーアレイの設置位置も高くなるということだ。

ウォール・サラウンド

もうひとつ、ITU 5.1chとの大きな違いがサラウンドチャンネルに関してだ。ITUでは点音源での再生となるサラウンドチャンネルが、シネマフォーマットではウォール・サラウンドアレイと呼ばれる壁面に設置された複数のスピーカーで再生されることとなる。デフューズ・サラウンドとも呼ばれるこのシステムは、やはり劇場でどの座席であっても一定のサラウンド感を感じられるように、という意図のもとにその設置が考えられている。

しかし、面で再生されるこのサラウンドチャンネルは定位感のある再生には不向きであり、Dolby Digitalまでの作品ではもっぱら環境音や音楽のリバーブなどの再生に活用されていた。もちろん、これは空間を囲むという意味では大きな効果があり、没入感を高めるための仕組みとしては大きな成功を収めている。Dolby Digital以前のSRではマトリクス・エンコードの特性上、正面に対して位相差を持ったサウンドしか配置をすることができず、まさに音を後方にこぼすといったことしかできなかったが、Dolby Digitalになりようやくチャンネルがディスクリートとなり、イメージした音がそこに入れられるようになったという技術的な進化も大きい。

さらに、Dolby Atmosではオブジェクトが使用できるようになり、点音源としてのサラウンド・チャンネルの活用が可能となった。この進化は大きく、ウォールで再生するベッドチャンネルと点音源で再生するオブジェクト・チャンネルを使い分けることで、音による画面外の表現が幅広く行えるようになった。スタジオ設計側としては、サラウンドも全チャンネルフラットにフルレンジの再生を求められることとなり、サラウンドスピーカーの選定において従来とは異なるノウハウが求められるようにもなってきている。再生環境として求められるスペックが増えるということは、逆説的には再生できる表現の可能性が広がったということでもある。これは進化であり大いに歓迎すべきポイントである。

フィルムに対するサウンドトラック

これらの映画音響の歴史は、まさにサウンドトラックの進化の歴史そのものでもあり、互換性が考えられながら新しいものへと連なっている。フィルムを上映して映像だけを楽しむサイレント映画から、それにレコードを同時に再生することで音を付け加えるという試みへと進化するが、まったく同期がとられていないため、当時は雰囲気として音楽を流す程度といったことが主流だったそうだ。

また、当時は活動写真弁士と呼ばれる映画に対して解説を加える解説者がいた。少し脱線するが、活動弁士という文化は日本独自のもの。海外ではテキストで状況説明を加えることで、映像同士に連続性をもたせることでレコードでの音楽再生のみというものが主流だった。しかし、日本では映画以前より人形浄瑠璃における太夫と三味線や、歌舞伎における出語りなど、口頭で場面の解説を加える、今風に言えば解説ナレーションの文化があった。もちろん、落語に代表される話芸の文化が盛んだったこともこのバックボーンにはあったのだろう。当初は、幕間の場繋ぎとしての解説者だったものが、上映中にもそれを盛り上げるための語り部となり、独自の進化を遂げたというのは興味深いところである。

フィルムで上映される映像と音声の記録されたレコードなどの媒体を同期するということは当時の技術では難しく、いくつものテクノロジーが発明されては消えていくということを繰り返していた。フィルム上にサウンドトラックを焼き付けるというサウンド・オン・フィルム。具体的には、光学録音された音声トラックを映像フィルムに焼き付けるという手法により技術革新を迎えるのだが、光学録音自体の特許登録がなされた1907年から、ハリウッドメジャーが共通フォーマットとして互換性を持ったサウンド・オン・フィルム技術を採用する1927年までに、なんと20年もの歳月がかかっている。その間、レコード等の録音媒体を使用した同期再生のチャレンジも続けられたが、確固たる実績となる技術へとは発展しなかった。サウンド・オン・フィルムの光学録音技術は、映画がデジタル化されDCP（Digital Cinema Package）でのデータ上映になるまでのフィルム上映では普通に使われ続けていくこととなる。

無音のサイレント映画に対してトーキー映画と言われる、映画に音をつけるという技術は瞬く間に普及することになる。1927年にハリウッドで採用されたということは前述の通りだが、その移行は早く、ハリウッドで制作された最後のサイレント映画が1929年ということからも、たったの2年間で時代の主流を奪っている。日本国内は活動弁士という独自の文化があったため、1938年になっても国内制作の1/3の映画はサイレントのままであったということだ。活動弁士の職を奪うということもあるが、贔屓の活動弁士による上映を見るため（聴くため）に劇場に足を運ぶということもあったということだ。今となっては想像することしかできないが、日本における最初期の映画とは人形浄瑠璃などの視覚的なエンターテイメントがフィルムになったという感覚だったのではないだろうか。

トーキー映画が黎明期を迎えてからのサウンドトラックの歴史は、まさに光学録音の歴史と言える。光学録音とは今日DAWなどで表示される波形をフィルムに焼き付けるというものだ。非常に細いスリットに光を当ててその記録を行うというのがその始まりだ。

光の強弱はまさに音の強弱であり、電気信号に変換された音声の強弱を光としてフィルム上に記録するということになる。しかし、ノイズや周りへのこぼれ（光なので屈折や解析などで周辺に溢れてしまう）、高域再生不足、様々な問題に直面し、それを乗り越えるノイズリダクションや、多チャンネル化の技術となっていく。光学録音に対して大きくは、ノイズの低減と高域再生特性の改善がそのテーマとして、様々な方式が出現しては消えていくということを繰り返す。それと並行して磁気記録技術が確立され、映像フィルムに磁気を塗布し、そこにサウンドトラックを収録するということも行われた。これは1950年代頃から70年代にかけてであり、Cinerama、Cinema Scopeといったものがその代表である。フロント3ch、サラウンド1chという仕様が一般的であった。

Dolby Atmosへの道筋

このような様々な技術や規格が乱立する中で、業界の標準となり今でも活躍をしているのがDolbyである。ノイズリダクション技術が世界的に認められ、映画の光学録音の収録などでも活用されていたDolby。1976年に開発されたDolby Stereoはマトリクス・エンコードを活用した2chのサウンドトラックでフロント3ch、サラウンド1ch仕様の4chの再生を可能とする技術として瞬く間に世界の標準フォーマットとなる。少しややこしいのだが、Dolby Stereoは2ch音声の技術ではなく、マトリクス・エンコードされた4chサラウンドの技術である。2trの音声トラックの収録であったことからStereoと名乗ったのだろうが、今となっては少し誤解を招く名称である。

このDolby Stereoを世界中が注目するようになるきっかけとなった作品は「スター・ウォーズエピソード 4 / 新たなる希望」である。このDolby Stereoの特徴となるのが、エンコードされた2chの音声トラックは、そのまま2chステレオで再生しても違和感なく聴くことができるという点。後方互換性を備えたフォーマットであったということは特筆すべきところだ。しかし、そのマトリクス・エンコードの特性から、サラウンドチャンネルに低域成分を加えることはできず、ディレイ処理もエンコード時に加わるため輪郭のあるはっきりとした音をサラウンドに配置することができなかった。とはいえ、このDolby StereoはDolby SR（Spectral Recording）として音響特性を改善させ、多くの映画館で採用されたまさに80年代の業界標準とも言えるフォーマットである。

アナログ時代の真打ちであるDolby Stereoの次の世代は、フィルムにデジタルデータを焼き付けることでその再生を行ったDolby Digitalの登場を待つこととなる。1992年に登場したDolby Digitalは圧縮された5.1chのディスクリート音声をフィルムに焼き付けつけるフォーマットである。しかも、Dolby Stereoの光学2trの音声トラックはそのままに、追加でのデータの焼き込みを可能としている。図版を見ると、パーフォレーションの隙間にQRコードのような図形データとして符号化されたものが書き込まれている。これを読み込み、5.1chの音声を取り出すフォーマットである。

Dolby Stereoの上映館でもDolby Digital上映館でも同一のフィルムで上映できるため、フィルム上映における標準フォーマットとして今日に至るまで標準フォーマットとして採用が続いている。映画館の5.1ch再生のスクリーンは、そのすべてがこのDolby Digitalでの上映と思って差し支えない。もちろん、1990年代にはそれに対抗するフォーマットとして非圧縮の5.1chで高音質を特徴としたDTS、大型スクリーン向けにフロントのチャンネル数を5chとした7.1chサラウンドのSDDS（Sony Dynamic Digital Sound）があった。残念ながら、DTSもSDDSも映画館向けのフォーマットとしては生き残ることができなかった。DTSに関しては、DTS-Xとしてイマーシブを引っ提げて再び映画館に戻ってくる動きもあるのでここは要チェックである。

2000年代半ばに、ネットやコンピューター技術の進化に合わせて映画館での上映が物理的なフィルムから、DCP（Digital Cinema Package）と呼ばれるデータでの上映に切り替わった。現在でも少ないとはいえフィルムでの上映を行っている劇場もあり、やはりフィルムの需要がゼロになったわけではなくDolby Digitalでの制作を行うことが今でも続けられているのだが、DCPであればフィルム上にサウンドトラックを記録するといった物理的な制約もなくなり、ほぼすべてがデータでの上映になっていると言っていい状況だ。

そして、DCPになったからこそ生まれたのが、データ容量が大きいDolby Atmosというフォーマットである。Blu-rayや配信ではDolby True-HDと呼ばれる技術により圧縮が行われているが、映画におけるDolby Atmos Cinemaは、Rendererで収録された最大128chのデータがそのまま収録され、Dolbyのフォーマットとしては初となる非圧縮での劇場上映を実現している。

まだまだ、歴史を紐解くと他のファクターも存在する映画音響に関する様々な特殊要素。ここではその代表とも言えるXカーブ、センタースピーカー、ウォールサラウンド、フィルムに対するサウンドトラックに触れたが、それらすべては大空間において座席に着席して視聴しているすべてのユーザーへより良い音響を届けるために考えられたものであるということを忘れてはならない。

スイートスポットでの視聴はあくまでも制作においての判断を行う場所であり、そこを離れても意図した音響設計が一定以上で再現できる環境構築のために100年の歳月が掛けられたノウハウである。映画の制作に携わることがなければなかなか足を踏み入れることのないダビングステージや映画の音響制作。そこでの考え方や、ノウハウは興味深いものが数多くある。今回の解説が映画音響以外でもサウンドに関わる方にとって何らかの刺激となれば幸いである。

＊ProceedMagazine2024-2025号より転載

SNSで共有

＊記事中に掲載されている情報は2025年01月16日時点のものです。

«Solution

Author

前田 洋介

映画音響技術の基礎解説

関連記事

Related Posts

前田洋介