«投稿
Author
ROCK ON PRO
渋谷:〒150-0041 東京都渋谷区神南1-8-18 クオリア神南フラッツ1F 03-3477-1776 梅田:〒530-0015 大阪府大阪市北区中崎西2-2-1 東梅田八千代ビル1F 06-6131-3078
なぜ今、ラウドネスメーターなのか?
なぜ今ラウドネスメーターなのか?
ARIB・民放連 国内ラウドネス規格策定に関わる 松永氏へのスペシャル・インタビュー
株式会社フジテレビジョン 松永 英一 氏
民放連、ARIBの規格制定に携わられた松永英一さん(株式会社フジテレビジョン)に音声基準としてのラウドネスが生まれた背景と国内基準が出来るまでのお話をいただきました。苦労の滲むお話も多く、国際基準の中で、日本がどのような基準でTV音声を作ってゆくのかを読み解きます。今回は松永さんへのインタビューの模様をお伝えいたします。
現状テレビを見ていて、突然大きな音がしてびっくりした、チャンネルを変えたら音が聞こえなくなった、番宣が入って音が大きくなった、などテレビの音についていろいろと気になることがあると思います。我々としては、こういったことが、視聴者にとって不利益なのでなんとかしたい。そういうことがまず前提にありました。実は、テレビ受像機の一部メーカーは上記の様な放送の実情を緩和し視聴者を保護する目的で、DolbyVolumeなどの技術を利用し、番組間のレベル差、ソースがかわったときのレベル差を解消しようという動きがありました。このような機能がテレビ受像機に搭載されており、メーカーによっては、購入時にONとなっている場合もあり、視聴者は知らずに自動調整された音声を聞いているということになります。
このような機能を搭載したテレビというのは、一見良さそうなのですが、オートゲインコントロールの様なものなので、制作者が意図的にメリハリをつけた部分、意図的に大きく作った部分が押さえられたり、意図的に小さく作った部分が持ち上げられたりと、制作意図に反することになります。しかし、この様な機能がテレビに搭載されてしまったことは、そもそも放送局側でコンテンツの音量管理ができていないのではないか?だとすれば、我々、放送局側が自主規制をするべきではないか?そう考えたのが、きっかけの一つです。
民放連では音声技術研修会という、ミキサー講習会を毎年2月〜3月頃に行っています。その講師の反省会の場で、民放連に対して、『現状の放送音声のバラバラ感を何とかしたい。民放連に音声のレベルに対しての基準がないように感じている、なんとかしたい』と相談をしました。『それならば、ワーキンググループを作って検討しましょう』ということになりました。4度の準備会合ののち、2009年5月の技術委員会でワーキンググループの設置提案をし、ご承認頂きました。それを受けて2009年7月1日から、ワーキンググループを正式に立ち上げました。準備会合時点では在京メンバー(WOWOWは当初から参加)だけで検討を開始していましたが、正式に発足してからは参加メンバーの枠を広げ、在名、在阪のメンバーを加え、更に音声技術者だけではなく、マスターのスタッフを加え、現在は、19名の委員とオブザーバー1名でワーキンググループの活動を行っています。
ワーキンググループが目指すこととは、まずは、「番組ごとのレベルを統一しなければいけない」というのが、一つの大命題となります。もう一つは、「放送局間のレベルをあわせないと、結局のところは、また意味のないものになってしまう。」ということ。放送局間の問題に関しては、日本放送協会(NHK)との協力が不可欠であり、ワーキンググループの検討と平行して日本放送協会(NHK)とも話し合いを行なってきました。
2011年7月に停波した従来のアナログの放送では、FM変調で実質50Hz~12KHz程度に帯域制限をして放送していました。また、放送音声にピーク成分があると映像に影響が出るといった問題もあった為、送出段にLim/Comp機能を有したオートレベルコントローラーが組み込まれていました。さらにその後段に、完全にピーク成分をカットするソフトスライサーが設備されていました。その為、あくまでも結果論ではありますが、素材がばらついていても送出段階で、ある程度が抑制されていました。
しかし、デジタル放送ではこの様なレベル抑制のための機器を通さず、そのまま送出のTS(TRANSPORTSTREAM)と呼ばれるデータに変換してしまうのが一般的です。デジタル放送のメリット活かす為には、送出段階でのレベルコントロールはできる限り行いたくない。ということは逆に、素材の音量差がそのまま放送波に乗ってしまうということなので、これは非常に大きな問題を孕んでいます。2011年7月24日の完全デジタル化に向けて、危機感を募らせていました。
今まで、民放連には一般番組に対しての音声レベルに関する基準がありませんでしたので、各社、各系列ごとに個別に運用規定(社内ルール的なもの)を作って運用していました。各社とも0VUという目安はありましたが、それをどう運用するのかという決まりはなく、唯一、CM素材だけはサイマル放送時の暫定版の搬入基準があって、『0VUを厳守。超えた場合にはリミッター等で、ひずむ可能性があるので注意するように』との記述があります。
民放連としては、『0VUを厳守。』はVUメータのピーク値が0VUという短い測定区間で算出される意味合いで規定していたのですが、CMで0VUを上限としラウドネス値て守っているものがほとんどないのが実情なのです。実際に、CMの制作関係の方にお伺いしたところ、『平均値で0VUをこえなければいいのでは』という解釈をされている方もいらっしゃるという状況です。
そもそもVUメータは単なる電圧計でしかなく、人間の感覚と同じとは限らないものなのです。アナログメータなので、見る角度によっても読み取り誤差が生じますよね。また、瞬時値を測っているので平均的なレベルに関しては、そもそも確認できないメータなのです。ご存知のように、人間の耳はf特を持っているので、(これは等ラウドネス曲線が有名です。)f特がフラットなVUメータではそもそもレベルを揃えることは無理だと考えています。
もちろんワーキンググループの立ち上げの当初は既存の放送設備でなんとかできないかと検討を重ねたのは事実で、VUメータとPeakメータでなんとかしたいと考えていました。しかしながらVUメータには前述のような限界があり、ITU-R BS.1770で規定されたラウドネスvsVUメータで音量問題を解決するのにどちらが有益なのか、実証実験を行いました。その実験結果を受けてVUメータで音量規定するのは無理だという判断をくだし、ラウドネスへ方向転換しました。(VUメータだけでレベルをあわせても聴感には等ラウドネス曲線のf特があるので、フラットな特性の番組とハイ上がりのCMではまだ、明らかな音量差が残ってしまいます。もちろんCMだけでなく最近では、バラエティーなども固い音が増えてしまっているのが現実なのですが、これはCMに引っ張られてそのような音作りをしてしまっている、というのが現状だと思います。
このようなテレビ放送における音量問題は世界共通の課題であり、ITU(国際通信連盟)では2000年位から研究を始め、2006年にRecommendを発表しました。これにはラウドネス測定のアルゴリズムとメータの要求用件(ITU-R BS.1770と1771)が発表されています。この発表以前に国内でも、日本放送協会(NHK)とヤマキ電気株式会社が共同開発したラウドネスメータもあり、ITUでも一つの方法論として検証、検討がされました。永年にわたる研究の集大成が、このITU-R BS.1770(ラウドネス測定のアルゴリズム)と1771(ラウドネスメータの要求要件)なのです。これが、ラウドネスの出発点となっています。
ラウドネス測定アルゴリズムとラウドネスメーターの要求要件が決まったことで、運用方法の検討が始まりました。多くの時間を費やしましたが、2010年3月にITU-R BS.1864「デジタルテレビ放送用番組の国際交換におけるラウドネス運用規準」が発表されました。内容は、-24LKFSで国際番組交換を実行するというもので、世界的なラウドネス運用の流れのスタートとなりました。
欧米の動向としては、アメリカではITU-R BS.1864に先駆けてATSC A85としてラウドネスの運用規定を制定しています。このATSC A85のITU-R BS.1864との違いは、変動幅の解釈の違いであり、ITUではターゲット値に対して、変動幅を最大2dBと記述していますが、アメリカ(A85)では±2dBとしています。ちなみに、日本(ARIB)とヨーロッパ(EBU)はターゲットラウドネス値±1dBとしています。この点が唯一の違いです。ヨーロッパも2010年9月にR-128「ラウドネス標準化と最大許容音声レベル」とTech3341「R128に準拠したメータの要求要件(EBUモード)」を発表しました。
EBU の発行するラウドネス基準と技術資料
・R128:Loundness Recommendation(2010.09)
・Tech3341:Metering specification(2010.12)
・Tech3342:Loundness Range descriptor(2010.12)
・Tech3343:Production Guidelines(2011.02)
・Tech3344:Distribution Guidelines(2011.04)
アメリカでは「A85」を運用中ですが、もう一つ大きく影響しているのが、CALM法案です。この法案はCMの音声に対しての音量規制法案で、罰則規定があるのが特徴です。2010年12月15日にオバマ大統領が調印したもので、一定の周知期間を持って実施される予定です。簡単に言えば、番組よりもCMの方が大きくてはいけないということなのですが、世界で初めて、テレビ音声に対しての罰則法案ということで、戦々恐々としているようです。また今年、フランスでも同様の法制化の動きがあったようです。
ヨーロッパでは、EBUP-Loudと呼ばれる団体が音量問題の研究を行っています。このP-Loudは各国の放送局だけでなく、メーカー(例えば、TCelectronicやRTW)などの有識者も参加し、150人規模の集まりで、そこで、R-128などの策定を進めていました。そこからは、ラウドネスレンジ(ダイナミックレンジのラウドネス版のようなもの)という考え方も提言されています。ラウドネスレンジに関しては、ITUでの検討は始まったばかりという状況です。実は、モーメンタリ・ラウドネスや、ショートターム・ラウドネスに関してもEBUから提案されITU-R BS.1771の改訂という形でこれから国際照会されると聞きました。また、EBUでは運用のガイドラインとしてtech3343や、tech3344といった、技術資料を配布しています。運用開始に関しては、P-Loudの議長のフローリアン・キャメロン氏(ORFオーストリア放送協会)は、2012年1月から始めたいと、各加盟国に対してアプローチを行っているそうです。キャメロン氏は、2010年に開催された、InterBEE2010にプレゼンターとして来日されました。
さて日本ですが、1997年からNHKが聴感心理モデルを採用したラウドネスメータ開発をヤマキ電気株式会社と行ったことが、近年のラウドネス研究に関する大きな動きだったと思います。ARIBもこの問題には早くから着目し、検討を行なっていたようです。民放連では、2009年7月に「テレビ音声レベルWG」を立ち上げ、検討を開始しました。当初は、VUメーターでの運用を考えていたのですが(このご時世、なるべく既存の放送設備で何とかできないか模索)、各種検討の結果、無理だということが分かり、ITU-R BS.1770で規定されたラウドネスに方向転換をしました。これは、等価騒音レベルの変化形でありK-Filterを使用したアルゴリズムで、音声モード(モノ、ステレオ、サラウンド)に関係無く測定結果として一つの値が出るようになっています。その測定値を合わせることによって番組の音量感が揃うという訳です。
我々、民放連としては、「ラウドネスで行く」という方向性が決まったので、規準作成に着手しました。目的の一つめの「番組間のレベルの統一」は、民放連加盟各社では実現出来るだろうと考えましたが、日本放送協会(NHK)とのレベル差については、課題として残ります。そもそもNHKと民放各社のアライメントレベルが2dB異なっており(NHK:-18dBFS/民放連:-20dBFS)、同じVUレベルで制作した場合、NHK制作番組は2dB高く出てきてしまうというのが現状です。このことを含め、同一の基準でラウドネスによる運用を行えば放送局間のレベル差は解消するので、是非とも民放連とNHKの協力体制を構築したいと思い、2009年12月から、意見交換を始めました。最初は、有志の非公式会合として話し合いを重ねました。その流れの中から、ARIBに対し、「国内基準を作れないか」という話を持っていきました。もちろんNHKの同意のもとで、ですけどね。
その頃は、私もARIB「スタジオ音声作業班」の委員になっていたのですが、2010年6月に提案をして合意を得ましたので、8月頃からARIB基準の策定作業に入りました。その中で大きかったのが、2010年10月のITU会合で、ITU-R BS.1770-2に改訂が決まりそうだということでした。
半年に一度開かれるITU会合には、日本からも20名程のメンバーで行くのですが、通例として民放連からも3名が行くことになっています。2010年10月のITU会合は、ITU-R BS.1770の改訂提案の審議が行われることが解っていて、今回の会合がその山場でした。民放連から参加する3名に事前にお集まりいただき『今回のSG6(WP6C)会合ではラウドネスに関する大切な改訂提案の審議が行われるので、参加して意見を入力してほしい』とお願いをして送り出したんです。ITU会期中も国際電話で、会議に出席したメンバーと情報交換しながら意見入力をしてもらったんです。議題の一つであったオーバーラップについても、EBUからの提案では50%だったんですが、それを75%にして欲しいと意見を出しました。これは、国内のCMには前後に0.5sの無音部分があるんですが、400msの50%だと200msでのオーダーとなるので、測定誤差が大きくなってしまいます。測定誤差を小さくする為に、民放連からは400msの75%を提案しました。その結果かどうかはわかりませんが、75%で合意、EBUからG8で提案された相対ゲーティングに関してもG10で合意に至りました。
以降、3ヶ月間の国際照会期間を経て2011年3月にITU-R BS.1770がITU-R BS.1770-2に改訂されました。今回のITU-R BS.1770-2の国際標準化に対してエミー賞が贈られたそうです。世界的にそれほど大きなインパクトと成果をもたらす決定であったことが伺えます。この決定にあわせ、EBUもR-128を改訂しG8であった相対ゲーティングを国際基準にあわせたG10に、オーバーラップも50%から75%に変更しています。
ARIBでは、2010年8月からラウドネス基準策定PGで基準の策定作業に着手しました。当初は、議論が先行していたEBUモード(R-128)で行こうかという話もありましたが、1770の改訂が行われることが解っていたこともあり、国際規格であるITUに準拠することとしました。当初は色々と悩みましたが、今はEBUにぶれなくてよかったと思っています。1770-2の改訂内容は熟知していたので、ARIB TR-B32で記述したラウドネス測定アルゴリズムはITU-R BS.1770-2の和訳に近いものになっています。運用ルールは、ITU-R BS.1864に準拠しました。2011年2月にドラフトを終え、承認作業に入りましたが、親会の審査では一言一句注文が入るような状況になり非常に苦労をしました。一度は、ムリかとも思うくらいつらい作業だったのですが、なんとか2011年3月28日の規格会議への提案にこぎつけました。これもITU-R BS.1770-2が2011年3月8日に国際承認されたことが非常に大きく、ITU基準に則ったものとして2011年3月28日にARIBで承認、制定されました。
私が、ARIBスタジオ音声作業班、民放連テレビ音声レベルWG、両方の委員だったこともあり、民放連規準の策定作業も、ARIBに歩調を合わせることが可能でした。ARIBが決まったらその方向性でいこうという事は、民放連WG内でコンセンサスが取れていました。民放連には総則というものがあります。このポリシーに則って技術基準が制定されました。
民放連T032の運用においては、民放の特殊事情ですが、番組よりもCMのほうが問題となることが予想されました。番組は各局に個別に入稿されますが、CMは同じ素材がコピーされ各局にばら撒かれます。どこの局で掛かるかわからないので、同じ素材がA局では納品OKだが、B局では規格外で改稿なんて事態が発生する可能性がありました。なのでCM素材搬入基準は民放連で統一しておかなければならないと思い、NHKへの打診と同じくらいのタイミングで、民放連営業委員会にも話をしました。事前に話をしておいたということもあり、営業委員会の方で決めているCM素材搬入基準は、我々の基準に沿ってやってもらえるということになりました。
と、ここまでは良かったのですが、また、営業委員会というのが一筋縄ではいかない。やはり営業という立場からか、総則に書かれているポリシーは理解してくれても、それでは仕事にならないと、なかなかそれぞれの立場で難しい事が多くあります。NAB技術規準T032は、提案のタイミングを図っていたのですが、ITU-R BS.1770-2が2011年3月8日に国際承認され制定、それを受けてARIBも近日中に承認されるということで2011年3月10日の技術委員会に提案しました。この3月10日というのもまた、絶妙で3月11日の東日本大震災の前日なんですよ。一日ずれていたら、技術委員会は2ヶ月に1回しか開催されないので2ヶ月平気で遅れていたということになります。
提案後、速やかに民放連加盟全社、NHK、JPPAに意見照会を行うのが常なのですが、震災直後の東北に答申を出すのはどうかということもあり、遅れて4月に答申を出しました。5月19日の技術委員会に最終提案を行い、承認され制定されました。CM素材搬入規準も同日に開催された営業委員会で承認、制定されました。
民間放送連盟 技術基準 T032 総則
・テレビ放送における音声は、視聴環境を考慮して制作するべき であり、視聴者に違和感や不快感を与えてはならない。
・本技術規準は、テレビ放送用の番組が視聴者にとって適正で統 一された音量・音質で制作・放送されることを目的とし、ラウド ネス(人が感じる音の大きさ)という概念を用いて測定する。
・なお、本技術規準の順守によるラウドネスメーターの整備など 運用に向けての準備が必要であるため、適用開始時期については 別途定める。
適用範囲は全ての完成番組(オンエアするすべての素材)としており、制作途中の素材は適用外となっています。CMだけ、番組だけでもダメだということで、全てのオンエアされるものを対象としています。また、ARIB TR-B32に準拠したものであり、レベルは-24LKFS±1dBに決まりました。民放連では、それ以外に標準音源というものを作成して、その音源との比較も追加しました。これは民放連HP上で、無償配布を行う予定となっています。
また運用面でも、ARIB TR-B032に準拠したラウドネスメータで番組を測定し、測定結果を納品物の添付書類に必ず明記するよう規定しています。重要な許容差(プラスマイナスの解釈)については、あくまでもターゲットは-24LKFSとし、±1dBについては、やり直しの出来ない生放送や、メータの測定誤差に対応するための±1dBということで、決して-23LKFSで納品しても良いという事ではないということは、今後、理解を広めていきたいと考えます。
ARIB TR-B032には、”「例外」として、「創造的な制作要求」が最優先される番組の場合、ターゲットラウドネス値を下回る値を目標として制作することが出来る”とありますが、T032では下限値を-28LKFSに設定し、小さすぎるレベル差にたいしても規定を行なっています。ただし、例えばフィラーや、BGVみたいに低いレベルの方が相応しい物は、-28LKFS以下で制作しても良いが、添付書類に理由を明記して下さいということにしてあります。(-28LKFS以下の番組が納品された場合、納品された局側で演出意図なのか、制作過程のどこかのミスで低くなってしまったのかの判別がつきにくいので、その旨を明記して欲しいというお願いです)
これが、一番揉めたところです。国内の場合はARIB STD B-21という受像機の規格があり、ダウンミックスステレオの場合(通常のステレオ受像機で視聴した場合)には全体係数1/√2が係り3dBさがりますので、明確な規準を提示しにくかったので、最初は記述しない方向で進めていました。しかし、営業委員会との話し合いの中でサラウンドを規定してくれないとサラウンドのCMは制作できない、規定に加えることはMUSTだと強く要望されました。今回策定した概要は、ダウンミックスステレオを測定するのではなく、LFEは除く5.0chで測定すること、国際番組交換を行う際はITU-R BS.1864に準拠して-24LKFSでの受渡しをすること、などです。
ただし、国内の場合は、ARIB STD B-21により、ダウンミックスステレオが3dB下がりますので、それを考慮して暫定措置で「ターゲットラウドネス値+2dBを最大許容量とする。」と規定しました。これは、両面があり、ステレオで聞いている人に対しては、サラウンド番組は若干低い状態。サラウンドで楽しんでいる方にはサラウンド番組が若干高い状態となりますが、苦肉の策として両方の視聴者にあまり祖語のない方法を取りました。ARIB STD B-21がある以上仕方が無いのですが、これは、問題点として残ってしまっています。
視聴する環境の暗騒音のレベルによって、聴こえる音の範囲は異なります。T032では「一般家庭の視聴環境を想定して、制作して欲しい。ホール、劇場などの比較的静かな環境での再生を考慮して制作された作品は、そのまま使用するのでなく、テレビ放送用として最適化することが望ましい。」と願いを込めて、記述しました。例えば、静かな劇場と暗騒音の高い渋谷の街角では聞こえ方、聴こえる部分が全然違うということです。家庭はその中間でしょうか。
映画関係の方には是非ともご説明したいと思っています。映画は劇場公開が前提なので、平均変調レベルが低いのですがピークは高い、ダイナミックレンジは広大です。劇場公開用としては正解なのですが、そのままテレビで放送すると、もちろんクレームになります。聞こえないとか、CMが大きい、など。要するに、番組とCMのレベル差がものすごいことになってしまうという訳です。最近では、パッケージ用、テレビ用に別ミックスを用意している場合もありますが、そうでない場合に問題になっています。ラウドネスとは別の話ですが、現状の放送上の問題点として規定させて頂きました。
自局の話で恐縮ですが、問題提起です。もちろん局から、局へ番組を売る場合のことですが。T032の適用開始後に制作された番組は問題ないと思いますが、適用開始後も、番販では過去素材を販売することがあると思います。フジテレビから番販する場合は、過去の作品も全て再測定を行い、-24LKFSに合わせて、納品して欲しいと関係スタッフに話をしているところです。キー局からもらった素材だから大丈夫だろうということで、オンエアされて、レベルが規格外だったら、目も当てられませんからね。もちろん、実際に行うのは、運用が始まってからの話ではあるのですが、今から下準備を始めています。
Q&A
Q:なぜ、K-カーブなのか?
A:これは、人間の感覚に沿ったメータでなければならないのですが、メータの作りやすさということも選択の理由になっていると思います。K-カーブは2段の単純なIRフィルターで構成されているだけですので、メータの設計は楽だと思います。厳密に等ラウドネス曲線に合わせようとすると、音圧レベル別にカーブを変更しなければなりません。これは、非常に困難で現実的ではありません。
Q:映画で使用されている、m-カーブを採用しないのはなぜでしょうか。
A:m-カーブはこのあとの高木さんにお任せするとして、このカーブは、ダイアログ中心に考えられたものですよね。当然テレビ番組はダイアログが中心の番組が多いのですが、音楽番組、ドキュメンタリーなど、その他の要素が多い番組もあり、一つの基準で全ての番組を制御するときに等ラウドネス曲線により近いk-カーブが採用されたのだと思っています。あくまでも私見で、根拠はありません。
Q:運用開始後の希望は?
A:とりあえず、視聴者がボリュームコントロールをしなくていい世界になってほしいです。
とはいえ、まだまだ課題は多く残っています。民放連の加盟社は現状、地上波とBS放送までであり、CSやCATVなどは非加盟です。(新規参入のBS放送局も非加盟)CATVも非加盟ですので、全くT032適用範囲外です。さらには、インターネットやDVD。ゲームなど様々な媒体にも、それらの出力レベルが統一されていません。多くの課題がありますが、テレビ受像機を使用する全てのコンテンツのレベル差がなくなるといいですよね。
Q:これから、オーバーコンプ、オーバーEQが通用しなくなる。本来のナチュラルなサウンドを届けられるようになるのでは?
A:本当はそれが言いたいのです。デジタル放送はCD並以上の音が出せるのです。この事を有効活用できるような基準を作りたいと思いました。もっと豊かな音を作りたい、家庭にお届けしたいという思いがあり、今までのCMにレベル負けしていたような自然な音の作り方でもしっかりと出せる。変に意図的に音をいじらなくてもよくなるということです。そんな放送にしていければというのがT032の裏に隠れた我々のねらいです。
松永 英一(株)フジテレビジョン 技術局 制作技術センター
制作技術部 エグゼクティブ・エンジニア
1997年のフジテレビ本社のお台場への移転、2007年の湾岸スタジオ新設において音声設備の構築を行った。また、20年以上に渡り、民放連音声技術研修会の講師も担当している。
現在はエグゼクティブ・エンジニアとして、後進の指導を行っている。
1979年 (株)フジテレビジョン入社 放送部に配属。マスター、回線系を担当
1981年 制作技術部音声に異動 以降、一貫して音声業務に従事。その間「ミュージックフェア」、「僕らの音楽」などの音楽番組、「夕やけニャンニャン」「クイズ・ドレミファドン」「なるほど!ザ・ワールド」などのバラエティー番組及びドラマ、映画の音声を担当
1999年 文化庁芸術祭優秀賞受賞ドラマ「少年H」の音声を担当
2002年 バレエ「ドラゴンクエスト」で日本プロ音楽録音賞放送部門優秀賞受賞
2009年 民放連技術委員会の下部組織である「テレビ音声レベルWG」の主査を担当
2010年 ARIB「スタジオ音声作業班」に委員として参加
2011年 3月に制定された ARIB TR-B32 策定にもPGリーダーとして参加