Honza Košulič: Norma hlasitosti EBU R128, svazuje nebo pomáhá?

Kategorie: Studio - VIP

Ondřej Jirásek | 29. září 2017

Honza Košulič z Nahrávacího studia Divadla na Orlí má na kontě "kupy" CD i "kupy" projektů pro rozhlas, televizi ad. Častokrát jsem ho slyšel ohnivě diskutovat o nové normě hlasitosti, o EBU R128. Rozhodně ho aktivně zajímá. Rozhodl jsem se udělat s ním - povolaným interview právě o ni.

Kategorie: Studio - VIP

Ondřej Jirásek | 29. září 2017

Témata: cubase wavelab

Jak dlouho mícháš a “mástruješ“ podle EBU R 128?

Úplně ji nevypínám tak poslední dva roky, možná tři. Dřív to po nás nikdo nechtěl. Špičkové hodnoty jsme si hlídali vždycky všichni, ale že bych třeba měřil programovou hlasitost CDčka předtím, než jsem ho odeslal do lisovny, to jsem nedělal. Teď už to dělám, i když to po mě nikdo nechce.

Kam konkrétně odevzdáváš své práce, které organizace to vyžadují?

Pokud vím, vyžaduje to po nás jenom Česká Televize. ČT má dokument, který se přímo jmenuje něco jako Všeobecné podmínky pro přijímání obrazových a zvukových mastrerů. Požaduje zvukové mastery tak, aby odpovídaly EBU R 128 s hlasitostí -23 LUFS (Loudness Unit Full Scale) a maximálním povoleným True Peak -3 dB. Ošemetné ale je, že když takto zvukař pořad vyrobí, není v této podobě odvysílán. Na vysílacím pracovišti mají totiž nějaký průměrovací kompresor, který hlasitost znovu změní. Takže ČT zatím spíš dlouhodobé vytváří normalizovaný archiv a momentálně to, co slyší posluchač/divák ve vysílání, není master ten, který odevzdal mistr zvuku a který by odpovídal normě. Pouze na vybrané pořady se tahle průměrovací krabička vypíná.

Co mně je známo, tak v poslední době to byly například přímé přenosy z Pražského Jara. To proto, že kompresor s dlouhými reakčními časy velmi znehodnotí vážnou hudbu, ve které se například objeví fortissimo úder na tympán, kompresor se zavře o 6 dB a minutu se postupně vrací zpět, což nezní úplně pěkně. Z produkce brněnského studia, kterou jsem dělal já, tak byl takhle odvysílaný například záznam koncertu Filharmonie Brno Schnittkeho Concerto grosso č. 2 a … Osmá. Po dlouhé debatě ném bylo povoleno, že tenhle processing bude vypnutý. Například ale záznam koncertu Avishai Cohen s Filharmonií Brno tenhle processing vypnutý neměl. A hned se k nám dostaly ne příliš pozitivní ohlasy na dynamiku. Je to prostě orchestrální hudba a přestože odevzdaný master odpovídal EBU R128 a měl požadovaný dynamický rozsah, prohnaný nevhodně nastaveným kompresorem zněl podstatně hůř.

Jaké jsou nejčastější žánry, co odevzdáváš?

Vážná hudba, jazz, pop, rock spíš méně, loni jsem dělal pro televizi folkový seriál Folk factory.

U každého žánru je doporučená hlasitost individuální?

Doporučení není příliš direktivní. EBU R128 neříká, že něco konkrétního takhle musí být, kromě mezních doporučených hodnot jako například maximální povolený True Peak. Takže metalové CDčko s maximálním Peakem – 0,2 dB samozřejmě normě odpovídat nemůže. Ale pokud bychom v téhle tendenci drsného stlačování pokračovali, tak budeme sami proti sobě, poněvadž ztrátové formáty jako MP3 nebo AAC mají velmi nerady jakýkoliv kliping. A lepší výsledky tyhle kodeky dávají, když nahrávky mají naopak dostatečný head room. Takže držet se pravidla, že maximální True Peak je -1 dB je super. Bez ohledu na to, jestli jde o metal, rock ad. Krom toho všechny online služby, přes které dnes posloucháme hudbu, mají obvykle nějaký normalizační prvek typu iTunes Sound Check, který bez ohledu na to, jak nahlas mistr zvuku nahrávku nastaví, provedou korekci na pomyslném master faderu a posluchač to slyší všechno stejně nahlas.

Odevzdáváš i formát MP3?

Ne. Nikdo to po mně zatím nechtěl. V digitální distribuci se dnes požadují "wavky", Apple je chce navíc ve vyšším rozlišení. Mistr zvuku proto předává formát "wave" a labely/služby si všechny ztrátové formáty generují samy. iTunes dnes ideálně chtějí 96 kHz/24 bit. Záměr je točit vše ve vysokém rozlišení, provést i analogovou postprodukci i master exportovat ve vysokém rozlišení. Jednak kvůli přidané estetické hodnotě, ale také aby suroviny byly pro zrátové formáty přívětivější.

V jakém programu měříš a nastavuješ finální hlasitost? Proč ti vyhovuje?

Pro své soukromé účely používám nástroj HOFA Inter Fader. Důvod je jednoduchý. Je zadarmo, funkční a pohodlný. Česká televize, kde občas pracuji na postprodukci, tak má TC Elektronic LM6, ale ten pouze měří. Neumí tu takzvanou normalizaci na cílovou programovou hlasitost, což jsem vyzkoušel. Je na to dnes k dispozici software firmy Izotope Loudness Control, který je součástí balíku Izotope RX Advanced. Funguje to výborně. Vy řeknete plug-ině cílovou hlasitost, ona asi hodinový záznam asi tak půl hodiny počítá a má v sobě integrovaný poměrně kvalitní True Peak limiter IRC3 (Inteligent Regest Control, se ten limiter jmenuje, který známe z Izotope Ozone, ten je v téhle plug-ině integrován) a ona provede normalizaci. Buď v toleranci, to je rychlejší, ale nedostanu naprosto přesnou cílovou hodnotu, což obvykle není potřeba. Pokud bych chtěl, tak ten propočet umí udělat přesněji. Trvá to déle a vyplivne konkrétní přesnou cílovou hodnotu programové hlasitosti. Problém je, že tahle plug-ina pořád stojí nad deset tisíc korun.

Když si jako zvukař zvyknete pracovat s vhodně nastavenou hlasitostí poslechu, naučíte pracovat tak, že znáte hlasitost vlastního poslechového zařízení a podvědomě si pamatujeme cílovou hlasitost, kterou po vás někdo chce. Pak se výsledná korekce hlasitosti pohybuje většinou v desetinách decibelu. To znamená, že když potřebuju udělat master -23 Loudness Unit Full Scale, tak vím, že nastavím-li si nějak nahlas poslech v režii, tak se na několik málo desetin Loudness Unit trefím, aniž bych to měřil. Tím pádem nepotřebuji drahý software, který za mě provede ruční normalizaci. Protože pak to změřím, provedu velmi snadno rychlou korekci a můžu odesílat.

Jakou integrovanou hlasitost nastavuješ? Těch -23 LUFS? Anebo jinak?

ČT vyžaduje -23 Loudness Unit Full Scale. Ale EBU sama naznala velmi rychle, že pro všechna mobilní zařízení je to vlastně potichu, že se tahle úroveň hodí do digitálního vysílání, ale pro mobilní telefony, pro tablety, notebooky je to vlastně potichu. Ve vážné hudbě, kdybychom odevzdali CDčko s úrovní -23 LUFS, tak nám ho možná nikdo nevrátí. V oblasti už Jazzu je -23 Loudness Unit Full Scale beznadějně potichu. -19, -18, -15, -12 to už může být dost, ale pořád to není nic kritického, žádná šílenost.

Vyžaduje vůbec některá organizace striktně -23 LUFS?

Česká televize v každém případě chce master, který má -23 LUFS. Většinou tuhle cílovou hodnotu vyžadují přesně. Pokud to neuděláte přesně vy, tak tam je technik, který korekci provede sám. Když odevzdáte například -23,4, tak to technik buď tak nechá, nebo to o trošku zesílí a v zásadě je to v pohodě. Vzhledem k tomu, že tato hodnota je tak jako tak závislá na charakteru programu, tyhle malé odchylky jsou poměrně bezvýznamné. Pokud například dostanete do pořadu České televize od externího člověka smíchanou písničku, která je nahlas, tak vy jako mistr zvuku pořadu, který má tu písničku do pořadu zakomponovat, tak ji samozřejmě ztlumíte tak, aby v pořadu dramaturgicky fungovala a aby programová výsledná hlasitost byla v pořádku. Takže tam v žádném případě k přijetí hlasitějšího masteru nedojde a skutečně, když odevzdáte –22 nebo -20, technické oddělení vám master vrátí, že je špatný. Vůbec se s vámi nebudou bavit.

V pořadu, kde je minimum ticha, je to samozřejmě jedno. V pořadu, kde nějaká ticha jsou, tak by programová hlasitost padala směrem dolů. Myslím si, že měření dynamické rozsahu je velmi nápomocné, ale asi se sem hodí pořekadlo, že je to velmi dobrý sluha, ale zlý pán.

Kdy je dobrý sluha?

Když chci udělat nahrávku, o které vím, že ji budou poslouchat lidi v tramvaji na sluchátka od mobilního telefonu nebo na ulici přímo z repreáku mobilního telefonu, tabletu nebo počítače anebo třeba doma, když si budou vařit kafe, tak velký dynamický rozsah, velký Loudness Range není žádoucí. Prvky jednotlivé hudební struktury bez ohledu na žánr se můžou ztrácet zamaskovány hlukem pozadí. Menší dynamický rozsah je velmi výhodný, protože sice na TOP reprosoustavách a kvalitních sluchátkách estetický požitek může být menší. Vím-li ale, že nahrávka není cílená pro tyhle posluchače, ale naopak je cílená do hlučných prostředí, tak nižší dynamický rozsah může být výhodou. Naopak, pracuji-li na záznamu vážné hudby a v půlce prací zjistím, že dynamický rozsah je 12 Loudness Units, tak jsem možná někde při kompresi udělal chybu, protože vím, že to číslo je příliš nízké, a že pokud ta hudba není extrémě dynamicky plochá z kompozičního hlediska, takže bych se měl jít projít a zjistit, jestli slyším to, co skutečně chci. Velmi svazující může být, když budu zadávat cílové hodnoty, které neodpovídají žánru.

Česká televize má ve svých všeobecných podmínkách Loudnes Range menší nebo rovno 23. To je velmi hodně. V obýváku večer při večeři pak nemusíme vůbec rozumět struktuře hudby. Na druhou stranu u některých pořadů po nás vyžadovali i podstatně hlasitější hodnoty, i kolem 15 Loudness Unit. A to dochází pro vážnou hudbu ke značnému stlačení - kompresi. Už dojde ke slyšitelnému estetickému znehodnocení. Ale je-li to pořad cílený na 19:00 večer, kdy ho uslyší posluchači u večeře, OK. Je asi v pořádku provést nějaké znehodnocení, přestože vím, že hifista nebude nadšen, ale 99% diváků je na takovou úpravu naučena, vlastně ji očekává. Je-li ale pořad cílený na 23:55 na ČT Art pro specializované posluchače, kteří se buď budou na tuhle věc dívat na iVysílání, anebo v noci v klidu se sluchátky nebo kvalitními reprosoustavami, pak je takový požadavek nesmyslný. To mi přijde přesně příklad toho, kdy může být aplikace nějakého maximálního povoleného rozsahu hlasitosti velmi špatným pánem, protože to tu hudbu prostě znehodnotíme.

Pomáhá ti tedy rozsah hlasitosti (LRA) nebo tě svazuje? Individuální maximální LRA přeci závisí na žánru a konkrétním technikovi, že?

Zatím se mi asi nestalo, že bych dostal požadavek na 2 různé vnitřní hlastosti stejné skladby. U nás si to ještě po mnoho let nedovedu představit, protože tento způsob uvažování je nám dost cizí. Velmi často jde totiž cílová skupina ruku v ruce s žánrem. Když budu míchat mainstreamový jazz, půjdu po trošku nižším dynamickém rozsahu, než když budu míchat jazz velmi experimentální. Tam ten, kdo to bude poslouchat, nebude překvapen velkým dynamickým rozsahem nahrávky.

Ale přeci, přeci jen dělal! Teď si vzpomínám! Určitým příkladem může být kombinovaný záznam, který má zvukovou verzi pro televizi a zároveň má verzi pro rozhlas. V rozhlase po nás dneska nikdo nechce žádné cílové hodnoty a dochází k tomu, že se dělá úplně samostatný ne master, ale dokonce mix. To má ale trošičku jiné pozadí než jenom EBU R128 dynamický rozsah a hlasitost. Je to především o tom, že u zvuku doplněném obrazovým vjemem chceme slyšet něco jiného, než když obrazový vjem chybí.

Kupříkladu v detailu prozáběrovná symfonie, kde na obrazovce vidíme ve velmi detailních záběrech nástupy středních hlasů. Tam je vyžadován jiný mix než u stejné symfonie, kde tyto detaily nevidíme a nepotřebujeme zvukově upozorňovat, že ve třetím plánu hraje flétna. Pokud ji nevidíme, nemáme potřebu mít ji zvýrazněnou. Ale nemusí se se mnou všichni kolegové shodnout.

Mícháš už tak, aby ses vešel do finální průměrné hlasitosti, anebo to necháváš až na mastering?

Určitě. Rozhodně míchám. Určitě je to v dnešní době nutné, poněvadž bez dynamických úprav se většina žánrů neobejde. A byť s nízkým kompresním poměrem hodlám nahrávku komprimovat, může to dost významně ovlivnit, jaké poměry mezi nástroji předem zvolím. Riskovat, že až vlastně v masteru zjistím , co se s nahrávkou stane, když ji zkomprimuji, nechci. Pokud už od začátku vím, že ji zkomprimovat musím, protože je to stylové, přichází naprosto racionální volba poměrů, navíc je z hlediska časového ekonomická. Protože pak můžu zplakat nad výdělkem, že jsem něco zkomprimoval a vlastně jsem si to zkazil.

Jako posluchač, zaznamenal jsi pozitivní vyrovnání hlasitosti v TV a rozhlasu? Tj. že dynamicky reklamy nevyčuhují z tišších lyričtějších filmů a naopak tišší pořady nejsou nezdravě „přenormalizovány“ – zhlašeny?

Já jsem špatný posluchač a divák, protože televizi nemám a rádio poslouchám jen v autě. Nicméně je asi potřeba upozornit na pár věcí. Ani rozhlas, ani televize u nás nevysílá tak, že by výstupní signál, který slyší posluchač přes konvenční vysílání, odpovídal EBU R128. Dokud bude rozhlas používat FM vysílání a televize analogové vysílání, tak vůbec není možné na tenhle standard naběhnout. Dokud hloubka modulace určuje dosah vysílače, tak -23 Loudness Unit Full Scale je naprostá utopie. Asi by bylo dobré říct, že měření programové hlasitosti má velký problém s krátkými pořady typu reklama. Algoritmus pro měření integrované hlasitosti na ty extrémě krátké 10 - 15 vteřinové úryvky moc dobře nefunguje. Jestli máme nějaký pozitivní posun ve vyrovnání hlasitosti reklam a okolních pořadů, je to spíš proto, že se hlasitost nesmí moc subjektivně lišit. A to umíme změřit velmi snadno. Na to stačí technik, který master faderem hlasitosti vyrovná a nepotřebujeme na to normu.

V rozhlase o přínosu EBU nelze vůbec mluvit, protože rozhlas nevyžaduje mastery odpovídající žádné normě. Když odevzdáte master trochu potichu nebo trochu nahlas, tak ho nikdo nevrátí a nenechá vás jej předělat. Jak v Českém rozhlase, tak v komerčních rádiích. Tam se nic podobného neděje. Raději využívají nějaký druh výstupní programové komprese. To znamená, že kromě vysílacího technika je v lince přítomen kompresor, který s velmi dlouhými reakčními časy srovnává hlasitosti pořadů. Dokud budeme používat analogové vysílání, tenhle způsob bude nevyhnutelný.

Pokud jsme zaznamenali zlepšení, tak určitě nejen kvůli tomu, že máme nnormu EBU R128, která není navíc nijak závazná. Prostě doporučení, které se Česká televize nějakým způsobem rozhodla implementovat, ale žádná legislativa to po nikom nikde nechce.

Co muzikanti, mluví ti do finální hlasitosti?

Myslím, že nijak. Věnuji se poměrně dost orchestrální hudbě a nikdy se mi nestalo, že by mi klient vrátil master, protože je jeho dynamický rozsah příliš velký. A to ani v nejextrémnějších případech soudobých skladeb. Naopak. Posluchač vážné hudby očekává velký dynamický rozsah a neřekl bych, že je dobré tu hudbu nějak komprimovat. Ostatně norma EBU R128 to ani nedoporučuje. Neexistuje žádný požadavek na velkou kompresi. Samozřejmě jiná situace nastává, budu-li dělat přímý přenos populárně symfonického projektu, který se bude vysílat skutečně v prime time na prvním nebo druhém programu a ne na kanálu umělecky zaměřeném. Je na zvážení, jestli nezkomprimováním a zachováním velkého dynamického rozsahu posluchače spíš nepoškodím. Je-li cílová skupina taková, že nemá podmínky k přehrávání hudby s velkým dynamickým rozsahem, je asi dobré na to pamatovat a mix a master přizpůsobit.

Samozřejmě se to netýká maximální povolené hladiny True Peak, na které parametr Loudness Range nijak nezávisí. A to, že dodržíme nějakou maximální povolenou špičkovou hodnotu, tomu prospěje v zásadě vždy.

Dokážeš to hudebníkům vysvětlit?

Myslím si, že to dokážu. Základní principy nejsou nikterak složité, muzikanti do toho mluví maximálně v intencích: nahrávka, kterou jsi nám dal je potichu. Kupříkladu ve srovnání s věcmi, které já poslouchám. To je věc, která se občas stane a zrovna teď nedávno jsem odevzdával master jazzové kapely, která chtěla nahrávku zesílit. Řekl jsem: OK. Do nějaké míry jde, když to zesílíme víc, technicky to problém není, ale nahrávku to esteticky spíš poškodí, než jí to prospěje. Hlasitěji by ji už asi nikdo nechtěl.