logo Disk

Natáčíme a mixujeme: slyšíme jinak, než ukazují ladičky? Vhodně doladěné melodie i akordy zní mnohem lépe!

Slyšíme výšku tónu stejně, jak nám ukazují měřáky? Nezní melodie či harmonie posunuté na správných místech mírně nahoru či dolů mnohem lépe? Existuje řada faktorů, které lidský sluch ovlivňují. Podívejme se, jak je využít při nahrávání, ale i mixu.

Kategorie: Studio - Tipy & Triky
Ondřej Jirásek | 18. srpna 2021

Luďo, je to normální? Ladička ukazuje na chlup přesně, ale já to slyším jinak!

Ladění a souvislost výšek s barvami jsou docela složitou chemií. Ladička s přesným poměrem v hertzích nemusí vůbec zaručit ladící melodii či harmonii. Ve hře je řada faktorů: nelineární zkreslení zvukového orgánu, subjektivní vnímání výšek a výškových poměrů, různé tónové terény s různými citlivými tóny i poměry, barvy, které více či méně ladí, anebo směřují základní výšku díky svému spektru výše či níže, než bychom podle základního tónu očekávali.

Samozřejmě, že můžeme využít dolaďovací programy typu VaRi Audio, Auto-Tune nebo Melody essential, ale leckdy výsledek jen zhoršíme. Subjektivně se nám bude líbit úplně jiný výškový tónový terén. Proč?

Pomocí Melodyne essential můžeme v programu Studio One dolaďovat a upravovat výšky. Otázkou vždy bývá, jak moc?

Nelineární zkreslení ucha

Ucho podobně jako systémy či přístroje s nelineární charakteristikou přicházející čistý signál do určité míry zkresluje. Znamená to, že k čistému sinusu, jedné harmonické složce nacházející se už nad hladinou intenzity 40 dB přidává další aurální složky, většinou vyšší harmonické tóny.

USB 2.0 zvuková karta AXE I/O od IK Multimedia v sobě obsahuje standardně i ladičku.

Tip1: Čím vyšší intenzita zvuku, tím dochází v uchu k většímu zkreslení původního signálu.

V takových případech zůstává stále první a základní složka – fundament tónu nejhlasitější složkou harmonického, celočíselného spektra. Intenzitou obvykle výrazně (o 40 dB a více) převyšuje ostatní parazitně vzniklé složky ve spektru. Lidské ucho ji tak vnímá jako zásadní při určování výšky tónu.

Nejen fundament, základní tón, ale i složky kombinační

Jiná situace nastává, když do ucha přijde signál harmonický a komplexní. Znamená to, že je složený z více složek v harmonickém, celočíselném poměru. V tom případě při sčítání těchto složek dochází v zvukovém ústrojí ke vzniku tzv. kombinačních složek. A to součtem (např. 2. a 3. harmonický způsobí, že ve spektru senzoricky vnímáme i 5. harmonický /tercii/, anebo rozdílem (např. v případě 5. a 2. harmonické složky nám v uchu/hlavě zazní i složka 3. /kvinta v druhé oktávě/).

Tip2: V případě složeného harmonického spektra vznikají kombinační tóny, které mohou mít vliv na vnímání základní výšky. Výšku tónu pak pří silném vyčnívání jiných harmonických složek můžeme vnímat základně od nich než od dynamicky „zastrčeného“ fundamentu.

Velice záleží, jak jsou jednotlivé harmonické složky navzájem výškově blízko a jakou mají intenzitu. Pokud je hlasitější hodně blízko, maskuje tu tišší. Pokud je daleko, k silnému maskování nedochází. Tak se vytvoří tzv. specifická součtová barva, která může mít vliv na vnímání celkové výšky. Jako základní nemusíme vnímat fundament, ale zcela jinou velmi dynamicky vyčnívající složku.

Ovlivňuje dynamika, tedy i akustický tlak vnímání výšky?

Experimentální testy ukázaly poměrně spolehlivě, že hlasitost vnímání absolutní výšky ovlivňuje, a to hlavně v případě jmenovaných jednoduchých tónů – tedy signálu ve tvaru sinusoidy (s jednou harmonickou složkou) a v případě signálů s barvami sinusoidě relativně blízkými (kde, jak uvádíme výše, dynamicky vévodí první harmonická a ostatní od ní mají značný dynamický odstup).

V takovém případě např. u barevně hebkého tónu s frekvencí 200 Hz jinak vnímáme výšku při akustickém tlaku 40 dB a jinak než při tlaku 80 dB. Při vyšším tlaku 80 dB budeme subjektivně vnímat tón s kmitočtem 200 Hz (malé g) jako nižší, a to až o 2 %. Naopak je tomu v polohách, oktávách vyšších. Pro frekvenci 6 kHz (fis5) např. platí, že při stejném nárůstu hlasitosti z 40 na 80 dB budeme subjektivně vnímat hlasitější tón co do ladění výše, a to o cca 3 %.

Tip3: U jednoduchých a hebčích barev v případě silné dynamiky může nadladění basů a podladění sopránů (ale raději na senzorické stupnici melů než na akusticky přesné stupnici Hertzů) subjektivně výšky scelit. A to ne tolik u pasáží homofonních (paralelních pohybů a tutti, kde rozlišujeme poměrově v rámci akordu – kochleu, hlemýždě zahltí celý akord), ale u navzájem si odpovídajících (tzv. responsoriálně vedených) hlasů – tedy např. chvíli bas a chvíli soprán, anebo chvíli jeden a chvíli druhý nástroj.

Na modulu Auto-Tune můžeme nastavujeme tónový terén (scale) a tóninu (key).

Jak jemnou změnu ladění rozpoznáme v různých oktávách?

V psychologii existuje termín diference limen, který souvisí se schopností či hranicí, kdy je člověk schopen zaznamenat nejmenší vnímatelný rozdíl mezi dvěma různými informacemi.

Tak testy ukázaly, že do 1000 Hz (od konce dvoučárkované oktávy) vnímáme výškovou změnu už v rámci 2-3 Hz, např. v pásmech kolem 7 kHz (kolem a5)) k rozeznání výšky pak potřebujeme změnu až 35 Hz.

Samozřejmě, že rozdíl v hertzích není v tomto případě zcela odpovídající, protože frekvenční řada narůstá geometricky (logaritmicky) oproti aritmetickému systému not či klaviatury. Pokud ale 2-3 Hz a 35 Hz vztáhneme na půltóny v daných polohách, zjistíme, že mezi půltónem c3 a cis3 (pásmo lehce nad 1000 Hz) k rozeznání změny výšky potřebujeme 4 % (dvaceti pětinu) z intervalu tamního půltónu a u půltónu mezi a5 a ais5 (pásmo kolem 7 kHz) to už bude 8 % (dvanáctina).

Tip4: Čím budeme po oktávách postupovat víc nahoru, tím větší výškový rozdíl budeme potřebovat, abychom zaznamenali rozdíl v intonaci. Jinými slovy u basů, tenorů a altů je třeba hlídat intonaci detailněji než u super vysokých sopraninových poloh.

Jednotka mel není od Mela Gibsona, či Leo Fendera, ale od melody

Pro měření výšek není tak důležité srovnávání absolutních výšek ale poměrových rozdílů. Vlastně poměřování půltónů, čtvrttónů, osminotónu atd. A tady se ukazuje, že až do úrovně cca 800 Hz (mezi g2/gis2) vnímáme rozdíly ve výšce jako +- stejné poměry. Například interval oktávy, tedy poměr 1:2 vnímáme v poloze od 200 do 400 Hz podobně široký jako v poloze od 300 do 600 Hz). Nad úrovní 800 Hz (g2/gis2) se ale tento vztah logaritmicky bortí a intervaly se subjektivním poslechem zužují. V hertzích odpovídají přesně výškově, nám se ale díky psychickému vnímání zdá vyšší tón z intervalu podladěný (nebo nižší nadladěný).

V případě blanozvučných bicích nástrojů vytvářejí tzv. dortové módy tóny a kruhové módy hluky. Bubeník může svou hrou ovlivnit, co bude v mixtuře dominantní.

Tip5: Od horní půlky dvoučárkované oktávy, úrovně 800 Hz (g2/gis2) začínáme vnímat subjektivně tóny níže. A čím výše, tím se posouvání vjemu dolů zesiluje.

Další měření a s nimi přicházející zkušenosti tak odhalily rozpor mezi frekvenční řadou a psychoakustickým vnímáním výšek. Bylo třeba vytvořit novou škálu subjektivních výšek.

Jednotku navrhli pánové Stevenson, Volkmann a Newmann v roce 1937. Podle melodie (melody) nese zkratku mel. Fyzický tón 1000 Hz na hladině akustického tlaku 40 dB (SPL) odpovídá subjektivní výšce 1000 melů.

Na ose x leží hertze, na ose y mely. Červený bod označuje průsečík, tj. kde se 1000 Hz rovná 1000 mel.

Tip6: Frekvence 1000 Hz a akustický tlak jsou společným průsečíkem většiny psycho akustických jednotek. Směrem nahoru a dolů od nich se pak hladiny rozcházejí.

Melova stupnice byla vytvořena experimentálně tak, že posluchači subjektivně ke každému tónu určili tón další, jehož výšku zaznamenali jako poloviční, dvojnásobnou atd. Stejně vnímaná intervalová vzdálenost” platila v celém rozsahu.

Tip7: Stupnice melů má mnohem nižší rozsah než stupnice hertzů, 10.000 Hz odpovídá škála 3.200 melů.

Závislost subjektivní výšky tónu na frekvenci funguje v nízkých pásmech téměř lineárně, zatímco u středních a vysokých poloh vykazuje charakter exponenciálně klesající. Na vlastní stupnici objevíme rozsah od 0 do 2400 melů, převod mezi hertzy a mely pak zjednodušeně vypadá např. takto: 100 Hz = 100 mel, 500 Hz = 500 mel, 1000 Hz = 850 mel a dále mely exponenciálně klesají.

Mnohem zajímavější i psychoakustiku více respektující jsou exotické tonální terény - např. v programu Komplete 13  indické módy.

A buch! Teď do toho vpadne barva!

Pozor! Dosud jsme se pohybovali ve spektrech, tedy barvách harmonických. I tam hrají roli různé faktory: lépe nám ladí sudé harmonické složky proti lichým, výrazně při sladění výšek pomáhá první intervalové pásmo (od 1. po 8. harmonický), zatímco pásmo druhé klastrové (od 9. po 16. harmonický) a pásmo třetí zvonící či bzučící (od 17. po 31. harmonickou složku vytvářející dojem spojitého spektra) pocit brilantně ladící barvy, tedy i výšek narušují.

To se ale stále nacházíme ve zcela jiné libozvučné kategorii proti tzv. spektrům neladícím, složeným z neharmonických či ruchových složek. Pokud složky neharmonické či ruchové dominují, kmity přestávají být pravidelné, zvuk přestává být tónem a stává se ruchem. A ruchy nesladíme.

Při psychoakustických experimentem se např. zkoumá vliv lichých a sudých složek (navíc rúzně rozladěných) na vnímání výšky.

Tip8: Žonglování mezi barvami ladícími a neladícími vnáší do hudby napětí. A to můžeme v rámci skladby patřičně využít.

Škála kombinací a valérů na ose harmonická, neharmonická a ruchová barva je však nesmírně široká a ingredience mohou existovat v nejrůzněji spjatých (relativně souladných) nebo nesouvisejících (nesouladných) vztazích. Konec konců, to je právě prostor pro nejrůznější odstíny a nové barvy.

Při psychoakustických výzkumech je třeba vyhodnotit, že názor respondemtů není fifty-fifty, ale kloní se více na jednu ze stran. Tehdy existuje větší pravděpodobnost, že jsou odpovědi validní a vnímání shodné.

Tip9: Efekty a syntezátory vnesly do hudby nové témbry, které můžeme sami řídit a nastavovat. Jimi podporovat soulad i nesoulad výšek.

Tip10: Perfektně ladící výšky vnášejí do hudby jasnou a čistou geometrii. Ta ale vůbec nemusí významově fungovat v různých žánrech a výpovědích. Je totiž jen jednou stranou reality, ve které žijeme.

Ladič pijan, aneb témbr a neharmonicity na klimpru

O tom, že jen logika čistých výšek nemusí vždy fungovat, svědčí zkušenost a systém, jakým se roztahují oktávy při ladění klavíru.

Křivka ukazuje roztažení ladění, při kterém zní klavír pro ucho mnohem plněji i harmoničtěji.

Naopak tam dle logiky melů a psychoakustiky roztahujeme oktávy, tedy zvyšujeme či snižujeme ladění. Od druhé poloviny dvojčárkované oktávy zvyšujeme směrem nahoru a basech pak od cca velké oktávy roztahujeme směrem dolů. Roztahování souvisí samozřejmě i s přesným temperovaným laděním a vzniklými neharmonicitami v překrývajících se barvách, které nezní tak dobře, jako když se určité poměry přiblíží přesným proporcím ladění přirozeného (2:1, 3:2, 4:3, 5:3, 5:4, 6:5, 8:5). I když se daný poměr patříčným násobkem použije třeba až v třetí oktávě od výchozího tónu v jednočárkované oktávě. Pijani vědí své!

Přečtěte si také:

Mixujeme a mástrujeme: co mi prozradí tvar vlny?

Zkušený zvukový mistr už pohledem na tvar vlny (wave) dokáže odhadnout, jaká při jejím přehrání zazní rámcová barva. A hlavně umí srovnáním původního tvaru vlny s tvarem po efektov…

Mixujeme a mástrujeme: co mohu vyčíst ze spektra

Dokážete rychlým pohledem na spektrum poznat, jaké obsahuje barvy? Kde je volno a můžete prostor zahustit a kde vás už clona nepustí? Víte, které barvy se dobře pojí či doplňují a …

Mixujeme a mástrujeme: subjektivní hlasitost, fóny a práh citlivosti

Když mixujeme nebo mástrujeme, slyšíme stejně, jak nám ukazují programy a měřáky? Lidský sluch disponuje totiž pahy citlivosti, které fungují v různých kmitočtových i dynamických h…

Mixujeme a mastrujeme: jak vnímá mozek hudbu?

Mixování hudby není jen o tom vyrobit co nejnadupanější mix, co pořád tlačí a zahltí prostor. Mělo by být prvotně o tom, donutit posluchače úměrně přemýšlet a vzbudit v něm požadov…

Líbí se Vám tento článek? Pošlete ho dál!
Přečtěte si také další související články:

Komentáře