Praktische audio theorie
Je hebt 2 speakers voor je staan. Dus je kunt het geluid naar links plaatsen, of naar rechts. Naar voren of achteren wordt lastig.
Maar met de juiste technieken kun je het tóch zo laten lijken dat iets wat verder naar voren of naar achteren gezet is in de mix. En dat noem ik altijd ‘3D mixen’. Een van de belangrijkste dingen die je moet leren als je een goede mix wil maken, want met die techniek kun je zorgen dat je mix echt overal goed klinkt. Ik zal het dus wel vaker over dat ‘3D’ mixen hebben op deze website. Maar goed, om überhaupt 3D te kunnen mixen, moet je wat van geluid weten.
Toen ik een audio opleiding volgde, gingen ze nogal diep in op de theorie. Ik heb toen bijvoorbeeld de rekenmethode geleerd om te weten wat de output van een pre-amp is na 20dB gain als de microfoon input 0.17 volt was. Tja. Ik heb dit later als volgt in de praktijk gebracht: als het te hard staat, moet je het zachter zetten. Dit soort sommen zul je dus ook niet tegenkomen. Eigenlijk kom je geen enkele som tegen hier. Maar wel theorie die je ook echt gaat gebruiken bij het mixen.
Hz, kHz, frequenties….wat?
Geluid is trillende lucht. Ons oor vangt die trillingen op en onze hersen vertalen dit zodat we weten wat we horen. Je hebt hele snelle geluidstrillingen en hele langzame. Snelle trillingen horen we als hoge tonen (plaatje hieronder links), langzame trillingen als lage (plaatje hieronder rechts).
Zoals we ‘meters’ gebruiken om afstanden te meten, zo gebruiken we ‘Hertz’ (Hz) om het aantal trillingen per seconde aan te geven. 100 Hz is dus 100 trillingen per seconde.
Dat kan als veel klinken, maar 100 Hz is een lage toon. Ons gehoor kan namelijk geluiden horen tussen de 20 Hz (heel laag) en 20.000 Hz (heel hoog). Vanaf 1000 Hz hebben we het meestal over KiloHerzen. Dus 1 KiloHertz = 1000 Hertz. En dat schrijven we dan op als 1 kHz, of soms gewoon als 1 K.
Ok, tot zover de snelcursus over frequenties. Belangrijk om iets vanaf te weten omdat een van de meest gebruikte tools bij het mixen een equalizer is. Daarmee kun je frequenties harder of zachter zetten. Maar dan is het wel handig om te weten welke frequenties je nou hoort.
Hieronder daarom een overzicht van welke muziekinstrumenten een duidelijke piek hebben in welk frequentiebereik zodat je een beetje een referentiekader hebt. En met ‘piek’ bedoel ik dan dat deze frequenties het hardste klinken bij dat instrument. Ook al zullen ze vast nog wel meer frequenties produceren: die zijn veel minder duidelijk te horen.
Basgitaar:
Laag, body: 60 – 100 Hz
Snaren / attack: 1-3 kHz
Vocals:
Verstaanbaarheid en helderheid: 2 Hz – 6 Hz
Body: 120 Hz
Electrische gitaar:
Presence: 1kHz – 5 kHz
Body: 150-250 Hz
Kick drum:
Laag, Body: 60 – 80Hz
‘Tik’ / attack: 2-3 kHz
Snare drum:
‘Crispy’ geluid: 5 kHz
Body: 240 Hz
Cymbals:
Helderheid en frisheid: 7 – 12 kHz
‘Ik kan je niet verstaan door de herrie’, oftewel Masking
Op verjaardagsfeestjes zie je het wel eens. Iemand is midden in een verhaal, maar iemand anders heeft daar iets aan toe te voegen. En dat is nogal dringend. Dus ze wacht niet met praten tot de ander klaar is, maar begint meteen. Daar is de ander niet zo van gediend, dus hij voert het volume van zijn gesprek wat op.
En voor je het weet wordt het een soort wedstrijdje wie het hardste kan praten. Want als je op hetzelfde volume doorpraat, kan niemand je natuurlijk nog verstaan. Dit is masking. De een maskeert het gesprek van de ander.
Maskering gebeurt vooral als twee geluiden ongeveer dezelfde frequentie hebben. Iets om rekening mee te houden bij het mixen.
Praktisch voorbeeld: de frequenties in een stem (zang of voice-over) die zorgen voor de verstaanbaarheid, zitten tussen de 2 en 6 kHz. Zoals je in het overzichtje bij het stukje Hz, kHz, frequenties….Wat? al kon zien, heeft een elektrische gitaar ook een piek in dat bereik. Het overlapt elkaar. Dus een elektrische gitaar zal je zang of spraak al heel snel maskeren, daarvoor hoef je hem nieteens heel hard te zetten. Een basgitaar niet. Die zul je juist veel harder moeten zetten voordat hij jouw spraak maskeert.
Als je zang of voice-over probeert te mixen met muziek waar toevallig veel elektrische gitaar in zit, dan zul je de gitaar dus flink wat zachter moeten zetten om ervoor te zorgen dat het niet in de weg zit. Maar als je weet dat het probleem vooral tussen de 2 en 6 kHz zit, is het veel handiger om een equalizer te pakken en gewoon alleen die frequenties een beetje terug te draaien in de gitaar. Als je dan tegelijkertijd deze frequenties juist wat harder zet in de zang/voice-over heb je het masking effect nog verder terug gedrongen. En je zult merken dat het dan lijkt alsof je de gitaar ook opeens beter kunt horen, ook al heb je er wat helderheid uitgehaald.
Decibellen?
Ik heb op allerlei plekken gewerkt in mijn audio carrière. Bij radiostations, bij audio postproductie studio’s, in muziek studio’s en in dubbing studio’s. Het maakt niet uit waar je komt, één ding zorgt toch altijd weer voor verwarring: dB’s. En ik zie diezelfde verwarring ook in vakbladen en op audioscholen.
Kortom: Een heel lastig onderwerp waar je boeken over vol kunt schrijven. En toch ga ik nu proberen de kern in een paar zinnen op te schrijven. Wish me luck. 😉 En laat me vooral weten als je toch nog vragen hebt: gijs@audiokickstart.com.
Ok, daar gaan we. Als ik het over een temperatuur van 35 graden heb kan dat verschillende dingen betekenen. Dit ligt eraan of ik het over graden Celsius, Fahrenheit of Kelvin heb. Ze hebben allemaal een ander nulpunt. Bij 35 graden Celsius is het bloedheet en kun je lekker zwemmen in zee om af te koelen. Maar bij 35 graden Kelvin is die hele zee bedekt met een dikke laag ijs en is het zo koud dat er misschien nieteens leven mogelijk is. Het nulpunt is namelijk anders. Bij Celsius is dat het vriespunt, maar bij Kelvin het absolute nulpunt.
Waarom hebben we het opeens over het weer? Omdat het met het meten van geluid hetzelfde is. We meten in decibel, maar ook hier zijn er verschillende referentiepunten.
En dat is de basis van alle verwarring: Als je het volume van een zang opname op ’30 dB’ zet, dan zegt dat nog niets over hoe hard het geluid is. Dat ligt aan het referentiepunt. Daarom noem je dit altijd in 1 adem mee. Bijvoorbeeld dBFS of dBm. Die ‘FS’ en die ‘m’ geven het referentiepunt aan.
Hieronder de drie referentiepunten die je het meeste tegenkomt in de praktijk.
dB SPL:
SPL staat voor Sound Preassure Level. Hierbij is het referentiepunt de absolute grens van ons gehoor. Dus 0dB = geen geluid. 100dB = veel geluid. 130dB = zoveel geluid dat het pijn doet.
dBFS:
FS staat voor ‘Full Scale’, de schaal gebruikt in digitale audio apparatuur. Die kom je dus overal tegen in plugins en audio software. Het nulpunt is hier gelegd op het hardste geluid wat je kunt opnemen in digitale apparatuur voordat het gaat oversturen. Dus verder dan dat kun je ook echt niet gaan, dan gaat het meteen heel lelijk en vervormd klinken. Gevolg is dat deze schaal precies andersom is: als 0 dB het hardst mogelijke geluid is, kun je het alleen maar hebben over -10dBFS, of -40 dBFS. Nooit over +40dBFS, want dat zou harder zijn dan het hardst mogelijke geluid wat je kunt opnemen.
dBm:
In geluidsapparatuur wordt een ander ‘nulpunt’ gebruikt. Even terug in de tijd. Lang geleden is besloten dat alle audio apparatuur op elkaar aangesloten moet kunnen worden. Zonder dat het geluid overstuurt of juist veel te zacht is. Dus moet er een referentiepunt komen zodat alle apparatuur hetzelfde gebouwd wordt. Maar waar leg je dat nulpunt? Het meest logische is om af te spreken dat 0 dB een bepaalde hoeveelheid elektriciteit is in de apparatuur. En dat kun je vervolgens op een meter zien (de bekende VU meter die je altijd op oude mengtafels terugziet). Als het naar 0 dB wijst, zit je precies op die afgesproken hoeveelheid elektriciteit. En dus op het optimale niveau van dat apparaat. Niet belangrijk om te onthouden, maar voor de elektronica liefhebber: Er werd toen gekozen voor 0 dB = 1 milliwatt bij een weerstand van 600 Ohm. Daarna kwamen er nog een paar smaken bij, zoals dBu en dBV. Allemaal met een ander nulpunt, maar allemaal een nulpunt wat gerelateerd is aan elektriciteit.
dBu:
Deze is een stapje technischer om uit te leggen. Als je geen verstand hebt van elektronica kun je onthouden dat dBu gewoon weer een ander referentiepunt gebruikt, net als dBm gerelateerd aan een bepaalde hoeveelheid elektriciteit in een apparaat. En dan voor de mensen die er wat dieper in willen duiken: die ene milliwatt bij een weerstand van 600 Ohm (dBm standaard) produceert een voltage van 0,775 Volt. In de praktijk bleek 600 Ohm een weerstand die niet heel praktisch is voor audio apparatuur. Dus al snel werd het referentiepunt die 0,775 volt, onafhankelijk van de weerstand. Dit werd dBu. Tegenwoordig wordt nog steeds dBu gebruikt. Namelijk in professionele audio apparatuur. We werken alleen tegenwoordig met 1.228 volt. Dat is omgerekend 4 dBu méér dan 0.775 volt. Daarom gebruiken we als nulpunt tegenwoordig +4dBu op professionele apparatuur.
Het verschil tussen mono en stereo
Hier een filosofische overpeinzing: Als je een geluid opslaat als ‘stereo’ bestand, is het niet altijd echt stereo.
Het is niet alleen maar een kwestie van het vakje ‘stereo’ aanvinken!
Stel: Je neemt een piano op. Je gebruikt 2 microfoons voor de opname. Je stuurt alles wat de linker microfoon opneemt naar de linker speaker en alles wat de rechter microfoon opneemt naar de rechter speaker. Nu ontstaan er verschillen tussen links en rechts, bijvoorbeeld omdat de linker microfoon meer van de lage tonen opvangt. Want hij staat nou eenmaal het dichtste bij de pianotoetsen die daarvoor zorgen. Bij de rechtermicrofoon is dit net andersom. Deze kleine verschillen zorgen ervoor dat de opname stereo klinkt.
Neem je deze piano op met 1 microfoon, dan is de opname mono. Je kunt later kiezen om deze opname op te slaan als stereo bestand, maar dan wordt het geluid van dezelfde microfoon gewoon naar zowel het linker- als het rechter kanaal gekopieerd. Omdat allebei de kanalen nu exact hetzelfde zijn, blijft de opname mono klinken. Er zijn geen verschillen tussen links en rechts.
Dit hoor je meteen: als je recht voor je speakers zit, lijkt het geluid precies uit het midden tussen de twee speakers te komen. Als dat zo is, is je opname mono. Ook al heb je het opgeslagen als stereo bestand. Luister maar eens naar het verschil tussen deze twee fragmenten (met de speakers recht voor je of met headphones op):
Stereo
Mono
Het is maar een fase…
We sluiten het theorie gedeelte af met fase. Belangrijk, want de reden dat een opname heel raar of slecht klinkt, kan zomaar de schuld zijn van fase.
Geluid is trillende lucht. Een afwisseling van hoge luchtdruk en lage luchtdruk laten je trommelvlies trillen. Zo’n geluidsgolf wordt vaak zo weergegeven:
Stel, een vriend speelt piano in een kamer. Jij gaat een eindje verderop staan luisteren. Dan komt een deel van het geluid direct bij je trommelvlies aan, maar een ander deel weerkaatst eerst tegen de muren of het plafond. En komt dus net wat later bij je trommelvlies aan.
Wat nou als de eerste golfvorm omhoog gaat als hij je trommelvlies raakt (hoge luchtdruk dus) en de weerkaatsing op dat moment juist omlaag (lage luchtdruk)? Het kan raar klinken, maar dan heffen ze elkaar gewoon op.
Noise-cancelling headphones maken gebruik van dit principe. En als ze allebei tegelijk omhoog gaan (allebei hoge luchtdruk), dan versterken ze elkaar juist.
Als weerkaatsingen van het geluid op willekeurige frequenties elkaar opheffen of juist versterken, dan kan het geluid snel raar gaan klinken. Het is niet voor niets dat studio’s veel tijd besteden aan het aanpassen van de akoestiek om weerkaatsingen in bedwang te houden.
Hoeveel de ene geluidsgolf later aankomt dan de andere wordt uitgedrukt in graden. Als de ene geluidgolf op zijn hoogtepunt is en de weerkaatsing van die geluidsgolf juist op zijn dieptepunt, dan is het faseverschil 180 graden.