Decibel e Meter – IV

fig. 1 loudnessnorm.jpg

Prima di procedere ad analizzare gli LUFS Meter che hanno definito limiti normativi e raccomandazioni di utilizzo nella realizzazione di mix e master audio dopo anni di battaglie per realizzare musiche e suoni con i più alti valori di loudness per avere il brano o traccia audio che suona più “forte”,  è bene fare qualche passo indietro e vedere come il concetto di loudness si è evoluto nel corso del tempo.

 

Cenni Storici

La gestione del loudness è un fenomeno nato con i primi sistemi di registrazione e riproduzione audio meccanici, quali fonografo e grammofono, in cui avere un elevato segnale medio di registrazione consentiva di mantenere un SNR ( Signal to Noises Ratio ) elevato e quindi un rumore di fondo relativamente basso e permettere una maggiore chiarezza del segnale audio.
Successivamente con la diffusione della musica e registrazioni acustiche ( inizialmente per lo più riprese ambientali attraverso corni ad imbuto di diverse dimensioni come si vede guardando i fonografi, poi successivamente attraverso l’utilizzo di sistemi elettrici ( attorno al 1925 ) come microfoni d’ambiente e close miking e sistemi di amplificazione ), si lavorò sul loudness per lo stesso principio di allontanare il rumore dal segnale audio anche attraverso la struttura ambientale, quindi ambienti acusticamente controllati, con tempi di riverberazione definiti ( 0,5 – 0,6 ms, T60 ) e nella gestione delle riprese microfoniche tali da avere minori rientri possibili o rientri ambientali controllati.
In aiuto venne anche la tecnologia con la nascita dei primi sistemi di registrazione elettromagnetici per il trasferimento ed incisione segnale audio prima su dischi in vinile ( dal 1948 ) e poi supporti magnetici, i quali consentivano un rapporto segnale rumore molto più elevato che il fonografo e/o grammofono.
Con la nascita e la diffusione della tecnologia digitale e l’aumento delle prestazioni hardware e software sia di processori analogici che digitali si permise un notevole possibile incremento del loudness sia in fase di registrazione che di mastering che di riproduzione ( grazie anche all’avvento dei supporti ottici ( 1982 ) e digitali ), tale da mandare in pensione qualsiasi attrezzatura di registrazione obsoleta primi fra tutti fonografo e grammofono ( in pensione già ai tempi di uscita del vinile ), per poi passare al vinile e cassette.
Il problema fondamentale è che l’evoluzione pur permettendo di sfruttare supporti di registrazione e riproduzione che siano hardware o software con una dinamica possibile utilizzabile ad oggi in certi casi anche oltre i livelli di percezione e sensibilità acustica delle orecchie umane, dal punto di vista dell’utilizzo si è sfruttato tutto questo solo per ottenere un loudness sempre più elevato e d’impatto, trascurando la possibile dinamica sfruttabile ( quindi qualità e naturalezza di ascolto ).
Ne consegue che ad oggi il livello dinamico lasciato ai brani musicali soprattutto quelli dal pop al rock al metal e disco è paragonabile al massimo livello dinamico ottenibile con il fonografo ( questo a detta dei discografici per una questione di “guerra di mercato” in cui come detto si ritiene che un brano con maggiore loudness venda di più che uno con meno ( anche se questo in realtà è stato sperimentato non essere vero ), oltre a questo per una questione di competitività ( anche qui dubbia ), in quanto se la media produce con un certo livello di loudness allora è necessario registrare e masterizzare un album o singolo con stessi o superiori valori per non essere fuori mercato. E’ vero anche che se si ascoltano due brani uno con un livello di loudness più alto rispetto all’altro tendenzialmente l’attenzione si porta verso il brano con il loudness più elevato.

Tramite analisi di molteplici file audio registrati dalla nascita dei primi cd ad oggi ( come vedremo più avanti ), si è arrivati alla conclusione che in più di 30 anni il livello medio dei brani musicali come il pop ha avuto un incremento del loudness di +20 dB, questo ha consentito a vecchie registrazioni di essere rimasterizzate secondo i livelli medi di loudness anno dopo anno in nuovi album e raccolte con l’obbiettivo di far acquistare il nuovo album essendo in comparazione con l’originale molto più loud, ad oggi siamo a livelli limite del loudness per la tecnologia digitale in commercio e la risoluzione delle nostre orecchie, e per questo oltre per aspetti normativi si pensa che la guerra per raggiungere il più alto loudness possibile sia finita.
Un’altro problema di incrementare sempre più il livello di loudness è l’aumento considerevole delle distorsioni ( soprattutto se si utilizzano processori di dinamica ) e dell’affaticamento all’ascolto ( il primo perchè l’eccessiva compressione tende a introdurre artefatti nel segnale audio, il secondo perchè ascoltare un brano musicale senza presentare crescendo e diminuendo provoca psicoacusticamente stress ).
Per fortuna come vedremo stanno cominciando a venire fuori raccomandazioni e prime normative che cercano di regolamentare il mercato del loudness, considerando sia l’aspetto qualitativo della musica che quello prettamente commerciale.

 

LUFS Meter

Nel 2006 con le rispettive revisioni fino ad oggi, ITU ed EBU per regolare al meglio le raccomandazioni e come vedremo le normative nate per limitare la guerra dinamica che andava a crescere nel broadcast e produzioni audio, hanno creato uno standard di meter che consente di analizzare al meglio il segnale audio nel rispetto delle normative.

ITU con la normativa ITU BS.1770 che regola questi nuovi meter digitali, ha introdotto anche un nuovo termine il LUFS ( Loudness Unit Full Scale ), termine al momento esclusivamente utilizzato per questa tipologia di meter, costruiti e regolamentati con tolleranze e metodi di calcolo come da normativa per andare a regolare i massimi volumi di loudness dei vari programmi musicali come da figura 1. Per cui che ci si trovi nel Broadcast ( trasmissioni televisive, pubblicità, radio, cinema ) o in Studio ( registrazione e mastering ) è importante avere un meter digitale aggiornato in riferimento agli standard appena visti ( generalmente i meter digitali presentano delle info sulle caratteristiche tecniche e i vari standard seguiti per il calcolo ).

I meter che seguono queste normative sono anche riconoscibili in quanto chiamati LUFS Meter.

Da come si può notare tutte queste normative sono per lo più per le trasmissioni broadcast che siano analogiche ( richiesto l’utilizzo di meter digitali per il rilievo del loudness ) o digitali e per la musica registrata ( studio ), non vi sono invece ancora ad oggi riferimenti normativi per il loudness nella musica live ( limitato esclusivamente per legge dai valori massimi e medi di esposizione dell’uomo al rumore ). In contesto digitale un tecnico professionista ( esempio attraverso l’ausilio di un mixer digitale con meter che rispetti questi standard o attraverso un meter su analizzatore esterno che sia software o hardware ) cerca per cui di seguire le normative definite per il broadcast e studio in modo tale da riproporre anche in ambiente live la stessa dinamica e loudness della registrazione a cui le persone sono abituate all’ascolto prima di recarsi ad un evento live. In caso di utilizzo di componenti analogiche ( esempio mixer analogico ) è bene attrezzarsi con dei meter digitali ( che seguano gli standard appena visti ) da interfacciare dopo l’uscita master della matrice audio ( mixer audio ). Se si utilizza un hardware e/o convertitore A/D esempio per rilevare il segnale audio tramite software interno al computer è necessario che la qualità dei convertitori sia come da normativa.

In figura 2 e figura 3 alcuni esempi di LUFS Meter.

fig. 2 lufsmeter_1_4_0_main.png

fig. 3meters-large.jpg

Generalmente i LUFS meter hanno impostazioni fisse, con un colore rosso, giallo o differente del valore rms quando il livello di audio supera i – 23 dB ( Program Loudness  o Integrated Loudness ), un colore per il livello di picco ed uno per il livello di range rms e barre inferiori, ma in molti è comunque possibile impostare colorazioni in base al livello raggiunto sia rms che di picco che altri valori, non chè tempo delle finestre di analisi ( fig. 4 ), in modo tale da poter utilizzare il meter anche per diversi riferimenti, come quelli in figura 1.

fig. 4 2016-09-10_18-19-41.jpg

Molti meter hanno meter loudness e picco separati.

Link alla spiegazione dettagliata delle normative:

ITU R-REC-BS.1770

EBU r128-2014

ALTRO

I meter digitali che rispettano le normative ITU ed EBU possiedono un algoritmo di calcolo differente da quello visto fino adesso, per il valore RMS in considerazione della risposta in frequenza dell’orecchio ( curve isofoniche ) ( fig. 5 ) fino a qualche anno fa veniva utilizzata una curva di ponderazione empirica chiamata Leq RLB ( fig. 6 ) che compensa la misurazione considerando le frequenze superiori a 2 kHz con un roll-off che parte da 100 Hz, tale da massimizzare l’ascolto delle basse frequenze anche a volumi bassi di ascolto in quanto l’orecchio umano a bassi volumi ha una differenza di percezione delle basse frequenze rispetto alle alte molto maggiore ( le basse vengono percepite con un volume molto più basso che ascoltando a livelli più alti ).

Ad oggi la curva di ponderazione è stata perfezionata ed è la Leq R2LB, formalmente conosciuta come Leq K ( livello equivalente K ) ( fig. 7 ).

n.b. La compensazione consente in fase di lavorazione dinamica di poter aumentare l’efficienza delle basse frequenze prima di arrivare al limite massimo consentito.

fig. 5 FHfitxa15_ilus_1

( si vedano in dettaglio le curve isofoniche in argomento psicoacustica )

fig. 6 mm

fig. 7 slide_6

I valori di picco invece sono marcati dBTP ( True Peak ) e la scala del meter si estende fino a qualche valore sopra lo 0 LUFS o dBFS in caso che in un meter sia applicata la dicitura dbFS. Rispetto ai meter tradizionali forniscono una migliore indicazione di headroom digitale, rilevando tramite algoritmi, quei picchi inter-sample con valore superiore a 0 dBFS che sono la causa della distorsione introdotta dai codec e dai convertitori D/A.

I meter tradizionali professionali come anche LUFS meter che rispecchiano lo standard EBU R128 hanno a volte la possibilità di determinare il tempo della finestra che analizza il segnale audio e media il valore RMS, ( una finestra temporale è d’obbligo in quanto analizzare ogni singolo campione del segnale audio digitale non rispecchierebbe la reale percezione dell’orecchio umano ), generalmente una finestra media temporale è di 400 ms ( momentary loudness con la presenza di gate ) ( generalmente utilizzata ) o 3 secondi ( short term loudness senza gate ) ( utilizzata per comparazione o come seconda finestra che viene mediata alla short per una maggiore sicurezza nel rientro dei parametri standard in quanto la short-term è molto varia nel tempo ). Altri meter che non rispettano le direttive EBU possono avere finestre temporali differenti.

I meter regolamentati da questi standard per il calcolo del valore rms prevedono poi l’utilizzo di Gating, e cio’è un processore che lavora e quindi opera i processi di calcolo e compensazione solo sopra ad una determinata soglia e non considerando l’audio sotto la stessa soglia, cosi da limitare e stressare meno il processore di calcolo facendolo lavorare al 100% solo nella zona utile e cercando di non considerare le pause ed i silenzi che potrebbero alterare il valore medio finale ( come succede nei normali meter ). Alcuni produttori propongono comunque alternative nell’algoritmo di controllo ( alcune sono migliorie, altre peggioramenti ) del segnale RMS e Picco mantenendo intatte le caratteristiche costruttive del meter digitale per il rispetto delle normative, come ad esempio uno Short Term al posto del Gating per il controllo del consumo del processore e l’eliminazione delle pause dalla media temporale.

n.b. Nei meter digitali tradizionali quando un segnale audio va in pausa cala progressivamente il valore del livello di segnale ( secondo le loro prestazioni ) fino ad arrivare a – ∞ dBFS, tanto più il calo sarà rapido e rispetterà l’immediatezza della pausa e tanto meno andrà a mediarsi in caso che il suono riprenda senza che il meter sia tornato a 0 per seguire la pausa.

Il Gating utilizzato nei LUFS meter segue le indicazioni fornite nella tabella in figura 8.

fig. 8 2016-09-05_18-20-56.jpg

I gating proposti da studiosi e varie associazioni sono G20 che esclude dal calcolo del valore rms il segnale che decade di 20 db, il G10 che esclude il segnale che decade di 10 dB ed il G8 che esclude il segnale che decade di 8 dB, il gate seguito dallo standard ITU BS.1770 è il G10, in alcuni LUFS meter è possibile comunque cambiare anche questo valore per avere riferimenti differenti. Nella tabella in figura 8 c’è una comparazione di tutti questi gate con anche un tradizionale meter senza gate. I meter tradizionali come si vede includono nella media il silenzio e le pause a differenza dei Gate. Un gate più stretto come può essere il G8 ha un focus sul valore RMS più mirato escludendo anche eventuali rumori di fondo.

Lo standard ITU ha optato per il G10 in quanto ritenuto più simile al tipo di risposta dell’orecchio nel percepire audio e musica.

In figura 9 un esempio di come cambia il valore RMS in base all’utilizzo di Gate o meno.

fig. 9  2016-09-05_19-37-03.jpg

Si nota in figura 9 come l’utilizzo di un gate ( G8 ) determini un valore RMS differente da quello rilevato con un meter standard, generalmente con valore più alto in quanto il meter standard come visto media anche le pause ed i silenzi.

Un’altro fattore ritrovabile generalmente nei LUFS Meter è il LRA ( Loudness Range Amplitude ), rappresenta le variazioni medie tra il valore di picco e quello RMS ed è sempre misurato in LUFS o LU. Il loudness range che deve avere un programma audio è sempre una raccomandazione e non una normativa come invece il massimo livello rms ( – 23 LUFS ).

Alcuni meter LUFS presentano anche un’altro parametro, il LUFK che considera il valore RMS medio di tutta la durata del programma audio preso in considerazione durante la misura,  in cui è presente generalmente anche il Max Loudness il quale identifica il massimo livello medio LUFS raggiunto ( il punto in cui il valore medio raggiunge il livello massimo ).

Un LUFS meter ha 2 finestre di analisi, la Momentary Loudness ( media campioni audio ogni 400 ms ) e la Short Term ( media campioni audio ogni 3 secondi ), questi valori sono stati stimati per la Momentary Loudness come il tempo di percezione medio del sistema uditivo umano e per la Short Term come un’analisi preventiva per stabilizzare e trattenere le veloci variazioni dei valori LUFS della Momentary Loudness che andrebbero a rendere difficile una stabile identificazione dei valori LUFS mediati nel tempo, lavora come sorta di prevenzione al fine di limitare i valori di Max Loudness che potrebbero facilmente eccedere i limiti normativi. LUFS medio di LUFS meter è generalmente una media di queste due finestre di ponderazione e chiamato spesso ( Program Loudness o Integrated LUFS ), ma in generale è anche possibile vedere i valori di entrambe le finestre ( fig. 10 ).

fig. 10  screen480x480.jpeg

n.b. Come da normativa EBU R128 il Max Loudness per un programma audio musicale può arrivare a – 18 LUFS se misurato in Short Term Loudness e – 15 LUFS se misura in Momentary Loudness.

L’analisi Short Term e Momentary sono immediate e visualizzano il valore del segnale mediato per il periodo della finestra temporale. L’Integrated Loudness è una media che considera tutta la durata dell’analisi ( Time Elapsed )

Il problema fondamentale di questi meter ( se pur tecnologicamente migliorati nel tempo ) è che avendo una compensazione dinamica della risposta dell’orecchio standard non possono essere correttamente applicati ( se pur utilizzati ) al canale LFE in un programma audio surround, il quale lavora meglio con meter standard o LUFS meter elaborati per l’analisi del canale LFE.

Alcuni potrebbero pensare a cosa servono tutte queste normative, potrebbero non essere d’accordo sui valori RMS massimi definendoli non qualitativi ai fini di una corretta percezione della dinamica audio per quel tipo di programma musicale ( soprattutto in quelli molti dinamici o per alti livelli di compressione che se non realizzati attraverso strumentazioni di qualità potrebbero indurre a generare alti valori di distorsione armonica ), o che limitano fortemente le capacità e qualità tecniche e creative di un sound engineer. Tutto questo è paragonabile ai motivi per cui esistono le leggi nella vita di tutti i giorni e a cui tutti non sono d’accordo su tutti, senza normative anche in ambiente audio ci sarebbe del gran caos, per molti molta più sporcizia e scarsa qualità non potendo offrire mai punti di riferimento a chi questo audio lo ascolta.

LUFS è quindi un ottimo meter che consente di analizzare direttamente la media RMS di tutto il brano senza considerare le pause, analisi che invece andrebbe fatta a mano ( selezionando solo le parti effettive in cui c’è audio, inutilizzabile quindi per un’analisi in tempo reale ) considerando le altre tipologie di meter come precedentemente visto, ed è un meter che rispecchia maggiormente la percezione dell’orecchio umano.

n.b. Considerando un meter LUFS per conversione di interfacciamento con dispositivi analogici lo 0 dB analogico è – 24 LUFS.

In figura 11 altre raccomandazioni – standard per il loudness normalizzato dei programmi audio in base al tipo di piattaforma di trasmissione.

fig. 11  2016-09-06_18-54-512016-09-06_19-03-04

Si nota in figura 11 come le trasmissioni in alta definizione per televisori HD ma anche UHD consentano e sono tecnologicamente predisposte per un picco e range loudness superiore, avendo all’ascolto una maggiore dinamica e loudness meno normalizzato e compresso rispetto a quello in ascolto da dispositivi mobili e TV non HD ( per cui più qualitativo ). Qualità dovuta ad un bitrate di trasmissione più elevato ( se digitale ) e in generale ad un minor rumore di fondo rispetto a piattaforme digitali mobile e televisori standard ( analogici o digitali ).

Le raccomandazioni per ottenere un segnale audio di qualità nel broadcast non chè normative regolamentate sono:

HDTV: True Peak Level Max – 1 LU, Program Loudness – 23 LUFS, Loudness Range < – 20 LU, Max Loudness – 20 LUFS ( short program ).

Tv non HD : True Peak Level Max – 1 LU, Program Loudness – 23 LUFS, Loudness Range < – 12 LU, Max Loudness – 20 LUFS ( short program ).

Piattaforme Mobile ( smartphone, tablet, lettori mp3, in cui rientrano podcast e streaming ) : True Peak Level Max – 1 LU, Program Loudness – 23 LUFS, Loudness Range < – 8 LU, Max Loudness – 20 LUFS ( short program ).

n.b. Per un programma musicale come precedentemente detto ci sono alcune tolleranze:

Max Loudness : – 18 LUFS se misurato in Short Term Loudness e – 15 LUFS se misura in Momentary Loudness.

Altri utilizzano propri standard sempre in elaborazione dell’ ITU BS.1770 come:

iTunes e iTunes Radio: Program Loudness – 16.5 LUFS ( tramite un algoritmo interno di normalizzazione del loudness chiamto Sound Check sempre presente nell’iTunes Radio selezionabile a scelta nell’iTunes ).

Games: L’audio per i giochi segue invece il – 23 LUFS di Program Loudness.

File compressi AC3 con Dialnorm: – 31 LUFS.

In figura 11 si nota come è utile quando possibile dare guadagno ai programmi audio con bassi valori dinamici e di picco, come i programmi per le tv non hd e mobile, fino al massimo di – 20 LUFS consentito per il Max Loudness.

n.b. Come si vedrà quando si parlerà di tecniche di mixaggio e mastering, creare dei mix e master che rispecchino le dinamiche come da normative e/o raccomandazioni proposte utilizzando LUFS a seconda di dove quella traccia audio andrà ad essere riprodotta, aiuta molto la qualità complessiva finale del brano in quanto che il processore presente nell’hardware di riproduzione che lavora e monitora il file audio andando ad amplificare od attenuare il livello del segnale in base a come viene letto per portarlo vicino ai livelli normativi ( sempre presente come da normativa per le trasmissioni broadcast in cui rientra tv, radio e mobile, con limite come detto a – 23 LUFS ), viene meno stressato e lavora meno sul proprio file già regolato in dinamica in fase di mix e mastering, cosi da porre minori alterazioni possibili e lasciando inalterate le qualità timbriche del mix e/o mastering fatto, soprattutto se il processore di controllo e correzione dell’hardware utilizzato per la riproduzione non è di qualità.

 

Differenza tra i processi di normalizzazione

EBU R128 ( Segnale in ingresso normalizzato a priori, salvato e poi diffuso, non vengono utilizzati metadati ).

iTunes e iTunes Radio ( I metadati di loudness ( le informazioni sul livello istantaneo di ogni campione audio ) vengo inseriti all’interno del file AAC, questi metadati vengono interpretati dal software e tramite l’algoritmo Sound Check viene creato un Gain Shift fino a raggiungere il livello normalizzato in fase di riproduzione, in pratica il guadagno si aggiusta automaticamente durante la riproduzione ), ( il problema fondamentale è che in Itunes il playback può essere eseguito anche su file non compressi come AIFF e WAV che non hanno la possibilità di trasportare metadati, in questo caso viene creato un pacchetto di metadati a parte aggiunto allo stream per la codifica da parte di Sound Check ).

ATSC ( Questo standard utilizza il Dialnorm della Dolby su AC3 bitstream, processo simile a quello EBU, non vengono utilizzati metadati ).

Tra i 3 quello ritenuto meno qualitativo è l’audio normalizzato da Itunes e Itunes Radio.

 

Gestione della normalizzazione da parte di iTunes e iTunes Radio

A differenza dello standard EBU e ATSC, iTunes e iTunes radio come detto leggono prima i metadati e poi normalizzano, un’altro problema di questo processo avviene quando si cerca di far leggere ad Itunes ad esempio un CD Audio, il CD non contiene metadati sulle informazioni di loudness e l’algoritmo non è in grado di leggere e percepire le informazioni sul loudness in tempo reale, per cui l’algoritmo necessita di far fronte ad un database ( chiamato Gracenote Database ) per rilevare i metadati ed applicare la relativa normalizzazione ( processo non preciso ), se il file audio non viene rilevato all’interno del database viene applicato di default un attenuazione di – 6 dB per poi ritornare a 0 dB una volta terminata la traccia e ripartire con una nuova analisi per la traccia successiva. In alcuni casi è possibile l’errore e cioè che rilevi un traccia all’interno del database ma che non è quella in riproduzione, questo porta ad una non corretta normalizzazione.

Per questi motivi sconsiglio di riprodurre CD Audio da iTunes.

Un’altro fattore che può far preferire altri sistemi di riproduzione soprattutto rispetto ad iTunes Radio ( quindi streaming radiofonico ) è il tipo di normalizzazione effettuata, cio’è la Single o Track Normalization che dato un valore medio definito, il processo tende a “schiacciare” quindi comprime o espandere i livelli dei brani al valore impostato ( in iTunes Radio è automatico e non editabile ), questo fa perdere ai brani la reale differenza dinamica ed ambiente di mixaggio ( esempio un brano può essere volutamente mixato e masterizzato con una dinamica più ampia rispetto ad un’altro o con un valore medio volutamente più basso, tutte queste variazioni dinamiche tra un brano e l’altro vengono perse nella Single o Track Normalization, ma è importante sapere che ogni brano mantiene la sua dinamica ), generalmente questi sistemi prevedono anche un limiter o compressore per limitare l’eventuale innalzamento dei valori di picco che potrebbero portare a livelli di distorsione.

Broadcast che invece seguono le direttive EBU o ATSC utilizzano Album Normalization, il quale consente ( quando riprodotto un album od una seria di tracce audio ) di portare ( tramite analisi di un algoritmo ) i valori delle tracce audio più loud allo stesso livello medio ed i valori delle tracce audio soft allo stesso livello medio ( i loud con i loud ed i soft con i soft ), ( anche questo sistema può presentare limiter o compressore per prevenire fenomeni di clip ).

L’album normalization permette all’utente finale più libertà di decidere tramite il proprio controller di volume il livello desiderato per l’ascolto senza perdere dinamica e profondità ( limitato solo dal rumore ambientale e rumore di fondo dell’attrezzatura utilizzata ).

iTunes invece per il playback di album e raccolte permette la scelta tra Single o Track Normalization e Album Normalization.

In figura 12 un esempio di differenza tra Single o Track Normalization e Album Normalization:

fig. 12 2016-10-29_15-20-35.jpg

Si nota come durante la SIngle o Track Normalization il valore medio di ogni traccia sia portato allo stesso livello, mentre durante l’Album Normalization vengano mantenuti i rapporti tra le tracce con più volume ( 1 – 3 ) e quelle con meno volume ( 2 – 4 ) se pur normalizzate.

 

Altri livelli di ponderazione

Alcuni LUFS meter hanno anche la possibilità di pesare in modo differente il livello medio del segnale audio analizzato come pesatura Leq ( A – B – C ), tale da poter eseguire e definire diversi tipi di loudness in base alle necessità, esempio il livello medio di un segnale audio all’interno di un ambiente in cui si devono rispettare normative sulla massima pressione sonora ( in quanto la massima pressione sonora in ambiente di spettacolo è misurata in Leq dBA ), ( tutto questo realizzabile tarando opportunamente il livello medio del LUFS meter esempio con ponderazione LeqA che raggiunge il livello limite quando il segnale rilevato da un fonometro di misura indica ad esempio 95 dBA, che rappresenta il limite di pressione sonora media in ambiente di spettacolo ), ( fig. 13 ).

fig. 13 ( LUFS Meter con possibilità di pesare il livello del segnale audio su Leq, la scelta del tipo di pesatura è indicata dal parametro “weighting” ).

fig. 13 2016-11-02_11-34-20.jpg

 

Meter per il controllo del livello del segnale in uscita dai codec

Con l’avvento di numerosi formati codec mp3, aac, mp4, codec per lo streaming come youtube, spotify, itunes, pandora, ecc.. i quali comprimono l’audio con diverse tecnologie producendo artefatti, distorsioni e cambiamenti del livello dBFS del segnale audio originale, il più delle volte aumentandone il livello rischiando di portare la decodifica a livelli di distorsione, sono nati meter che danno la possibilità di prevedere sia il livello del segnale audio dBFS in uscita dal codec che di effettuare un pre-ascolto di come questo suono verrà percepito, che visualizzarne la risposta in frequenza ( fig. 14 – 15 – 16 ).

Fig. 14 2016-11-14_16-01-20.jpg

Fig. 15 2016-11-14_16-07-06.jpg

Fig. 16 2016-11-14_16-03-06.jpg

 

Loudness War

La storia del recente passato fino al prossimo futuro ci insegna che più passano gli anni e più viene richiesta una maggiore compressione dinamica dei programmi audio ed un innalzamento del valore RMS, perchè ?

Secondo le case discografiche un brano musicale con più alto volume ( quindi aumentando il valore RMS ) vende di più che un brano musicale con più basso volume. Per evitare fenomeni di guerra tra le varie case discografiche e cinematografiche che avrebbero potuto portare l’audio a livelli di scarsa qualità ( in quanto più si cerca di comprimere e tanto più verranno introdotti e risulteranno fattori di distorsione armonica sia del brano musicale stesso che dallo strumento utilizzato per la compressione e per cui è necessario utilizzare strumentazione di assoluta qualità ) ( anche per questo motivo è nato il Mastering, per ottimizzare e lavorare al meglio sulla dinamica del file audio ), gli standard ITU ed EBU hanno cominciato a definire i livelli normativi dei valori RMS utilizzabili. Tramite studi fatti si è poi capito che all’ascoltatore finale nella maggior parte dei casi sentire un programma musicale con un valore RMS più alto non porta alcun beneficio in termini di investimento. L’utente finale tende sempre ad acquistare il brano preferito indipendente dal suo livello di loudness rispetto agli altri o rispetto allo stesso se avrebbe un valore RMS più basso.

Ci sono poi normative create per il controllo del rispetto delle normative stesse del limite massimo del loudness, come la CALM ( Commercial Advertisement Loudness Mitigation ) che obbliga il broadcast americano a non trasmettere la pubblicità ad un livello RMS più alto del programma trasmesso.

Di contro si ha il fatto che programmi musicali come la musica classica che ha bisogno di tutta la dinamica possibile per la rappresentazione timbrica di ogni strumento subiscano un peggioramento della qualità finale dovendo subire un’ipercompressione fino ai valori standard definiti, portando cosi alti valori di distorsione. Questo nel broadcast in quanto la regolazione dei livelli dinamici è generalmente fissa ( normalizzata a – 23 LUFS o comunque non può superare questo valore ) per tutti i programmi e viene riproposta attraverso processori di dinamica prima della diffusione della trasmissione, compressione posta su audio che già è stato lavorato ( quindi anche compresso ) in studio di registrazione e/o mastering. Per eventi dal vivo, televendita e promozione sono concesse oscillazioni di +/- 1 dB.

n.b. La normativa che regola il massimo volume medio a – 23 LUFS ( esclusivo per il broadcast ) non è una semplice raccomandazione ma è una vera e propria legge che se non rispettata può incombere in denunce e controversie legali.

Fortunatamente come detto in precedenza in contesto live ancora non esistono precise normative per cui è possibile ancora mantenere gli standard qualitativi necessari. In studio invece è ancora possibile regolare i livelli dinamici corretti cercando di seguire le normative definite secondo il programma musicale come da figura 1.

Anche la stessa tecnica di ponderazione utilizzata per il rilievo del valore RMS ( R2LB ) può essere motivo di discussione, soprattutto sul fatto di non rispettare realmente la percezione umana al suono, ma di compensare solamente la risposta timbrica sonora percepita al fine di variare il valore RMS di un programma musicale per pareggiare i valori timbrici di ascolto ( la tecnica come visto lavora bene se si considerano bassi volumi di ascolto ), alterando cosi la risposta naturale percettiva.

A livello professionale per essere prodotti e commercializzati è altamente consigliato proporre progetti ( ancor più se si lavora per il broadcast, come possono essere le trasmissioni radio-televisive e pubblicità ) che rispettino i limiti normativi ITU ed EBU o standard in base al paese in cui ci si trova.

n.b. Alcuni programmi, soprattutto quelli di mastering ed editing audio hanno tra le opzioni la possibilità di normalizzare i valori RMS seguendo lo standard di riferimento ( molto spesso EBU R-128, con riferimento ai – 23 LUFS da standard per il broadcast, anche se in realtà l’algoritmo calcola il livello rms del programma musicale analizzato e aumenta o attenua il valore rms avvicinandolo ai – 23 LUFS ponendosi come limite livelli di distorsione armonica ed alterazione della risposta in frequenza che quando rilevati limitano il fenomeno di guadagno o attenuazione, per cui è facilmente rilevabile che per alti valori rms o bassi valori rms la non effettiva normalizzazione ai – 23 LUFS, generalmente senza provocare distorsioni ed alterazioni della risposta in frequenza questi algoritmi riescono a lavorare bene in un range di +/- 5 dB, evitare per cui di utilizzare il fattore di normalizzazione per valori rms del programma musicale molto al di fuori di questo range, se molto alti provvedere ad attenuare in fase di mixaggio o procedure di mastering il livello RMS finale, se troppo basso provvedere allo stesso modo di alzare il valore RMS finale, cosi facendo si ottiene sicuramente una maggiore qualità ).

Di seguito alcune rappresentazioni grafiche per capire come il loudness è cambiato nel corso del tempo ( analisi e grafici statistici sono stati eseguiti da Ortner nel 2012, su di un campione di + 10.000 brani dal 1951 al 2011 concentrandosi soprattutto sulle registrazioni e mastering per CD ) ( fig. 17 ).

fig. 172016-10-26_15-50-28.jpg

Come si vede nella figura 17 dal ’79 fino al ’03 il livello medio di loudness è andato ad aumentare a dimostrazione della battaglia per raggiungere loudness sempre più elevati prima definita. Dal ’03 al ’11 il livello di loudness è andato a pareggiare, questo un po per le perdite di qualità ottenibili alzando ulteriormente il livello ed un po per il supporto di registrazione ( in questo caso il cd ) che non è in grado di registrare e riprodurre correttamente livelli di loudness superiori.

Dal ’97 al ’05 si nota anche come il livello di picco sia superiore di qualche dB allo 0 dBFS, da + 0.5 dBTP a + 5.4 dBTP causa gravi problemi di distorsione soprattutto in digitale, ma che a suo tempo pur di far risultare un suono più loud veniva trascurato.

fig. 18 2016-10-26_16-02-28

In figura 18 si vede la sezione di Loudness Range sempre in considerazione dei campioni audio analizzati. Si vede come la differenza anno dopo anno non sia poi cosi elevata se non nei periodi dal ’85-93 e dal ’03-05 a significare che sono stati maggiormente utilizzati processori di compressione e/o una maggiore diffusione di suoni elettronici ( quindi compressi ). Per questo si capisce anche come la battaglia del loudness non sia dal punto di vista dell’estensione dinamica musicale, sempre ben rispettata.

In figura 19 una rappresentazione espansa del Loudness Range e livello medio in base al periodo di analisi.

fig. 192016-10-26_18-56-52.jpg

Dove invece si è lavorato molto per raggiungere livelli ragguardevoli è dal punto di vista del Program Loudness quindi dell’headroom nella limitazione dei picchi ed innalzamento del livello complessivo, portando allo schiacciamento dinamico e alla percezione di un suono sempre più piatto ( fig. 20 ).

fig. 20 2016-10-26_16-14-43

In figura 21 una rappresentazione espansa sul massimo livello di picco ( Maximum True Peak ) in base al periodo di analisi, si nota chiaramente come dal ’91 in poi si tenda ad eccedere lo 0 dBFS.

fig. 21 2016-10-26_18-59-56.jpg

A scopo informativo vediamo anche l’andamento del valore medio nel tempo per Momentary Loudness ( fig. 22 ) e Short Term Loudness ( fig. 23 ).

fig. 22 momentary.jpg

fig. 23 short.jpg

Di seguito una tabella di comparazione comprensiva di ogni fattore di loudness evidenziato per ogni periodo di analisi, compreso Integrated Level ( fig. 24 ).

fig. 24 2016-10-26_19-05-59.jpg

Di seguito invece una tabella rappresentativa dell’utilizzo di processori per il raggiungimento del livello di loudness desiderato ( fig. 25 ):

fig. 25 2016-10-26_17-28-25.jpg

Si nota come inizialmente fino ai primi anni ’90 i compressori e limiter venivano più che altro utilizzati per bilanciare il livello di loudness dei master e limitare i picchi nelle fasi di registrazione e mixaggio delle componenti analogiche ( oltre per l’utilizzo di VU Meter come scale di riferimento che già di suo limitano le possibilità di gestione del loudness ). Successivamente con l’avvento dell’audio digitale e dei plugin è cominciata l’era dell’abuso di software, hardware digitale e guerra di loudness ( passando per sempre più aggressive compressioni ed utilizzo di limiter per evitare fenomeni di distorsione oltre i 0 dBFS anche se in alcuni casi come si vede si è arrivati anche oltre, passando anche da un abuso di equalizzazione soprattutto nelle alte frequenze per ottimizzare l’ascolto anche in zone in cui l’orecchio fatica in sensibilità ” le alte ” ), fino ad oggi in cui siamo arrivati ai limiti oltre i quali non è più possibile comprimere se non ottenendo scarsi risultati.

In figura 26 invece abbiamo una rappresentazione grafica mirata ad evidenziare la differenza nel tempo tra i passaggi soft ed il program loudness dei vari brani musicali nel tempo.

fig. 26CAM00707.jpg

Si nota come nell’era analogica un po limitati dalle attrezzature e dalle basse dinamiche dei processori e diffusori utilizzati la differenza tra il valore di program loudness e soft passages sia più ristretta rispetto al rapporto tra gli stessi dopo l’avvento dell’era digitale ( soprattutto dal ’94 in poi ). Questo perchè durante l’era analogica il rumore di fondo di tutte le apparecchiature utilizzate era superiore ad oggi e quindi si cercava di avvicinare il più possibile i passaggi morbidi e leggeri al valore medio percepito ( e nonostante questo si ottenevano maggiori dinamiche di ascolto rispetto ad oggi ), durante l’era digitale invece il fenomeno della compressione e l’elevata dinamica utilizzabile ha permesso di poter lavorare maggiormente sulla differenza tra i passaggi soft e loud rendendo suoni più naturali ( peccato però che si tenda a schiacciare tutta la dinamica verso il più alto valore di picco possibile ).

Alcuni pensano che la guerra del loudness sia cominciata con l’avvento e diffusione dell’audio nelle automobili e dispositivi portatili, cominciando dal presupposto di realizzare brani loud per compensare il rumore di fondo causato dalle auto sia interno che esterno che dal rumore ambientale e dai prodotti ad uso consumer e non più Hi-Fi.

Di seguito invece propongo grafici dell’andamento di un brano degli anni ’80 ( Beat It di Michael Jackson ) e la sua evoluzione nel tempo, a rappresentare come la discografia punti a rimasterizzare vecchi brani e album secondo i valori medi del periodo a cui fanno riferimento per vendere nuovamente nuove raccolte dello stesso artista ( fig. 27 – 28 – 29 ):

fig. 27 ( andamento dei parametri LUFS )2016-10-27_14-03-17

In figura 27 si nota chiaramente come qualsiasi parametro si sia alzato di livello nel corso del tempo ad indicare la sempre maggiore compressione per adattare il livello di loudness al mercato. Il fattore Crest indica l’headroom tra il massimo valore di loudness e il Max TP. HLSD ( High Level Sample Density ) indica il livello di sample presenti nel brano tra – 1 dBFS e 0 dBFS, è chiaro come l’evoluzione abbia portato all’utilizzo di sempre più limitatori e normalizzatori di livello per alzare la dinamica del segnale.

fig. 28 ( evoluzione del guadagno nella risposta in frequenza utilizzando come riferimento l’equalizzazione data nel 1982 )2016-10-27_14-03-43.jpg

Si nota come soprattutto in bassa frequenza sia stato dato un notevole incremento di dB ( oltre i 10 dB di guadagno ). Anche in alta frequenza è stato dato un notevole incremento di dB ( oltre i 7 dB ) ad indicare la migliore efficienza in risposta in frequenza ( quindi una più estesa banda in frequenza utilizzabile ) dei dispositivi di registrazione e riproduzione utilizzati dopo il 1990 con l’avvento del CD.

fig. 29 ( evoluzione della risposta in frequenza )2016-10-27_14-29-49.jpg

In figura 29 abbiamo la risposta in frequenza, anche in questo caso è chiaro come vi sia un aumento considerevole del valore medio  ( colori rosa e rosso ) ed una normalizzazione del valore di picco ( probabilmente attraverso normalizzatori e/o limitatori ) ( colore blu ).

Un’ultimo dato per comprendere a pieno lo sviluppo del loudness nella storia è in figura 30 in cui sono rappresentati tutti i livelli di picco normalizzati a 1029 hz nel corso del tempo:

fig. 30 2016-10-27_16-43-45.jpg

In figura 30 è chiaro come nei primi anni 50 le strumentazioni utilizzate non consentissero l’estensione in dinamica e risposta in frequenza alle alte frequenze sopra ai 5.000 hz ( considerando un – 10 dB di tolleranza ) e in bassa frequenza sotto agli 80 hz ( considerando un – 10 dB di tolleranza ). Si vede anche come soprattutto negli ultimi anni si tenda ad eccedere lo 0 dBFS accettando un po di distorsione ma garantendo maggiore loudness.

 

Considerazioni sulla normalizzazione

Come si intuisce da tutto quello analizzato in questo articolo ogni media e dispositivo di riproduzione ha di base in modo automatico o manuale un certo tipo di normalizzazione per prevenire e limitare questa Loudness War, soprattutto nel broadcast. Ad oggi gli unici dispositivi in grado di consentire ancora piena libertà nella gestione del loudness sono i CD, Bluray e Dvd player o alcuni software come JRiver, che non presentano se non per selezione manuale processi di normalizzazione.

Per questo molti produttori scelgono di processare e mixare con diverso loudness i file audio per questi supporti.

Per questo motivo si ritiene che i supporti ottici siano duri a morire!

Anche la musica dal vivo comprese le sequenze ( se non normalizzate ) garantiscono una piena libertà nella gestione della dinamica, limitati esclusivamente dalle normative di legge sulla massima esposizione al rumore.

Ad oggi la normalizzazione può risultare un problema dal punto di vista della creazione di un mix e mastering in quanto come si può facilmente intuire da tutto quello spiegato tende a modificare la naturalità del mix e mastering originale. Per cui per non perdere ore di lavoro ed impegno è utile conoscere il tipo di destinazione che avrà il singolo o l’album prodotto al fine di creare un master che segue gli effetti di processamento e normalizzazione del sistema di riproduzione, che sia broadcast, player portatile o streaming al fine di capirne gli effetti e creare mix-master mediati o specifici per il tipo di destinazione ( questo può essere visto anche come un aumento considerevole del lavoro svolto più che altro come operazione di mastering ), cosi da evitare picchi e distorsioni, schiacciamento dinamico, riduzione dell’immagine stereo o surround, impoverimento di effetti e risposta in frequenza.

 

Conclusioni

In conclusione può essere fatta una domanda:

E’ meglio quindi ascoltare un segnale loud ma distorto od un segnale più dinamico ?

La risposta corretta sarebbe un segnale più dinamico ed aumentare o diminuire il guadagno tramite il potenziometro di amplificazione del proprio dispositivo di riproduzione secondo quando “loud” vuole essere percepito.

LUFS Meter è quindi ad oggi uno strumento indispensabile per un qualsiasi tipo di applicazione dal mixing al mastering, che sia studio o live, grazie ad esso è possibile raggiungere livelli dinamici, profondità, spazialità di un mix non raggiungibili con i normali meter analogici o digitali. Consiglio quindi chi non l’avesse già fatto di sostituire il proprio meter con un LUFS Meter ( vedremo in altre argomentazioni come sfruttare LUFS Meter per mixare e fare Mastering ).

Per maggiori informazioni sull’evoluzione del loudness in cui sono presenti molti dei grafici qui proposti in una spiegazione più dettagliata:

Loudness Evolution

Esistono poi altri riferimenti normativi ITU ed EBU oltre a quelli appena visti, per lo più legato alle trasmissioni televisive e broadcast:

EBU.3342

EBU.3343

ITU R BS 1770 “Algorithms to measure audio programme loudness and true peak audio level” (09/2007)
ITU R BS 1771 “Requirements for loudness and true peak indicating meters” (07/2006)
ITU R BS 1726 “Signal level of digital audio accompanying television in international
programme exchange” (04/2005)
ITU R BS 1864 “Operational practices for loudness in the international exchange of digital television programmes” (03/2010)
ITU R BR 1352 “File format for the exchange of audio programme materials with metadata on information technology media” (12/2007)
Altro su Decibel e Meter:

Decibel e Meter – I ( Tipologie di Decibel e Standard )

Decibel e Meter – II ( Meter Analogici )

Decibel e Meter – III ( Meter Digitali e Software )

Decibel e Meter – V ( I Meter nelle Apparecchiature Audio )

Decibel e Meter – VI ( Loudness Manager )

 

Acquista Meter dai principali Store

 

Meter e Hardware Tools

 

logo amazon.it

Thomann_logo1

The-new-eBay-logo

 

Software e Plugin Tools

 

Thomann_logo1

The-new-eBay-logo

 

Applicazioni di Trading Online Sponsorizzate

DESKTOP

MOBILE

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

w

Connessione a %s...