Psicoacustica – VII

Sensazione di Localizzazione

Che l’ascolto sia in Stereo o Multicanale l’ILD e ITD non si comportano in egual modo a tutte le frequenze, a seconda della frequenza dovremmo avere un certo tipo di differenza di intensità e di tempo per poter essere localizzata in un determinato punto.

In figura 1 un esempio di grafico che mostra la differenza di livello (ILD) necessaria per spostare un tono a circa 15° verso sinistra, considerando una tipologia di ascolto stereofonico.

Fig. 1 (da Tecniche Stereofoniche di Microfonaggio).

20180528_105313.jpg

Come si nota dalla figura 1 la minore differenza di tempo necessaria per lo spostamento si ha dove l’orecchio è più sensibile, quindi medio-alta, mentre dove l’orecchio è meno sensibile si necessità di una maggiore differenza di ampiezza, soprattutto quindi in bassa frequenza (per compensare anche il fatto di faticare ad essere percepite come differenza di ampiezza ILD). In questo caso si considera un ascolto frontale attraverso due monitor in stereo, per cui differenti angoli di ascolto ed una tipologia di ascolto binaurale faranno ulteriormente variare questi parametri.

Per quanto riguarda ITD è stato proposto un grafico come quello in figura 2.

Fig. 2 (da Tecniche Stereofoniche di Microfonaggio).

20180528_105319.jpg

In questo caso si determina il tempo necessario per ottenere uno spostamento dell’immagine di 15° verso sinistra (ITD), sempre su ascolto stereo e tonale, quindi variabile per tutte le tipologie di ascolto viste precedentemente.

Anche qui dove l’orecchio è più sensibile serve un tempo di ritardo inferiore rispetto a dove l’orecchio è meno sensibile, in questo caso però dipende dall’effetto precedenza e quindi sensibilità dell’effetto Haas nel percepire eco, che anche in questo caso varia in base alla frequenza, dipende anche dalla lunghezza d’onda, cioè se si determina un segnale in fase o controfase dalla somma di arrivo dei due toni.

E’ ritenuto che anche la larghezza di banda sia fondamentale per la variazioni di questi parametri di base, per cui molto difficile da definire in un conteso reale dove i suoni che ascoltiamo non sono quasi mai tonali ma sempre a larga banda. Per cui largo spazio ai test e a quando effettivamente percepiamo questo spostamento.

n.b. La direttività in frequenza dei monitor utilizzati per l’ascolto (come vedremo meglio quando parleremo di sistemi di diffusione sonora) è fondamentale per le variabili dei parametri visti fino ad esso, tenuti validi solo per una tipologia di ascolto da monitor che diffondono il suono che arriva alle nostre orecchie lineare a tutte le frequenze (cioè anche variando l’angolo di posizione del monitor la risposta non cambia, mentre in realtà vedremo che non è cosi).

n.b. Quando si mixa in stereo, ma lo stesso è applicabile per sorgenti multicanale, e come vedremo meglio quando parleremo di mixer audio, il posizionamento della sorgente tra i due monitor (realizzato attraverso il controllo di PAN, fig. 3), determina se lo spostamento della sorgente avviene verso sinistra o verso destra o altri canali utilizzati, questo avviene per ILD, quindi a livello elettrico si manda più energia all’altoparlante a cui si sta direzionando l’immagine sonora e meno a quello/i opposto/i. Cosi facendo le nostre orecchie percepiscono un differente livello di intensità sonora tra i monitor e localizzano di conseguenza la sorgente. Se si fa questo con frequenze basse, come visto non avviene, in quanto non riusciamo a localizzarle. Per aumentare il livello di localizzazione sarà necessario lavorare per ITD, quindi ritardare la parte basse nel monitor opposto a quello dove la si vuole direzionare.

Fig. 3 rfff.png

E’ stato poi definito che (considerando un ascolto stereofonico) per avere uno spostamento pieno dell’immagine da un monitor ad un altro siano necessari 20 dB di differenza o 1,5 ms di ritardo tra i due monitor.

In figura 4 un esempio dello spostamento dell’immagine in base alla differenza di livello.

Fig. 4 (da Tecniche Stereofoniche di Microfonaggio)

20180528_120250.jpg

In figura 5 un esempio di spostamento dell’immagine derivato dalla differenza di tempo.

Fig. 5 (da Tecniche Stereofoniche di Microfonaggio)

20180528_121516.jpg

n.b. Il nostro sistema di localizzazione come visto anche nei precedenti articoli permette un interazione tra ILD e ITD, questo però può portare alcuni livelli di confusione, ad esempio se ritardo il monitor che presenta un livello di intensità superiore si può creare confusione di localizzazione per mancata focalizzazione. Questo perchè avendo un livello di intensità superiore il segnale viene localizzato su di esso, ma inserendo un tempo di ritardo maggiore tendiamo a far ritornare l’immagine verso posizione centrale. Essendo come visto valori che dipendono da molti fattori come frequenza, larghezza di banda e molto altro, si può facilmente creare confusione, per cui è sempre bene per migliorare la focalizzazione dell’immagine utilizzare uno o l’altro metodo.

Questi valori considerano una tipologia di ascolto stereofonico, in caso ci si allontani con l’ascolto (o si riduca la distanza tra le sorgenti), il rapporto distanza-ascolto aumenta e le due sorgenti risulteranno maggiormente in fase e ravvicinate a maggiori distanze, per questo servirà un maggiore ritardo e differenza di ampiezza per percepire uno spostamento della localizzazione di provenienza, fino ad un limite per cui non riusciamo più a filtrare e focalizzare la provenienza.

n.b. Questo è uno dei motivi per cui non ci si dovrebbe mai trovare ad ascoltare troppo lontani dal campo vicino della sorgente sonora (vedremo questo quando parleremo di acustica).

Al contrario se allarghiamo troppo la distanza tra le sorgenti (o ci avviciniamo con l’ascolto), servirà sempre minor tempo e intensità di differenza in quanto si va ad estremizzare la provenienza laterale del suono alle nostre orecchie. Anche in questo caso fino ad un limite per cui l’ascolto tende ad essere transaurale, (fig. 6).

Fig. 6 svsl.JPG

n.b. Non conviene essere nè troppo vicini al campo vicino delle sorgenti (per via delle turbolenze e distorsioni che si generano in prossimità della sorgente sonora, come vedremo quando parleremo di acustica) nè distanziare troppo le due sorgenti determinando una percezione di buco centrale ed il suono spostato tutto sui due lati. Ancora peggio se si riproduce un suono mixato in stereo o con altre tipologie di ascolto. In caso di riproduzione di brani musicali registrati la posizione delle sorgenti deve essere la stessa utilizzata per il mixaggio (stereo, surround, ecc…) altrimenti non si rispecchierà mai la dinamica, la profondità, l’ambienza, posizione degli strumenti nello spazio dato nel mix, per il live invece si può definire un concetto di immagine determinato da molteplici fattori che vedremo in altre argomentazioni.

 

Tipologie di Ascolto

Monofonico

Quando alle orecchie arriva un singolo suono (tonale o broadband) prodotto da un singolo altoparlante, valgono le regole viste per ILD e ITD, la percezione è detta Monofonica, localizzata in un punto di provenienza, con zero dimensione (suono piatto), (fig. 7), (A.1).

Fig. 7 mmono.JPG

A.1 Esempio di tono ad 1 Khz con stessa fase ed ampiezza, da riprodurre con un singolo altoparlante, è chiaro come venga percepito in direzione frontale.

Il suono monofonico è stata la prima tipologia di suono realizzata attraverso la registrazione e riproduzione di un singolo canale audio nei rulli/cilindri di cera/stagno per fonografi e dischi di zinco/ebanite per grammofoni. Utilizzato poi all’interno di colonne sonore per il cinema (grazie soprattutto al fatto di tenere poco spazio e poco peso, sia come spazio occupato nelle pellicole cinematografiche che come peso in termini di MByte in formato digitale. Utilizzato per lo più ad oggi per la registrazione e riproduzione della voce, in quanto un differente tipo di ascolto da quello monofonico (come quelli che vedremo), può creativamente in certi casi essere sfruttato come effetto, ma comunque risulta innaturale all’ascolto. Viene anche sfruttato oltre che per la voce per il mixaggio di un qualsiasi strumento nel posizionamento della sua immagine al centro.

n.b. L’ascolto monofonico è quindi solo quello che fa percepire il suono in una posizione centrale, privo di dimensione e spazialità. E’ possibile ascoltare un qualsiasi programma audio musicale per capirne l’effetto.

Quando invece arrivano più suoni contemporaneamente alle nostre orecchie entrano in gioco non solo i fattori di ILD e ITD ma anche l’Effetto Precedenza e l’Effetto Haas.

 

 

Stereofonico

Realizzato nei laboratori Bell negli anni 30 del 900 alla ricerca di un sistema per riproporre nello spazio gli strumenti dando un immagine della loro dimensionalità e posizione, si riuscì per il momento a definire questo in uno spazio orizzontale con 2 altoparlanti, quindi la dimensione è realizzata ma rimane schiacciato sulla profondità e altezza.

Dall’ascolto Stereofonico in su (aumento del numero di altoparlanti e tipologia di segnale audio con fase, ampiezza, frequenza e tempo di ritardo differente) grazie a ILD e ITD si percepisce una maggiore dimensionalità ed esteriorità del suono, cosa che invece manca come vedremo per un ascolto in cuffia (binaurale). Quindi se le due sorgenti hanno lo stesso livello di intensità sonora e noi ci troviamo in mezzo al loro asse di ascolto percepiremo un suono centrale (mono) con un estensione orizzontale che dipende dalla fase e tempo di arrivo dei due segnali.

 

Phantom Image

Questa percezione di un suono centrale nonostante la presenza di 2 monitor di ascolto è detta Phantom Image o Ghost Image, ad indicare un immagine fantasma centrale realizzata dall’interazione delle due orecchie da parte del cervello, ma che in realtà è prodotta da due monitor appositamente distanziati ed angolati tra loro rispetto ad una posizione di ascolto,

Per avere un perfetto e preciso ascolto stereofonico è necessario seguire questo principio di posizionamento monitor – ascolto (fig. 8):

Fig. 8 Triangolo ottimale di ascolto control room .png

I monitor vanno posizionati con i centri acustici minimo a 2 metri di distanza tra loro, (anche se poi dipenderà dal range di frequenze riprodotto per ovviare alle cancellazioni di fase come vedremo più avanti in altre argomentazioni), e inclinati di 60° rispetto alla posizione di ascolto, in modo da formare un perfetto triangolo equilatero.

n.b. Le orecchie si devono trovare come si vede dall’immagine in figura 8, all’interno del triangolo equilatero. Ed è proprio questo il principale difetto di questa tipologia di ascolto, per cui anche un piccolo spostamento della testa o del centro acustico del triangolo equilatero formato dalla posizione dei monitor rispetto alla testa fa perdere un perfetto e preciso ascolto.

Se variamo la posizione della testa, la fase (tempo) e ampiezza di differenza tra i due monitor cominceremo a percepire suono stereo.

Questo ascolto stereofonico di un programma musicale, farà si che la nostra percezione, sia più ampia, cioè più aperta, molto più gradita all’orecchio di una percezione sonora chiusa e centrale come nel caso monofonico, questo perché si avvicina di più alla reale percezione umana. Date le variazioni di fase, frequenza e ampiezza, si determina la capacità di percepire e visualizzare la posizione degli strumenti in un ambiente e la loro grandezza. La posizione percepita come massimo estremo, sarà esclusivamente quella Left ( L ) / Sinistra e Right ( R )/Destra.

Un ascolto stereofonico consente di percepire il bilanciamento di un suono nella sua dimensione e localizzazione, in uno spazio frontale su di un piano orizzontale.

L’estensione stereo detta anche larghezza di campo è la distanza tra il punto dell’immagine di estrema destra e quello di estrema sinistra percepita ad esempio in un mix (fig. 9).

Fig. 9 (da Tecniche Stereofoniche di Microfonaggio)

20180525_154155.jpg

Fig. 10 (da Tecniche Stereofoniche di Microfonaggio)

20180525_152701.jpg

Come si vede della figura 10 un immagine sonora percepita centrale è più definita e maggiormente localizzata di un’immagine sonora estesa su di una più ampia estensione stereo, a cui però è maggiormente percepita la sua reale dimensione, con in più un risalto (come vedremo quando parleremo di tecniche di microfonaggio) della componente ambientale che caratterizza l’ambiente in cui si trova a suonare quello strumento. Un’immagine mono è invece statica e piccola, poco realistica.

n.b. Quando si dice che un mix ha un’estensione stereo piccola, significa che i punti di estrema destra ed estrema sinistra dell’immagine di un qualsiasi strumento musicale sono percepiti molto vicino ad una posizione centrale (mono). Come vedremo quando parleremo di mastering esistono numerosi tool con cui è possibile interagire per monitorare costantemente il tipo di estensione stereo, ma lo stesso per ascolti surround e 3D. Se si lavora in ambiente live dove l’audience è varia e non è possibile definire una precisa posizione di installazione dei diffusori acustici per avere un perfetto ascolto, tanto è vero che si da priorità ad un’omogenea distribuzione della pressione sonora, si può optare considerando la riproduzione di un brano musicale mixato in stereo, di allargare l’immagine (attraverso appositi processori che regolano l’estensione dell’immagine che vedremo in altre argomentazioni) se l’area di ascolto è maggiormente concentrata “lontano” dall’impianto o stringere l’immagine se l’area di ascolto è maggiormente concentrata “vicino” all’impianto secondo i principi visti, e considerando sempre che la base di partenza è sempre la teoria di ascolto stereofonico.

Come detto un ascolto stereo non presenta profondità ma anche altezza come invece può avere un ascolto surround o 3D, per sopperire a questo e dare un senso più realistico del posizionamento dell’immagine sonora non solo sul piano orizzontale ma anche di vicinanza e allontananza, si aggiunge riverberazione e prime riflessioni ambientali (possibilmente ripresa da ambienti reali) e si lavora con il livello di intensità e bilanciamento tra i due segnali. Tutte tecniche che vedremo meglio quando parleremo di ripresa microfonica.

Molto scarse sono invece le possibilità di determinare una posizione verticale dell’immagine sonora (distribuzione in altezza).

n.b. E’ possibile ascoltare un qualsiasi mix stereo di un programma musicale per capire l’effetto di un ascolto stereo.

n.b. Come vedremo meglio quando parleremo di tecniche di ripresa microfonica, per realizzare un tipo di ascolto stereo è necessario registrare il suono con una tecnica stereofonica (detto anche mix a stereofonia discreta). Posizionare a Left o Right uno o più segnali mono, ma anche sdoppiare un segnale mono e variarne la fase ed ampiezza non è realizzare un mix stereo ma sempre mono, solo con un posizionamento del segnale mono in un determinato punto dello spazio orizzontale, ed è definito mix a stereofonia non discreta.

 

Monoaurale

La percezione di un suono da un solo orecchio, come ad esempio attraverso un solo padiglione di una cuffia è detto Monoaurale, ed è il tipo di ascolto più innaturale che ci sia, in quanto disponiamo di 2 orecchie che interagiscono tra di loro per ILD e ITD.

 

Binaurale

Il Binaurale è il tipo di ascolto che abbiamo quando sentiamo un qualsiasi programma musicale in cuffia (fig. 11) con entrambe le orecchie.

Fig. 11 dribble-portrait-2.png

n.b. Provare ad ascoltare uno stesso mix tramite coppia di diffusori stereo e poi in cuffia per capire meglio la differenza tra i due ascolti.

Percezione di un segnale lateralizzato dentro la testa per via di due suoni indipendenti, ILD e ITD sono estremizzati e limitati al singolo orecchio. Questo è enfatizzato per le maggiori distorsioni con  i suoni che impattano sul padiglione auricolare che ci sono avvicinando in questo modo la sorgente alle orecchie (pochi mm) per le cuffie grandi, mentre al contrario privo di riflessioni del padiglione, per in ear, percezione di suono ovattato e maggiormente risonante all’interno della testa. Una giusta equalizzazione della risposta in frequenza delle cuffie permette di risolvere questo problema.

L’ascolto binaurale è l’ascolto più chiaro e definito che c’è in quanto non subisce delle distorsioni ambientali (riverbero, riflessioni, diffrazioni, assorbimento dell’aria, ecc..) ma poco realistico (proprio perchè mancano queste componenti che fanno parte invece di un contesto di ascolto naturale, in quanto chiuso e limitato nel percorso altoparlante-orecchie, sta quindi nel corretto mix per il binaurale inserire riverberazione, ambienza, profondità, tutte cose che ci sono per un ascolto tramite diffusori esterni in cui c’è anche l’interessamento del nostro corpo al vibrare e riflettere i suoni che impattano su di esso.

Un registrazione binaurale da eccellenti immagini in cuffia ma un po schiacciate per ascolti stereo e multicanale.

E’ definito a volte anche ascolto Interaurale in quanto è percepito come un suono interno alla nostra testa.

 

Olofonico

L’ascolto Olofonico è essenzialmente una tipologia di ascolto Binaurale, solo registrando il suono attraverso un apposito microfono ad 8 capsule (Olofono, che vedremo meglio quando parleremo di tecniche di microfonaggio).

Per alcuni la registrazione con questo tipo di microfono invece che con tecniche stereofoniche o teste artificiali, risulta più fedele a come noi percepiamo il suono, e quindi da una maggiore chiarezza all’ascolto binaurale in cuffia, per altri invece non cè differenza, per altri ancora la tecnologia di registrazione con testa artificiale ed opportuna correzione con l’equalizzazione risulta ancora la migliore.

 

Intercanale

Quando ascoltiamo con la presenza di più di un monitor (quindi non tramite cuffie), avremo una tipologia di ascolto non solo determinata da ITD  e ILD ma anche dall’interazione di fase quindi tempo di ritardo, e livelli di differenza di intensità dei due monitor, che determinano un tipo di ascolto complesso (come anche quello stereofonico). Questo tipo di ascolto è definito Intercanale (fig. 12) ed è il più reale tra gli ascolti, in quanto che nella vita di tutti i giorni, suoni e rumori sono percepiti da più sorgenti poste nello spazio ambientale che arrivano con differenti tipologie di tempo ed intensità alle nostre orecchie.

Fig. 12 fxvxvx.JPG

 

Transcanale

L’ascolto Transcanale è una tipologia di ascolto artificiale, quindi non presente nella realtà, realizzato tramite apposito processore che regola fase e ampiezza dei segnali audio provenienti da una coppia di monitor, permette di realizzare una tipologia di ascolto simile a quella Binaurale attraverso una coppia di monitor.

Per fare questo in modo corretto è necessario un tipo di segnale audio registrato in binaurale (es. tramite testa artificiale, come vedremo più in dettaglio quando parleremo di tecniche di microfonaggio), questo processamento tende ad eliminare tutti quei segnali che hanno stessa fase ed ampiezza in entrambi i canali (L-R), cosi da definire due segnali indipendenti, proprio come avviene per un ascolto binaurale (fig. 13).

Fig. 13 cbcbcv.JPG

Il Transcanale va oltre l’ascolto binaurale perché permette anche (sempre tramite regolazione della differenza di fase ed ampiezza tra i due canali), un tipo di ascolto surround con solo due monitor di ascolto, quindi avere la sensazione di percepire il suono provenire da più lati attorno alla testa, frontale, sopra e sotto, sinistra destra, vie di mezzo, ma anche dietro, anche se non molto efficiente (è la base dell’ascolto 3D che vedremo più avanti).

E’ detto anche Transaurale in quanto come il Binaurale è un suono percepito all’interno della nostra testa, ma in questo caso riprodotto da una coppia di monitor esterna, ed è in grado di dare una maggiore dimensione ed ampiezza del segnale riprodotto rispetto all’ascolto Binaurale, in quanto è diffuso in ambiente e non diretto alle nostre orecchie.

 

Surround Multicanale

L’ascolto multicanale è un tipo di ascolto Intercanale avvolgente che permette di dare le basi di percezione a 360° attorno alla testa, il minimo di diffusori ritenuto utile per effettuare questo tipo di ascolto è 4, fino ad un limite massimo non definito, ma che segue ad oggi diversi standard di configurazione costantemente in sviluppo.

Per realizzare questo come per l’ascolto stereo è necessario avere per ogni monitor di ascolto un tipo di segnale con fase, ampiezza e frequenza differente.

C’è da dire però che più diffusori determinano anche più rumore di fondo, in quanto si sommano i rumori di fondo sia dei diffusori stessi, che delle linee di segnale e potenza che portano l’audio, che dal rumore degli amplificatori e processori vari utilizzati, tutto sommato per il numero di diffusori utilizzati. In più aumentano le direzioni di provenienza del segnale audio che può creare maggiore confusione di localizzazione-focalizzazione.

Per questo motivo mixare in multicanale è molto più complesso che mixare in stereo (vedremo poi le tecniche di mixaggio multicanale in altre argomentazioni).

Nel corso degli anni sono state sviluppate diverse tecniche e sistemi di riproduzione di un segnale audio Surround con lo scopo di ottimizzare l’ascolto e renderlo il più possibile reale, il cui suo principale utilizzo è in ambiente cinematografico, in cui si cerca di immergere lo spettatore all’interno dell’ambiente rappresentato dal film, come se ci si trovasse in mezzo, e quindi con l’obbiettivo di far sentire tutti i rumori, suoni, parlato, musica nel rispetto della loro posizione all’interno del film. Es. un aereo che nel film seguendo la visione offerta dalla telecamera passa da dietro a davanti è importante che allo spettatore venga fatto percepire questo spostamento da dietro al fronte, cosi da immergerlo come se lui si trovasse in quel posto in quel punto a percepire quell’aereo.

Più recentemente sono state applicate tecniche di mixaggio e riproduzione surround anche per eventi live, soprattutto per i video di concerti, tale sempre da immergere l’ascoltatore come se si trovasse nel concerto in quell’ambiente, magari in una determinata posizione con gente attorno (questi ultimi due concetti legati al video di concerti), come può appunto avvenire in un contesto reale, ma non solo, anche per ottimizzare un tipo di mix spaziale, potendo in questo contesto gestire anche la profondità ed altezza degli strumenti (molto più immersivo di un ascolto stereofonico), (quest’ultimo concetto molto utilizzato anche per eventi live).

Le tipologie di ascolto multicanale, molte delle quali cadute in disuso (le vedremo più in dettaglio quando parleremo appunto di audio surround) sono:

4.0 – 5.1 – 6.1 – 7.1 – 10.2 e molte altre.

Il .1 è riferito al canale adibito al diffusore per basse frequenze-effetti, canale LFE (low frequency effect).

Ogni configurazione permette una tipologia di ascolto dell’immagine sonora, posizione, localizzazione, spazialità, con sensazione di immersione e realismo differente.

Ad oggi si ritiene che come linea generica, più canali ci sono, appositamente posizionati e configurati (come vedremo tramite applicazione di delay e variazioni sul livello di pressione sonora) e più si ottiene realismo.

Riporto alcune immagini di riferimento per la comprensione, ma entreremo più in dettaglio in altre argomentazioni.

4.0 L’ascolto quadrifonico è stato la prima tipologia di diffusione – ascolto in surround, composto da 4 altoparlanti in opportuna tipologia di configurazione stereo rispetto ad un punto di ascolto centrale (2 frontali Left e Right Front e 2 posteriori Left e Right Back).

In figura 14 un esempio di configurazione quadrifonica e relativa immagine sonora percepita.

Fig. 14 (da Surround Sound Up and Running)

20180713_093409.jpg

Il test di psicoacustica eseguito si basa sugli effetti di localizzazione dell’immagine sonora percepita in base ai livelli di SPL di differenza tra i monitor. Come si nota si ha una distribuzione della localizzazione molto simile ad una farfalla o petali di rosa. Se tutti i monito hanno la stessa intensità sonora l’immagine è percepita centrale (se pur sfocata come visto in questa serie di articoli).

I cerchi concentrici mostrano il livello SPL, le linee che intersecano i cerchi mostrano invece l’estensione della deviazione dell’immagine sonora alla quale è spesso associato anche la differenza tra i monitor di riferimento per ottenere quel livello di deviazione di localizzazione. Il cerchio in cui è presenta la linea di deviazione definisce il livello di differenza SPL tra i monitor.

I valori alfanumerici posti sul cerchio più esterno indicano rispettivamente il livello di sensazione percepita dalla deviazione:

(D= Diffuse, H= High, J= Jumpy, L=Low, NH=Normal Height, s=Slightly, v=Very).

Un esempio, se abbassiamo di 10 dB il canale Right, avremo uno spostamento dell’immagine sonora di circa 22,5° verso Left. E finisce in un tipo di sensazione H sD (Quindi un suono che tende ad alzarsi, e a diffondersi – estendersi leggermente).

n.b. Questo esperimento ha portato le basi per gli sviluppi dell’ascolto multicanale.

Rispetto ai prossimi che vedremo è quello più limitato dal punto di vista del ricreare un immagine sonora realistica.

5.1 è un ascolto multicanale composto da 1 diffusore centrale (canale C o Center), una coppia di diffusori stereo inclinati di 30° per gli stessi motivi che legano audio e video visti nella figura 9 (canale Left – Right), una coppia di diffusori posteriori inclinati di 110° rispetto all’asse centrale (canale LS o Left Surround e canale RS o Right Surround), ed un diffusore (canale LFE) per gli effetti e la riproduzione delle basse frequenze (fig. 15).

Fig. 15 p5s5s2pop01[1].gif

Rispetto all’ascolto quadrifonico (il cui principio di ascolto rimane invariato) sono variati gli angoli di posizionamento dei vari altoparlanti al fine di dopo una serie di test psicoacustici, determinare una tipologia di ascolto più naturale e reale possibile.

n.b. L’aggiunta del canale frontale C all’ascolto stereo L-R è stato necessario per minimizzare la distorsione di localizzazione dovuto ad un eventuale spostamento della testa per cui si generano differenze di fase e ampiezza tra l’arrivo di un canale e l’altro alle nostre orecchie (si va quindi a perdere la Phantom Image, che rappresenta come detto la percezione di un suono frontale). Questo canale opportunamente mixato con quello stereo, consente di ridurre questo fenomeno di distorsione. Questo è anche uno dei motivi per cui la voce in un film viene spesso riprodotta dal solo canale centrale, cosi da evitare differenze di timbro alla spostamento della testa da parte dell’ascoltatore.

6.1 è un ascolto multicanale composto da 1 diffusore centrale (canale C o Center), una coppia di diffusori stereo inclinati di 30° per gli stessi motivi che legano audio e video visti nella figura 9 (canale Left – Right), una coppia di diffusori posteriori inclinati di 110° rispetto all’asse centrale (canale LS o Left Surround e canale RS o Right Surround), un diffusore posteriore opposto al canale centrale di 180° (canale S o Surround), ed un diffusore (canale LFE) per gli effetti e la riproduzione delle basse frequenze (fig. 16).

Fig. 16 sixone.jpg

7.1 è un ascolto multicanale composto da 1 diffusore centrale (canale C o Center), una coppia di diffusori stereo inclinati di 22°-30° per gli stessi motivi che legano audio e video visti nella figura 9 (canale LF o Left Front e RF o Right Front), una coppia di diffusori laterali posti a 90°-110° rispetto all’asse centrale (LS o Left Side e RS o Right Side), una coppia di diffusori posteriori inclinati di 135°-150° rispetto all’asse centrale (canale LB o Left Back e canale RB o Right Back), ed un diffusore (canale LFE) per gli effetti e la riproduzione delle basse frequenze (fig. 17).

n.b. Un differente grado di inclinazione determina anche una più apertura o chiusura dell’immagine surround.

Fig. 17 7.1-surround-sound.png

10.2 è un ascolto multicanale che basa il suo sviluppo sul surround 5.1 effettuando su di esso un upgrade per migliorare il raggio di copertura di ascolto.

E’ un ascolto multicanale composto da 1 diffusore centrale (canale C o Center), una coppia di diffusori stereo inclinati di 30° per gli stessi motivi che legano audio e video visti nella figura 9 (canale Left e Right), una coppia di diffusori sempre frontali ma inclinati di 55° (LW o Left Wide e RW o Right Wide), una coppia di diffusori sempre frontali, inclinati di 45° rispetto all’asse centrale (LH o Left High e RH o Right High) e distanziati in profondità rispetto all’asse circolare di distribuzione delle sorgenti, due diffusori laterali posti a 100°-120° rispetto all’asse centrale (LS o Left Surround e RS o Right Surround), un diffusore posteriore opposto al canale centrale di 180° (canale BS o Back Surround), ed una coppia di diffusori (canale LFE anche chiamato Left Sub e Right Sub), per gli effetti e la riproduzione delle basse frequenze, in modalità stereo cosi come visto in questa serie di articoli per aumentare il grado di percezione di localizzazione anche delle basse frequenze, oltre che ridurre effetti modali caratteristici come risonanza negli ambienti confinati (fig. 18).

Fig. 1810.2-channel-system.jpg

In una riproduzione stereofonica abbiamo definito che la Phantom Image è sempre presente e definita (centrale ma anche localizzata di lato a seconda della fase, tempo e spettro in frequenza), che la coppia di diffusori sia davanti o dietro alla nostra testa. La Phantom Image in un ascolto surround multicanale è invece povera e poco definita, e per questo non è mai consigliato in un mix surround utilizzare contemporaneamente tutti i diffusori per uno stesso segnale audio o anche distribuire questo segnale tra la parte dietro e davanti, ma utilizzare sempre coppie di diffusori o solo davanti o solo dietro o laterali. Un po come visto anche per la Psicoacustica Transizionale in cui l’immagine tende non più a focalizzarsi ma a lateralizzarsi tutta intorno alla testa. Può risultare invece bene per creare particolari effetti di illusione acustica.

In caso il segnale audio sia riprodotto sia dai canali frontali che surround avviene un fenomeno di aumento della chiarezza per la parte frontale ed una sensazione di separazione/sdoppiaggio del segnale audio tra il fronte ed i canali surround.

Se si panna dinamicamente il segnale tra il fronte ed il retro, avviene un fenomeno continuo tra la percezione di un segnale chiaro e definito quando è fronte e retro, ed un improvviso sdoppiaggio quando si trova in contemporanea tra i vari canali (sempre utile per effetti).

n.b. Tanti più canali audio in opportuna configurazione multicanale ci saranno e tanto meno l’effetto di sdoppiaggio verrà percepito, dando un senso via via più naturale.

Lavorando con la fase, tempo di ritardo, pannaggio ed equalizzazione, è possibile quindi tramite l’utilizzo di questi diffusori multicanale determinare la posizione di un suono a 360° attorno alla testa e definire un certo grado di profondità ed altezza. Questo però a livello percettivo non è preciso e ben localizzato-focalizzato dal nostro sistema uditivo, oltre che come vedremo avere dei limiti di posizionamento, e generare buchi e zone d’ombra in determinati punti dello spazio a 360°.

Questo è risolto attraverso un ascolto 3D o Virtuale.

La registrazione multicanale (in cui vi è anche il 3D e Virtuale che vedremo più avanti) ma quindi anche sua riproduzione, che come detto è sfruttata principalmente per l’audio nel cinema, ma che grazie all’ascolto 3D sta prendendo piede anche a livello musicale in eventi live e recording, è quella che tiene più spazio (non registrabile all’interno delle pellicole cinematografiche ad oggi in commercio, con un massimo di capienza fino a 7.1), e più peso in termini di MB digitali rispetto ad un qualsiasi altro ascolto.

 

3D e Virtuale

L’ambiente di ascolto 3D e Virtuale (fig. 19) è essenzialmente quello digitale in cui spazio e memoria consentono di lavorare con molteplici canali audio sia in registrazione che in riproduzione.

Fig. 19 fsfsfsd.JPG

E’ per lo più realizzato tramite motori software (dall’Ambisonic al Dolby Atmos e molti altri, che a seconda della matrice e numero di canali discreti che possono gestire, riescono a realizzare un più preciso posizionamento dell’immagine sonora, che il segnale di partenza sia mono, stereo o multicanale), attraverso degli appositi algoritmi regolano fase ampiezza ed intensità riuscendo a spostare il suono in un ambiente a 360°.

(vedremo questo più in  dettaglio quando parleremo di audio digitale).

Questo spazio sonoro garantisce la massima copertura possibile di ascolto e quindi il tipo di ascolto migliore e più realistico possibile, ottimizzando ambienza, dinamica, prospettiva, posizione, su tutti i piani di ascolto (compreso alto e basso).

Può essere per ascolto binaurale (https://www.klang.com/en/home), ma anche attraverso monitor (sia per il cinema https://www.dolby.com/us/en/brands/dolby-atmos.html, che per il live http://www.l-isa-immersive.com/).

Risulta più efficiente in cuffia, è come se ci fosse migliaia di diffusori in ambiente reale, si realizza anche in ambiente reale ma non ha la stessa risoluzione in quanto i diffusori in ambiente reale sono sempre in un numero finito e soprattutto è molto più dispendioso economicamente.

n.b. Un tipo di ascolto surround o 3D-Virtuale, è realizzato nativamente solo attraverso un tipo di ripresa microfonica multicanale, come vedremo meglio quando parleremo di tecniche di ripresa microfonica. Spostare semplicemente l’immagine di un segnale mono non è surround, ma il solo posizionamento di questa in uno spazio dimensionale a 360°.

Alcuni esempi di ascolto 3D per differenti tipologie di motore virtuale:

https://fluxhome.com/project/spat-revolution/

 

Campo Libero

Un ascolto in Campo Libero è una tipologia di ascolto che avviene tramite monitor in un’ambiente privo di riflessioni, cosa che in realtà non esiste perchè prima o poi il suono nel suo percorso incontrerà sempre un ostacolo che porrà un suo contributo di riflessione, alterando lo spettro sonoro nel suo complesso. Un ascolto ideale in Campo Libero è quindi quello con un tempo di riverbero pari a 0. Anche gli ambienti più controllati ed acusticamente tarati, tramite l’inserimento di appositi materiali e trappole acustiche che vedremo meglio in altre argomentazioni, hanno sempre anche se minimo tempo di riverbero (pur parlando di milli o microsecondi).

Un esempio di Campo Libero che si avvicina molto alla idealità del fenomeno ed in cui vengo testati monitor e diffusori acustici al fine di rilevarne le caratteristiche e specifiche tecniche con minime distorsioni ed alterazioni ambientali è l’ambiente Anecoico.

 

Ambiente Anecoico

Un Ambiente o Sala Anecoica è appunto come anticipato una tipologia di ambiente in cui sono minime le riflessioni ambientali (fig. 20). E’ un tipo di sala realizzata tramite l’inserimento di materiali Fono Assorbenti e Fono Isolanti che vedremo meglio in altre argomentazioni. Questi materiali sono in grado di ridurre al minimo l’energia dell’onda acustica ed assorbirla quasi completamente, ponendo un grado di riflessione ambientale prossimo allo 0 dB.

Fig. 20Camara-anecoica-Equipson.jpg

Questi ambienti come accennato solo per lo più utilizzati per effettuare sperimentazioni in campo libero per acustica architettonica e materiali edilizi ed analizzare la specifiche acustiche di altoparlanti e diffusori, senza quindi la presenza di riflessioni e rifrazioni che possono alterarne la misura.

 

Silenzio

In ambienti anecoici vi è quindi il silenzio o prossimo. In termini di ascolto questo silenzio è innaturale e per questo se andiamo in una sala anecoica è molto probabile che dopo un pò il nostro sistema psico-fisico si stressi, sensi di disorientamento, giramenti di testa, nausea, proprio perchè come visto in questa serie di articoli anche l’apparato uditivo come la vista ci permette di orientarci e darci equilibrio.

 

Campo Diffuso

Il Campo Diffuso è l’esatto opposto del Campo Libero, in questo caso le riflessioni e rifrazioni sono massime, quindi è una zona di forte riverberazione, ed anche in questo caso non esiste un contesto ideale di riverberazione infinita, ma sia l’aria che gli elementi riflettenti di cui è composto l’ambiente introdurranno una loro resistenza al passaggio dell’aria che farà decadere via via il livello della pressione sonora.

Il Campo Diffuso o meglio Quasi-Diffuso è più reale del Campo Anecoico in quanto elementi che riflettono e rifrangono il suono sono sempre presenti in un contesto reale.

Anche in questo caso un prolungato ascolto in campo riverberante essendo non naturale porta a livello psico-fisico, disorientamento, nausea e mal di testa.

 

Ambiente Riverberante

Fig. 21 ssss.jpg

L’Ambiente o Sala Riverberante (fig. 21) è una tipologia di ambiente in cui c’è molta riverberazione, utilizzata sempre per sperimentazioni ed analisi apparecchiature audio, come anche i fonometri tarati in campo riverberante.

Come accennato non esiste una sala con riverberazione infinita, il massimo raggiungibile ad oggi si attesta con un tempo di riverbero poco superiore ai 20 secondi.

 

Camera Semi Anecoica o Semi Riverberante

Fig. 22 sdcsdcds.jpg

La Camera o Ambiente Semi Anecoico (fig. 22) è una via di mezzo tra quella Anecoica e quella Riverberante, presenta lati e soffitto anecoico ma pavimento riflettente. Sempre utilizzata per rilievi e sperimentazioni acustiche.

 

 

Altro su Psicoacustica

Psicoacustica – I ( Orecchio Esterno, Orecchio Medio, Orecchio Interno, Sistema Uditivo Centrale, Emissioni Oto-Acustiche, Acufeni ).

Psicoacustica – II ( Percezione Sonora, Bande di Percezione Logaritmica, Bande di Frequenza, Livello di Sensazione Sonora, Sensazione Sonora, Livelli di Intensità Sonora ).

Psicoacustica – III ( Curve di ponderazione A-B-C, Curve di Egual Fastidio D, Curve CCIR-468 o ITU-468, ISO 21727, CCIR-AMS, Curve RC, NCB, Bande Critiche, Rumore Bianco, Rumore Rosa, Rumore Marrone ).

Psicoacustica – IV ( Mascheramenti, Battimenti, Risposta Soggettiva all’Impulso, Riflesso Aurale, Distanza di Ascolto ).

Psicoacustica – V ( Localizzazione, ILD, ITD, Errore di Localizzazione, Funzione Anatomica di Trasferimento, Percezione Controfase, Errore di Focalizzazione, Distorsione dell’Immagine, Teoria delle Decisioni, Parti Anatomiche ).

Psicoacustica – VI ( Lateralizzazione, Effetto Precedenza, Effetto Haas, Effetto Doppler, Distorsione Aurale, Ricostruzione Apparente, Terzo Suono di Tartini, Effetto Franssen, Effetto Cocktail Party, Zwicker Tone, Scala di Shepard, Psicoacustica e Loudness, Suono Reale e Suono Atteso, Psicoacustica del Rumore, Psicoacustica Transizionale, Effetto Specchio, Psicoacustica nel Campionamento Digitale ).

Psicoacustica – VIII ( Psicoacustica Visiva e Video, Effetto McGurk, Effetto Ventriloquo, Ottimizzazione della Focalizzazione e Localizzazione in Eventi Live, Abitudine di Ascolto ).

Psicoacustica – IX ( Test ed Esercitazioni, Audiometria e Patologie )

 

Acquista Attrezzature Audio dai principali Store

 

logo amazon.it

Thomann_logo1

The-new-eBay-logo

 

Applicazioni di Trading Online Sponsorizzate

 

DESKTOP

MOBILE

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...