Un’ultimo test definisce il fatto che a parità di campionamento e quantizzazione di destinazione ( quindi la risoluzione audio che si vuole ottenere ) partire convertendo da un più alto valore di quantizzazione e campionamento migliora sicuramente il file risultante dalla conversione.
In figura 1 un file convertito a 16 bit 44.1 Khz partendo da una risoluzione di 24 bit 48 Khz, in figura 2 lo stesso file a 16 bit 44.1 Khz partendo invece da una risoluzione di 24 bit 192 Khz, mentre in figura 3 lo stesso file a 16 bit 44.1 Khz ma partendo da una risoluzione di 32FP bit 96 Khz.
fig. 1
fig. 2
fig. 3
Come è facile notare in figura 13 quindi il file a 16 bit 44.1 Khz convertito dalla più alta risoluzione sotto test ( 32FP bit 96 Khz ) è quello con il minor contributo armonico, poi seguito dal segnale in figura 12 ( 24 bit 192 Khz ) ed infine dal segnale in figura 1 ( 24 bit – 48 Khz ), se pur tra la figura 1 ed 12 vi siano lievi differenze. Questo conferma il fatto che a risoluzioni più elevate il file originale presenta sempre più linearità nella risposta in frequenza e minor contributo armonico rispetto a risoluzioni più basse ( considerando sempre l’idealità dei casi, ovviamente per uno scarso convertitore e/o generatore si possono avere casi differenti ), per questo anche facendo un downsampling e/o downquantization le varie armoniche e distorsioni introdotte saranno sempre più contenute rispetto a convertire da file con più bassa risoluzione. Tanto più pulito sarà il segnale originale a più alta risoluzione e tanto migliore risulterà la conversione in downsampling o downquantization.
Per comparazione vediamo anche i risultati dell’FFT, in figura 4 la risposta ( giallo ) rappresenta il segnale audio convertito da 24 bit 192 Khz mentre la risposta ( rosso ) il segnale audio convertito da 24 bit 48 Khz.
fig. 4
E’ possibile notare come i risultati maggiori che confermano un miglioramento nel processo di conversione da una risoluzione più alta, siano in medio alta ed alta frequenza, in cui la conversione da 24 bit 192 Khz mantiene un livello armonico più basso.
n.b. Vi è invece un leggero incremento rispetto alla risoluzione a 24 bit 48 Khz in prossimità della sinusoide tonale, questo molto probabilmente dovuto all’instabilità del SRC che come vedremo non esiste un SRC che lavori ottimamente a tutte le frequenze e quantizzazioni, ma ci sono SRC che lavorano meglio ad un certo tipo di risoluzione ed altri che lavorano meglio ad un’altro tipo di risoluzione.
In figura 5 la comparazione dell’FFT per la conversione da 24 bit – 192 Khz ( rosso ) con l’FFT per la conversione da 32FP bit 96 Khz ( giallo ).
fig. 5
Come ulteriore conferma dal grafico FFT si vede come la conversione a 32FP bit 96 Khz sia armonicamente migliore ( le mantiene più basse ) della conversione a 24 bit 192 Khz, in questo caso anche un po in bassa frequenza.
Per chiarezza come accennato anche in passato in questa serie di articoli ridurre il campionamento porta un risultato qualitativo molto inferiore rispetto a ridurre la quantizzazione, la dimostrazione in figura 6 – 7 – 8.
fig. 6
fig. 7
fig. 8
In figura 6 il file originale a 32FP bit 96 Khz, in figura 7 un dowsamplig a 32FP bit 44.1 Khz, si nota un gran incremento di armoniche ed un impoverimento della precisione del tono che da entro 0,3 secondi di impulso nel file originale passa ad entro 0,7 secondi, questo significa una peggiore linearità della risposta ed un ingresso di armoniche distorsive nel segnale audio. In figura 8 invece un downquantization a 16 bit 96 Khz, come si nota la precisione dell’impulso rimane entro i 0,3 secondi, mentre le armoniche raggiungo valori energetici più elevati rispetto al downsampling ma sempre in misura più contenuta a segno di un mantenimento della precisone e linearità della risposta ma con un impoverimento della dinamica.
Direi che già dallo spettrogramma è molto chiaro e non c’è bisogno della controprova tramite grafico FFT.