Il formato WAVE dei file audio

I file audio wave (estensione .wav) sono file non compressi. Il formato venne introdotto con windows 3.1 come formato standard per il suono utilizzato in applicazioni multimediali. Le sue specifiche tecniche e la sua descrizione sono presenti nel documento Microsoft/IBM Multimedia programming Interface and Data Specifications (agosto 1991). E’ basato sulle specifiche RIFF (Resource Interchange File Format) introdotte nel 1991 costituenti un meta-format per file multimediali che girano in ambiente Windows. La struttura RIFF organizza blocchi di dati in sezioni chiamate Chunk ognuna delle quali descrive una caratteristica del file wave (la sample rate, la bit rate, il numero dei canali audio, ecc) o che contiente i valori dei campioni (in questo caso si parla di data chunk). I chunk sono a 32 bit (con alcune eccezioni che vedremo).

Il file wave inizia sempre con un chunk di tipo type costituito da 4 caratteri che descrivono la parola “R” “I” “F” “F”, seguito dal chunk che esplicita la dimensione del file e dal chunk format che specifica che il tipo del file è un “W” “A” “V” “E”. (questi tre chunk sono rappresentati con il colore violaceo nell’immagine seguente).

Dopo i primi tre chunk, il file wave richiede due tipologie di subchunk:

  1. FMT (color verde nell’immagine precedente): utilizzati per specificare le caratteristiche del file wave (sample rate, numero canali, ecc.);
  2. DATA (color salmone nell’immagine precedente): contengono i campioni).

Ecco un esempio di come appare un file wave (rappresentazione dei dati in esadecimale)

Il file wave può avere diverse sample rate (fino a 384 kHz) e può essere a 8, 16, 24, 32 bit. Il cd audio utilizza lo standard 44,1 kHz a 16 bit (rappresentabile con la sigla 44,1/16), l’industria broadcast predilige il 48 kHz. I convertitori AD presenti nelle schede audio possono acquisire l’audio a 24 bit mentre i motori audio dei software di sequencing ed editing possono sfruttare i 32 bit a virgola mobile.

Ovviamente più è alta la sample rate e maggiore è la risoluzione del file audio e maggiore è il numero di bit (bit rate) è più ampia è la definizione della dinamica. Aumentando la sample rate e/o la bit rate aumenta la dimensione del file wave (più campioni nell’unità di tempo e con word binarie più ampie). Vediamo di capire quanto spazio può occupare un file wave sulla base di diverse risoluzioni.

Un file wave stereo 44,1/16 occupa il seguente spazio:

1 secondo: 44100*2(byte) = 88,2 kB ma poichè i canali audio sono 2 (stereo), lo spazio occupato è pari a 176,4 kB

1 minuto: 176,4*60 = 10584 kB e tenendo conto che 1024 kB = 1 MB, si ha che un minuto di audio stereo 44,1/16 occupa lo spazio pari a 10,1 MB

ESERCIZIO: Calcolare lo spazio che richiedono 8 file wave mono 44,1/24 con lunghezza pari a 16 minuti ciascuno.

Svolgimento:

44,1 * 3 = 132,3 kB/s

132,3 * 60 = 7938 kB/min pari a 7938/1024 = 7,75 MB/minuto

7,75 * 16 = 124 MB ogni traccia

124 * 8 = 992 MB complessivi

ESERCIZIO: Calcolare lo spazio che richiedono 8 file wave stereo 48/24 con lunghezza pari a 12 minuti ciascuno.

48 * 3 = 144 kB/s 144 * 2 = 288 kB/s (file stereo) 288 * 60 = 17280 kB/min pari a 17280/1024 = 16,875 MB/minuto

16,875 * 12 = 202,5 MB ogni traccia

202,5 * 8 = 1620 MB complessivi

bit rate relativo ai file 44,1/16, 48/16, 48/24, 96/24.

44,1 * 16 = 705,6 kbps (mono), 705,6 * 2 = 1411,2 kbps (stereo)

48 * 16 = 768 kbps (mono), 768 * 2 = 1536 kbps (stereo)

48 * 24 = 1152 kbps (mono), 1152 * 2 = 2304 kbps (stereo)

96 * 24 = 2304 kbps (mono),  2304 * 2 = 4608 kbps (stereo)

Informazioni su silviorelandini

sound designer, docente di tecnologie musicali (Conservatorio S. Cecilia, Saint Louis College of Music), direttore iitm
Questa voce è stata pubblicata in Scienza del Suono e contrassegnata con . Contrassegna il permalink.