Processament digital del so


Les variacions de pressió produïdes per un objecte vibrant (campana, altaveu, metalls, etc.) genera sons. Si concentrem l'atenció en un punt de l'espai i mesurem la pressió, s'observa què aquesta pressió canvia en el temps. La pressió en cada punt canvia de forma contínua en el temps, això vol dir què podem saber el valor exacte de la pressió en qualsevol instant de temps. Els senyals què varien de forma contínua en el temps se'ls anomena senyals analògics. Així la pressió sonora és un senyal analògic.  

 

Digitalitzar un so consisteix en mesurar els valors de la pressió a intervals regulars de temps transformant un so contínu en el temps (podem saber el valor de la pressió en cada instant de temps) en un altre discontinu (només coneixem els valors de la pressió en determinats instants de temps). El so discontinu en el temps es denomina so digital. La informació continguda en un so digital és menor què la continguda en un so analògic. Mostrejar un so consisteix en prendre mostres (en aquest cas, valors de pressió) a intervals regulars de temps. A l'interval de temps comprès entre dos mostres consecutives s'el denomina període de mostreig (T).

 

 

L' inversa del període de mostreig (1/T) es denomina freqüència de mostreig. La freqüència de mostreig és el número de mostres què és prenen per unitat de temps d'un so analògic per a produir un so digital. Quant més gran sigui la freqüència de mostreig millor serà la qualitat del so. Si la freqüència de mostreig és molt petita el so digital perd informació respecte el so analògic i el so analògic no és pot reconstruir a partir del so digital. En els exemples què podem veure a la imatge s'observa què a mesura què s'incrementa la freqüència de mostreig la forma del so digitalitzat (en vermell) s'aproxima més al so original analògic (en blau).

 

 

El teorema de Nyquist diu què, quan es mostreja un senyal, per a que el senyal original es pugui reconstruir a partir de les mostres, la freqüència mínima de mostreigdeu ser almenys 2 vegades major què la freqüència màxima del senyal mostrejat, a aquesta freqüència es denomina freqüència de Nyquist.

 

Freqüència de mostreig +- Freqüència de Nyquist = 2 x freqüència del senyal mostrejat

 

Si la freqüència de mostreig és més alta què la què ens diu Nyquist obtindríem una major representació del senyal original. Pot ocorrer què al mostrejar un senyal periòdic (per exemple, de tipus sinusoïdal) s'obtinguin les mateixes mostres què al mostrejar un altre senyal periòdic de diferent freqüència, en aquest cas els senyals mostrejats són indistingibles i el senyal original no pot ser reconstruït de manera unívoca a partir del senyal digital. A aquest fenòmen es denomina aliasing i té lloc quan les freqüències dels dos senyals estàn relacionades per la equació:

 

F1 = F2 + Fs*n, per n = 1,2,3A ...; a on F1 i F2 són les freqüències dels senyals i Fs és la freqüència de mostreig.

 

L'efecte aliasing s'el·limina si mostregem el senyal amb una freqüència de mostreig superior a la freqüència de Nyquist.

 

 

Els ordinadors utilitzen informació què està composta per seqüències de 0 i 1. Per emmagatzemar sons en un ordinador necessitem una tarja de so i un micròfon connectats a aquest. La tarja de so digitalitza els sons analògics què li arriben a través del micròfon convertint cada mostra del senyal digitalitzat en una sèrie de zeros i uns què són emmagatzemats en l'ordinador.

 

L'amplitut de cada mostra es representa mitjançant un número N de zeros i uns (o bits). Per exemple, si codifiquem un so a 8 bits (8 dígits), el nombre binari 00000000 (equivalent al 0 en el sistema decimal) representaria a la mostra de menor amplitut. I el número binari 11111111 (equivalent al número 2= 256 del sistema decimal) representaria a la mostra de major amplitut. La resta de les amplituts intermitjes estaran representades per qualsevol altre combinació de 8 zeros i uns. És a dir, amb 8 bits es poden aconseguir sons digitals amb un màxim de 256 amplituts diferents. Si incrementem el número de bits a 16 podriem aconseguir sons digitals amb un màxim de 216 = 65.536 amplituts. A mesura què s'incrementa el nombre de bits major serà la resolució del so digital. L'estàndard definit per als discos digitals d'audio especifica què deu tenir una freqüència de mostreig de 44.1 KHz i 16 bits en estereo. Això voldrà dir que es deuen prendre 44100 mostres per segon, cadascuna de les mostres es representaran a 16 bits i en dos canals independents (so estèreo).

 

Per exemple, per emmagatzemar un minut de so en qualitat CD són necessaris 84.672.000 bytes (1 minut x 60 segons per minut = 60 segons; 60 segons x 44100 mostres per segon = 2.646.000.00 mostres; 2.646.000 mostres x 16 bits per mostra = 42.336.000 bits en cada canal; 42.336.000.00 bits per canal x 2 canals = 84.672.000 bits; 10.584.000.00 bytes, és a dir aproximadament 10 Mb).    

 

Per emmagatzemar el so en un ordinador existeixen varis formats, els més utilitzats són: 

 

- .WAV: és el format estàndard del sistema operatiu Windows. És un format d'audio no comprimit, és a dir, s'emmagatzemen tots els bits obtinguts durant el procés de digitalització, per lo tant, són arxius què ocupen molt (aproximadament 10 Mb per minut de so en qualitat d'audio), però conserven tota la qualitat del so digitalitzat. Aquests tipus d'arxius poden ser llegits tant per un ordinador com per un reproductor de CDs convencional.

 

- .AIFF (Audio Interchange File Formant): És un format d'audio no comprimit molt utilitzat en les plataformes d'Apple.

 

- .MP3: És un format d'audio comprimit, utilitza tècniques complexes de compressió per a obtenir arxius més petits què els corresponents al .wav. El tamany és aproximadament 1 Mb per minut de so de qualitat d'audio, però aquest valor pot variar per que es poden crear arxius amb diversos índexs de compressió.

 

- .WMA (Windows Media Audio): És el format d'audio de Windows comprimit. Tenen el problema de què no tots els reproductors poden reconèixer aquest format.

 

- A més d'aquests, existeixen d'altres formats: .MIDI (Musical Instrument Digital Interface), .RA (Real Audio), .RMF (Rich Music Format).

 

 

1. AVANTATGES I INCONVENIENTS DEL SO DIGITAL I L'ANALÒGIC

 

Una de les principals avantatges del so digital vers l'analògic és que no perd qualitat al copiar-lo, reproduir-lo o emmagatzemar-lo. Un so digital no és més què una col·lecció de zeros i uns i per tant es pot copiàr o reproduir fàcilment sense modificar la qualitat del so. Per contra, els dispositius tradicionals d'emmagatzematge de so analògic (discs de vinil i les cintes de cassette) es deterioren amb l'ús perdent per tant la qualitat del so. Una altre de les avantatges del so digital és que es pot manipular utilitzant una gran varietat de processos, existeix una àmplia gamma de programes què permeten millorar o simplement modificar els sons digitals. També és possible processar sons analògics però els programes per a processar sons digitals solen ser més potents. Les principals desavantatges dels sons digitals vers els analògics és la pèrdua d'informació la qual es produeix a transformar-se un senyal continu en un altre més discret.

 

 

2. PROCESSAMENT DE SENYALS DIGITALS

 

Una de les avantatges del so digital davant l'analògic és que es pot manipular utilitzant una gran varietat de processos: filtrat, el·liminació de soroll, modificació de l'amplitut, etc. Existeix una àmplia gamma de programes els quals permeten millorar o simplement modificar els sons digitals. 

 

Un filtre és un sistema què depenent d'uns paràmetres modifica un senyal d'entrada obtenint un altre de sortida amb algunes de les seves característiques modificades amb respecte al senyal d'entrada. Per exemple, un filtre d'aire permet passar l'aire però no deixa passar les partícules de pols. En el cas del so, un filtre és un sistema què té com a entrada un so i com a sortida un altre so què té modificada alguna de les seves propietats: amplitut, freqüència o fase.

 

Si el senyal d'entrada és analògic serà necessari un filtre analògic i si és digital el filtre serà digital. Degut a les ventatges del processament digital sobre l'analògic en aquest tema només incidirem amb els filtres digitals.

 

En la imatge següent es poden observar:

 

- Filtre en amplitut què redueix l'amplitut del senyal. El senyal d'entrada té 20 dB d'amplitut i el senyal de sortida 10 dB d'amplitut.

 

- És un filtre en fase què desfasa el senyal de sortida respecte al d'entrada. La fase del senyal d'entrada és 0 i la de sortida és n/2.

 

- És un filtre en freqüència què el·limina la freqüència superior (2000 Hz) del senyal d'entrada. El so d'entrada és un senyal sinusoïdal de freqüències 1000 Hz i 2000 Hz i el senyal de sortida és un senyal sinusoïdal de freqüència 1000 Hz.

 

 

A la vida diària existeixen molts objectes els quals actuen com a filtres sonors, per exemple un bosc o les parets d'una casa, les pantalles acústiques són filtres què atenuen les altes freqüències. També existeixen dispositius electrònics què actuen com a filtres sobre els senyals elèctrics, per exemple un amplificador de so (o etapa de potència) és un filtre què amplifica l'intensitat del senyal d'entrada; o un equalitzador què és un filtre què permet millorar el so modificant les seves freqüències segons els nostres gustos.

 

 

En el camp de l'audiologia els filtres són molt importants. Determinats audífons actúen com a filtres els quals atenuen el soroll i amplifiquen la parla. Dins el sistema auditiu, l'orella, la còclea, la cèl·lula ciliada interna i el nervi auditiu actuen com a filtres els quals modifiquen el so d'entrada

 

 

3. TIPUS DE FILTRES SEGONS LA SEVA RESPOSTA EN FREQÜÈNCIA

 

a. FILTRE PASSA BAIXOS: és el que deixa passar les freqüències greus, és a dir, no modifica les freqüències des de 0 fins a una determinada freqüència denominada freqüència de tall de filtre i el·limina les freqüències superiors a la freqüència de tall. 

 

La imatge mostra com actúa un filtre de passa baixa amb una freqüència de tall de 3000 Hz sobre un senyal d'entrada què és soroll blanc.

 

La figura A mostra el senyal d'entrada.

La figura B mostra l'espectre del senyal d'entrada, en ser soroll blanc, l'espectre té components a totes les freqüències.

La figura C mostra la freqüència en un filtre de passa baixa amb una freqüència de tall de 3000 Hz. S'observa què fins a 3000 Hz el guany del filtre és 0 (el filtre no modifica el senyal d'entrada) i a pertir dels 3000 Hz el guany disminueix molt ràpidament.

La figura D mostra el senyal de sortida del filtre.

La figura E mostra l'espectre del senyal de sortida del filtre. Fins a 3000 Hz els senyals d'entrada i de sortida són iguals (el filtre no ha modificat les baixes freqüències) i a partir de 3000 Hz el senyal de sortida desapareix (el filtre ha el·liminat les freqüències superiors a 3000 Hz).

 

 

b. FILTRE PASSA ALTS: és el que deixa passar les freqüències altes, és a dir, no modifica les freqüències superiors a una determinada freqüència de tall del filtre el·liminant les freqüències inferiors a la freqüència de tall.

 

La imatge mostra com actúa un filtre de passa alta amb una freqüència de tall de 3000 Hz sobre un soroll blanc.

La figura A mostra el senyal d'entrada.

La figura B mostra l'espectre del senyal d'entrada.

La figura C mostra la resposta en freqüència d'un filtre de passa alta amb freqüència de tall de 3000 Hz. S'observa què a partir de 3000 Hz el guany del filtre és 0 (el filtre no modifica el senyal d'entrada) i per sota de 3000 Hz el guany és molt petit.

La figura D mostra el senyal de sortida del filtre.

La figura E mostra l'espectre del senyal de sortida del filtre. A partir de 3000 Hz els senyals d'entrada i de sortida són iguals (el filtre ha deixat passar les altes freqüències) i per sota de 3000 Hz no hi ha senyal de sortida (el filtre ha el·liminat les freqüències inferiors a 3000 Hz).

 

 

c. FILTRE PASSA BANDA: és el que no modifica totes les freqüències compreses entre dos determinades freqüències denominades freqüències de tall.

 

A la imatge es mostra com actua un filtre de passa banda amb freqüències de tall de 2000 i 4000 Hz sobre un soroll blanc. 

La figura A mostra és senyal d'entrada.

La figura B mostra l'espectre del senyal d'entrada.

La figura C mostra la resposta en freqüència d'un filtre de passa banda amb freqüències de tall de 2000 i 4000 Hz. S'observa què entre 2000 i 4000 Hz el guany del filtre és 0 (el filtre no modifica el senyal d'entrada) i per sota de 2000 Hz i per sobre de 4000 Hz el guany és molt petit.

La figura D mostra el senyal de sortida del filtre.

La figura E mostra l'espectre del senyal del filtre. Entre 2000 i 4000 Hz els senyals d'entrada i de sortida són iguals (el filtre ha deixat passar les freqüències compreses entre 2000 i 4000 Hz) i per sota de 2000 Hz i per sobre de 4000 Hz no hi ha senyal de sortida (el filtre ha el·liminat les freqüències compreses entre 2000 i 4000 Hz).

 

 

d. FILTRE SUPRESSOR DE BANDA: és el què no modifica les freqüències escepte les compreses entre dos freqüències denominades freqüències de tall, és a dir, seria l' inversa d'una passa banda. 

 

 

4. CARACTERÍSTIQUES D'UN FILTRE SEGONS LA SEVA RESPOSTA EN FREQÜÈNCIA

 

a. FREQÜÈNCIA DE TALL: és la freqüència què delimita el grup de freqüències què passen o no passen per un filtre. Es defineix la freqüència de tall com la freqüència a la què l'amplitut cau en 3 dB. En el filtre de passa baix, passaràn les freqüències per sota de la freqüència de tall i en el filtre de passa alta passaran les freqüències per sobre de la freqüència de tall. En el cas del filtre de passa banda passaràn les freqüències compreses entre les dues freqüències de tall del filtre. En aquest cas es defineix l'ample de banda com la diferència entre les dues freqüències de tall del filtre.

 

L' imatge mostra dos filtres passa banda amb dos amples de banda diferents, l'ample de banda del filtre blau és (f2-f1) i l'ample de banda del filtre vermell és (f4-f3). L'ample de banda del filtre en blau és menor què l'ample de banda del filtre en vermell i per tant, el filtre blau és més selectiu què el filtre en vermell, és a dir, deixa passar un menor rang de freqüències. Una altre característica d'un filtre passa banda és el factor de qualitat que es defineix com el quocient entre la freqüència central del filtre (fo) i l'ample de banda del filtre, així Q = fo/(f2-f1) o Q = fo/(f4-f3).

 

 

b. L'ORDRE D'UN FILTRE: medeix el grau d'acceptació o rebuig de les freqüències per sobre o per sota de les freqüències de tall del filtre. Idealment un filtre hauria d' el·liminar totalment totes les freqüències per sota o per sobre de la freqüència de tall (Fc), és a dir, lo ideal seria què el filtre fós totalment quadrat i què el·liminara per complert les freqüències no desitjades (corba taronja). No obstant, a l'imatge s'observa com les corbes (en blau, vermell i verd) descendeixen lentament fins el seu nivell més baix. A mesura què incrementem l'ordre del filtre incrementem el pendent i el filtre s'aproxima mes al filtre ideal (taronja).   

 

c. GUANY D'UN FILTRE: mesura com varia l'amplitut del senyal de sortida respecte al d'entrada. Atenent al guany els filtres es poden classificar en actius o passius.

 

Filtres passius: Els filtres passius són els què atenuen el senyal de sortida respecte al d'entrada

 

Filtres actius: els actius són els que ho amplifiquen.

 

En la imatge es mostra un filtre amb guany 0 (l'amplitut del senyal de sortida i l'entrada és la mateixa) per a freqüències inferors a F i guany menor què 0 per a freqüències superiors a F. La freqüència de tall es defineix com la freqüència a la que l'amplitut del senyal cau en 3 dB, és a dir, a la freqüència de tall el guany del filtre de -3dB.

 

 

d. FASE D'UN FILTRE: medeix el desplaçament en el temps de l'ona de sortida respecte a l'ona d'entrada. 

 

A la imatge es mostra un filtre de passa baixa amb freqüència de tall de 300 Hz, en la part superior es mostra com afecta el filtre a l'amplitut del senyal i en la part inferior a la fase.

 

 

e. RESPOSTA EN FREQÜÈNCIA: Descriu la resposta en amplitut i fase d'un filtre a diferents freqüències. Es medeix introduïnt en el filtre senyals de la mateixa amplitut i diverses freqüències i messurant la sortida a cada freqüència. La resposta en freqüència es pot expressar com un model matemàtic què descriu el comportament del filtre, és a dir, determinarà la forma en que el senyal canvia en amplitut i fase en funció de la freqüència. 

 

 

En aquesta imatge podem veure una mostra en freqüències d'alguns tipus de filtres utilitzats habitualment: Butterwordth, Chebyshev i Elliptic.

 

 

La resposta en freqüència d'un filtre es pot expressar com una equació matemàtica, H(f), la qual expressa la sortida en funció de l'entrada.

 

 

f. RESPOSTA D'IMPULS D'UN FILTRE: és la resposta del filtre a un clic ideal d'amplitut 1.

 

 

Si fem la transformada de fourier del clic filtrat de l'imatge anterior obtenim què és igual a la resposta en freqüència del filtre. La transformada de Fourier de la resposta impuls d'un filtre és igual a la resposta en freqüència del filtre.

 

 

Si filtrem un clic ideal amb dos filtres passa-banda amb diferents amples de banda s'observa què a mesura què s'incrementa l'ample de banda del filtre les oscil·lacions del clic filtrat són menors, a aquest efecte se'l denomina ringing.

 

En la imatge inferior s'observa un clic ideal filtrat amb dos filtres passa banda amb diferent ample de banda.

 

Filtre passa-banda amb freqüències de tall de 1000 i 4000 Hz.

 

Filtre passa-banda amb freqüències de tall de 1000 i 1500 Hz.

 

S'observa què el clic filtrat amb el segon filtre (filtre de menor ample de banda) presenta més oscil·lacions què el clic filtrat amb el primer filtre (filtre de major ample de banda).

 

 

L'orella actúa com un filtre les freqüències de la qual actua depenent de la localització del so.

 

A la imatge es mostra la freqüència de l'orella davant a sons procedents de diferents alçades: + 40, 0 i -40 graus.

 


Bibliografia