Còdec d'àudioUn còdec d'àudio és un còdec que inclou un conjunt d'algoritmes que permeten codificar i descodificar dades d'àudio; és a dir reduir el nombre de bits que ocupa un arxiu d'àudio. S'utilitza per comprimir senyals o arxius d'àudio amb un flux de dades (stream) perquè ocupin el menor espai possible, aconseguint una bona qualitat final, i descomprimir-los quan s'han de reproduir o manipular en un format més apropiat. S'implementa en programari (software), maquinari (hardware) o una combinació d'ambdós. Mètodes de codificacióHi ha una gran varietat de còdecs d'àudio, tant per codificar música com a senyals de veu. Tot i que cada cop són més complexos i afegeixen característiques addicionals, es poden classificar en quatre grans grups depenent dels mètodes de codificació o reducció de la taxa de bits: Codificadors perceptualsEls codificadors perceptuals aprofiten les limitacions en la percepció del sistema auditiu humà (llindar d'audició, emmascarament temporal i/o freqüencial) per a codificar el flux de dades. Per a codificar les mostres en format PCM (àudio digital sense comprimir), es transformen al domini freqüencial i es quantifiquen i codifiquen a partir d'un conjunt de dades obtingudes en un model psicoacústic. La implementació d'aquest model psicoacústic és el que determina la qualitat final i acostuma a aprofitar l'emmascarament temporal o freqüencial, sent el llindar d'emmascarament el que controla la quantificació. En la quantificació d'àudio s'utilitzen diferents tipus tipus de quantificadors: uniforme, no-uniforme, logaritmic (llei-mu o llei-A), diferencial o vectorial. Generalment s'utilitza quantificació no-uniforme per música, quantificació logarítmica o diferencial per senyals de veu i quantificació vectorial per a processament avançat del senyal de veu. A la sortida d'aquest bloc es pot incorporar un codificador entròpic que comprimeix sense pèrdues per reduir la mida de la trama binària. Aquesta trama s'empaqueta juntament amb informació addicional que conté dades imprescindibles per a la descodificació com la mida de la trama, el nombre de bits de codificació, el marge dinàmic… També s'hi pot afegir correcció d'errors. El descodificador desempaqueta el senyal codificat per obtenir les mostres i la informació auxiliar. Seguidament descodifica les mostres i les converteix al domini temporal per obtenir l'àudio en format PCM, tot i que aquest no serà igual a l'inicial, ja que és un procés de quantificació amb pèrdues. Alguns dels còdecs que utilitzen aquest mètode són les diferents versions de MPEG-1, de les quals el més conegut és MP3 (MPEG-1 layer 3). Codificadors paramètricsEls codificadors paramètrics es basen en el fet que l'àudio i la veu es poden representar i sintetitzar únicament amb tons aïllats, patrons harmònics (representats amb sinusoides) i components sorolloses. Aquests, es representen amb paràmetres com l'amplitud, la freqüència fonamental o els components espectrals, i requereixen pocs bits per representar-los. Durant el procés de codificació s'extreu informació de les mostres d'entrada aplicant una transformada de fourier per llavors realitzar l'estimació de paràmetres. Després es codifiquen basant-se en un model de la percepció humana i es multiplexen per formar la trama de bits amb els paràmetres codificats. En el procés de descodificació, a través d'un bloc de síntesi i amb els paràmetres codificats, es reprodueix un senyal amb les característiques anàlogues al senyal original. Un exemple d'aquest tipus de codificació és HVXC per veu i HILN per música, ambdós compresos dins l'estàndard MPEG-4. Vocoders (codificadors paramètrics per a senyals de veu)Els vocoders són codificadors paramètrics específics per a codificació de la parla. S'analitza el senyal de veu corresponent a un segment temporal considerat estacionari per extreure'n els paràmetres del model i l'excitació. Aquesta informació és la que es codifica. En el procés de descodificació, el descodificador sintetitza els paràmetres a través d'un model de producció de veu.
Codificadors de forma d'onaEls codificadors de forma d'ona es basen en l'estudi del senyal d'àudio, de manera que intenten reproduir la forma d'ona del senyal d'entrada. Generalment es dissenyen per ser independents del senyal, de manera que s'utilitzen per codificar una gran varietat de senyals. Aquests codificadors aprofiten la redundància del senyal, i a partir d'una predicció lineal permeten codificar el senyal; és per això que aconsegueixen taxes de compressió elevades quan els senyals són molt redundants i pràcticament nul·les quan no ho són. La codificació del senyal es pot dur a terme tant en el domini temporal com freqüencial:
Codificadors híbrids (senyals de veu)Els codificadors híbrids també coneguts com a codificadors d'anàlisi-per-síntesis combinen les tècniques dels codificadors de forma d'ona amb les dels vocoders. L'objectiu d'aquests és obtenir una alta qualitat de veu a taxes de bit baixes (inferiors a 8 kHz). El seu funcionament es basa a analitzar un conjunt de mostres com una única per obtenir-ne els paràmetres del senyal. Al decodificar-la, se sintetitzen els paràmetres aconseguint que s'assembli al màxim amb l'original.
Tipus de còdecs d'àudioSi obviem les pèrdues causades per l'error de quantificació que en molts casos són inapreciables, els còdecs poden ser, segons el tipus de compressió amb pèrdues (lossy) o sense pèrdues (lossless). Còdecs d'àudio amb pèrduesEn àudio s'aprofiten les limitacions del sistema auditiu humà (llindar d'audició, emmascarament temporal i/o emmascarament freqüencial) per a comprimir les dades d'àudio. S'utilitzen diferents mètodes per eliminar les dades inaudibles:
El nivell de compressió es pot controlar i depèn de la qualitat que es vulgui obtenir, la mida de l'arxiu, l'amplada de banda de la xarxa, el temps de compressió... Generalment s'utilitzen compressions màximes per a transmissions, especialment quan són serveis en directe com telefonia (telefonia IP o cel·lular) o reproduccions sota demanda com podcasts (ràdio per internet o programes d'àudio per internet). Després de la compressió amb pèrdues s'aplica sempre una compressió sense pèrdues, explicada a continuació. Còdecs d'àudio sense pèrduesAquests còdecs utilitzen una compressió sense pèrdues per minimitzar la mida del flux de dades. Per dur a terme aquesta codificació s'utilitzen algorismes basats en l'eliminació de la redundància del senyal d'àudio i per tant en el grau de predicibilitat d'una informació. Si el senyal té patrons repetitius, aquest és redundant i per tant resulta fàcil predir-lo. Sovint, els patrons repetitius dels senyal són més evidents en un altre domini (temporal, freqüencial...), és per això que la transformació d'un senyal en funció d'aquests patrons permetrà reduir-ne o eliminar-ne la redundància. En àudio, com en vídeo, imatge o dades l'eliminació de la redundància s'implementa:
ParàmetresEls paràmetres amb els quals es caracteritza un còdec d'àudio són:
AplicacionsL'objectiu principal dels còdecs d'àudio és reduir la quantitat de dades digitals necessaris per reproduir un senyal auditiu. És útil comprimir les dades perquè ocupin la mínima mida possible a l'hora d'emmagatzemar-los i, si s'han d'enviar per qualsevol tipus de xarxa, la transisssió sigui ràpida. Així, les principals aplicacions són:
EstandarditzacióHi ha dues organitzacions que dominen l'estandardització de codificadors d'àudio:
Característiques dels principals còdecs d'àudioLes característiques tècniques dels principals còdecs d'àudio són:
Exemples de còdecs d'àudio
Vegeu també
Enllaços externs
|