Kódování Mp3

Slovníček pojmů

Nejznámnější audio formáty

O autorovi

Formát Mp3

MP3 je zkratka MPEG Layer 3. Tento ztrátový kompresní algoritmus byl vyvinut koncem osmdesátých let společným úsilím německého Fraunhoferova institutu a univerzity v Erlagenu v rámci projektu digitálního rozhlasového vysílání (DAB). Jaký je jeho princip? Zvukový signál se nejprve rozloží na spektrální komponenty, na které se poté aplikují filtry vybrané podle příslušného psychoakustického modelu a slyšitelné úrovně šumu. Takto získané složky se následně přes specifické masky zakódují do požadovaného formátu (datového toku). MPEG ovšem není pouze jeden – je to celá rodina formátů, vzniklých vesměs postupným vývojem (převážně v režii Fraunhoferova institutu). Tyto formáty, označované přívlastkem Layer (vrstva), se liší především kvalitou zpracování signálu a maximálním dosažitelným kompresním poměrem, tedy hodnotou, na kterou lze typicky zmenšit jednotku originálního signálu. V současné době jsou k dispozici formáty MPEG Layer 1, 2, 3, MPEG2 AAC (Advanced Audio Coding) a MPEG4. Každý se sice uplatňuje v trochu jiných aplikacích, ale vesměs převažuje využití v digitálním rozhlasovém vysílání, přenosu zvuku po internetu a při reprodukci v domácích kinech. Protože článek je věnován MP3, nadále se zaměříme jen na tuto variantu MPEG.

Druhy Mp3

MP3 je jeden z velké skupiny kompresních algoritmů MPEG, všechny druhy MPEG standardů realizují ztrátovou kompresi. MPEG (Moving Picture Experts Group) pracuje pod vedením International Standards Organization (ISO) a International Elektro-Technical Commission (IEC) a zabývá se kódováním videa a audia. MPEG standardy se dělí:

Každý standard obsahuje několik částí, které popisují kódování audia, videa, synchronizačních dat a formáty uložení kódovaných dat. MPEG standard obsahuje několik vrstev Layer I-III, které popisují kódovací schémata. Od Layer I do Layer III roste komplexnost a efektivita komprese zvuků, ale klesá rychlost kódování a dekódování. Zvuková schémata se dělí:

VRSTVY MPEG A JEJICH VYUŽITÍ

OZNAČENÍ KOMPRESE DATOVÝ TOK (kb/s) VYUŽITÍ
originál 1:1, tj. žádná 1 411, 200 (172 kB/s) Audio-CD apod.
MPEG Layer 1 1:04 384 (48 kB/s) DCC (Digital Compact Cassette)
MPEG Layer 2 1:6-1:8 256-192 (32-24 kB/s) DAB (Digital Audio Broadcast), CD-I, DVD
MPEG Layer 3 1:10 – 1:12 128-112 (16-14 kB/s) ISDN, satelitní rozhlas, hudba po internetu (MP3)

obrázek

Komprese do Mp3

Při kódování zvuku prostřednictvím MP3 lze využít širokou paletu kompresních poměrů od 1:4 až do 1:96, avšak v praxi se uplatňují pouze některé. Poměr ovlivňuje nejen velikost datového souboru, ale také (a to hlavně) kvalitu výsledného zvuku. Zjednodušeně: čím vyšší kompresní poměr, tím menší soubor a horší kvalita a naopak. Proto byl přijat určitý kompromis – poměr 1:12, který zaručuje kvalitu subjektivně srovnatelnou se zvukem z CD. Tento poměr sníží datový tok zhruba dvanáctinásobně na 128 kb/s (kilobitů za sekundu), takže jedna minuta zvukové nahrávky zabírá asi 1 MB paměti (proti přibližně 10 MB na CD). Kromě něj se poměrně často užívají i vyšší poměry 1:16 (datový tok 80 kb/s) a 1:20 (64 kb/s). Formát MP3 je značně flexibilní. Při kódování záznamu lze kromě kompresního poměru ovlivnit také mnoho jiných parametrů. Například specifikovat typ zpracování stereofonní informace, konkrétně způsob přídělu počtu bitů pro jednotlivé kanály. Na výběr je buď pevný počet, anebo proměnný podle charakteru skladby. Navíc se určité monofonní složky mohou označit jako společné pro oba kanály. Volit lze také mezi konstantním a proměnlivým datovým tokem. V druhém případě se u komplikovanějších partií datový tok zvětší a u jednodušších naopak zmenší. Tyto úpravy pomáhají nahrávku MP3 zkvalitnit (při zachování jejího vnějšího charakteru). Tento poměr sníží datový tok zhruba dvanáctinásobně na 128 kb/s (kilobitů za sekundu), takže jedna minuta zvukové nahrávky zabírá asi 1 MB paměti (proti přibližně 10 MB na CD). Kromě něj se poměrně často užívají i vyšší poměry 1:16 (datový tok 80 kb/s) a 1:20 (64 kb/s). Formát MP3 je značně flexibilní. Při kódování záznamu lze kromě kompresního poměru ovlivnit také mnoho jiných parametrů. Například specifikovat typ zpracování stereofonní informace, konkrétně způsob přídělu počtu bitů pro jednotlivé kanály. Na výběr je buď pevný počet, anebo proměnný podle charakteru skladby. Navíc se určité monofonní složky mohou označit jako společné pro oba kanály. Volit lze také mezi konstantním a proměnlivým datovým tokem. V druhém případě se u komplikovanějších partií datový tok zvětší a u jednodušších naopak zmenší. Tyto úpravy pomáhají nahrávku MP3 zkvalitnit (při zachování jejího vnějšího charakteru).

Závislost kvality zvuku na kompresi

Kvalita zvuku komprimovaných skladeb je samozřejmě závislá na použitém formátu komprese a zvoleném datovém toku. V tomto směru vždy platí, že čím vyšší datový tok si zvolíme, tím bude výsledný soubor větší, ale především výsledná nahrávka kvalitnější, jelikož kompresní algoritmus nemusí „zahodit“ tolik dat. V první tabulce je velmi dobře patrné, jakým způsobem jednotlivé kompresní algoritmy ovlivňují velikost hudebního souboru při různých datových tocích a na jakém kmitočtu začínají omezovat frekvenční charakteristiku.


Slovníček pojmů

Nejznámnější audio formáty

O autorovi

Ověřit XHTML 1.0 Strict
Ověřit CSS