MPEG NORME

UVODNI POJMOVI

Prostorna i vremenska redundancija

Kompresija videosignala zahtijeva postupak identifikacije redundancije u programskom materijalu koji se prenosi. Taj postupak obično se provodi u dva koraka:

1. pronalaženje i uklanjanje prostorne redundancije – vrši se unutar svake pojedinačne slike, bez referenci na prethodne ili slijedeće slike;

2. vremenska redundancija pronalazi se i uklanja pomoću usporedbe trenutne i prethodne slike.

Diskretna kosinusna transformacija

Prostorna redundancija postoji u svim realnim programskim materijalima. Ako u slici postoji neki prepoznatljivi objekt, tada će svi elementi slike koji ga predstavljaju imati sličnu vrijednost amplitude. Veličina objekata u slici određuje prostornu frekvenciju koja će se pojaviti u signalu. U realnim situacijama prevladavaju niže frekvencije, a osim toga, u signalu se najčešće ne pojavljuje cijeli spektar frekvencija. Nužno je dakle provesti frekvencijsku analizu. U tu svrhu koristi se diskretna kosinusna transformacija (DCT = Discrete Cosine Transform) da bi se vrijednosti elemenata slike pretvorile u koeficijente koji se dalje lakše mogu podvrgnuti postupku kompresije.

Izvorna slika najprije se dijeli u blokove veličine 8×8 elemenata slike. Na svaki blok se primjenjuje dvodimenzijska DCT koja daje 64 DCT koeficijenta:

za u = 0, C(u) = 1, za u = 1, 2, ... , 7;

za v = 0, C(v) = 1, za v = 1, 2, ... , 7.

U gornjoj formuli F(u,v) su DCT koeficijenti, a f(j,k) izvorne vrijednosti amplitude elemenata slike.

F(0,0) naziva se istosmjerni (DC) koeficijent i najčešće se računa prema formuli:

Ova formula govori nam da je DC koeficijent zapravo jednak osmerostrukoj srednjoj vrijednosti elemenata slike u bloku.

Slika 10. Prikaz bloka DCT koeficijenata

Na slici 10. gornji lijevi kut predstavlja DC koeficijent, a spuštajući se dolje i desno dolazi se do koeficijenata koji predstavljaju visoke prostorne frekvencije signala nastalog iz izvorne slike. Pomak prema desno predstavlja porast horizontalne prostorne frekvencije, a pomak prema dolje predstavlja porast vertikalne prostorne frekvencije.

Na strani dekodera vrijednosti elemenata slike mogu se rekonstruirati pomoću inverzne diskretne kosinusne transformacije (IDCT):

Diskretnom kosinusnom transformacijom ne provodi se kompresija. Pomoću te transformacije samo se izvorni elementi slike pretvaraju u oblik iz kojega je moguće jasno odrediti redundanciju. Pošto sve prostorne frekvencije nisu istodobno prisutne u signalu, DCT će dati skup koeficijenata od kojih će neki biti jednaki ili vrlo bliski nuli. Koeficijente koji su jednaki nuli ne treba uopće prenositi, a koliko će se koeficijenata bliskih nuli odbaciti, ovisi o željenoj kvaliteti slike i stupnju kompresije koji se želi postići. Ukoliko se neki koeficijent ne može odbaciti, moguće ga je, u cilju postizanja većeg stupnja kompresije, prenijeti s manjim brojem bita, čime se manje narušava kvaliteta slike nego potpunim odbacivanjem.

Kvantizacija

Vidljivost prostornih frekvencija u signalu znatno varira u cijelom rasponu. Ljudsko oko može tolerirati mnogo veću količinu šuma na visokim frekvencijama nego na niskim. Zbog toga se rabi kvantizacija, kako bi se sav eventualno nastali šum koncentrirao u području visokih frekvencija, gdje je slabo uočljiv. DCT koeficijenti se dijele faktorom koji je funkcija položaja koeficijenta u bloku (faktor dijeljenja se povećava pri kretanju prema desno i prema dolje u tablici koeficijenata). Istosmjerni (DC) koeficijent se ne kvantizira. Na strani dekodera visokofrekvencijski koeficijenti se množe najvećim faktorom, tako da je utjecaj šuma prebačen najvećim dijelom u to područje, koje je oku najmanje vidljivo.

Nakon kvantizacije, vrijednosti koeficijenata bit će još manje, tako da će većina njih biti vrlo bliska nuli. U tipičnom programskom materijalu, većina velikih koeficijenata se nalazi u gornjem lijevom kutu bloka. Zbog takvog rasporeda koeficijenata prikladno je koeficijente očitavati metodom cik-cak analiziranja (slika 11.), počevši od gornjeg lijevog kuta tablice.

Slika 11. Cik-cak analiziranje

Pritom se dobiva niz koeficijenata koji na početku sadrži koeficijente različite od nule, dok su koeficijenti jednaki nuli koncentrirani na kraju niza. Takav oblik omogućava da se umjesto krajnjih koeficijanata (koji su ionako jednaki nuli) u daljnji tok signala šalje samo oznaka koja predstavlja te koeficijente.

Kodiranje s promjenjivom dužinom niza

U nizu podataka dobivenom nakon cik-cak analiziranja koeficijenti manje vrijednosti imaju ispred sebe više nula nego koeficijenti veće vrijednosti. Zbog toga je pogodno koristiti algoritam kodiranja koji će takvu raspodjelu znati iskoristiti.

Huffmanov način kodiranja dodjeljuje kraći kod onim vrijednostima koje se češće pojavljuju, a duži kod onim vrijednostima koje se pojavljuju rijetko. Time se postiže veća učinkovitost pri prijenosu većine realnih informacija.

Pri upotrebi diskretne kosinusne transformacije čest je slučaj da mnogi koeficijenti imaju vrijednost jednaku nuli, te je učinkovito takav niz kodirati pomoću kodiranja dužine niza. Na taj način koder jednostavno šalje podatak koliko je koeficijenata zaredom jednako nuli.

Kodiranje unutar slike (intra-kodiranje)

Slika 12. Kodiranje unutar slike

Slika 12. prikazuje potpunu blok-shemu kodiranja unutar slike. Kodiranjem unutar slike nastaju tzv. I-slike (Intra-coded pictures) Ulazna slika se dijeli u blokove veličine 8×8 elemenata. Na svaki blok se primjenjuje DCT, čime se dobiva tablica koeficijenata koji se potom kvantiziraju. Cik-cak analizom se iz tablice dobiva niz koji se šalje na kodiranje dužine niza i rezultat se šalje u prijenosni kanal.

U dekoderu se izvorni signal ponovno rekonstruira postupkom koji je potpuno inverzan postupku pri kodiranju.

Kodiranje između slika (inter-kodiranje)

Sustav prikazan na slici 11. uklanja samo prostornu redundanciju sadržanu unutar pojedine slike. Kodiranje unutar slike ne iskorištava postojanje redundancije između dviju slika u nizu. Kako iskoristiti i tu (vremensku redundanciju?

Rješenje leži u diferencijalnom kodiranju (slika 13.)

Slika 13. Dobivanje razlike slika

Da bi se mogla dobiti razlika između dvije slike, nužno je imati kašnjenje realizirano u sklopu kodera. Vrijednost svakog elementa prethodne slike se oduzima od odgovarajućeg elementa u trenutnoj slici, čime se dobiva razlika slika, koja je također dvodimenzijska slika, i može se podvrgnuti postupku kompresije unutar slike primjenom diskretne kosinusne transformacije.

U dekoderu se također koristi kašnjenje prethodne slike, s kojom se potom zbraja razlika slika da bi se dobila trenutna slika. Ta trenutna slika zatim ponovno ulazi u krug kašnjenja da bi se dobila slijedeća slika.

Pri ovakvom postupku kodiranja između slika nužno je spriječiti gomilanje sitnih pogrešaka zbog opasnosti da se one akumuliraju tijekom procesa kompresije izvornog videosignala. Najznačajniji uzrok pojave pogrešaka je kompresija razlike slika.

Radi uklanjanja pogrešaka koje bi uzrokovale potpun gubitak informacije nakon nekog vremena, nužno je da koder i dekoder imaju identični dekoder razlike slika. U trenutku kada dekoder oduzima ptrethodnu sliku od trenutne, on u stvari oduzima lokalno dekodiranu sliku, identičnu onoj koju će dobiti stvarni dekoder na drugoj strani prijenosnog puta. Na taj način će biti uklonjene sve pogreške uzrokovane prethodnom kompresijom razlike slika. Sustav je prikazan na slici 14.

Slika 14. Uklanjanje kumulativne pogreške pri kodiranju između slika

Nadomještanje pokreta; P-slike

Diferencijalno kodiranje prikazano na slici 14. daje dobre rezultate ukoliko izvorni videosignal ne sadrži znatan broj pokretnih objekata u slici. Ukoliko to nije slučaj, razlika slika će sadržavati gotovo istu količinu podataka kao da se uopće nije koristilo kodiranje između slika. Najbolji primjer za to je pomak kamere u jednom smjeru. Pri takvom pomaku vrijednosti većine elemenata slike se ne mijenjaju, nego samo dolazi do njihovog pomaka na drugo mjesto. Da bi se i takav videosignal mogao uspješno komprimirati, nužno je uvesti nadomještanje (kompenzaciju) pokreta.

Pri upotrebi kodera koji omogućava nadomještanje pokreta, uspoređuju se područja dvaju susjednih slika u nizu, kako bi se ustanovio smjer i veličina relativnog pomaka između slika. Tako se dobivaju podaci u obliku dvodimenzijskog vektora pomaka (slika 15.).

Slika 15. Kodiranje uz nadomještanje pokreta

(1) Mjerenje pomaka između slika A i B

(2) Pomicanje slike A pomoću vektora pomaka

(3) Oduzimanje slike A od slike B

(4) Odašiljanje vektora i podataka razlike slika u prijenosni kanal

Koder rabi vektore pomaka za pomicanje elemenata prethodne slike i stvaranje predviđene slike (P-slike, Predicted Frames) prije nego što njihove vijednosti oduzme od vrijednosti elemenata trenutne slike. Ukoliko je pocjene pokreta bila točna, proces pomaka će dovesti objekte u predviđenoj slici na isto mjesto na kojem se nalaze u stvarnoj slici, te će preostati samo mala količina podataka o razlikama između slika.

Pošto se vektori pomaka šalju zajedno s podacima razlike slika, dekoder na prijemnoj strani ih može upotrijebiti za jednaki pomak prethodne slike čime dobiva odgovarajuću P-sliku. Zbrajanjem signala razlike dobiva se dekodirana trenutna slika.

Za potrebe nadomještanja pokreta slika je razbijena u pravokutna područja koja se nazivaju makroblokovi. Svaki makroblok ima vlastiti vektor pomaka koji se primjenjuje na cijeli blok. U ovisnosti o položaju objekata, neki makroblokovi se pomiču, a neki ne. Zato nije uvijek nužno koristiti nadomještanje pokreta, već se koder treba ''odlučiti'' da li takav postupak daje manju potrebnu brzinu prijenosa ili je bolje raditi bez nadomještanja pokreta, prenoseći samo razlike slika.

Zbog činjenice da je kretanje nekog objekta u realnom programskom materijalu relativno konstantno u trajanju od nekoliko slika, vektori pomaka se odašilju diferencijalno, tj. ukoliko nema promjene u načinu pomaka, vrijednost parametra vektora pomaka jednaka je nuli, te se vektori jednostavno kopiraju iz prethodne slike. Ako kretanje mijenja brzinu ili smjer, tada se šalju razlike vektora pomaka.

Dvosmjerno predviđanje; B-slike

U svrhu dodatnog smanjenja zahtjeva na brzinu prijenosa, odnosno za postizanje još većeg stupnja kompresije, uvodi se koncept dvosmjernog kodiranja (slika 16.), čime se dobivaju B-slike (Bidirectionally Coded Frames).

Slika 16. Dvosmjerno kodiranje

Trenutna slika se uspoređuje i sa prethodnom i sa budućom slikom; izvode se dvosmjerni vektori pomaka. Područje označeno kvadratićem na trenutnoj slici dobiva se tako iz buduće slike.

Dvosmjerno predviđanje zahtijeva promjenu rasporeda slika pri prijenosu jer do dekodera moraju prvo stići buduće slike potrebne u procesu predviđanja, a zatim trenutna slika.

Najčešće grupe slika (uz mnogo ostalih rasporeda):

IIII...

IPIP...

IBPIBP... (prijenosni raspored IPBIPB...)

IBIB...

Razlozi za prijenos I-slika

U praksi nije moguće koristiti čisto diferencijalno kodiranje, budući da dekoder može primati signal samo od njegovog početka. Osim toga, svaka pogreška u prijenosu samo jedne slike prenosi se na sve slijedeće slike.

Zbog toga je nužno povremeno u prijenosni tok ubaciti slike koje su kodiranje isključivo metodom kodiranja unutar slike, bez predviđanja (I-slike), tako da se dobiva struktura toka podataka kao na slici 17.

Slika 17. Primjer strukture prijenosnog toka podataka

U nizu slika nije apsolutno nužno da se I-slike pojavljuju u strogo određenom rasporedu, budući da svaka slika ima oznaku koja govori dekoderu kako je treba obraditi.

Uređivanje i naknadna obrada ovakvog signala moguća je samo u trenucima u kojima se pojavljuju I-slike. Zbog toga, u slučaju kad je potrebna naknadna obrada videosignala, I-slike se moraju koristiti u znatnijoj mjeri, te nisu mogući veliki omjeri kompresije.

OPĆENITO O MPEG NORMAMA

MPEG (Moving Pictures Experts Group) je radna grupa unutar ISO/IEC (International Standardization Organisation / International Electrotechnical Committee), zadužena za razvoj međunarodnih standarda za kompresiju, dekompresiju, obradu i prezentaciju pokretnih slika i pratećih audio sadržaja.

Do sada su donešene slijedeće norme:

MPEG-1 – kodiranje pokretnih slika i pratećih audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s (1992. godine);

MPEG-2 – generičko kodiranje pokretnih slika i pratećih audiosignala (1995.);

MPEG-4 – kodiranje audio-vizualnih objekata (verzija 1: 1998., verzija 2: 1999.);

MPEG-7 – sučelje za opis multimedijskih sadržaja (2001.);

MPEG-21 – multimedijski sustav.

MPEG norme same po sebi se ne mogu jednostavno definirati. U svojoj biti, MPEG je skup standardnih alata, precizno definiranih algoritama i načina na koji se oni mogu kombinirati kako bi se napravio stvarni sustav za kompresiju signala.

Suprotno očekivanju, MPEG norme ne propisuju egzaktni način na koji se kompresija mora provesti. Umjesto toga, MPEG precizno propisuje način na koji dekoder mora obraditi skup različitih komprimiranih tokova podataka. MPEG ne propisuje kako treba prenositi sam signal, jer će to biti određeno karakteristikom sustava u primjeni. Razlog za takav pristup je omogućavanje velike fleksibilnosti, uz istovremeneo zadržavanje kompatibilnosti među sustavima. Razni proizvođači opreme mogu razvijati različite algoritme kompresije, ali izlazni komprimirani videosignal mora biti sukladan MPEG standardu. To omogućava da se sami algoritmi kompresije neprekidno usavršavaju, a da istovremeno komprimirani signal ostane kompatibilan sa svim postojećim dekoderima.

Primjena kompresije videosignala na zadržava se samo na televizijskim sustavima; kompresija se koristi za niz primjena, počevši od prikaza videosignala na monitorima računala, pa sve do raznih prezentacijskih primjena. Zahtjevi za kvalitetom variraju od vrlo malih (npr. videotelefoni, videonadzor, ...) do vrlo velikih (transparentnost potrebna u TV produkciji).

U različitim primjenama tako se može dopustiti različit stupanj složenosti kodera i dekodera, što je dovelo do potrebe za slojevitom strukturom kodiranja.

MPEG-1 (ISO/IEC IS 11172)

Formati slike

ITU-R preporuka BT.601:

određuje frekvencije uzorkovanja za komponente videosignala u 525/60 i 625/50 standardima uz omjer stranica 4:3 i 16:9

definira formate uzorkovanja 4:4:4 (frekvencija uzorkovanja za sve komponente signala iznosi 13,5 MHz (4:3), odnosno 18 MHz (16:9)) i 4:2:2 (frekvencija uzorkovanja 13,5/18 Mhz za luminantnu komponentu i 6,75/9 MHz za svaku od krominantnih komponenti)

576 linija u aktivnom dijelu slike za 625/50 sustav i 480 linija u aktivnom dijelu slike za 525/60 sustav

svaka digitalna linija u aktivnom intervalu sadrži 720 luminantnih uzoraka, te 720 (4:4:4) ili 360 (4:2:2) uzoraka krominantnih komponenti

Osim formata 4:4:4 i 4:2:2 u upotrebi su i formati 4:1:1 i 4:2:0 (nije dio preporuke BT.601, ali se koristi u MPEG normi).

Kao polazišni format pri kompresiji prema MPEG-1 normi, upotrebljava se SIF (Source Input Format), izveden iz ITU-R preporuke BT.601.

Tablica 1. SIF i BT.601 formati slike

Vertikalna frekvencija

25 Hz

30 Hz

Luminantna komponenta:

ITU-R BT.601

SIF

720 × 576

360 × 288

720 × 480

360 × 240

Krominantna komponenta:

ITU-R BT.601

SIF

360 × 576

180 × 144

360 × 480

180 × 120

Iz tablice je vidljivo kako je rezolucija slike koja se koristi u postupku MPEG-1 kodiranja smanjena na polovicu, u odnosu na rezoluciju slike propisanu preporukom BT.601.

Slika 18. Postupak dobivanja SIF formata iz BT.601 oblika

Brojke u zagradama na slici se odnose na 525/60 sustav, a izvan zagrada na sustav 625/50.

Postupkom prikazanim na slici 18. dobiva se SIF format (strukture uzorkovanja 4:2:0), koji ipak nije još uvijek moguće direktno upotrijebiti za kompresiju, jer horizontalna rezolucija od 360 elemenata slike nije djeljiva sa 16, što je nužno zbog podjele slike na makroblokove. Prilagođenje se izvodi odbacivanjem krajnjih lijevih i krajnjih desnih elemenata slike, čime se dobiva format 352 × 288 (za 625/50 sustav) ili 352 × 240 (za 525/60 sustav).

Hijerarhijska struktura kodiranja

Kodiranje po MPEG normi organizirano je u šest slojeva (slika 19.):

Blok – najmanja jedinica koja se podvrgava kodiranju; veličine 8×8 elemenata slike

Makroblok – osnovna jedinica za kodiranje s nadomještanjem pokreta; veličine 16×16 elemenata slike

Isječak slike (slice) – horizontalni niz makroblokova

Slika – osnovna jedinica u MPEG kodiranju; četiri vrste:

I-slike – slike kodirane samostalno unutarnjim kodiranjem

P-slike – kodirane s predviđanjem uz nadomještanje pokreta

B-slike – kodirane s predviđanjem uz nadomještanje pokreta, pri čemu se predviđanje vrši iz prethodnih i iz budućih slika

D-slike – slike dobivene kodiranjem samo istosmjernog (DC) koeficijenta; koriste se izuzetno rijetko

Grupa slika (GOP = Group of pictures) – niz od jedne ili više slika pri kodiranju i/ili prijenosu

Sekvenca – niz od određenog broja grupa slika

Slika 19. Hijerarhijska struktura kodiranja

U grupi slika pojedine slike su raspoređene prema slijedećem rasporedu:

I₁ B₁ B₂ P₁ B₃ B₄ P₂ B₅ B₆ P₃ B₇ B₈ I₂

Za rekonstrukciju B-slika nužno je imati i prethodne i buduće I i P-slike, te se prijenosni raspored mora tome prilagoditi (slika 20.):

I₁ P₁ B₁ B₂ P₂ B₃ B₄ P₃ B₅ B₆ I₂ B₇ B₈

Slika 20. Raspored slika pri kodiranju i pri prijenosu

Postupak kodiranja

Postupak MPEG kodiranja provodi se u više faza (blok-shema je prikazana na slici 21.):

Slika se dijeli u blokove veličine 8 × 8 elemenata slike.

Provodi se diskretna kosinusna transformacija (uklanjanje prostorne redundancije)

koriste se 64 koeficijenta transformacije

provodi se kvantizacija DCT koeficijenata

Provodi se kodiranje s predviđanjem uz nadomještanje pokreta (uklanjanje vremenske redundancije)

DCT koeficijenti se inverzno kvantiziraju, transformiraju i pohranjuju

izvorna slika se uspoređuje s prethodnom I ili P-slikom

u sklopu za predviđanje pokreta proračunavaju se vektori pokreta

vektori pokreta se primjenjuju na prethodnu sliku

makroblok iz prethodne slike pomaknut vektorom pokreta postaje prediktor (osnova za daljnje predviđanje)

pogreška predviđanja (razlika slika) kodira se primjenom DCT

provodi se kvantizacija DCT koeficijenata (korak kvantizacije za sve koeficijente je 16)

Slika 21. Blok-shema MPEG kodera:

Značenje kratica na slici:

Q = kvantizacija,

DCT = diskretna kosinusna transformacija,

VLC = kodiranje s promjenjivom dužinom riječi,

Q^-1 = inverzna kvantizacija,

DCT^-1 = inverzna DCT.

Osnovna namjena MPEG-1 norme: kodiranje pokretnih slika i pratećih audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s.

Koristi se isključivo progresivno analiziranje.

MPEG-2 (ISO/IEC IS 13818)

Opća svojstva MPEG-2 norme

MPEG-2 je norma za generičko (aplikacijski neovisno) kodiranje videosignala i pratećih audio sadržaja. Algoritam koji se primjenjuje za kodiranje sličan je algoritmu u MPEG-1 normi.

Osnovna razlika između MPEG-1 i MPEG-2 normi:

MPEG-1 je prilagođen videosignalu s progresivnim analiziranjem, osnovna namjena mu je bila snimanje videosignala na CD, brzina prijenosa do 1,5 Mbit/s.

MPEG-2 je opći standard namijenjen i videosignalima s progresivnim analiziranjem i videosignalima koji koriste analiziranje s proredom (slika se dijeli na dvije poluslike);

MPEG-2 nudi slojevitu strukturu profila (podskup sintakse toka podataka) i razina (određuje parametre koji su dopušteni unutar odabranog profila.

Struktura MPEG-2 kodiranja

MPEG-2 norma sadrži slijedeće profile i razine:

1. Profili:

osnovni (SP = Simple Profile) – daje najnižu kvalitetu signala, ne podržava slojevito kodiranje, ne uključuje dvosmjerno predviđanje, format slike je 4:2:0;

glavni (MP = Main Profile) – ne podržava slojevito kodiranje, ali postoji dvosmjerno predviđanje; format slike je također 4:2:0;

4:2:2 (4:2:2P) – format slike je 4:2:2, omogućeno je korištenje većih brzina prijenosa nego u glavnom profilu;

profil sa slojevitošću u odnosu na omjer signal/šum (SNR) – omogućava različite kvalitete slike s obzirom na odnos signala i šuma;

profil s prostornom slojevitošću (Spatial) – podržava različite prostorne rezolucije slike;

vršni profil (HP = High Profile) – podržava potpunu slojevitost i najvišu kvalitetu slike.

Razine:

niska (LL = Low Level) – SIF format slike

glavna (ML = Main Level) – standardni formati TV slike

visoka 1440 (High-1440) – videosignal sa 1440 uzoraka po liniji

visoka (HL = High Level) – videosignal sa 1920 uzoraka po liniji

Tablica 2. Profili i razine u MPEG-2 normi

Razina				Profil
Razina		Osnovni	Glavni	4:2:2	SNR	Prostorni	Vršni
Visoka	Uzoraka/liniji Linija/slici Format Vrste slika Mbit/s		1920 1152 4:2:0 I, P, B 80	1920 1152 4:2:2 I, P, B 80			1920 1152 4:2:2,4:2:0 I, P, B 100
Visoka 1440	Uzoraka/liniji Linija/slici Format Vrste slika Mbit/s		1440 1152 4:2:0 I, P, B 60			1440 1152 4:2:0 I, P, B 60	1440 1152 4:2:0,4:2:2 I, P, B 80
Glavna	Uzoraka/liniji Linija/slici Format Vrste slika Mbit/s	720 576 4:2:0 I, P 15	720 576 4:2:0 I, P, B 15	720 576 4:2:2 I, P, B 50	720 576 4:2:0 I, P, B 15		720 576 4:2:0,4:2:2 I, P, B 20
Niska	Uzoraka/liniji Linija/slici Format Vrste slika Mbit/s		352 288 4:2:0 I, P, B 4		352 288 4:2:0 I, P, B 4

MPEG koder – dobivanje I, P i B slika

Na slikama 22a, 22b i 22c prikazana je tipična izvedba MPEG kodera, koja sadrži dvosmjerno nadomještanje pokreta. Digitalni videosignal ulazi kroz seriju sklopova za kašnjenje, koje je moguće zaobići, ovisno o željenom rasporedu slika. Signal zatim ulazi u sklop za oduzimanje i u sklop za procjenu pomaka.

Ukoliko se želi dobiti I-slika, ulazno kašnjenje je uključeno u tok signala, a sklop za oduzimanje je isključen, tako da signal direktno prolazi do sklopa za prostorno kodiranje (kodiranje unutar slike). Signal se zatim šalje u slikovnu memoriju, gdje se pohranjuje nastala I-slika (slika 22a).

Slika 22a. MPEG koder – dobivanje I-slike

Slijedeći korak pri kodiranju videosignala je dobivanje P-slike (slika 22b). U tu svrhu, ulazni sklopovi za kašnjenje se isključuju, kako bi se odabrala buduća slika, što je potrebno zbog strukture grupe slika pri prijenosu. Sklop za procjenu pomaka uspoređuje I-sliku (koja se nalazi u izlaznoj memoriji) sa P-slikom u ulaznoj memoriji, kako bi se dobili vektori pomaka. Pomoću tih vektora pomaka pomiče se I-slika čime se dobiva predviđena P-slika.

Predviđena P-slika se oduzima od stvarne P-slike radi dobivanja iznosa pogreške predviđanja. Pogreška predviđanja se prostorno kodira i šalje zajedno s vektorima pomaka. Osim toga, pogreška predviđanja se dodaje predviđenoj P-slici, čime se dobiva lokalno dekodirana P-slika koja se pohranjuje u izlaznoj memoriji.

Izlazna memorija sada sadrži I-sliku i P-sliku, tako da se može prijeći na kodiranje B-slika.

Slika 22b. MPEG koder – dobivanje P-slike

Nakon kodiranja I i P-slike, u ulazni memorijski spremnik dolazi B-slika. Sklop za nadomještanje pokreta uspoređuje B-sliku s prethodnom I-slikom i budućom P-slikom (koje su pohranjene u izlaznoj memoriji), čime se dobivaju dvosmjerni vektori pomaka (slika 22c).

Postupkom nadomještanja pokreta provedenim u oba smjera dobivaju se dvije predviđene B-slike, koje se oduzimaju od trenutne B-slike. Na razini makroblokova odabire se pomak prema naprijed ili prema natrag, ovisno o tome koji daje najmanju razliku. Razlike se potom prostorno kodiraju i šalju zajedno s vektorima pomaka.

Nakon što se kodiraju sve B-slike, prelazi se na stvaranje nove P-slike iz prethodno pohranjene P-slike. Postupak se zatim nastavlja.

Slika 22c. MPEG koder – dobivanje B-slike

Kvaliteta slike; primjene MPEG-2 norme

Cilj koji se želi postići pri prijenosu videosignala jest visoka kvaliteta uz što je moguće manju brzinu prijenosa. Pritom neizbježno dolazi do problema i različitih načina pristupa rješenju.

Smanjenjem brzine prijenosa konstantnu kvalitetu slike moguće je postići promjenom strukture grupe slika. Grupa slika koja se sastoji samo od I-slika zahtijeva najveću brzinu prijenosa, što znači da je pri smanjivanju brzine prijenosa nužno ubacivati B i P-slike. Visoku kvalitetu pri brzinama prijenosa nižim od 20 Mbit/s moguće je ostvariti jedino uz primjenu B i P-slika (slika 23).

Slika 23. Krivulja konstantne kvalitete

U normi MPEG-2 primjenjuje se slojevito kodiranje – podaci se u koderu dijele na dva ili više tokova s različitim informacijama o videosignalu. Time je omogućen rad kodera i dekodera različitih kvaliteta.

Slojevito kodiranje jedna je od najznačajnijih osobina MPEG-2 norme. Poseban značaj slojevito kodiranje ima pri prijenosu videosignala putem računalne mreže, jer se postupak kodiranja može prilagoditi ovisno o trenutnom prometu u mreži, odnosno o raspoloživoj brzini prijenosa i kašnjenju paketa uzrokovanom prilikama u mreži.

Dekoder može dekodirati samo dio podataka iz ukupnog toka podataka, ukoliko je dovoljna niža kvaliteta slike.

Podaci se u koderu dijele po kriteriju koji može biti odnos signal/šum, prostorna ili vremenska rezolucija. Takvu slojevitost podržavaju SNR profil, profil s prostornom slojevitošću i vršni profil.

Kvaliteta slike je određena brzinom prijenosa i rasporedom slika u grupi slika, što se određuje ovisno o primjeni.

Ukoliko je potrebno naknadno obrađivati videosignal, koriste se kratke grupe slika (IBIB...) uz brzine prijenosa 30-50 Mbit/s, a ukoliko se radi samo ograničen broj generacija snimke, tada se može upotrijebiti i grupa slika IBBP... uz brzinu prijenosa od približno 20 Mbit/s.

Primjene 4:2:2P@ML (4:2:2 profil, glavna razina):

terenska snimanja i vijesti (18 Mbit/s, struktura grupe slika IB)

primarna distribucija (20 Mbit/s, struktura IBBP)

pohranjivanje (30 Mbit/s, struktura IP)

postprodukcija (50 Mbit/s, samo I slike).

Primjena MP@ML (glavni profil, glavna razina):

distribucija do krajnjih korisnika (TV gledatelja) putem zemaljskih, kabelskih i satelitskih distribucijskih sustava uz brzine prijenosa 4-9 Mbit/s.

Uz manje brzine prijenosa (manje od 15 Mbit/s), 4:2.2 profil daje lošije rezultate nego glavni profil (slika 23.), a razlog za to jest veći broj krominantnih uzoraka u 4:2:2 profilu, koji zahtijeva veći stupanj kompresije da bi se postigla ista brzina prijenosa nego glavni profil (4:2:0).

Slika 24. Ovisnost kvalitete o brzini prijenosa i strukturi grupe slika

Iz slike je vidljivo da struktura grupe slika znatno utječe na kvalitetu slike. Također je vidljivo da, čak ni uz visoke brzine prijenosa, nije moguće postići visoku kvalitetu slike bez upotrebe predviđanja pokreta.

Prijenos i pohranjivanje MPEG-2 signala

Da bi se pristupilo prijenosu ili pohranjivanju MPEG-2 signala, tokovi podataka (videosignal, audiosignal) moraju se multipleksirati.

Multipleksiranjem se dobiva:

Prijenosni tok podataka (TS = Transport Stream) – namijenjen prijenosu signala zemaljskim, kabelskim ili satelitskim vezama

Programski tok podataka (PS = Program Stream) – namijenjen pohranjivanju podataka na digitalni medij (DVD, magnetska vrpca, ...)

Multipleksiranje audio i videosignala potrebno je kako bi se omogućio njihov zajednički prijenos, te ispravno dekodiranje i prikazivanje.

U programskom toku podataka se multipleksira videosignal s pratećim audiosignalima (višekanalni zvuk) i podacima, pri čemu ti svi signali pripadaju jednom programu.

U prijenosnom toku moguće je multipleksiranje audiosignala, videosignala i podataka koji pripadaju različitim programima.

Hijerarhija multipleksiranja određena MPEG-2 normom sastoji se od tri vrste tokova podataka:

osnovni tok podataka (ES = Elementary Stream)

paketizirani osnovni tok podataka (PES = Packetized Elementary Stream)

prijenosni (TS) ili programski (PS) tok podataka (slika 25.).

Slika 25. Dobivanje programskog i prijenosnog toka podataka

Programski tok dobiven multipleksiranjem sadrži pakete nastale iz jednog ili više osnovnih tokova podataka koji pripadaju jednom programu; može sadržavati jedan tok podataka videosignala i više tokova podataka audiosignala.

Paketi programskog toka imaju promjenjivu duljinu što uzrokuje poteškoće budući da dekoder mora prepoznati točan početak i kraj paketa. Da bi se to omogućilo, u zaglavlju paketa se nalaze podaci o duljini paketa. Primjer programskog toka prikazan je na slici 26.

Slika 26. Paketi programskog toka podataka

Za razliku od programskog toka podataka, prijenosni tok može sadržavati jedan ili više različitih programa, tj. on može nastati multipleksiranjem više programskih tokova podataka ili multipleksiranjem PES paketa koji pripadaju različitim programima. Osim toga, prijenosni tok je namijenjen prijenosu MPEG signala kroz mrežu, tako da mora biti oblikovan tako da bude što manje osjetljiv na smetnje i pogreške u prijenosu. Zbog toga se koriste paketi fiksne duljine koji se mogu brzo komutirati u širokopojasnim mrežama.

Paketi programskog toka podataka imaju konstantnu duljinu od 188 bajta, od čega zaglavlje sadržava 4 bajta, a ostalih 184 bajta je podijeljeno na adaptacijsko područje i područje podataka (slika 27.)

Slika 27. Paket prijenosnog toka podataka

Paket prijenosnog toka (188 bajta)
Zaglavlje (4 bajta)	Adaptacijsko područje	Podaci

Adaptacijsko područje sadrži vremenske oznake i reference kao i informacije koje omogućuju dohvat podataka; definira izgled ostalih dijelova paketa i sadrži informaciju o vrsti signala koji se prenosi u paketu.

Primjena MPEG-2 norme u radiodifuziji digitalnog TV signala

Prijenos digitalnog TV signala definiran je u okviru DVB (Digital Video Broadcasting) projekta. Kao rezultat DVB projekta nastale su europske ETSI norme za satelitsku, kabelsku i zemaljsku radiodifuziju digtalnog TV signala.

Opća blok-shema sustava za radiodifuziju digitalnog TV signala prikazana je na slici 28.

Slika 28. Sustav za prijenos digitalnog TV signala

Izvorno kodiranje obuhvaća postupke smanjenja količine podataka i brzine prijenosa. Prenose se tri vrste podataka: videosignali, audiosignali i prateće informacije (vremenske, sigurnosne, identifikacijske...). Kao rezultat izvornog kodiranja dobivaju se osnovni tokovi podataka (ES = Elementary Stream).

MPEG-2 normom definiran je postupak uključivanja osnovnih tokova podataka u prijenosnu mrežu. Podaci se paketiziraju, pri čemu se paketi prijenosnog toka (TS) šalju na kanalno kodiranje, čime se osigurava zaštita od pogreške, i priprema signal za modulaciju VF nosioca.

U svim zemaljskim, kabelskim i satelitskim sustavima za radiodifuziju digitalnog TV signala za izvorno kodiranje rabi se MPEG-2 norma, dok se kanalno kodiranje i modulacijski postupak razlikuju, ovisno o prijenosnom mediju:

za satelitsku radiodifuziju rabi se modulacijski postupak QPSK (Quadrature Phase Shift Keying)

glavna karakteristika tog modulacijskog postupaka je djelotvornost po snazi, što je važno zbog male snage odašiljača na satelitu i velikog gušenja signala pri prolasku kroz atmosferu;

za kabelsku distribuciju digitalnih TV signala rabi se QAM (Quadrature Amplitude Modulation – kvadraturna amplitudna modulacija) sa 16, 32 ili 64 diskretna stanja;

glavna osobina QAM postupka jest spektralna djelotvornost, koja omogućava prijenos signala kanalom čija je širina ograničena na 8 MHz;

za zemaljsku radiodifuziju rabi se OFDM (Orthogonal Frequency Division Multiplex) – frekvencijski multipleks ortogonalnih podnosilaca;

OFDM postupak koristi veliki broj frekvencijski vrlo bliskih podnosilaca, pri čemu je moguće pojedine podnosioce modulirati različitim modulacijskim postupcima.

MPEG kodiranje – test

Test kvalitete slike kodirane primjenom MPEG normi obavljen je pomoću programa VcDemo, koji omogućava definiranje svih neophodnih parametara kodiranja (brzina prijenosa, vrsta grupe slika, odabir MPEG-1 ili MPEG-2 norme). Cilj ovog testa je dati uvid u ovisnost kvalitete slike o brzini prijenosa te strukturi grupe slika, a kao parametar kvalitete uzima se vršni odnos signal-šum u komprimiranom signalu (PSNR = Peak Signal to Noise Ratio). Ispitne sekvence koje se koriste u ovom testu dobivene su uz sam program.

PSNR se temelji na razlici izvorne i dekodirane slike, prema slijedećoj formuli:

pri čemu je n broj bitova korištenih za kodiranje uzorka slike, a MSE parametar definiran formulom:

Značenje oznaka u formuli: M, N – dimenzije slike,

x_j,k – uzorak izvorne slike,

x'_j,k – uzorak dekodirane slike.

Rezultat testa je prikazan na slikama 29a i 29b. Na x-osi se nalaze vrste grupe slika, a na y-osi vrijednosti PSNR izražene u decibelima.

Slika 29a. Rezultat kodiranja ispitne sekvence ''Suzie''

Slika 29b. Rezultat kodiranja ispitne sekvence ''Car phone''

Iz dobivenih rezultata može se zaključiti slijedeće:

najveći utjecaj na kvalitetu slike (predstavljenu vršnim odnosom signal-šum) ima brzina prijenosa koju je moguće ostvariti u nekom prijenosnom kanalu;

utjecaj strukture grupe slika je jasno vidljiv: uz dodavanje P i B-slika u grupu slika, kvaliteta se poboljšava, što je naročito važno pri malim brzinama prijenosa;

vrsta kodiranja (MPEG-1 ili MPEG-2) ne utječe vidljivo na kvalitetu slike (u testiranim uvjetima);

sadržaj slike utječe na kvalitetu slike (uz inače jednake uvjete kodiranja).

Dobiveni rezultati jasno govore da je poželjno, kad god je to moguće, koristiti veće grupe slika, uz primjenu i P-slika i B-slika. Nedostatak takve strukture pokazuje se jedino u slučaju da je videosignal potrebno naknadno obrađivati. U tom slučaju poželjno je (zbog uvjeta da rez mora započeti I-slikom) da grupe slika budu što kraće, odnosno da se koriste samo I-slike. Takav sustav zahtijeva velike brzine prijenosa.