FMUSER Bezdrátový přenos videa a zvuku snadnější!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikánština
sq.fmuser.org -> albánština
ar.fmuser.org -> arabština
hy.fmuser.org -> Arménský
az.fmuser.org -> Ázerbájdžánština
eu.fmuser.org -> baskičtina
be.fmuser.org -> běloruský
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> Katalánština
zh-CN.fmuser.org -> čínština (zjednodušená)
zh-TW.fmuser.org -> Čínsky (zjednodušeně)
hr.fmuser.org -> chorvatština
cs.fmuser.org -> čeština
da.fmuser.org -> dánština
nl.fmuser.org -> Dutch
et.fmuser.org -> estonština
tl.fmuser.org -> filipínský
fi.fmuser.org -> finština
fr.fmuser.org -> French
gl.fmuser.org -> galicijština
ka.fmuser.org -> gruzínština
de.fmuser.org -> němčina
el.fmuser.org -> Greek
ht.fmuser.org -> haitská kreolština
iw.fmuser.org -> hebrejština
hi.fmuser.org -> hindština
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandština
id.fmuser.org -> Indonéština
ga.fmuser.org -> Irština
it.fmuser.org -> Italian
ja.fmuser.org -> japonština
ko.fmuser.org -> korejština
lv.fmuser.org -> lotyština
lt.fmuser.org -> Litevština
mk.fmuser.org -> makedonština
ms.fmuser.org -> Malajština
mt.fmuser.org -> maltština
no.fmuser.org -> Norwegian
fa.fmuser.org -> perština
pl.fmuser.org -> polština
pt.fmuser.org -> portugalština
ro.fmuser.org -> Rumunština
ru.fmuser.org -> ruština
sr.fmuser.org -> srbština
sk.fmuser.org -> slovenština
sl.fmuser.org -> Slovinština
es.fmuser.org -> španělština
sw.fmuser.org -> svahilština
sv.fmuser.org -> švédština
th.fmuser.org -> Thai
tr.fmuser.org -> turečtina
uk.fmuser.org -> ukrajinština
ur.fmuser.org -> urdština
vi.fmuser.org -> Vietnamská
cy.fmuser.org -> velština
yi.fmuser.org -> Jidiš
(1) Redundantní informace o video signálu
Vezmeme-li jako příklad YUV formát záznamu digitálního videa, YUV představuje jas a dva barevné rozdíly. Například pro stávající systém pal TV je vzorkovací frekvence jasového signálu 13.5 MHz; frekvenční pásmo chroma signálu je obvykle poloviční nebo menší než jasový signál, což je 6.75 MHz nebo 3.375 MHz. Vezmeme-li jako příklad vzorkovací frekvenci 4: 2: 2, signál Y přijímá 13.5 MHz, barevný signál U a V se vzorkuje o 6.75 MHz a vzorkovací signál je kvantován po 8 bitech, poté lze vypočítat kódovou rychlost digitálního videa jak následuje:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216 Mbit / s
Pokud se takové velké množství dat ukládá nebo přenáší přímo, bude obtížné použít kompresní technologii ke snížení bitové rychlosti. Digitální video signál lze komprimovat podle dvou základních podmínek:
L. redundance dat. Například prostorová redundance, redundance času, redundance struktury, redundance entropie informací atd., Tj. Existuje silná korelace mezi pixely obrazu. Odstranění této redundance nevede ke ztrátě informací a jde o bezztrátovou kompresi.
L. vizuální nadbytečnost. Některé charakteristiky lidských očí, jako je prahová hodnota rozlišení jasu, vizuální prahová hodnota, se liší v citlivosti na jas a barevnost, což znemožňuje zavést příslušné chyby v kódování a nebudou detekovány. Vizuální charakteristiky lidských očí lze použít k výměně za kompresi dat s určitým objektivním zkreslením. Tato komprese je ztrátová.
Komprese digitálního obrazového signálu je založena na výše uvedených dvou podmínkách, díky nimž jsou obrazová data velmi komprimována, což vede k přenosu a ukládání. Běžné metody komprese digitálního videa jsou smíšené kódování, což je kombinace transformačního kódování, odhadu pohybu a kompenzace pohybu a entropické kódování ke komprimaci kódování. Obvykle se transformační kódování používá k odstranění redundance obrazu uvnitř snímku a odhad pohybu a kompenzace pohybu se používají k odstranění mezidramové redundance obrazu a entropické kódování se používá k dalšímu zlepšení účinnosti komprese. Stručně jsou představeny následující tři metody kódování komprese.
(a) Metoda kompresního kódování
(b) Transformační kódování
Funkce transformačního kódování je transformovat obrazový signál popsaný v prostorové doméně do frekvenční domény a poté kódovat transformované koeficienty. Obecně lze říci, že obraz má silnou korelaci v prostoru a transformace do frekvenční oblasti může realizovat dekorelaci a koncentraci energie. Běžná ortogonální transformace zahrnuje diskrétní Fourierovu transformaci, diskrétní kosinusovou transformaci atd. Diskrétní kosinová transformace je široce používána v kompresi digitálního videa.
Diskrétní kosinová transformace se označuje jako DCT transformace. Může transformovat obrazový blok L * l z vesmírné domény do frekvenční domény. Proto v procesu komprese obrazu a kódování na základě DCT je třeba obraz rozdělit na nepřekrývající se obrazové bloky. Předpokládejme, že velikost obrázku je 1280 * 720, je rozdělen do 160 * 90 obrazových bloků s velikostí 8 * 8 bez překrývání ve formě mřížky. Potom lze pro každý obrazový blok provést transformaci DCT.
Po rozdělení bloku je každý 8 * 8 bodový obrazový blok odeslán do kodéru DCT a 8 * 8 obrazový blok je transformován z prostorové domény do frekvenční domény. Obrázek níže ukazuje příklad obrazového bloku 8 * 8, kde číslo představuje hodnotu jasu každého pixelu. Z obrázku je vidět, že hodnoty jasu každého pixelu v tomto obrazovém bloku jsou relativně jednotné, zejména hodnota jasu sousedních pixelů není příliš velká, což naznačuje, že obrazový signál má silnou korelaci.
Skutečný blok obrazu 8 * 8
Následující obrázek ukazuje výsledky DCT transformace obrazového bloku na výše uvedeném obrázku. Na obrázku je vidět, že po transformaci DCT nízkofrekvenční koeficient v levém horním rohu koncentruje hodně energie, zatímco energie na vysokofrekvenčním koeficientu v pravém dolním rohu je velmi malá.
Koeficienty obrazového bloku po transformaci DCT
Po transformaci DCT je třeba kvantifikovat signál. Protože lidské oči jsou citlivé na nízkofrekvenční charakteristiky obrazů, jako je celkový jas objektů, a nikoli na vysokofrekvenční detaily v obraze, může být v procesu přenosu vysokofrekvenční informace přenášena méně nebo ne, pouze nízkofrekvenční část. Kvantizační proces snižuje přenos informací kvantifikací koeficientů nízkofrekvenční oblasti a hrubou kvantací koeficientů ve vysokofrekvenční oblasti, což odstraňuje vysokofrekvenční informace, které nejsou citlivé na lidské oči. Kvantizace je proto ztrátovým procesem komprese a hlavním důvodem poškození kvality v kódování komprese videa.
Proces kvantifikace lze vyjádřit následujícím vzorcem:
Mezi nimi FQ (U, V) představuje DCT koeficient po kvantování; f (U, V) představuje DCT koeficient před kvantizací; Q (U, V) představuje kvantizační váhovou matici; q je kvantizační krok; zaokrouhlení odkazuje na konsolidaci a hodnota, která má být vydána, se považuje za nejbližší celočíselnou hodnotu.
Vyberte kvantizační koeficient rozumně a výsledek po kvantování transformovaného obrazového bloku je zobrazen na obrázku.
Koeficient DCT po kvantifikaci
Většina DCT koeficientů se po kvantování změní na 0, zatímco pouze několik koeficientů je nenulových hodnot. V tuto chvíli je třeba komprimovat a kódovat pouze tyto nenulové hodnoty.
(b) Entropické kódování
Entropické kódování je pojmenováno, protože průměrná délka kódu po kódování je blízká hodnotě entropie zdroje. Entropické kódování je implementováno pomocí VLC (kódování s proměnnou délkou). Základním principem je dát krátký kód symbolu s vysokou pravděpodobností ve zdroji a dát dlouhý kód symbolu s malou pravděpodobností výskytu, aby se statisticky získala kratší průměrná délka kódu. Kódování s proměnnou délkou obvykle zahrnuje Hoffmanův kód, aritmetický kód, běhový kód atd. Kódování délky běhu je velmi jednoduchá metoda komprese, její účinnost komprese není vysoká, ale rychlost kódování a dekódování je rychlá a stále se často používá, zejména po transformaci kódování pomocí kódování délky běhu má dobrý účinek.
Nejprve se AC koeficient bezprostředně následující za výstupním DC koeficientem kvantizátoru naskenuje v typu Z (jak je znázorněno v řádku šipky). Z-sken transformuje dvourozměrný kvantizační koeficient do jednorozměrné sekvence a poté pokračuje v kódování délky běhu. Nakonec se k kódování dat po kódování běhu použije další kód s proměnnou délkou, například Hoffmanovo kódování. Prostřednictvím tohoto druhu kódování s proměnnou délkou se účinnost kódování dále zlepšuje.
c) Odhad pohybu a kompenzace pohybu
Odhad pohybu a kompenzace pohybu jsou účinné metody k eliminaci korelace časového směru obrazových sekvencí. Výše popsané metody DCT transformace, kvantování a entropického kódování jsou založeny na jednom snímku snímku. Prostřednictvím těchto metod lze eliminovat prostorovou korelaci mezi pixely v obraze. Ve skutečnosti má kromě prostorové korelace obrazový signál také časovou korelaci. Například pro digitální video se statickým pozadím, jako je vysílání zpráv a malý pohyb hlavní části obrazu, je rozdíl mezi každým obrázkem velmi malý a korelace mezi obrázky je velmi velká. V tomto případě nepotřebujeme kódovat každý snímek snímku zvlášť, ale můžeme kódovat pouze změněné části sousedních video snímků, abychom dále snížili množství dat. Tato práce je realizována odhadem pohybu a kompenzací pohybu.
Technologie odhadu pohybu obecně rozděluje aktuální vstupní obraz na několik malých dílčích bloků obrazu, které se navzájem nepřekrývají, například velikost obrazu rámečku je 1280 * 720. Nejprve je rozdělen na 40 * 45 obrazových bloků s 16 * 16 velikostí, které se navzájem nepřekrývají ve formě mřížky, a poté v rámci vyhledávacího okna předchozího obrázku nebo druhého obrázku najděte blok pro každý blok obrázku, abyste našli jeden blok obrázku v rozsahu vyhledávací okno Nejpodobnější blok obrázků. Proces hledání se nazývá odhad pohybu. Výpočtem informací o poloze mezi nejpodobnějším blokem obrazu a blokem obrazu lze získat pohybový vektor. Tímto způsobem lze aktuální obrazový blok odečíst od nejpodobnějšího obrazového bloku namířeného pohybovým vektorem referenčního obrazu a lze získat zbytkový obrazový blok. Protože každá hodnota pixelu v bloku zbytkového obrazu je velmi malá, lze v kompresním kódování dosáhnout vyššího kompresního poměru. Tento proces odečítání se nazývá kompenzace pohybu.
Protože je nutné použít referenční obraz pro odhad pohybu a kompenzaci pohybu v procesu kódování, je velmi důležité vybrat referenční obraz. Kodér obecně rozděluje každý vstup obrazového snímku do tří různých typů podle různých referenčních obrazů: I (intra) snímek, B (navádění predikce) rámec a P (predikce) rámec. Jak je znázorněno na obrázku.
Typická sekvence struktury rámce I, B, P
Jak je znázorněno na obrázku, rámec I používá pro kódování pouze data v rámci a během procesu kódování nepotřebuje odhad pohybu a kompenzaci pohybu. Je zřejmé, že protože rámec I nevylučuje korelaci časového směru, je kompresní poměr relativně nízký. V procesu kódování používá P snímek jako referenční obraz pro kompenzaci pohybu přední I snímek nebo P snímek, ve skutečnosti kóduje rozdíl mezi aktuálním obrazem a referenčním obrazem. Režim kódování B rámce je podobný P rámci, jediný rozdíl je v tom, že pro předpovídání během procesu kódování potřebuje použít přední I snímek nebo P snímek a pozdější I snímek nebo P snímek. Každé kódování P rámce tedy potřebuje použít jeden snímek jako referenční snímek, zatímco snímek B potřebuje jako referenci dva snímky. Naproti tomu B snímek má vyšší kompresní poměr než P snímek.
d) Smíšené kódování
Příspěvek představuje několik důležitých metod komprese a kódování videa. V praktické aplikaci nejsou tyto metody odděleny a jsou obvykle kombinovány, aby se dosáhlo nejlepšího efektu komprese. Následující obrázek ukazuje model hybridního kódování (tj. Transformační kódování + odhad pohybu a kompenzace pohybu + kódování entropie). Tento model je široce používán v MPEG1, MPEG2, H.264 a dalších standardech. Z obrázku vidíme, že aktuální vstupní obraz musí být nejprve rozdělen do bloků, blok obrazu získaného blokem bude odečten od predikovaný obraz po kompenzaci pohybu k získání rozdílového obrazu x a poté se pro blok rozdílového obrazu provede DCT transformace a kvantování. Kvantovaná výstupní data mají dvě různá místa: jedním je jejich odeslání entropickému kodéru pro kódování a kódovaný datový proud je odeslán do mezipaměti Uložit do zařízení a počkat na přenos. Další aplikací je čelit kvantifikaci a reverzní změně signálu x ', který přidává výstup obrazového bloku s kompenzací pohybu pro získání nového signálu predikčního obrazu a posílá nový blok predikčního obrazu do paměti rámce.
|
Zadejte e-mail a získejte překvapení
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikánština
sq.fmuser.org -> albánština
ar.fmuser.org -> arabština
hy.fmuser.org -> Arménský
az.fmuser.org -> Ázerbájdžánština
eu.fmuser.org -> baskičtina
be.fmuser.org -> běloruský
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> Katalánština
zh-CN.fmuser.org -> čínština (zjednodušená)
zh-TW.fmuser.org -> Čínsky (zjednodušeně)
hr.fmuser.org -> chorvatština
cs.fmuser.org -> čeština
da.fmuser.org -> dánština
nl.fmuser.org -> Dutch
et.fmuser.org -> estonština
tl.fmuser.org -> filipínský
fi.fmuser.org -> finština
fr.fmuser.org -> French
gl.fmuser.org -> galicijština
ka.fmuser.org -> gruzínština
de.fmuser.org -> němčina
el.fmuser.org -> Greek
ht.fmuser.org -> haitská kreolština
iw.fmuser.org -> hebrejština
hi.fmuser.org -> hindština
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandština
id.fmuser.org -> Indonéština
ga.fmuser.org -> Irština
it.fmuser.org -> Italian
ja.fmuser.org -> japonština
ko.fmuser.org -> korejština
lv.fmuser.org -> lotyština
lt.fmuser.org -> Litevština
mk.fmuser.org -> makedonština
ms.fmuser.org -> Malajština
mt.fmuser.org -> maltština
no.fmuser.org -> Norwegian
fa.fmuser.org -> perština
pl.fmuser.org -> polština
pt.fmuser.org -> portugalština
ro.fmuser.org -> Rumunština
ru.fmuser.org -> ruština
sr.fmuser.org -> srbština
sk.fmuser.org -> slovenština
sl.fmuser.org -> Slovinština
es.fmuser.org -> španělština
sw.fmuser.org -> svahilština
sv.fmuser.org -> švédština
th.fmuser.org -> Thai
tr.fmuser.org -> turečtina
uk.fmuser.org -> ukrajinština
ur.fmuser.org -> urdština
vi.fmuser.org -> Vietnamská
cy.fmuser.org -> velština
yi.fmuser.org -> Jidiš
FMUSER Bezdrátový přenos videa a zvuku snadnější!
Kontakt
Adresa:
Budova č. 305 Room HuiLan No.273 Huanpu Road Guangzhou Čína 510620
Kategorie
Newsletter