Mukautuva Huffman-algoritmi

Mukautuva Huffman-koodaus (kutsutaan myös dynaamiseksi Huffman-koodaukseksi ) on Huffman -koodaukseen perustuva adaptiivinen menetelmä . Sen avulla voit rakentaa koodikaavion suoratoistotilassa (ilman alustavaa tietojen skannausta) ilman alkuperäisen jakelun alkutietoa, mikä mahdollistaa tietojen pakkaamisen yhdellä kertaa. Tämän menetelmän etuna on kyky koodata lennossa.

Algoritmit

Tälle menetelmälle on useita toteutuksia, joista merkittävimmät ovat "FGK" (FGK: Voller, Gallagher ja Knuth ) ja Witterin algoritmi.

FGK-algoritmi

Sen avulla voit säätää Huffman-puuta dynaamisesti ilman alkutaajuuksia. FGD Huffman -puussa on erityinen ulompi solmu, nimeltään 0-solmu , jota käytetään saapuvien merkkien tunnistamiseen. Toisin sanoen aina kun uusi merkki kohdataan, sen polku puussa alkaa nollasolmusta. Tärkeintä on, että sinun on tarvittaessa katkaistava ja tasapainotettava FGD Huffman -puu ja päivitettävä siihen liittyvien solmujen taajuus. Symbolin taajuuden kasvaessa myös sen kaikkien vanhempien taajuutta on lisättävä. Tämä saavutetaan solmujen, alipuiden tai molempien peräkkäisellä permutaatiolla.

FGD-puun tärkeä ominaisuus on veljeys (tai kilpailu) -periaate: jokaisella solmulla on kaksi lasta (solmuja ilman lapsia kutsutaan lehtiksi) ja painot ovat laskevassa järjestyksessä. Tämän ominaisuuden ansiosta puu voidaan tallentaa tavalliseen taulukkoon, mikä lisää suorituskykyä. [1] [2]

Witterin algoritmi

Koodi esitetään puurakenteena, jossa jokaisella solmulla on paino ja yksilöllinen numero.

Numerot laskevat ja oikealta vasemmalle.

Painojen on täytettävä veljeyden periaate. Siten, jos A on B:n vanhempi ja C on B:n lapsi, niin . $W(A)>W(B)>W(C)$

Paino on vain tähän mennessä havaittujen merkkien määrä.

Joukko solmuja, joilla on sama paino, on lohko .

Saadaksemme koodin jokaiselle solmulle binääripuun tapauksessa voisimme yksinkertaisesti kulkea kaikki polut juuresta solmuun kirjoittamalla esimerkiksi "1", jos menemme oikealle, ja "0", jos menemme mene vasemmalle.

Tämä algoritmi käyttää myös erityistä lehteä (solmu ilman jälkeläisiä), NYT (englanniksi ei vielä lähetetty - ei vielä lähetetty merkki), josta "kasvaa" uusia, ennen näkemättömiä merkkejä.

Enkooderi ja dekooderi alkavat vain juurisolmusta, jolla on suurin paino. Alussa tämä on NYT-solmumme.

Kun välitämme NYT-merkin, meidän on ensin välitettävä itse solmun koodi ja sitten tiedot.

Jokaiselle puussa jo olevalle symbolille meidän on välitettävä vain päätesolmujen (lehtien) koodi.

Jokaiselle lähetetylle merkille lähetin ja vastaanotin suorittavat päivitystoimenpiteen:

Jos nykyistä symbolia ei löydy, lisää NYT:hen kaksi alisolmua: yksi seuraavalle NYT:lle ja toinen symbolille. Lisää uuden arkin ja vanhan NYT:n painoa ja siirry vaiheeseen 4. Jos nykyinen symboli ei ole NYT, siirry symboliarkkiin.
Jos tällä solmulla ei ole lohkon suurinta painoa, vaihda se suurimman numeron omaavaan solmuun, ellei tämä solmu ole pääsolmu [3]
Nykyisen solmun painon lisääminen
Jos se ei ole juurisolmu, siirry pääsolmuun ja siirry sitten vaiheeseen 2. Jos se on juurisolmu, lopeta.

Huomautus: Solmujen vaihtaminen tarkoittaa painojen ja vastaavien symbolien, ei numeroiden, korvaamista.

Esimerkki

Aloitamme tyhjästä puusta.

" A" :lle välitämme sen binaarikoodin.

NYT synnyttää kaksi lapsisolmua: 254 ja 255. Lisää juuren painoa. Solmuun 255 liittyvästä "a"-koodista tulee 1 .

Lähetä "b": lle 0 (solmun NYT-koodi), sitten sen binaarikoodi.

NYT synnyttää kaksi lasta: 252 NYT ja 253 b . Lisäämme painoja 253, 254 ja juuria. "b" :n koodi on 01.

Seuraavaksi "b" lähetetään 01.

Siirrymme arkkiin 253. Meillä on painolohko 1:ssä ja suurin luku lohkossa 255, joten muutamme solmujen 253 ja 255 painoja ja symboleja, lisäämme painoa, siirrymme juureen ja lisäämme juuren painoa.

Jatkossa "b":n koodi on 1, ja "a":n koodi on nyt 01, mikä kuvastaa niiden taajuutta.

Muistiinpanot

↑ [1] Arkistoitu 24. syyskuuta 2016 the Wayback Machine , FGK Algorithm
↑ [2] Arkistoitu 21. syyskuuta 2016 Wayback Machinessa , Huffman Adaptive Coding
↑ Mukautuva Huffman-koodaus . Cs.duke.edu. Haettu 26. helmikuuta 2012. Arkistoitu alkuperäisestä 12. helmikuuta 2012. (määrätön)

Kirjallisuus

Vitterin alkuperäinen artikkeli: JS Vitter, " Dynaamisten Huffman-koodien suunnittelu ja analyysi ", ACM Journal, 34(4), lokakuu 1987, s. 825-845.
JS Vitter, "ALGORITHM 673 Dynamic Huffman Coding", ACM Transactions on Mathematical Software, 15(2), kesäkuu 1989, s. 158–167. Näkyy myös ACM:n kerätyissä algoritmeissa.
Donald E. Knuth, "Dynamic Huffman Coding", Journal of Algorithm, 6(2), 1985, s. 163–180.

Linkit

Paul E Musta Mukautuva Huffman-koodaus . Algoritmien ja tietorakenteiden sanakirja . NIST . (määrätön)

Puristusmenetelmät _

Teoria

Tiedot	Oma Keskinäinen Haje Ehdollinen entropia Monimutkaisuus Redundanssi
Yksiköt	Bitti Nat Napostella Hartley Hartleyn kaava

Häviötön

Entropian pakkaus	Epäsymmetriset lukujärjestelmät Huffmanin algoritmi Mukautuva Huffman-algoritmi Shannon-Fano-algoritmi Shannonin algoritmi Aritmeettinen koodaus ( intervalli ) Golomb koodit Delta Universaali koodi Elias fibonacci
Sanakirjamenetelmät	RLE Tyhjennä LZ ( LZ77/LZ78 LZSS LZW LZWL LZO LZMA LZX LZRW LZJB LZT LZ4 Brotli zstandardi )
Muut	RLE CTW BWT MTF PPM DMC

Audio

Teoria	Convolution PCM Aliasing Näytteenotto Kotelnikovin lause
menetelmät	LPC LAR LSP WLPC CELP ACELP Laki μ-laki ADPCM MDCT Fourier-muunnos Psykoakustinen malli
Muut	Äänen kompressori Puheen pakkaus Band koodaus

Kuvat

Ehdot	väriavaruutta Pikseli Saturaatio-alinäytteenotto Pakkausesineet
menetelmät	RLE DPCM fraktaali aallokko EZW SPIHT LP PrEP PCL
Muut	Bittinopeus Normaali testikuva PSNR Kvantisointi

Video

Ehdot	Videon ominaisuudet Kehys Kehystyypit Videon laatu
menetelmät	Liikekompensointi PrEP Kvantisointi aallokko
Muut	Videokoodekki Nopeuden vääristymisteoria CBR ABR VBR