Kuvapyramidi on monimittakaisten hierarkkisten tietorakenteiden luokka, joka on suunniteltu käytettäviksi sovelletuissa konenäköongelmissa , tiedon pakkaamisessa , bittikarttatekstuurianalyysissä jne. Tällaiset rakenteet sisältävät jokaisella hierarkian tasolla pienennetyn version edellisestä kuvasta. joista lasketaan rekursiivisesti aikaisempien kerrosten perusteella käyttämällä samantyyppistä operaatiota (esim. tasoitus ) [1] . Samanaikaisesti kullekin hierarkian tasolle osoitetaan ratkaistavan ongelman kannalta relevantti skaalausparametri, joka kuvaa kiinnostavia kuvan ominaisuuksia [2] .
Asiantuntijoiden kiinnostuksen ilmaantuminen kuvien matemaattiseen käsittelyyn hierarkkisissa pyramideissa liittyy tarpeeseen ratkaista joitain sovellettuja ongelmia olosuhteissa, joissa haluttujen ominaisuuksien tai ominaisuuksien mittakaava on a priori tuntematon. Koska tätä ominaiskokoa ei ole määritelty, mahdollinen tapa ratkaista se on hajottaa alkuperäinen kuva hierarkkiseksi järjestelmäksi, jossa jokaista kerrosta edustaa oma mittakaava, joka artikuloi erillisen joukon piirteitä. Biologisten kohteiden videoinformaation käsittelyjärjestelmä on järjestetty samalla tavalla [2] .
Ensimmäiset hierarkkiset pyramidit ilmestyivät 1970-luvun lopulla [3] , ja niiden nimen valinnan saneli puhtaasti ulkoinen visuaalinen assosiaatio [4] . Hierarkkisten pyramidien aktiivinen käyttö alkoi 1980-luvulla kuvien sekoitusongelmissa ja vastaavuuden etsimisessä eri mittakaavaisten elementtien ja rakenteiden välillä. Samalla saatiin päätökseen jatkuvien versioiden luominen pyramidirakenteista tilamittakaavaan käsittelyä varten. Kuitenkin 1980-luvun lopulla perinteisten pyramidien oli tehtävä tilaa aallokemuunnosten aktiivisen käyttöönoton vuoksi [5] .
Kuvapyramidi voidaan pohjimmiltaan ajatella pystysuoraan hierarkiaan järjestetynä näkymien joukona sen pienentyessä. Tyypillisesti alkuperäinen korkearesoluutioinen kuva sijaitsee pyramidin pohjalla, ja kun siirryt ylöspäin, mittakaava ja resoluutio pienenevät. Tämän seurauksena karkein likiarvo huonolla laadulla ja informaatiosisällöllä on yläosassa [6] [7] .
Yleensä pyramidin muodostamiseksi sen esittämisen helpottamiseksi alkuperäinen kuva lasketaan uudelleen mitoissa, jotka ovat 2:n potenssin kerrannaisia [1] . Jos alkuperäinen data oli pikselimatriisin muodossa , tämä merkintä vastaa , jossa [6] . Tässä muodossa parametrilla on pyramidin korkeuden rooli, joka ilmaistaan alkuperäisen kuvan (kerrosten) esitysten lukumääränä [8] .
Pyramidin ensimmäinen kerros (likiarvo) voidaan saada laskemalla peräkkäinen keskiarvo naapuripikseleistä, mikä johtaa matriisiin . Tämän menettelyn käyttäminen rekursiivisesti tuottaa joukon kuvia, joiden koko pienenee eksponentiaalisesti. Samalla välikuvien pikselit sisältävät tietoa alla olevien kerrosten pikselien neliölohkoista korkeammalla resoluutiolla [9] . Tällöin mielivaltaisesti valittu välikerros sisältää pikseleitä, joissa 0 ≤ j < n , ja pikselien kokonaismäärän pyramidissa, joka sisältää kerroksia [6] :
Pyramidin välisolmujen ei tarvitse olla alempien kerrosten intensiteetin painotettu keskiarvo. Voimakkuuden sijasta ne voivat tallentaa muun tyyppistä tietoa, esimerkiksi pintakuviokuvaajat tai geometristen elementtien parametrit (viivat, käyrät jne.) [10]
Monimittaisten pyramidien ilmeisin hyödyllinen ominaisuus on kyky alentaa eri algoritmien laskentakustannuksia " hajoita ja hallitse " -periaatetta soveltamalla. Myös kaksiulotteisen kuvan pyramidin muodossa esittämisen etuja pidetään sen paikallisten elementtien ja ominaisuuksien korrelaationa globaalien kanssa. Tämän avulla voit rakentaa puumaisia tietorakenteita monimuuttujaanalyysiä varten, mukaan lukien paikalliset ja globaalit tiedot. Esimerkiksi yksittäisten pikselien arvojen linkittäminen niitä ympäröivien alueiden ominaisuuksiin [11] .
Gaussin pyramideja ja Laplacian pyramideja pidetään klassisina pyramidihierarkioiden tyyppeinä . Hyvin tutkittujen ominaisuuksiensa vuoksi niitä käytetään laajasti useissa käytännön sovelluksissa [12] .
Gaussin pyramidi koostuu kerroksista, joista kukin saadaan edellisestä tasoittamalla symmetrisellä Gaussilla ( alipäästösuodatus ) ja sitä seuraavalla näytteenotolla. Näiden kerrosten kokonaisuutta kutsutaan kuvan karkeaksi mittakaavaksi. Gaussin pyramidien käyttöalue on yleensä kuvahaun ongelma mittakaavassa ja eri kuvien tilavertailu [13] [14] .
Laplacian pyramidit lasketaan peräkkäisellä tasoituksella ja alkutietojen desimaatiolla . Samanaikaisesti jokainen pyramidin taso on jalostus edellisistä ja vastaa erillistä taajuuskaistaa ( kaistanpäästösuodatus ). Toisin kuin Gaussin pyramidit, tämä tietotyyppi mahdollistaa suuremman tiedon pakkausasteen [15] [16] . Tämän lisäksi alkuperäinen kuva on helposti palautettavissa välikerrosten superpositiolla, mikä mahdollistaa sen, että sitä ei tallenneta muistiin [17] .