LSM puu

LSM-puu (sanasta Log-structured merge-tree - log -structured merge tree) on monissa DBMS -järjestelmissä käytetty tietorakenne , joka tarjoaa nopean indeksin pääsyn toistuvissa lisäyspyynnöissä (esimerkiksi tapahtumalokeja tallennettaessa ). LSM-puut, kuten muutkin, tallentavat avainarvopareja. LSM-puu ylläpitää kahta tai useampaa erilaista rakennetta, joista kukin on optimoitu sille laitteelle, johon se tallennetaan. Synkronointi näiden rakenteiden välillä tapahtuu lohkoissa.

Kuinka se toimii

Yksinkertainen versio LSM-puusta, kaksitasoinen puu, koostuu kahdesta puumaisesta rakenteesta C 0 ja C 1 . C 0 on pienempi ja se on tallennettu kokonaan RAM-muistiin, kun taas C 1 on haihtumattomassa muistissa. Uudet merkinnät lisätään kohtaan C 0 . Jos C0:n koko ylittää lisäyksen jälkeen jonkin ennalta määrätyn kynnyksen, viereinen segmentti poistetaan C0:stä ja yhdistetään Cl : n kanssa jatkuvassa varastoinnissa. Hyvä suorituskyky saavutetaan sillä, että puut on optimoitu varastointia varten ja yhdistäminen suoritetaan tehokkaasti ja useiden tietueiden ryhmissä yhdistämislajittelua muistuttavalla algoritmilla .

Useimmat käytännössä käytetyt LSM-puut toteuttavat useita tasoja. Taso 0 (kutsutaanko sitä MemTableksi) on tallennettu RAM-muistiin ja se voidaan esittää tavallisella puulla. Pysyvien tallennuslaitteiden tiedot tallennetaan avainten mukaan lajiteltuina taulukoina ( SSTable ). Taulukko voidaan tallentaa erillisenä tiedostona tai tiedostojoukona, jonka avainarvot eivät ole päällekkäisiä. Tietyn avaimen löytämiseksi sinun on tarkistettava sen läsnäolo MemTablessa ja käytävä sitten läpi kaikki pysyvän tallennuslaitteen SSTables.

Kaava työskentely LSM-puun kanssa:

SSTable-indeksit ladataan aina RAM-muistiin;
merkintä tehdään MemTablessa;
luettaessa tarkistetaan ensin MemTable ja sitten tarvittaessa pysyvän tallennuslaitteen SSTable;
MemTable huuhdellaan ajoittain haihtumattomaan muistiin pysyvää tallennusta varten SST-taulukkona;
Pysyvien tallennuslaitteiden SST-taulukot yhdistetään ajoittain.

Haettu avain voi esiintyä useissa taulukoissa yhtä aikaa pysyvillä tallennuslaitteilla, ja lopullinen vastaus riippuu ohjelmasta. Useimmat sovellukset tarvitsevat vain viimeisen arvon, joka liittyy tiettyyn avaimeen. Toisten, kuten Apache Cassandra , jossa jokainen arvo on tietokantarivi (ja rivillä voi olla eri määrä sarakkeita eri taulukoissa pysyvästä tallennustilasta), on käsiteltävä kaikki arvot jollakin tavalla saadakseen oikea tulos [1] . Kyselyn suoritusajan lyhentämiseksi käytännössä pyritään välttämään tilanne, jossa pysyviä tallennuslaitteita on liikaa.

Laajennuksia "taso"-menetelmään B+‍-rakenteiden ylläpitämiseksi on kehitetty , kuten bLSM [2] ja Diff-Index. [3]

Aukioloajat

LSM-puuarkkitehtuurin avulla voit täyttää lukupyynnöt joko RAM-muistista tai yhdellä kutsulla pysyviin tallennuslaitteisiin. Kirjoittaminen on myös aina nopeaa tallennustilan koosta riippumatta.

Pysyvien tallennuslaitteiden SSTable on muuttumaton. Siksi muutokset tallennetaan MemTableen, ja poistojen on lisättävä MemTableen erityinen arvo. Koska uusia lukuja tapahtuu peräkkäin indeksissä, päivitetty arvo tai arvon poistomerkintä tapahtuu ennen vanhoja arvoja. Säännöllisesti suoritettava vanhojen SST-taulukoiden yhdistäminen pysyvään tallennustilaan tekee nämä muutokset ja itse asiassa poistaa ja päivittää arvot, mikä poistaa tarpeettomat tiedot.

Muistiinpanot

↑ Tasoitettu tiivistys Apache Cassandrassa / datastax.com
↑ Margo Seltzer | MARGO I. SELTZER on Kanadan tietojenkäsittelytieteen 150-tutkimuksen johtaja British Columbian yliopistossa. Hänen tutkimuskohteensa ovat systeemit, rakennettu q... . Haettu 5. marraskuuta 2016. Arkistoitu alkuperäisestä 3. tammikuuta 2017. (määrätön)
↑ Arkistoitu kopio . Haettu 5. marraskuuta 2016. Arkistoitu alkuperäisestä 3. elokuuta 2016. (määrätön)

Linkit

Patrick O'Neil, Log-structured merge-tree (LSM-tree) // Acta Informatica Volume 33 Issue 4, 1996, s. 351-385, doi:10.1007/s002360050048

Puu (tietorakenne)
Binäärihakupuu Puu (graafiteoria) puun rakenne
Binääripuut	binääripuu T-puu
Itsetasapainottavat binaaripuut	AA puu AVL puu Puna-musta puu Splay-puu puu sakkoilla karteesinen puu Fibonacci puu B-puu T-puu
B-puut	2-3-puu B⁺-puu B*-puu B x -puu UB puu 2-3-4 puu (a,b)-puu tanssiva puu
etuliite puita	suffiksi puu Pakattu etuliitepuu Kolmiosainen hakupuu
Avaruuden binaarinen osiointi	k-ulotteinen puu VP-puu
Ei-binääripuut	Quadtree oktreen Harva Voxel Octree eksponentiaalinen puu PQ puu
Avaruuden hajottaminen	R-puu Hilbert R-puu R+-puu R*-puu X-puu M-puu Fenwick puu Segmenttipuu
Muut puut	pino hash puu sormipuu metrinen puu Päällystyspuu BK-puu Kaksiketjuinen puu iDistance Linkistä leikattu puu LSM puu
Algoritmit	Leveys ensimmäinen haku Ensimmäinen syvyyshaku DSW-algoritmi kattava puu protokolla