Sarakevarastointi on tapa järjestää tallennustietokantoihin , kun tietoja ei tallenneta rivi riviltä (rivi riviltä), vaan sarake sarakkeelta. Se on tehokkain tietojen valintatoimintoihin pienestä sarakkeiden osajoukosta ja niiden myöhemmässä sarakekohtaisessa käsittelyssä sekä tietojen pakkaamisessa (koska sarakkeet tallentavat usein päällekkäisiä tai suljettuja tietoja). Suuren rivimäärän lisääminen voidaan toteuttaa tehokkaasti, mutta yksittäiset lisäys-, päivitys- ja poistotoiminnot ovat vähemmän tehokkaita sarakevarastoissa kuin rivitallennustilassa.
Columnar DBMS on tietokannan hallintajärjestelmä, joka tukee sarakevarastointia. Perinteiset relaatiotietokantajärjestelmät käyttävät tyypillisesti rivitallennustilaa, joka on tehokas OLTP - skenaarioissa, kun taas OLAP - työkuormissa saraketallennus tarjoaa yleensä paremman suorituskyvyn.
Relaatiosarakepohjaisia tietokantajärjestelmiä ovat Teradata Database , Netezza , Sybase IQ , kdb , C-Store (ja sen jälkeläinen Vertica ), Greenplum , Hana , ParAccel (ja sen jälkeläinen Amazon Redshift ), MonetDB , ClickHouse . Useat perinteiset relaatiotietokantajärjestelmät käyttävät sarakevarastointia ( Oracle Database , MS SQL Server , MariaDB ) tai on olemassa lisäosia (esimerkiksi Citus for PostgreSQL ). Tärkeimmät Hadoop-muodot - RCFIle , ORC , Parquet , Apache Arrow - käyttävät myös sarakejärjestystä. Saraketietokantajärjestelmät ovat useita järjestelmiä, jotka keskittyvät työskentelemään aikasarjojen kanssa ( InfluxDB , Apache Druid ).
Tietokanta | |
---|---|
Käsitteet |
|
Objektit |
|
Avaimet | |
SQL | |
Komponentit |