Tietoyksiköillä mitataan erilaisia tietoon liittyviä ominaisuuksia .
Useimmiten tiedon mittaus koskee tietokoneen muistin ( tallennuslaitteiden ) kapasiteetin mittaamista ja digitaalisia viestintäkanavia pitkin siirrettävän datan määrän mittaamista . Harvemmin mitataan tiedon määrää .
Suuri tietomäärä voi sisältää hyvin vähän tietoa. Toisin sanoen tiedon määrä ja tiedon määrä ovat erilaisia ominaisuuksia, joita käytetään eri tietoon liittyvillä alueilla, mutta historiallisesti nimeä " informaation määrä " on käytetty "datamäärän" merkityksessä ja nimiä " informaation entropia " ” ja ”informaation arvoa” käytettiin mittaamaan tiedon määrää.
Niitä käytetään tallennusväline - tallennuslaitteiden kapasiteetin mittaamiseen ja tietomäärien mittaamiseen .
Niitä käytetään mittaamaan tietomäärän tietomäärä . Tiedon entropia
Tietomäärän ensisijainen ominaisuus on mahdollisten tilojen määrä .
Datavolyymin mittauksen ensisijainen yksikkö on 1 mahdollinen tila (arvo, koodi).
Tietomäärän toissijainen ominaisuus on bitti .
Yhden numeron kapasiteetti (tilavuus) voi olla erilainen ja riippuu käytetystä koodausjärjestelmästä.
Yhden numeron kapasiteetit binääri-, kolmi- ja desimaalikoodausjärjestelmissä:
Yhdellä binäärinumerolla ( bitillä ) on 2 toisensa poissulkevaa mahdollista tilaa (arvot, koodit).
Yhdellä kolminumeroisella numerolla ( trit ) on 3 toisensa poissulkevaa mahdollista tilaa (arvot, koodit).
…
Yhdellä desimaalilla (desimaalilla) on 10 toisensa poissulkevaa mahdollista tilaa (arvoja, koodeja).
…
Tietomäärän tertiääriset ominaisuudet ovat erilaisia bittijoukkoja .
Bittijoukon kapasiteetti on yhtä suuri kuin tämän bittijoukon mahdollisten tilojen lukumäärä , joka määritetään kombinatoriikassa , on yhtä suuri kuin toistojen sijoittelujen lukumäärä ja lasketaan kaavalla:
mahdolliset tilat (koodit, arvot)missä
- yhden bitin mahdollisten tilojen lukumäärä (valitun koodausjärjestelmän perusta), on numeroiden lukumäärä numerojoukossa .Toisin sanoen bittijoukon kapasiteetti on bittien lukumäärän eksponentiaalinen funktio , jonka kanta on yhtä suuri kuin yhden bitin mahdollisten tilojen lukumäärä .
Esimerkki:
1 tavu koostuu 8 ( ) binäärinumerosta ( ) ja voi kestää:
mahdolliset tilat (arvot, koodit).
Kun jotkin suureet, mukaan lukien datamäärä, ovat eksponentiaalisia funktioita , niin monissa tapauksissa on kätevämpää käyttää ei itse suureita, vaan näiden suureiden logaritmeja .
Tiedon määrä voidaan esittää myös logaritmisella, mahdollisten tilojen lukumäärän logaritmina [1] .
Tiedon määrä (datan määrä) - voidaan mitata logaritmisella. [2] Tämä tarkoittaa, että kun useita objekteja käsitellään yhtenä, mahdollisten tilojen määrä kerrotaan ja informaation määrä lisätään . Ei ole väliä, puhummeko matematiikan satunnaismuuttujista , tekniikan digitaalisista muistirekistereistä vai fysiikan kvanttijärjestelmistä .
Binääritietomäärien tapauksessa on kätevämpää käyttää binäärilogaritmeja.
mahdolliset tilat , binäärinumero = 1 bitti mahdolliset tilat , bitit = 1 tavu ( oktetti ) mahdolliset tilat , bitit = 1 kilotavu (kilooktetti) mahdolliset tilat , bitit = 1 megatavu (megaoktetti) mahdolliset tilat , bittiä = 1 gigatavu (gigaoktetti) mahdolliset tilat , bitit = 1 teratavu (TeraOctet)Pienin kokonaisluku, jonka binäärilogaritmi on positiivinen kokonaisluku, on 2. Sitä vastaava yksikkö bitti on digitaalitekniikan tiedon laskennan perusta.
Kolmiosaisille datavolyymeille on kätevämpää käyttää ternäärisiä logaritmeja.
mahdolliset tilat , kolminumeroinen ( trit) mahdolliset tilat , kolminumeroiset ( trit s) = 1 Ominaisuus .Numeroa 3 vastaava yksikkö trit on yhtä suuri kuin log 2 3≈1,585 bittiä.
Sellaista yksikköä kuin nat (nat), joka vastaa luonnollista logaritmia , käytetään teknisissä ja tieteellisissä laskelmissa. Tietotekniikassa sitä ei käytännössä käytetä, koska luonnollisten logaritmien kanta ei ole kokonaisluku.
Desimaalitietojen määrissä on kätevämpää käyttää desimaalilogaritmeja.
mahdolliset tilat , desimaalipaikka = 1 dec mahdolliset tilat , desimaalit = 1 kilodesiitti . mahdolliset tilat , desimaalit = 1 megadesiitti . mahdolliset tilat , desimaalit = 1 gigadesiitti .Numeroa 10 vastaava yksikkö desitti on log 2 10≈3,322 bittiä.
Kiinteässä viestintätekniikassa (lennätin ja puhelin) ja radiossa tietoyksikkö sai historiallisesti ensimmäistä kertaa merkinnän baud .
Binäärinumeroiden (bittien) kokonaislukuina mahdollisten tilojen määrä on yhtä suuri kuin kahden potenssit.
Neljällä binäärinumerolla (4 bittiä) on erityinen nimi - tetrad , half byte , nibble , jotka sisältävät yhden heksadesimaalinumeron sisältämän tiedon määrän .
Mittaukset tavuissa | ||||||||
---|---|---|---|---|---|---|---|---|
GOST 8.417-2002 | SI -etuliitteet | IEC -etuliitteet | ||||||
Nimi | Nimitys | Tutkinto | Nimi | Tutkinto | Nimi | Nimitys | Tutkinto | |
tavu | B | 10 0 | — | 10 0 | tavu | B | B | 20 _ |
kilotavu | KB | 10 3 | kilo- | 10 3 | kibitavu | KiB | KiB | 2 10 |
megatavua | MB | 10 6 | mega- | 10 6 | mebitavu | MiB | MiB | 2 20 |
gigatavua | GB | 10 9 | giga- | 10 9 | gibitavu | GiB | GiB | 2 30 |
teratavu | TB | 10 12 | tera- | 10 12 | tebitavu | TiB | Tib | 2 40 |
petatavu | pb | 10 15 | peta- | 10 15 | pebitavu | PiB | P&B | 250 _ |
eksatavu | Ebyte | 10 18 | exa- | 10 18 | exbibyte | EiB | EIP | 2 60 |
zettatavu | Zbyte | 10 21 | zetta- | 10 21 | sebitavu | ZiB | ZiB | 2 70 |
yottatavu | Ibyte | 10 24 | yotta- | 10 24 | yobibyte | YiB | Y&B | 2 80 |
Seuraava suosittu tiedon yksikkö järjestyksessä on 8 bittiä tai tavua (terminologiset hienoudet kuvataan alla ). Kaikki tietotekniikassa lasketut suuret tietomäärät annetaan suoraan tavulle (eikä bitille).
Useita tavuja muodostavia arvoja, kuten konesana jne., ei käytetä lähes koskaan mittayksiköinä .
Suurten tallennuslaitteiden kapasiteetin ja suurien tietomäärien mittaamiseen, joissa on suuri määrä tavuja, käytetään yksiköitä "kilobyte" = [1000] tavua ja "Kbytes" [3] ( kibitavu , kibitavu) = 1024 tavua (noin desimaali- ja binääriyksiköiden ja termien sekaannus, katso alla ). Tämä suuruusluokka on esimerkiksi:
"3,5" tiheää levykettä lukemalla saatu tiedon määrä on 1440 KB (täsmälleen) ; muut muodot lasketaan myös kokonaisina kilotavuina.
Yksikköjä "megatavu" = 1000 kilotavua = [1 000 000] tavua ja "mebitavu" [3] (mebitavu) = 1024 kilotavua = 1 048 576 tavua käytetään tallennusvälineen tilavuuden mittaamiseen.
Intel 8086 -prosessorin osoiteavaruus oli 1 Mt.
RAM- ja CD-ROM- kapasiteetti mitataan binääriyksiköissä (mebitavuissa, vaikka niitä ei yleensä kutsuta sellaiseksi), mutta kiintolevykapasiteetin osalta desimaalimegatavut olivat suositumpia.
Nykyaikaisten kiintolevyjen volyymit ilmaistaan näissä yksiköissä vähintään kuusinumeroisina numeroina, joten niihin käytetään gigatavuja.
Yksiköt "gigatavu" = 1 000 megatavua = [1 000 000] kilotavua = [1 000 000 000] tavua ja "GB" [3] ( gibitavu , gibitavu) = 1 024 MB = 230 tavua mittaavat esimerkiksi suurten kiintolevyjen tallennusvälineiden kokoa . Ero binääri- ja desimaaliyksiköiden välillä on jo yli 7 %.
32-bittisen osoiteavaruuden koko on 4 Gt ≈ 4,295 MB. Samaa suuruusluokkaa on DVD-ROM-levyn ja flash-muistin modernin median koko . Kiintolevyjen koot ovat jo saavuttamassa satoja ja tuhansia gigatavuja.
Vielä suurempien tietomäärien laskemiseksi on yksiköitä teratavuja ja tebitavuja (10 12 ja 2 40 tavua), petatavuja ja pebitavuja (vastaavasti 10 15 ja 2 50 tavua) jne.
Periaatteessa tavu on määritelty tietylle tietokoneelle muistin minimiosoitteen askeleeksi , joka vanhemmissa koneissa ei välttämättä ollut 8 bittiä (ja muisti ei välttämättä koostu bitistä - katso esimerkiksi: ternary computer ). Nykyaikaisessa perinteessä tavua pidetään usein yhtä suurena kuin kahdeksan bittiä .
Tällaisissa nimityksissä, kuten tavu (venäjäksi) tai B (englanniksi), tavu (B) tarkoittaa täsmälleen 8 bittiä, vaikka termi "tavu" sinänsä ei ole teorian kannalta aivan oikea.
Ranskan kielessä symboleja o , Ko , Mo jne. (sanasta oktetti) käytetään korostamaan, että puhumme 8 bitistä.
Pitkään aikaan tekijöiden 1000 ja 1024 välistä eroa yritettiin olla antamatta paljon merkitystä. Väärinkäsitysten välttämiseksi erottelu:
nämä yksiköt ovat määritelmän mukaan 10 3 , 10 6 , 10 9 tavua ja niin edelleen.
IEC ehdottaa "kibitavua", "mebitavua", "gibitavua" jne . termeiksi "KB", "MB", "GB" jne., mutta näitä termejä arvostellaan äänettömyydestä, eikä niitä löydy puhutusta kielestä. puhe.
Tietojenkäsittelytieteen eri osa-alueilla desimaali- ja binääriyksiköiden käytön mieltymykset ovat myös erilaisia. Lisäksi vaikka terminologian ja nimitysten standardoinnista on kulunut useita vuosia, ne eivät suinkaan kaikkialla pyri selventämään käytettyjen yksiköiden tarkkaa merkitystä.
Englannin kielessä "kibi" \u003d 1024 \u003d 2 10 käytetään joskus isoa kirjainta K korostamaan eroa pienellä kirjaimella SI kilo osoittamaan etuliitteeseen . Tällainen nimitys ei kuitenkaan perustu arvovaltaiseen standardiin, toisin kuin venäläinen GOST koskien "Kbytes".
Tietoyksiköt | |
---|---|
Perusyksiköt | |
Liittyvät yksiköt | |
Perinteiset bittiyksiköt | |
Perinteiset tavuyksiköt | |
IEC -bittiyksiköt |
|
IEC -tavuyksiköt |