Tiedosto

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 18.11.2021 tarkistetusta versiosta . tarkastukset vaativat 8 muokkausta .

Tiedosto ( englanniksi  tiedosto ) on nimetty tietoalue tallennusvälineellä, jota käytetään perusobjektina vuorovaikutuksessa tietojen kanssa käyttöjärjestelmissä .

Tiedostojen kanssa työskentely toteutetaan yleensä tiedostojärjestelmillä, jotka tarjoavat tiedostotyön organisoinnin ja abstraktion tiedonvälittäjien kautta . Yleensä suoritettavat tiedostot (ohjelmat) ja varsinaiset datatiedostot (esimerkiksi tekstitiedostot tai mediasäiliöt ) erotetaan toisistaan. Tiedostomuoto  on tapa järjestää tietoja tiedoston sisällä, jolloin voit kirjoittaa siihen tietoja sen merkityksen mukaisesti ja tulkita kirjoitettua. Monet käyttöjärjestelmät rinnastavat ja käsittelevät muita resursseja, kuten tiedostoja; tiedoston käsitteen yleisin käyttö on tyypillistä Unix-tyyppisille käyttöjärjestelmille, jotka toteuttavat käsitteen "kaikki on tiedosto" ( eng.  everything is a file ). Niissä tiedostoina ei katsota vain taltion tietoalueita , vaan myös erityisesti fyysisiä laitteita ( portteja tai tulostimia ), virtuaalisia laitteita ( /dev/null , /dev/random , /dev/urandom ja muita), tietoja virrat (esimerkiksi nimetyt putket ), verkkoresurssit, pistorasiat .

Historia

Word - tiedostoa sovellettiin ensimmäisen kerran tietokoneen tallennusjärjestelmään vuonna 1950. Mainos RCA - muistista CRT-muistista Popular Science -lehdessä [ 1] luki:

... lukemattomien laskelmien tulokset voidaan säilyttää "arkistokaappissa" ( englanniksi  on file ) ja vastaanottaa uudelleen. Tämä "tiedostokaappi" on nyt olemassa RCA-laboratorioissa kehitetyssä muistiputkessa. Se tallentaa sähköisesti tietokoneelle lähetetyt numerot ja säilyttää ne muistissa, samalla kun se muistaa uudet, mikä nopeuttaa älykkäitä ratkaisuja matematiikan labyrinteissä.

Vuonna 1952 sanaa tiedosto kutsuttiin reikäkorttipakkaan . [2] Aluksi sanatiedosto viittasi itse muistilaitteeseen, ei sen sisältöön ( rekisteritiedosto ). Esimerkiksi IBM 350 -levyjä , joita käytettiin esimerkiksi IBM 305 -koneessa , kutsuttiin levytiedostoiksi [3] . Järjestelmät, kuten Compatible Time-Sharing System , esittelivät tiedostojärjestelmän käsitteen, jossa useita virtuaalisia "muistilaitteita" on yhdessä tallennuslaitteessa, mikä antoi sanalle "tiedosto" sen nykyaikaisen merkityksen. CTSS:n tiedostonimet koostuivat kahdesta osasta, "ensisijaisesta nimestä" ja "toissijaisesta nimestä" (jälkimmäinen on edelleen olemassa tiedostopäätteenä ) [4] [5] .

Tiedostojärjestelmä

Tietojenkäsittelytekniikan kehityksen myötä järjestelmien tiedostot lisääntyivät. Heidän kanssaan työskentelyn helpottamiseksi ne, kuten muut tiedot, alkoivat järjestellä rakenteiksi (symboliset nimet ilmestyivät samaan aikaan). Aluksi se oli yksinkertainen taulukko , joka oli "liitetty" tiettyyn tallennusvälineeseen. Tällä hetkellä puumainen organisaatio, jossa on mahdollisuus liittää ja lisätä lisälinkkejä (eli linkkejä), on yleistynyt . Vastaavasti tiedoston nimi on saanut tiedostopolun luonteen : luettelo tiedostojärjestelmäpuun solmuista, jotka täytyy kulkea, jotta siihen päästään.

Tiedosto käyttöjärjestelmän API-objektina

Käyttöjärjestelmä tarjoaa sovelluksille joukon toimintoja ja rakenteita tiedostojen käsittelyä varten. Käyttöjärjestelmän ominaisuudet asettavat lisärajoituksia tiedostojärjestelmän rajoituksille. API :n näkökulmasta tiedosto on objekti, johon tämän API:n toimintoja voidaan soveltaa. API-tasolla ei ole enää merkitystä, onko tiedosto olemassa tiedostojärjestelmäobjektina vai esimerkiksi I/O-laite.

Tiedoston ominaisuudet

Tiedostojärjestelmästä riippuen tiedostolla voi olla erilaisia ​​ominaisuuksia.

Tiedoston nimi

Useimmissa tiedostojärjestelmissä tiedostonimeä käytetään osoittamaan, mitä tiedostoa käytetään. Eri tiedostojärjestelmissä tiedostonimirajoitukset vaihtelevat suuresti: FAT16 :ssa ja FAT12 :ssa tiedostonimen koko on rajoitettu 8,3 merkkiin (8 nimelle ja 3 tunnisteelle ) ; muissa järjestelmissä tiedostonimi on yleensä rajoitettu 255 tavuun; NTFS : ssä nimen enimmäispituus on joissakin käyttöjärjestelmissä 256 Unicode-merkkiä (32 768 merkkiä määrityksen mukaan).

Tiedostojärjestelmän rajoitusten lisäksi käyttöjärjestelmän rajapinnat rajoittavat edelleen tiedostojen käsittelyssä sallittua merkistöä.

MS-DOS-käyttöjärjestelmässä tiedostonimessä sallitaan vain latinalaiset isot kirjaimet ja numerot . Välilyönti, kysymysmerkki, tähti, suurempi kuin ja pienempi kuin -symbolit, pystypalkkisymbolit eivät ole sallittuja. [6] Kun järjestelmätoimintoja kutsutaan, tiedostonimet pienellä tai sekakirjaimella muunnetaan isoiksi kirjaimiksi.

Windowsissa tiedoston nimessä sallitaan isot ja pienet kirjaimet, numerot, jotkut välimerkit, välilyönti. Symbolit >, <, |, ?, *, /, \, :, ovat kiellettyjä ".

Linuxissa (ottaen huomioon peittomahdollisuuden) kaikki merkit ovat sallittuja , /paitsi nollamerkki .

Useimmat käyttöjärjestelmät edellyttävät, että tiedostonimi on yksilöllinen yhdessä hakemistossa, vaikka jotkut järjestelmät sallivat samannimiset tiedostot (esimerkiksi nauha-asemien kanssa työskennellessä).

Joissakin tiedostojärjestelmissä on mahdollista luoda ja käyttää nimeämättömiä tiedostoja. Tällaiset tiedostot ovat aina väliaikaisia. Niiden tärkeimmät edut ovat, että luodessaan niissä ei voi olla nimiristiriitoja eikä niitä löydy hakemistostaan ​​nimellä. Loput ovat täydellisiä tiedostoja.

Tiedostonimen tunniste

Tiedostonimen tunniste (usein: tiedostopääte tai -tunniste) on itsenäisenä tiedostomääritteenä FAT16- , FAT32- , NTFS -tiedostojärjestelmissä, joita käyttävät MS-DOS-, DR-DOS-, PC DOS- ja MS Windows -käyttöjärjestelmät, ja sitä käytetään määrittämään tiedostotyyppi. Sen avulla järjestelmä voi määrittää, minkä sovelluksen pitäisi avata tiedosto. Oletuksena Windows- ja Mac OS -käyttöjärjestelmissä laajennus on piilotettu käyttäjältä.

Muissa tiedostojärjestelmissä pääte on sopimus, osa nimeä, erotettu nimen oikeanpuoleisella pisteellä (liite).

Pääominaisuudet

Jotkut tiedostojärjestelmät, kuten NTFS, tarjoavat attribuutteja (yleensä kyllä/ei-binääriarvo, joka on koodattu yhdellä bitillä). Monissa nykyaikaisissa käyttöjärjestelmissä määritteillä on vain vähän tai ei ollenkaan vaikutusta mahdollisuuteen käyttää tiedostoja; tätä varten joissakin käyttöjärjestelmissä ja tiedostojärjestelmissä on käyttöoikeudet .

Ominaisuuden nimi Käännös Merkitys Tiedostojärjestelmät Käyttöjärjestelmät
Lue ainoastaan vain lukemista varten tiedostoa ei saa muokata FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2 , Windows
Järjestelmä systeeminen käyttöjärjestelmän kriittinen tiedosto FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
Piilotettu piilotettu tiedosto on piilotettu näytöltä, ellei toisin mainita FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
Arkisto arkistointi (vaatii arkistoinnin) tiedostoa on muokattu varmuuskopioinnin jälkeen tai varmuuskopiointiohjelmat eivät kopioineet sitä; kun tiedosto muuttuu, käyttöjärjestelmä asettaa tämän määritteen automaattisesti FAT32, FAT12, FAT16, NTFS, HPFS, VFAT DOS, OS/2, Windows
SUID Käyttäjätunnuksen asettaminen suorittaa ohjelman omistajan puolesta ext2 Unixin kaltainen
SGID Ryhmätunnuksen asetus ohjelman suorittaminen ryhmän puolesta (hakemistot: mikä tahansa tiedosto, joka on luotu hakemistoon, jossa on asetettu SGID, saa määritetyn omistajaryhmän) ext2 Unixin kaltainen
tahmea pala tahmea pala alun perin kehotti ydintä olemaan purkamatta valmis ohjelmaa muistista heti, vaan vasta jonkin ajan kuluttua, jotta vältytään jatkuvalta useimmin käytettyjen ohjelmien lataamiselta levyltä, sitä käytetään tällä hetkellä eri tavalla eri käyttöjärjestelmissä ext2 Unixin kaltainen

Aika

Tiedostolle voidaan määrittää luomisen aikaleimat, viimeinen muokkaus, viimeinen käyttöoikeus ja muut.

Tiedoston omistaja ja ryhmä

Jotkut tiedostojärjestelmät ilmoittavat tiedoston omistajan ja omistajaryhmän.

Käyttöoikeudet

Jotkut tiedostojärjestelmät tarjoavat mahdollisuuden rajoittaa käyttäjien pääsyä tiedoston sisältöön. Unixin kaltaisissa käyttöjärjestelmissä tiedostoille erotettiin aiemmin yleensä kolmenlaisia ​​oikeuksia: kirjoitus-, luku- ja suoritusoikeus. Jokainen oikeus asetetaan erikseen omistajalle, ryhmälle ja kaikille muille. ACL mahdollistaa sekä oikeuksien että käyttäjien tarkemman erottelun.

Windows NT -käyttöjärjestelmissä NTFS - tiedostojärjestelmän kanssa työskennellessä käyttöoikeudet asetetaan nimenomaisesti käyttäjille tai ryhmille tai ne peritään pääobjekteista. Oikeudet sisältävät oikeuden lukea, kirjoittaa, suorittaa, poistaa, muuttaa attribuutteja ja omistajaa, luoda ja poistaa alikansioita (kansioille) sekä lukuoikeudet ja muut, kuten POSIXissa. Jokainen oikeus voidaan määritellä luvaksi tai kielloksi. Kielto on luvan edelle, toisin kuin POSIX.

Tiedostotoiminnot

Perinteisesti voidaan erottaa kahden tyyppisiä toimintoja tiedostolla - ne liittyvät sen avaamiseen ja ne, jotka suoritetaan avaamatta sitä. Ensimmäisen tyypin operaatioita käytetään yleensä tietojen lukemiseen ja kirjoittamiseen tai lukemiseen tai kirjoittamiseen valmistautumiseen. Toisen tyypin toiminnot suoritetaan tiedostolle tiedostojärjestelmän "objektina", jossa tiedosto on strukturoinnin pienin elementti.

Tiedoston avaamiseen liittyvät toiminnot

Jotkin toiminnot eivät ehkä ole käytettävissä käyttöjärjestelmästä riippuen.

Yleensä tiedoston kanssa työskentelemiseen liittyvät lisäyksiköt erotetaan:

Toiminnot

Toiminnot, jotka eivät liity tiedoston avaamiseen

Toiminnot, jotka eivät vaadi tiedoston avaamista, toimivat sen "ulkoisilla" ominaisuuksilla - koko, nimi, sijainti hakemistopuussa . Tällaisilla toimilla on mahdotonta päästä käsiksi tiedoston sisältöön, tiedosto on tiedonjaon vähimmäisyksikkö.

Mahdolliset tiedostotoiminnot: luominen, poistaminen, uudelleennimeäminen, kopioiminen, siirtäminen toiseen tiedostojärjestelmään, symbolisen linkin tai kiinteän linkin luominen, määritteiden hankkiminen ja muuttaminen.

Jotkin toiminnot eivät välttämättä ole käytettävissä tiedostojärjestelmästä, tallennusvälineestä tai käyttöjärjestelmästä riippuen.

Tiedostotyypit

Järjestelytavan mukaan tiedostot jaetaan hajasaantitiedostoihin ja tiedostoihin, joilla on peräkkäinen pääsy .

Eri käyttöjärjestelmät ja tiedostojärjestelmät voivat toteuttaa erityyppisiä tiedostoja, ja eri tyyppien toteutus voi vaihdella.

Toteutusominaisuudet

Unix - käyttöjärjestelmässä prosessit (yleensä /proc) ja laitteet ( /dev) esitetään erityisinä tiedostotyypeinä, mikä mahdollistaa joidenkin tiedostotoimintojen käytön näiden objektien käsittelemiseen.

Joissakin tiedostojärjestelmissä (kuten VMS -tiedostojärjestelmässä ) tiedostot versioitetaan, jolloin tietyn tiedoston vanhemmat versiot voidaan avata. Mac OS -tiedostojärjestelmässä ( HFS ) tiedostoilla on kaksi "virtaa": tietovirta (johon tiedoston sisältö on tallennettu) ja resurssivirta, joka tallentaa tietoja ohjelmasta, jonka tarkoitus on avata tietty tiedosto ja mahdollisesti jotain tietoa kyseisestä ohjelmasta. NTFS : ssä tiedosto voi sisältää päätiedoston lisäksi niin monta nimettyä tietovirtaa kuin halutaan.

Katso myös

Muistiinpanot

  1. Bonnier Corporation. Populaari Tiede . - Bonnier Corporation , 1950. - S. 96 -. Arkistoitu 9. tammikuuta 2022 Wayback Machinessa
  2. Robert S. Casey, et ai. Reikäkortit: niiden sovellukset tieteeseen ja teollisuuteen , 1952.
  3. Martin H. Weik. Ballististen tutkimuslaboratorioiden raportti #1115. maaliskuu 1961. s. 314-331 Arkistoitu 21. lokakuuta 2016 Wayback Machinessa
  4. Fernando J. Corbató et ai. " An Experimental Time-Sharing System arkistoitu 6. syyskuuta 2009 Wayback Machinessa ." 3. toukokuuta 1962
  5. Jerome H. Saltzer CTSS Technical Notes Arkistoitu 13. syyskuuta 2006 Wayback Machinessa . Projekti MIT-LCS-TR016
  6. FAT-, HPFS- ja NTFS-tiedostojärjestelmien yleiskatsaus . Haettu 22. lokakuuta 2008. Arkistoitu alkuperäisestä 8. toukokuuta 2008.