Sähköinen arkistointi ( digitaalinen säilyttäminen ) on joukko käytäntöjä, strategioita ja työnkulkuja sähköisten asiakirjojen suojaamiseksi vanhentumiselta ja tietojen katoamiselta. Digitaalisen arkistoinnin tavoitteena on luoda, ylläpitää ja säilyttää digitaalisen tiedon eheys. Sähköisen arkistoinnin käytäntöön viitattaessa käytetään useita termejä - digitaalinen säilyttäminen (kirjaimellisesti - sähköinen tai digitaalinen säilyttäminen), digitaalinen arkistointi (sähköinen tai digitaalinen arkistointi) tai digitaalinen hallinta (digitaalinen tiedonhallinta). Usein näitä käsitteitä käytetään vaihtokelpoisina, mutta yksittäisten termien käyttö vaihtelee maittain.
Sähköisen arkistoinnin käytäntö alkoi ilmaantua 1990-luvun puolivälissä, jolloin tietotekniikan ja uudentyyppisten digitaalisten medioiden kehittyessä nousi yhä enemmän esille kysymys digitaalisten esineiden pitkäaikaisen säilytyksen tarpeesta. Tarve tälle syntyi digitaalisen median suhteellisen lyhyen käyttöiän vuoksi - esimerkiksi levykkeille ja muistikorteille tallennuksen luotettavuus on vain muutama vuosi ja optisten levyjen tapauksessa 3 - 20 vuotta. Magneettinauhaa pidetään vakavimpana tiedontallennustapana , jolle tietoja voidaan säilyttää luotettavasti 15-30 vuoden ajalta. 1990-luvun alkuun asti digitaalinen tieto monistettiin paperikopioina. Kaikkea aineistoa ei kuitenkaan arkistoitu tällä tavalla - koska monet sähköiset asiakirjat eivät olleet yleisöltä suljettuja, ne eivät olleet arkistoinnin alaisia.
Sähköistä arkistointia säännellään useilla hyväksytyillä kansainvälisillä standardeilla ja työryhmäraporteilla, mukaan lukien Open Archival Information System (OAIS) malli, Trusted Digital Repository, Digital Preservation Network (DPN), InterPARES Project , PRONOM ja muut. Digitaalisten materiaalien arkistointi tapahtuu säilyttämisstrategioiden avulla (työskentely materiaalien kanssa alkuperäisessä muodossa ja alkuperäisellä medialla, käyttämällä alkuperäistä tekniikkaa tai aiemmin käytettyä laitteistoa ja ohjelmistoa), emuloinnilla (toistamalla vanhentuneen järjestelmän toiminnallisuus vanhentuneiden kanssa työskentelyn varmistamiseksi ) tietomuodot), kapselointi (asiakirjan teknisen kuvauksen sisällyttäminen itse digitaaliseen objektiin, mikä vähentää sen riippuvuutta ulkoisesta ympäristöstä, koska näiden tietojen avulla voit joko toistaa alkuperäisen ympäristön tai siirtää asiakirjan uuteen) , migraatio (sähköisten asiakirjojen siirto muihin tietovälineisiin tai toiseen käyttöjärjestelmään - esimerkiksi magneettinauhalta CD-levylle), digitaalinen arkeologia (materiaalien arkistointimenetelmä, jossa tallennetaan ne digitaaliset kohteet, jotka ovat tulleet saavuttamattomiksi teknisen vanhenemisen vuoksi ja/tai fyysinen hajoaminen), uusiutumisstrategiat (siirto tietojen siirtäminen pysyvältä välineeltä toiselle) tai verkkoarkistointi ( verkkosivustojen ja materiaalien kerääminen, säilyttäminen ja poimiminen Internetistä niiden sijoittamiseksi sähköiseen arkistoon tulevien sukupolvien käyttöön).
Ensimmäiset yritykset automatisoida toimintoja voidaan jäljittää 1300-luvulle, jolloin keksittiin kellokellot – mekaaniset kellotapulit, joita ohjattiin poljinmekanismilla, joka toi vivut haluttuun järjestykseen niiden pyöriessä kiinnittyessä metallisylinteriin tapeilla [1] . Tämä rumpuautomaation periaate otettiin myöhemmin käyttöön tekstiiliteollisuudessa - 1700-luvulla luotiin ensimmäinen reikäkortti tai paperiteippi, jonka läpi sukkulat kulkivat [2] . Pian reikäkortteja alettiin käyttää laskelmien automatisointiin, ne muodostivat perustan Charles Babbagen analyyttiselle moottorille [3] ja myöhemmin - ensimmäisen sukupolven tabuloijille ja tietokoneille [4] [5] .
1970-luvulle asti reikäkortteja käytettiin laajalti tietojen tallentamiseen ja syöttämiseen - niihin voitiin koodata jopa 80 merkkiä. Tietokoneiden nopea kehitys on kuitenkin johtanut vaihtoehtoisten tapojen syntymiseen tietojen tallentamiseen ja automatisointiin [6] . Vuonna 1954 luotiin ensimmäinen magneettinen media IBM 350 ja vuonna 1956 kiintolevy [7] . Jo 1960-luvulla rei'itetty kortti korvattiin magneettinauhalla , josta tuli johtava tallennus- ja automaattinen tietojenkäsittelymenetelmä [8] [9] . Tietojen tallentamiseen ja tallentamiseen tarkoitettujen magneettilevyjen ja flash-muistien kehittämisen ja käyttöönoton myötä niiden kapasiteetti ja suorituskyky ovat kasvaneet merkittävästi. Kuitenkin ilmaantui tallennusvälineiden haurauden ongelma, mikä vaikutti negatiivisesti tietojen turvallisuuteen. Siten tietojen tallennuksen luotettavuus magneettilevyille ja flash-korteille on vain muutaman vuoden - nämä tietovälineet ovat epävakaita sekä yli 100 ℃ lämpötiloissa että voimakkaissa sähkömagneettisissa kentissä . Optisten levyjen tiedot poistetaan asteittain 50-70 ℃:n vaikutuksesta, ne pystyvät tallentamaan tietoja 3-20 vuoden ajalta. Luotettavimmat tiedon tallennustavat ovat magneettinauhat, joille tietoja voidaan säilyttää 15-30 vuotta [10] .
Tietotekniikan ja uudentyyppisten digitaalisten medioiden kehittyessä kysymys sähköisen tiedon pitkäaikaisesta tallentamisesta on tullut yhä tärkeämmäksi. 1990-luvun alkuun asti suurin osa digitaalisesta tiedosta kopioitiin paperikopioille. Kaikkea materiaalia ei kuitenkaan arkistoitu tällä tavalla, ja monet sähköiset asiakirjat eivät olleet paperiarkistoinnin alaisia, koska ne olivat suljettuja yleisöltä [11] [12] . Ensimmäiset sähköisen arkistoinnin projektit alkoivat ilmestyä 1990-luvun jälkipuoliskolla. Joten vuonna 1996 Australian hanke Preserving Access to Digital Information (PADI) sai valtion rahoitusta. Sen toteuttaminen uskottiin Australian kansalliskirjastolle . PADI on julkaissut projektiraportteja ja aikakauslehtiartikkeleita monista eri aiheista, ja se on myös nähnyt ammattiyhteisön muodostumista digitaalisen säilyttämisen alalla [13] . Samana vuonna käynnistettiin Brewster Keilin perustama Internet-arkiston [14] verkkoarkistointiprojekti , Ruotsin kansalliskirjaston (Kulturarw Heritage Project) ja Australian kansalliskirjaston (PANDORA-projekti) [15] hankkeet . Vuonna 1998 useat eurooppalaiset kansalliskirjastot perustivat Networked European Deposit Libraryn (NEDLIB) säilyttämään elektronisia esineitä kirjastojärjestelmässä [16] . Samaan aikaan alkoi kehittyä projekteja tehokkaiden arkistointistrategioiden kehittämiseksi - Arts and Humanities Data Service (1999) ja Project CAMiLEON (1999). 2000-luvulta lähtien sähköisiä tietojen säilytyskäytäntöjä on otettu käyttöön kaikkialla. Niinpä Kongressin kirjasto käynnisti vuonna 2000 Minerva Initiativen kerätä ja arkistoida sähköistä tietoa, ja Dutch Digital Preservation Testbed -projektista tuli osa kansallista digitaalisen tiedon säilyttämisohjelmaa. Vuonna 2001 perustettiin Digital Preservation Coalition - organisaatioiden yhteenliittymä, joka toteuttaa sähköisen arkistoinnin käytäntöjä Isossa- Britanniassa ja muissa maissa. Vuonna 2006 perustettiin vastaava projekti - Digital Preservation Europe [17] [18] .
Maailmanlaajuisesti käyttöönotetut sähköisen arkistoinnin strategiat ovat muuttaneet kirjastojen, arkistojen ja julkaisijoiden rooleja, jotka perinteisesti ovat vastuussa tiedon arkistointia. 2000-luvulta lähtien myös yksityiset organisaatiot, tieteelliset tietokeskukset ja voittoa tavoittelemattomat organisaatiot ovat olleet mukana sähköisten asiakirjojen säilyttämisessä [19] .
Vuonna 2003 UNESCO yritti yhdistää kansainväliset ponnistelut luodakseen järjestelmällisen lähestymistavan sähköiseen arkistointiin julkaisemalla Digital Preservation Charter -kirjan, jossa kehotettiin maailman yhteisöä toteuttamaan strategioita uhanalaisten elektronisten esineiden säilyttämiseksi. Vuonna 2012 Unescon Memory of the World -ohjelman konferenssissa toistettiin yhtenäisen kansainvälisen ponnistelun tarve elektronisen perinnön säilyttämiseksi ja saatavuuden tarjoamiseksi. Tämän seurauksena vuonna 2013 luotiin PERSIST-ohjelma, jonka tavoitteena oli säilyttää maailman dokumenttiperintö [20] [21] .
Digitaalisen perinnön säilyttämisen tarkoituksena on tuoda se yleisön saataville. Siksi digitaalisen perinnön aineiston, erityisesti julkisen aineiston, saatavuuteen ei pitäisi kohdistua kohtuuttomia rajoituksia. Samalla on suojattava kaikenlaisilta luottamuksellisilta ja yksityisiltä tietoturvaloukkauksilta.[...]
Vaarana on, että maailman digitaalinen perintö menetetään peruuttamattomasti tuleville sukupolville. Tähän vaikuttavia tekijöitä ovat digitaalisten aineistojen käyttömahdollisuuksien tarjoavien laitteiden ja ohjelmien vanhentuminen, epävarmuus resurssien tarjoamisesta, vastuusta ja menetelmistä säilytyksen ja säilytyksen varmistamisessa, asianmukaisten säädösten puuttuminen.[...
] Jos vallitsevien uhkien ehkäisemiseen tähtääviä toimenpiteitä ei toteuteta, digitaalinen perintö menetetään nopeasti ja väistämättä. Perinnön säilyttämiseen tähtäävien oikeudellisten, taloudellisten ja teknisten toimenpiteiden toteuttaminen hyödyttää jäsenvaltioita. On kiireesti nostettava tietoisuutta ja lisättävä edunvalvontaa, kiinnitettävä poliittisten päättäjien huomio ja herättävä yleisön kiinnostus sekä digitaalisen median mahdollisuuksia että digitaalisen säilyttämisen käytännöllisyyttä kohtaan.
Useita termejä käytetään kuvaamaan sähköisen arkistoinnin käytäntöjä - digitaalinen säilyttäminen ( englanniksi - "elektroninen / digitaalinen säilytys"), digitaalinen arkistointi ( englanniksi - "elektroninen / digitaalinen arkistointi") tai digitaalinen hallinta ( englanniksi - "management of electronic / digitaalinen data"). Usein näitä käsitteitä käytetään vaihtokelpoisina, mutta yksittäisten termien käyttö vaihtelee maittain. Esimerkiksi Yhdysvalloissa termiä "digitaalinen säilyttäminen" ( digitaalinen säilytys ) käytetään useammin, ja se kattaa pääsääntöisesti kaikki sähköisten arkistojen hallintaan liittyvät toiminnot niiden luomishetkestä lähtien. Termiä "digitaalinen säilyttäminen" käytettiin ensimmäisen kerran vuonna 1992 Theater Crafts -lehden artikkelissa, jossa käsiteltiin uusia digitaalisen säilytyksen tyyppejä. Isossa-Britanniassa sitä vastoin termillä "digitaalinen tiedonhallinta" ( digitaalinen hallinta ) tarkoitetaan sähköisten asiakirjojen elinkaaren hallintakäytäntöjä ja digitaalista säilyttämistä - niitä toimia, joilla pyritään varmistamaan niiden saatavuus. tulevaisuudessa. Samaan aikaan englanninkielistä termiä preservation tai "preservation" käytetään useammin kuin termiä arkistointi tai "arkistointi", koska jälkimmäinen tarkoittaa fyysisten asiakirjojen säilyttämistä olemassa olevissa materiaalivarastoissa. Tästä syystä säilytystä kutsutaan useammin elektronisiksi esineiksi [23] [24] [25] .
Vuonna 2007 perustettu American Library Association -työryhmä määritteli sähköisen arkistoinnin strategioiden, periaatteiden ja käytäntöjen yhdistelmäksi, jonka tarkoituksena on toistaa autenttista sisältöä ajan mittaan riippumatta mediaongelmista ja tallennustekniikoiden muutoksista. Käsite koskee sekä alun perin sähköisessä muodossa luotuja asiakirjoja että digitoituja aineistoja [26] . Toisin sanoen tämä on tiedon valintaa, tallentamista ja säilyttämistä, jotta tuleville sukupolville tarjotaan pääsy siihen [27] [28] . Cornell University Library määrittelee elektronisen arkistoinnin laajaksi joukoksi toimintoja, joiden tarkoituksena on pidentää koneellisesti luettavien tietokonetiedostojen käyttöikää ja suojella niitä mediavialta, fyysiseltä katoamiselta ja vanhentumiselta [27] [29] .
Sähköinen arkistointi pyrkii suojaamaan ja säilyttämään tietoa tuleville sukupolville [30] [31] [29] . Sähköinen säilytystoiminta keskittyy digitaalisen tiedon luomiseen, ylläpitoon ja eheyden säilyttämiseen. Luominen edellyttää tiedostojen täydellisten ja selkeiden eritelmien määrittämistä, luotettavien päätiedostojen ja riittävän kuvailevien, hallinnollisten ja rakenteellisten metatietojen tuottamista tulevan käytön varmistamiseksi. Ylläpito on kaikkien tiedostoille suoritettujen toimien dokumentointi ja muutosten täydellinen seuranta. Tietojen säilyttäminen edellyttää luotettavan laskenta- ja verkkoinfrastruktuurin luomista, joka mahdollistaa materiaalien tallentamisen ja synkronoinnin useiden sivustojen välillä, sekä jatkuvaa seurantaa ja strategioiden kehittämistä tietojen häviämisen estämiseksi [26] [32] .
Tavoitteesta riippuen sähköinen arkistointi voi olla pitkäaikaista (pääsy tarjotaan määräämättömäksi ajaksi), keskipitkän (käyttöoikeus tietyn ajan) ja lyhytaikaista (digitaalisen aineiston käyttö tietyn ajan ja / tai kunnes se on saavuttamattomissa - esimerkiksi tekniikan muutosten vuoksi) [28] [33] . Sähköisen arkistoinnin infrastruktuurikomponentteja on kolme [24] :
Samaan aikaan sähköisen arkistoinnin tekniset näkökohdat voidaan jakaa seuraaviin ryhmiin [34] :
Päätökset digitaalisten esineiden arkistointitarpeesta perustuvat niiden pysyvän arvon arviointiin . Arviointi on vain yksi strategioista, arkistonhoitajat käyttävät myös tilastollisia otanta- ja riskianalyysimenetelmiä valittaessa materiaalia säilytettäväksi. Tilastollinen otanta perustuu tilastollisiin menetelmiin, joilla luodaan edustava otos ja valitaan asianmukaisesti paperi- ja digitaaliset asiakirjat säilytystä tai digitointia varten. Riskianalyysimenetelmän tarkoituksena on arvioida mahdollisia vaikeuksia, joita voi syntyä digitaalisten resurssien kanssa työskennellessä, sekä niiden mahdollisia seurauksia - esimerkiksi tiedosto- ja mediamuotojen vanhenemisen riskiä, digitaalisten resurssien säilyttämättä jättämiseen liittyvien menetysten riskiä. , ja niin edelleen. Pääsääntöisesti riskianalyysi tehdään yhdessä muiden valintakriteerien, kuten kustannusarvioiden kanssa [35] .
1980-luvulla yhä useammat arkistonhoitajat alkoivat kiinnittää huomiota siihen, että digitaalisten esineiden ja mahdollisten sähköisten asiakirjojen luominen tapahtui ottamatta huomioon niiden pitkäaikaissäilytyksen vaatimuksia. 1990-luvun alussa ilmeni ohjelmistojen vanhenemisongelma ja siten sen avulla luodun tiedon luotettavan arkistoinnin mahdottomuus. Sähköisen arkistoinnin käyttöönoton myötä ilmestyi ensimmäiset yritykset säännellä prosessia. Näin syntyi InterPARES-projektin työryhmä, joka oli mukana kehittämässä mallia arkistoitavien elektronisten objektien valintaan [36] [37] .
Kohdista makro- ja mikroarviointi. Makroarviointi ymmärretään arkistoitavien asiakirjojen valintana kontekstin tärkeyden perusteella - kaikki tiettyjen organisaatioiden, toimijoiden tai tietyn ajanjakson aikana luomat resurssit katsotaan tärkeiksi ja arvokkaiksi [35] . InterPARESin kehittämän mallin mukaan sähköisten asiakirjojen kontekstien arviointi koostuu neljästä päävaiheesta:
Tiedostojen arkistointipäätös voidaan tehdä oikeudellisen ja hallinnollisen kontekstin (oikeudellinen ja hallinnollinen järjestelmä, jossa materiaalit on luotu), taloudellisen kontekstin (luovan elimen, sen toimivaltuudet, rakenteen ja toiminnot), menettelyllisen kontekstin ( liiketoimintamenettely, jonka aikana tietueet luodaan ), dokumentaarinen konteksti (rakenne ja suhteet muihin asiakirjoihin) tai tekninen konteksti (sähköisten järjestelmien tekniset komponentit, joissa digitaalisia objekteja luodaan) [36] .
Arkistonhoitajat keräävät myös tietoa sähköisen aineiston pysyvästä arvosta ja aitoudesta. Esineen pysyvä arvo määräytyy sen perusteella, kuinka hyvin tietueet palvelevat tekijöiden ja yhteiskunnan etuja tai tarpeita. Se voidaan kyseenalaistaa tapauksissa, joissa materiaalin säilyvyyttä voitaisiin loukata. Jos arvioijalla on hyvä syy epäillä, että tietueet ovat menettäneet aitouden ja poikkeavat alkuperäisestä versiostaan, niiden arkistointi kyseenalaistetaan [36] .
InterPARES-työryhmän suositusten mukaan suojelumahdollisuuden selvittäminen tapahtuu useassa vaiheessa. Ensin asiantuntija määrittää materiaalien sisällön ja ne tekniset elementit, jotka on säilytettävä aitousvaatimusten mukaisesti. Tämän jälkeen arvioija mukauttaa nämä säilytysvaatimukset arkistoitujen asiakirjojen pysyvästä säilyttämisestä vastaavan organisaation kykyihin [36] .
Aiempien kriteeriarviointien perusteella sovelletaan päätöstä asiakirjan säilyttämisestä [36] .
Mikroarvioinnin tarkoituksena on määrittää yksittäisten asiakirjojen arvo. Sen tärkein kriteeri on asiakirjan yhteensopivuus säilyttäjän keräyspolitiikan kanssa - näiden kriteerien noudattamatta jättämisen vuoksi sähköistä arkistointia koskeva pyyntö voidaan hylätä myös arvokkaiden resurssien tapauksessa. Esimerkiksi Earth Resources Observation and Science (EROS) kieltäytyi päästämästä Apollo-avaruusohjelman tietojoukkoon , joka sisältää tuhannen NASAn operaation aikana ottaman materiaalin . Huolimatta siitä, että materiaalilla on kiistatonta arvoa Yhdysvalloille, EROS hylkäsi sen, koska suurin osa elokuvista on kuvattu avaruusaluksesta tai Kuun pinnalta , kun taas järjestön tehtävänä on säilyttää elokuvat ja valokuvat, jotka on otettu Maapallo. Toiseksi tärkein arviointikriteeri on digitaalisten resurssien arvo, joka voi olla myös ensisijainen ja toissijainen. Ensisijaisella arvolla tarkoitetaan hallinnollisia, verotuksellisia ja oikeudellisia arvoja. Toissijainen arvo on materiaalien hyödyllisyys, käytettävyys ja saatavuus. Kolmas arviointikriteeri on hinta, joka voi olla ratkaiseva tekijä valittaessa useita versioita samasta materiaalista. Arkistonhoitajat ottavat myös huomioon arkistoinnin toteutettavuuden, koska jotkut konservaattorit kieltäytyvät hyväksymästä digitaalisia resursseja tietyissä tiedostomuodoissa tai tietovälineissä, koska he eivät voi taata yksittäisten materiaalien pitkäaikaista säilymistä [35] .
Sähköistä arkistointia sovelletaan pääasiassa digitaalisessa ympäristössä luotuihin tai digitoituihin esineisiin. Ensimmäiseen luokkaan kuuluu data, joka on luotu jollain digitaalisella tekniikalla. Digitoidulla materiaalilla tarkoitetaan dataa, joka on muutettu analogisesta digitaaliseen muotoon skannauksen tai muodonmuutoksen avulla [38] . Sähköistä arkistointia käytetään useimmiten [27] :
Sähköiset arkistot tai tietovarastot ovat yksi sähköisen arkistoinnin keskeisiä elementtejä. Tietovarastot tallentavat kaikenlaisia digitaalisia objekteja sekä niihin liittyviä kuvailevia ja hallinnollisia metatietoja. Digitaalisia esineitä voivat olla sähköisen lehden artikkeleita, digitoituja kuvia valokuvista, numeerisia tietoja, digitaalisia videoita, kirjojen täysversioita [32] . Osana avoimen pääsyn liikettä arkistot liittyvät " vihreään " polkuun tai itsearkistoinnin käytäntöön – tieteellisten aineistojen kirjoittajat voivat sijoittaa itsenäisesti artikkeleita sähköisen arkiston sopivaan osioon ja antaa siitä lyhyen kuvauksen [39] [40] . Yksi ensimmäisistä suurista temaattisista tietovarastoista arXiv.org ilmestyi vuonna 1991. Se tarjoaa pääsyn matematiikan, fysiikan, tietojenkäsittelytieteen ja kvantitatiivisen biologian tieteellisiin julkaisuihin . Tietovarastot mahdollistavat paitsi pääsyn teosten sähköisten kopioiden kokoelmiin, myös automaattisesti lisäävät julkaisuja Citebase- tietokantaan, joka mahdollistaa viittausindeksin seurannan [41] .
Tietovarastot voivat olla institutionaalisia, kurinpidollisia (tai temaattisia) tai kansallisia. Temaattiset arkistot tarjoavat pääsyn yhden tai useamman alueen kirjallisuuteen, kun taas instituutioarkistot tallentavat saman oppilaitoksen sisällä julkaistuja teoksia - pääsääntöisesti nämä ovat teknisiä raportteja, väitöskirjoja, tietokantoja, artikkeleita, painettuja julkaisuja. Esimerkki institutionaalisista arkistoista on MIT :n DSpace [42] . Erilliset arkistot luotiin yhteistyön tuloksena suurten tieteellisten julkaisujen kanssa – esimerkiksi Springer Nature tukee In Review -palvelua ja Elsevier ChemRN:ää. Myös voittoa tavoittelemattoman avoimen tieteen keskuksen alaisuudessa on useita kansallisia tietovarastoja, mukaan lukien Arabirxiv ( arabimaista esipainetut tiedot), Frenxiv ( ranskalainen palvelin), INArxiv ( indonesialainen ), Indiarxiv ( intialainen ). Myös Latinalaisen Amerikan maiden preprintit julkaistaan SciELO- arkistossa [43] [44] .
Organisaatiot käyttävät avoimen lähdekoodin ohjelmistopaketteja luodakseen ja toteuttaakseen institutionaalisia tietovarastoja. Näitä ovat Eprints ja DSpace . Vuonna 2002 julkaistu DSpace on avoimen lähdekoodin yleinen arkistosovellus, jonka HP Labs ja Massachusetts Institute of Technology Libraries ovat kehittäneet yhdessä monitieteisille tutkimusorganisaatioille. DSpace käyttää sopivaa Dublin Coren metatietostandardia digitaalisten objektien kuvaamiseen ja tukee myös Open Archives Initiative Protocol for Metadata Harvesting [44] . Muita merkittäviä aihevarastoja ovat vuonna 1996 perustettu PubMed , jossa julkaistaan lääketieteen ja biologian artikkeleita, PhilSci-Archive filosofian artikkeleineen ja Social Science Research Network (SSRN), joka on julkaissut yhteiskunta- ja humanistisia artikkeleita. vuodesta 1994. [40] . Yksi suurimmista avoimen pääsyn arkistoista on vuonna 2003 perustettu Archive of European Integration Sivusto julkaisee Euroopan unionin asiakirjoja , jotka on tarkoitettu julkiseen jakeluun. Tammikuussa 2016 arkisto sisälsi yli 41 800 EU-asiakirjaa ja noin 7 300 yksityistä teosta [45] . Useat maat ovat toteuttaneet kansallisia aloitteita arkiston infrastruktuurituen tarjoamiseksi, kuten SHERPA -projekti Isossa- Britanniassa , DARE Alankomaissa ja 12 miljoonan dollarin arvoiset Australian hallituksen hankkeet arkistojen edistämiseksi. Yksittäiset organisaatiot voivat myös ostaa palveluita, jotka tarjoavat pääsyn yksittäisiin pilviresursseihin. Joten Amazon tarjoaa useita pilvipalvelimia kerralla, mukaan lukien Amazon S3 tiedostojen isännöintiin [46] .
Samaan aikaan kehitetään järjestelmiä, jotka tekevät hakuja useista arkistoista samanaikaisesti. Esimerkki tällaisesta järjestelmästä on OAIster , jonka kautta voit tarkastella yli 200 tietovaraston tietoja [47] [48] [42] . OpenDOAR hakee lähes 3000 julkisesti listatun tietovaraston sisällöstä ympäri maailmaa [49] .
Yksi tärkeimmistä metatietoja säätelevistä standardeista on Dublin Core (DCMES), jonka pääjoukko koostuu 15 ominaisuudesta [50] :
Dublin Core on yleinen standardi objektien luetteloinnissa. DCMES:n yleisen luonteen vuoksi voi kuitenkin olla vaikeaa kuvata monimutkaisia kokoelmaobjekteja. Tästä syystä useimmissa tapauksissa Dublin Core yhdistetään muihin standardeihin [51] .
Eheys ja joustavuus ovat arkistoitujen digitaalisten objektien olennaisia ominaisuuksia. Eheys tarkoittaa tietojen tarkkuuden ja luotettavuuden ylläpitämistä koko sen elinkaaren ajan. Se voi rikkoutua tiedonsiirron tai replikoinnin aikana. Eheyden ylläpitäminen on yksi tärkeimmistä sähköisen arkistoinnin tehtävistä [52] [53] . Pysyvyys tarkoittaa, että tiedosto pysyy muuttumattomana sähköisen arkistoinnin aikana ja että se säilytetään siinä muodossa, jossa se luotiin [54] .
Kansainvälinen PREMIS-standardi määrittelee metatiedot "tiedoksi, jota arkisto käyttää tukemaan digitaalista säilytysprosessia". Metatiedot ovat tietoja tiedoista, kuten kuvaukset tiedostomuodosta, ohjelmistosta ja muutoshistoriasta. Ihannetapauksessa metatietoja tulisi kerätä ja päivittää digitaalisen objektin koko elinkaaren ajan [55] . Metatietojen ensisijainen tehtävä on tunnistaa, kuvata ja tarjota älykäs pääsy digitaalisen kokoelman sisältöön. Erityyppisiä metatietoja tarvitaan resurssien kuvaamiseen, digitaalisten objektien löytämiseen, hakemiseen, käyttämiseen, esittämiseen ja säilyttämiseen. Tärkeimmät metatiedot on tarkoitettu kokoelmien järjestämiseen visuaalisten, ääni- ja animaatiomateriaalien kanssa, joita on vaikea tunnistaa ilman tekstillistä kuvausta. On olemassa useita metatietoja [24] :
Yksi tärkeimmistä metatietoja säätelevistä standardeista on Dublin Core (DCMES), jonka pääjoukko koostuu 15 ominaisuudesta [50] :
Dublin Core on yleinen standardi objektien luetteloinnissa. DCMES:n yleisen luonteen vuoksi voi kuitenkin olla vaikeaa kuvata monimutkaisia kokoelmaobjekteja. Tästä syystä useimmissa tapauksissa Dublin Core yhdistetään muihin standardeihin [51] .
Toinen perusstandardi on VRA Core. Toisin kuin DCMES, VRA Core antaa sinun luokitella taideteoksia (tai alkuperäisiä esineitä) ja niiden korvikkeita (digitaalisia kuvia) eri luokkiin. Tämän ratkaisun avulla voit luoda tarkemman kuvauksen esineistä ja esimerkiksi ilmoittaa molempien teosten - alkuperäisen teoksen ja sen valokuvan - luomispäivämäärän [51] .
Preservation Metadata: Implementation Strategies eli PREMIS on kehitetty OCLC:n ja RLG:n työryhmässä vuonna 2005. Standardi määrittelee tiedostojen arkistoihin tallentamiseen tarvittavat metatietoyksiköt. Vuonna 2021 PREMISiä ylläpitää ja sponsoroi Kongressin kirjasto . Standardi koostuu kahdesta pääosasta - tietomallista ja sanakirjasta. PREMIS määrittelee useita metadatatyyppejä, mukaan lukien kuvailevat, rakenteelliset, tekniset ja hallinnolliset. Sanakirjassa painotetaan suuresti digitaalisen alkuperän (esineen historian) ja suhteiden dokumentointia, erityisesti erilaisten arkistoissa olevien digitaalisten objektien välillä [24] . PREMIS-standardin mukaan arkiston tulee automaattisesti säätää metatiedot jokaiselle yksittäiselle sähköiselle objektille ja säilyttää tiedostossa tapahtuneiden muutosten historia [56] [57] .
Sähköisen tiedonarkistoinnin perusperiaatteet on muotoiltu useissa 1990-luvun lopun ja 2000-luvun alun standardeissa ja aloitteissa.
Vuonna 1994 voittoa tavoittelematon järjestö Commission on Preservation and Access (CPA) käynnisti yhdessä kirjastokonsortion Research Libraries Group kanssa erityisen toimikunnan, jonka toiminnan tavoitteena oli tunnistaa sähköisten asiakirjojen pitkäaikaista arkistointia ja arkistointia koskevia käytäntöjä. asianmukaisten suositusten laatiminen. Työvaliokunnan tavoitteena oli myös vaihtoehtoisten arkistointikäytäntöjen kehittäminen - sen sijaan, että tietoja siirrettäisiin uusiin samoihin tietovälineisiin tuolloin hyväksyttyihin versioihin, toimikunnan jäsenet ehdottivat migraatiomenetelmää ja elektronisten objektien siirtämistä uusille kiintolevyille ja ohjelmistoille. Toukokuussa 1996 Donald Watersin ja John Garrettin johtama 21-jäseninen paneeli julkaisi loppuraportin Preserving Digital Information. Raportti sisälsi kaksi pääsuositusta: sisällöntuottajien osallistuminen ja nimeäminen sähköiseen arkistointikäytäntöihin sekä tarve luoda luotettavien ja sertifioitujen sähköisten arkiston verkosto [58] . Tästä asiakirjasta tuli perusta myöhemmille aihetta koskeville käytännön suosituksille [59] [34] . Vuonna 1997 perustettiin kirjasto- ja tietoresursseja käsittelevä neuvosto [60] CPA:n ja RLG:n yhteistyön tuloksena .
RLG on toteuttanut useita käytännön aloitteita raportin pääperiaatteiden toteuttamiseksi käytännössä. Yksi näistä oli Studies in Scarlet, hanke, joka toteutettiin yhdessä Harvard Law School Libraryn kanssa . Tarkoituksena oli säilyttää Amerikasta, Isosta-Britanniasta ja Irlannista vuosilta 1815-1914 peräisin olevia tiedostoja, jotka koskivat perheväkivaltaa , kaksinaisuutta , avioliittolupauksen rikkomista, huoltajuutta , raiskauksia ja murha [61] . Toinen suuri projekti oli Global Immigration Project, joka digitalisoi maahanmuuttoasiat. Molemmat projektit keskittyivät digitointiin ja tietojen säilyttämiseen, mutta säilytyksen logiikka oli molemmissa tapauksissa erilainen. Siten Studies in Scarlet -hankkeen asiakirjojen arkistointi johtui tarpeesta toteuttaa RLG:n perusperiaatteet arkistoinfrastruktuurista ja Global Immigration Projectin tapauksessa tarpeesta digitalisoida ja asettaa saataville maahanmuutto- kokoelmat, joiden laatu heikkeni nopeasti. Myös hankkeiden organisaatiomallit poikkesivat toisistaan. Scarlet-tutkimuksessa oli keskitetty malli – kaikki materiaalit toimitettiin yhdessä, ja maahanmuuttoprojektin arkisto koostui useista eri kokoelmista, joita pidettiin 11 osallistuvassa laitoksessa Yhdysvalloissa, Isossa-Britanniassa ja Kanadassa . Samaan aikaan RLG käynnisti Arches-projektin, joka keskittyi digitaalisten resurssien online-arkiston ja ohjelmistoympäristön luomiseen kansainvälisen arkistomateriaalin käyttöön [62] . Arches on avoimen lähdekoodin ohjelmistoalusta, joka on kehitetty yhteistyössä Getty Conservation Instituten ja World Monuments Fundin kanssa luonnonsuojelulaitosten käyttöön ympäri maailmaa. Arches tarjoaa tietoa arkeologisista kohteista, rakennuksista ja rakenteista, kulttuurimaisemista, kaupunkikokonaisuuksista [63] [64] .
Nykyaikaiset lähestymistavat ja ratkaisut sähköisen arkistoinnin alalla perustuvat kansainvälisessä OAIS-standardissa [65] muotoiltuihin konsepteihin ja toiminnallisiin moduuleihin . Vuonna 1990 Kansainvälisen standardointijärjestön (ISO) pyynnöstä kansainvälinen avaruustietojärjestelmien neuvoa-antava komitea alkoi kehittää virallisia standardeja avaruuslentojen aikana syntyneiden tietojen pitkäaikaiseen sähköiseen arkistointiin. Vuonna 1995 järjestettiin sarja kansainvälisiä seminaareja, joiden tuloksena julkaistiin Open Archival Information System (OAIS) -viitemalli. Ensimmäinen versio julkaistiin vuonna 1997 ja viimeinen vuonna 2002 (päivitetty 2012). OAIS oli ensimmäinen järjestelmä, joka kuvasi arkistopaketin ja digitaalisten objektien käsitteen. Myöhemmin standardista tuli prototyyppi tuleville hankkeille, jotka koskivat sähköisten tietovarastojen luomista , pääsyä olemassa oleviin tietokantoihin ja metatietoihin [58] . Vuonna 2003 OAIS hyväksyttiin kansainväliseksi standardiksi ISO 14721:2003 ”Ulkoavaruuden tiedon- ja tiedonsiirtojärjestelmät. Avoin arkistotietojärjestelmä. Vertailumalli” (Avaruustiedon ja tiedonsiirtojärjestelmät – Avoin arkistotietojärjestelmä – Viitemalli (OAIS)) [66] . Standardi esitteli ensimmäisenä neutraalin sanaston, joka kuvaa toimijoiden rooleja ja vastuita tietovarastojen ylläpidossa ja käyttäjien pääsyn säätelyssä [34] . Siten OAIS-standardi määritteli ja ohjasi kestävän digitaalisen säilytysohjelman kehittämistä tarjoamalla yhteisen sanaston, tietomallin ja korkean tason digitaalisen säilytysarkkitehtuurin [67] . OAIS perustuu kolmeen pääkonseptiin - "OAIS-ympäristö", "OAIS-tiedot", "OAIS-ulkoinen vuorovaikutus". Ensimmäinen luokka koostuu OAIS-arkistoa ympäröivästä ympäristöstä "tuottajat", "kuluttajat" ja "johtajat". Tuottajat voivat olla sekä henkilöitä, jotka toimittavat tietoja järjestelmään ladattavaksi, että järjestelmiä. Esimiehet ovat niitä toimijoita, jotka eivät osallistu arkiston päivittäiseen toimintaan, mutta vaikuttavat OAIS:n yleiseen politiikkaan. Muut OAIS-arkistot tai ei-OAIS-yhteensopivat järjestelmät voivat olla vuorovaikutuksessa OAIS-arkiston kanssa "tuottajina" tai "kuluttajina" [68] .
OAIS:n mukaan arkistoidun kohteen tietopaketin tulee sisältää seuraavat tiedot [69] [66] :
Lisäksi OAIS- viitemalli kuvaa kolmen tyyppisiä tietopaketteja [69] [66] :
Vuonna 2000 RLG ja Online Computer Library Center (OCLC) aloittivat yhteistyön luodakseen kansainväliseen OAIS-standardiin perustuvan Trusted Digital Repositoryn (TDR tai Trusted Electronic Repositories ). Hankeraportti julkaistiin elokuussa 2001. Asiakirjan mukaan RLG- ja OCLC-työryhmä ehdottaa kansallisten ja kansainvälisten sähköisten arkiston järjestelmien luomista, jotka vastaavat julkisen, sosiaalisen, taloudellisen, kulttuurisen ja henkisen perinnön saatavuudesta. Raportin suositusten mukaan RLG:n, OCLC:n ja muiden järjestöjen toiminnan tulisi suunnata sähköisten arkiston sertifioinnin kehittämiseen, työkalujen tutkimiseen ja luomiseen digitaalisen materiaalin tärkeiden säilytysominaisuuksien tunnistamiseen; yhteistyöverkkojen ja tietovarastopalvelujen mallien tutkimus ja kehittäminen [58] [70] . Yhdessä tämän määritelmän kanssa annettiin TDR:n tärkeimmät ominaisuudet: hallinnollinen vastuu, organisatorinen elinkelpoisuus, taloudellinen vakaus, tekninen ja menettelyjen yhteensopivuus sekä järjestelmän turvallisuus [58] .
Luotettu digitaalinen tietovarasto on sellainen, jonka tehtävänä on tarjota luotettava, pitkäaikainen pääsy hallittuihin digitaalisiin resursseihin tietylle yhteisölle nyt ja tulevaisuudessa [34] .
Tutkimuskirjastoryhmä muodosti vuonna 2003 yhteisen työryhmän Yhdysvaltain kansallisen arkisto- ja asiakirjahallinnon kanssa kehittämään erityisiä kriteerejä sähköisten arkiston sertifioinnille. Vuonna 2005 RLG ja Center for Research Libraries alkoivat testata perusperiaatteita käytännössä ja kaksi vuotta myöhemmin julkaisivat tutkimuksen tulosten perusteella Trustworthy Repositories Audit & Certification -dokumentin , joka muodosti perustan. ISO-standardin 16363 mukaisesti ja määritellyt perusperiaatteet digitaalisten tietovarastojen luomiseen ja hallintaan .
Vuonna 2012 Yhdysvaltoihin perustettiin Digital Preservation Network (DPN) -yhteisö, johon kuului noin 60 organisaatiota, jotka kokoontuivat jakamaan teknologiaa, asiantuntemusta ja taloudellisia resursseja luodakseen läpinäkyvän ja pitkän aikavälin sähköisen arkistointipalvelun. Voittoa tavoittelemattoman DPN-järjestön jäsenyys oli vain yhdysvaltalaisten organisaatioiden saatavilla, jotka olivat kiinnostuneita sähköisen tiedon pitkäaikaisesta säilyttämisestä [71] . Kun he liittyivät DPN:ään, ne sisällytettiin jaettuun tallennusverkkoon, joka toimi viiden suuren tietovaraston kautta: Academic Preservation Trust (APTrust), Chronopolis, HathiTrust , Stanford Digital Repository (SDR) ja University of Texas Digital Repository (UTDR). Jokaista arkistoa pidettiin "solmuna" DPN-organisaatioiden verkostossa, joka sijaitsi eri osissa Yhdysvaltoja ja jolla oli oma arkkitehtuuri, laitteistoalusta ja organisaatio/taloudellinen rakenne. DPN:n toiminnan tavoitteena oli luoda kestävä materiaalivarastointijärjestelmä [72] . Vuonna 2018 DPN lakkautettiin [73] .
InterPARES Project on sarja kansainvälisiä yhteistyöhankkeita, joita on toteutettu vuodesta 1994 lähtien nimellä UBC Project. Projektin aloitti British Columbian yliopisto yhteistyössä Yhdysvaltain puolustusministeriön ja Yhdysvaltain kansallisen arkisto- ja asiakirjahallinnon kanssa vuosina 1994-1997. Sen päätavoitteena oli kehittää sähköinen arkistointimetodologia, joka mahdollistaisi materiaalien säilyttämisen autenttisessa muodossa pitkään [74] . InterPARES perustettiin vuonna 1999 tutkijoiden Luciana Duranti ja Terry Eastwood johtaman UBC-projektin pohjalta. Hankkeen ensimmäinen vaihe (1999-2001) keskittyi tietokantoihin ja dokumenttienhallintajärjestelmiin luotujen ja ylläpidettyjen tietueiden pitkäaikaiseen säilyttämiseen. Projektin toisessa vaiheessa (2002-2007) tutkijat analysoivat tieteellisen, taiteellisen ja valtion toiminnan yhteydessä syntyneitä levyjä. Hankkeen kolmannessa vaiheessa (2007-2012) hankittua käytännön tietoa testattiin pienissä ja keskisuurissa arkistolaitoksissa. Viimeinen vaihe (2013–2018) oli omistettu käyttäjien itsensä Internetiin lataamille sähköisille tietueille [75] [76] . Projektin tuloksena luotiin DOD-standardi 5015.2 arkistointijärjestelmää varten [71] [74] .
Vuonna 2002 Ison-Britannian kansallisarkiston digitaalisen säilytyksen osasto loi PRONOM - teknisen rekisterin, joka sisältää tietoa tiedostomuodoista , ohjelmistoista ja arkiston teknisistä komponenteista. Rekisteriä päivitetään jatkuvasti, ja harvinaisten ja patentoitujen tiedostomuotojen parissa työskentelevät tutkijat voivat jättää hakemuksia. Aluksi PRONOM pidettiin Ison-Britannian kansallisarkiston sisäisenä resurssina, mutta myöhemmin se muutettiin avoimeksi kansainväliseksi portaaliksi [56] [77] .
Vuosina 1996–2010 Australian kansalliskirjasto toteutti Preserving Access to Digital Information (PADI) -projektia edistääkseen strategioita ja ohjeita digitaalisten esineiden arkistointia ja pääsyä varten kaikissa Australian kulttuuriperintölaitoksissa . Hankkeen tuloksena luotiin yhteinen temaattinen portaali, jonka kautta toimielimet voivat vaihtaa vapaasti tietoja ja käyttää tarvittavia sähköisiä resursseja [56] .
Joulukuussa 2000 Yhdysvaltain kongressi myönsi 100 miljoonaa dollaria National Digital Information Infrastructure and Preservation Program (NDIIPP) luomiseen, joka siirrettiin Kongressin kirjastolle . Rahat kohdistettiin kansallisiin toimiin, joilla suunniteltiin sähköisten asiakirjojen pitkäaikaista arkistointia ja yhteistyötä muiden liittovaltion, tutkimus-, kirjasto- ja yritysjärjestöjen edustajien kanssa [78] .
Lokakuussa 2011 Moskovassa järjestetyn kansainvälisen konferenssin "Sähköisen tiedon säilyttäminen tietoyhteiskunnassa: ongelmat ja näkymät" puitteissa hyväksyttiin julistus digitaalisen tiedon säilyttämisestä, josta tuli myöhemmin yksi alan perusasiakirjoista. sähköisen arkistoinnin [79] . Julistuksessa hahmoteltiin digitaalisen tiedon säilyttämisen painopistealueita ja tehtiin useita ehdotuksia Unescolle, kansallisvaltioille ja hallintorakenteille asiakirjojen digitointia koskevien käytäntöjen käyttöönottamiseksi [80] .
Digitaalisen tiedon säilyttämisen menetelmänä on työskennellä materiaalien kanssa alkuperäisessä muodossa ja alkuperäisellä medialla käyttäen alkuperäistä tekniikkaa tai aiemmin käytettyjä laitteita ja ohjelmistoja. Tällöin syntyy ns. "tietokonemuseoita", joissa materiaalien visualisointi ja sisältö säilytetään alkuperäisessä muodossa ja alkuperäisellä toiminnallisuudella. Säilytystä on kutsuttu väliaikaiseksi sähköiseksi arkistointistrategiaksi, vaikka joillekin digitaalisille tiedoille menetelmä on paras ratkaisu, koska se pystyy säilyttämään alkuperäiset pääsytyökalut, kuten ohjelmistot [65] [81] [82] . Pitkällä aikavälillä strategia on ongelmallinen mahdollisten ylläpitoongelmien ja tiettyjen tiedostotyyppien saatavuuden vuoksi. Säilytys rajoittaa myös resurssin siirrettävyyttä, joka tässä tapauksessa riippuu suoraan tiettyihin paikkoihin varastoituista laitteista [81] .
EmulointiEmulointi viittaa järjestelmän toimintojen toistamiseen, jotta varmistetaan toiminta vanhojen tietomuotojen kanssa. Emulointi tarkoittaa virtuaalikoneen luomista tietokoneelle, jonka avulla voit toistaa alkuperäisen laitteisto- ja ohjelmistoympäristön toiminnallisuuden [65] . Joillakin tavoilla emulointi on samanlainen kuin säilytysstrategia , koska se sisältää alkuperäisen sovellusohjelman säilyttämisen. Emuloinnin tavoitteena on säilyttää digitaalisen objektin ulkonäkö sekä sen toimivuus kopioimalla resurssin tekninen sisältö ja käyttämällä tulevaisuudessa alkuperäistä objektia tai alkuperäisen objektin päivitettyä kopiota [81] . PC-pelien ystävät ovat kehittäneet emulointiohjelmistoja 1990-luvun alusta lähtien, mutta 2000-luvun alusta lähtien se on herättänyt kiinnostusta myös digitaalisen säilytyksen yhteisössä. Huolimatta siitä, että alun perin emulointia pidettiin teknisesti monimutkaisena järjestelmänä, jota oli lisäksi vaikea toistaa, menetelmästä tuli vähitellen yksi tärkeimmistä sähköisen arkistoinnin alalla - uusia kehityssuuntia, mukaan lukien emulaattorin käyttöönotto suoraan selaimen laajennukseen . , yksinkertaisti käyttöä huomattavasti. Emulaattori on ohjelmoitu jäljittelemään vanhempien laitteistoalustojen ja käyttöjärjestelmäohjelmistojen, kuten pelien ja tiedostojen, käyttäytymistä. Tämä strategia ei kuitenkaan sisällä vanhojen laitteistojen ja alkuperäisten ohjelmistojen säilyttämistä. Esimerkki on Java-virtuaalikone [81] [83] . Emulointia käytetään sekä sovelluksissa ja käyttöjärjestelmissä että laitteistoalustoissa [84] .
Emuloinnin käyttäminen tiedostomuotojen ja vanhojen ohjelmistojen käyttämiseen tarjoaa useita etuja. Näitä ovat kyky käyttää monimutkaisia digitaalisia objekteja, kuten pelejä, virtuaalitodellisuutta ja sovelluksia. Antamalla käyttäjien olla vuorovaikutuksessa digitaalisten objektien kanssa niiden alkuperäisessä ympäristössä, emulointi tarjoaa tutkijoille arvokasta kontekstia ympäristöstä, jossa tekijä työskenteli tuolloin. Kun sitä käytetään suuressa mittakaavassa, se voi tarjota pääsyn suuriin osiin kokoelmasta [83] . Emuloinnin käyttöä vaikeuttavat kuitenkin mahdolliset oikeudelliset ongelmat - vanhojen ohjelmistojen ja käyttöjärjestelmien lisenssiehdot eivät aina salli emulointia, koska tämä menetelmä sisältää kopioinnin. Emuloinnin valinta elektroniseksi arkistointistrategiaksi voi myös johtaa riippuvuuteen emulaattorien vanhentumisesta ja ajan mittaan ehdottaa laitteiden tehohäviöistä johtuvia rajoituksia [82] .
KapselointiKapselointimenetelmä tarkoittaa asiakirjan teknisen kuvauksen sisällyttämistä itse digitaalisen objektin koostumukseen, mikä vähentää sen riippuvuutta ulkoisesta ympäristöstä, koska tämä tieto mahdollistaa joko alkuperäisen ympäristön toistamisen tai asiakirjan siirtämisen uuteen [ 65] [85] . Useimmissa käytetyissä tiedontallennusmenetelmissä erilaisia elektronisia tietokomponentteja on tallennettu eri paikkoihin (esimerkiksi tietokantaan tai tiedostojärjestelmään) osana erilaisia digitaalisia objekteja. Eri komponenttien väliset suhteet ovat linkkien, osoittimien ja tiedostonimien kautta. Tietotekniikan nopea kehitys edellyttää kuitenkin, että digitaalisten objektien välinen suhde on vakaampi - sähköisen tietueen komponenttien säilyttäminen erikseen on aina riskitöntä ja heti kun suhde katkeaa eikä sitä voida palauttaa, tietue otetaan huomioon. menetetty. Arkistonhoitaja voi välttää tämän riskin sisällyttämällä metatiedot asiakirjoja sisältäviin tietokonetiedostoihin. Kun kaksi komponenttia yhdistetään yhdessä fyysisessä objektissa, tietueen ja metatietojen välinen yhteys ei voi kadota [86] . Kapselointia voidaan soveltaa digitaalisiin resursseihin, joiden muoto on hyvin määritelty ja laajalti käytetty [81] . Tämä strategia ratkaisee myös tiedostomuotojen teknologisen vanhenemisen ongelman, koska metatiedot sisältävät tavan luoda alkuperäinen sovellus pääsyä varten kehittyneemmillä tietokonealustoilla [87] [81] .
Kansainvälinen OAIS-standardi kuvaa myös lisätietojen tyypit, jotka tulee sisällyttää kapseloituun tiedostoon - alkuperä (kuvailemaan objektin lähdettä), konteksti (kuvatakseen kuinka objekti liittyy muihin tietoihin "säilön" ulkopuolella), viittaus yhteen tai useampaan tunnisteeseen (objektin yksilöimiseksi) [81] .
SiirtoSiirtotapa on siirtää sähköisiä asiakirjoja toiselle medialle tai toiseen käyttöjärjestelmään - esimerkiksi magneettinauhalta CD-levylle. Tämä strategia on yksi suosituimmista sähköisen arkistoinnin käytännöistä, koska se säilyttää digitaalisen aineiston eheyden ja käyttäjien kyvyn löytää ja käyttää tietoa ilman, että vanhentuneet tekniikat vaikuttavat siihen [81] [88] [82] .
Kansainvälinen OAIS-standardi erottaa neljä migraatiotyyppiä: päivitys, replikointi, uudelleenpakkaus ja muunnos. Päivittäminen varmistaa, että luotettava kopio bittivirrasta säilyy, kun taas replikointi ja uudelleenpakkaus varmistavat, että objektin hallittu paketti on saatavilla [81] . Tällä strategialla pyritään säilyttämään siirretyn kohteen sisältö samalla kun jotkin tekniset ominaisuudet voivat kadota [81] [89] [90] .
Digitaalinen arkeologiaDigitaalinen arkeologia on kallis menetelmä materiaalien arkistointiin, jossa tallennetaan niitä digitaalisia esineitä, jotka ovat tulleet saavuttamattomiksi teknologisen vanhenemisen ja/tai fyysisen huonontumisen vuoksi. Koska kustannukset ovat korkeat ja tietojen täydellisyyden palauttamiselle ei ole takeita, tällaisen strategian käyttöä pidetään välttämättömänä toimenpiteenä [82] [65] .
PäivitäPäivitysstrategiaan kuuluu tiedon siirtäminen kestävältä tallennusvälineeltä toiselle – esimerkiksi rappeutuneelta 4 mm:n DAT -nauhalta uudelle 4 mm:n DAT-nauhalle tai vanhalta CD-RW- levyltä uudelle CD-RW-levylle. Päivitys on välttämätön osa jokaista onnistunutta sähköistä arkistointiohjelmaa, mutta se ei ole strategia sinänsä. Menetelmä ratkaisee median kulumisen ja vanhenemisen ongelman, mutta sitä ei pidetä kestävänä pitkän aikavälin arkistointimenetelmänä [82] [91] [27] .
Sivuston arkistointiVerkkoarkistointi on prosessi, jossa kerätään, säilytetään ja poimitaan verkkosivustoja ja aineistoja Internetistä, jotta ne voidaan sijoittaa sähköiseen arkistoon tulevien sukupolvien käyttöön. Tällä strategialla pyritään ratkaisemaan verkon dynamiikasta ja lisenssiehtojen muutoksista johtuva tiedon menetys Internetissä. Yksi suurimmista ja tunnetuimmista verkkoarkistointihankkeista oli voittoa tavoittelematon Internet Archive , joka perustettiin vuonna 1996 . Arkistokokoelma koostuu useista arkistoitujen verkkosivustojen alakokoelmista, digitoiduista kirjoista, ääni- ja videotiedostoista, peleistä ja ohjelmistoista. Vuonna 2001 Archives lanseerasi Wayback Machinen , palvelun, joka on omistettu suuren osan "avoimesta" Internetistä säilyttämiseen. Wayback Machinen käyttäjät voivat seurata valituilla sivustoilla tapahtuvia muutoksia ja verrata eri versioita muokkauksista. Elokuussa 2021 Wayback Machine tarjosi pääsyn yli 581 miljardille tallennettuun verkkosivulle [92] [93] [82] [94] .
Organisaatiot voivat käyttää valikoivia verkkoarkistointiohjelmia. Suurimpia näistä palveluista ovat PANDAS (PANDORA Digital Archiving System), jonka edelläkävijä on Australian kansalliskirjasto. PANDAS on Java- ja Perl -kielillä kirjoitettu verkkosovellus, joka tarjoaa käyttöliittymän web-arkistointiprosessin hallintaan. Samanlaista roolia on The Web Creator Tool, avoimen lähdekoodin työnkulkutyökalu valikoivan verkkoarkistoinnin hallintaan, jonka ovat kehittäneet National Library of New Zealand ja British Library yhdessä Oakleigh Consultingin kanssa [95] .
strategia | Edut | Vikoja | Sovellus |
---|---|---|---|
Suojelu | Säilyttää ulkonäön. Voit työskennellä alkuperäisten tiedostomuotojen ja ohjelmistojen kanssa. | Tiedoston ylläpidon korkeat kustannukset. Turvallisuus riippuu varusteista. | Tiedostot, joissa on vanhentuneita formaatteja, ohjelmistoja, resursseja, joiden ulkonäöllä on merkitystä. |
Emulointi | Säilyttää ulkonäön. | Emulaattorin luomisen monimutkaisuus. Paljon tietoa tallennettava. Tiedon saanti vaatii arkaaista ohjelmistoa. | Ohjelmisto; monimutkaiset digitaaliset resurssit (esimerkiksi jotka sisältävät suoritettavia tiedostoja); resurssit, joiden arvoa ei tiedetä ja joiden käyttö tulevaisuudessa on epätodennäköistä; resursseja, joiden ulkonäöllä on merkitystä. |
Kapselointi | Tallentaa tietoja tiedostosta ja siitä, miten se voidaan toistaa. | Tieto tiedostosta ja sen toistojärjestelmästä säilyy. | Resurssit, joita ei ole saatavilla, ja resurssit tunnetuissa muodoissa. |
Muuttoliike | Ei vaadi alkuperäisten sovellusten tallentamista. Tukee aktiivista pääsyä ja ohjausta. | Korkeat kustannukset pitkäaikaisesta säilytyksestä. Metatietojen tallennuskyvyn puute. Jatkuva päivitys ja arkistonhoitajien työn tarve. | Resurssit, joita käytetään ja joita hallitaan aktiivisesti, kuten tieteellinen data tai tietokannat. Resurssit yleisesti käytetyillä muodoilla. |
Digitaalinen arkeologia | Voit rekonstruoida sähköisiä esineitä, joihin pääsy on menetetty. | Korkeat kustannukset ja ei takuita tiedostojen palautuksesta. | Kadonneet tiedostot. |
Päivittää | Käsittelee kulumista ja median vanhenemista. | Menetelmä on tehokas vain lyhytaikaisena ratkaisuna. | Resurssit, joiden tiedotusvälineet ovat vaarassa vanhentua. |
Verkkoarkistointi | Ratkaisee verkon kehityksen dynamiikasta ja lisenssiehtojen muutoksista johtuvan tiedonhäviön ongelman Internetissä. | Tekijänoikeuslakiin liittyvät mahdolliset oikeudelliset ongelmat. | Kaikki tiedostot ja sivustot, jotka löytyvät Internetistä ja jotka säilyttävä toimija pitää arkistoinnin arvoisena. |
Sähköisen arkistoinnin käytäntöjen tehokkaaksi toteuttamiseksi organisaatioita kannustetaan toteuttamaan myös rakenteellisia muutoksia. Teknologisen vanhenemisen kielteisten vaikutusten vähentämiseksi digitaaliseen mediaan on siis tarpeen ottaa käyttöön ja noudattaa kansainvälisiä standardeja, jotka säätelevät ohjelmistojen käyttöönottoon liittyviä kysymyksiä ja vähentävät riippuvuutta ohjelmistokehittäjien päivityksistä. Viralliset standardointielimet ja kansainväliset konsortiot, mukaan lukien National Digital Stewardship Alliance (NDSA), World Wide Web Consortium (W3C), International Organization for Standardization ja International Internet Preservation Consortium (IIPC). NDSA on perustettu vuonna 2010, ja se on digitaalisen tiedon pitkäaikaiseen säilyttämiseen keskittynyt organisaatioiden yhteenliittymä. World Wide Web Consortium on toiminut vuodesta 1994 ja on kansainvälinen yhteisö, jonka jäsenjärjestöt työskentelevät verkkostandardien kehittämiseksi. Bibliothèque nationale de Francessa vuonna 2003 perustetussa IIPC:ssä on mukana useita organisaatioita, mukaan lukien Chilen kansalliskirjasto ja Kongressin kirjasto, jotka kehittävät standardeja ja työkaluja verkkoarkistointiin [82] .
Digitaalisten aineistojen säilyttäminen edellyttää merkittäviä investointeja digitaalista arkistointia tukevaan teknologiseen infrastruktuuriin. Tietojen pitkäaikaisen säilymisen varmistamiseksi on välttämätöntä valita oikein käytettävät tietovälineet, jotka mahdollistavat tiedon pitkän pääsyn. Esimerkiksi magneettisten ja optisten välineiden käyttöä ei ole pidetty perusteltuna 2000-luvulta lähtien. Median valintakriteerien tulisi sisältää analyysi sellaisista asioista kuin vanhentuminen, standardointi ja kustannukset. Pysyvät paikalliset tai pilvitallennusjärjestelmät ovat olleet suosittuja 2010-luvulta lähtien [82] .
Sähköisen arkistoinnin onnistunut ja pitkäjänteinen toteutus edellyttää organisaatioiden, ammattiryhmien ja digitaalisten objektien luojien yhteistyön parantamista. Tätä varten on olemassa kansainvälisiä konsortioita, organisaatioiden teemaverkostoja ja avoimen lähdekoodin ohjelmistoja - esimerkiksi Open Journal Systems ja DSpace [82] .
Digitaalisen säilyttämisen näkökulmasta jokainen sähköposti, joka koostuu otsikosta, viestin rungosta ja liitteistä, on monimutkainen viestintäpaketti, joka sisältää ainutlaatuista lähdemateriaalia, jolla on usein mahdollista historiallista, oikeudellista ja hallinnollista arvoa [96] . Sähköpostien vaihto on merkittävä osa Internet-liikennettä, mutta se on suhteellisen harvinaista osaksi sähköisiä arkistointiohjelmia. Esimerkiksi US Library of Congress kerää arkiston julkisista twiiteistä ympäri maailmaa, UK Web Archive, Internet Archive ja Internet Memory Foundation ovat olleet mukana säilyttämässä verkkosivuja ja kerännyt tietoja sivustoilta; Yksikään hankkeista ei kuitenkaan kerää sähköpostitse lähetettyjä tietoja [97] . Tärkeimmät syyt tähän ovat sähköpostien mahdollinen luottamuksellisuus, erot sähköpostiohjelmien muodoissa ja standardoidun muodon puute viestien tallentamiseen [97] [98] [96] .
Sähköpostin arkistointiprojekteja on useita:
Vuodesta 2012 lähtien Manchesterin yliopiston kirjaston omistama Carcanet Press -arkisto alkoi tallentaa sähköistä kirjeenvaihtoa kuuluisien runoilijoiden, kriitikkojen, toimittajien, kääntäjien ja taiteilijoiden kanssa. Carcanet Press Email Preservation Project käytti sekä perinteisiä arkistointimenetelmiä että uusia standardeja digitaaliseen säilytykseen:
Vuodesta 1999 vuoteen 2003 DAVID-projekti oli aktiivinen Antwerpenin kaupunginarkiston ja KU Leuvenin monitieteisen oikeus- ja tietotekniikan keskuksen yhteistyön tuloksena . Tämän projektin tavoitteena oli luoda käsikirja sähköiseen arkistointiin. Henkilökunta kävi läpi sähköpostin arkistoinnin laki- ja arkistointivaatimukset ja viittasi joihinkin mahdollisiin arkistointistrategioihin. Teoreettisen arvonsa lisäksi raportti oli tärkeä myös siinä mielessä, että sen jälkeen aloitettiin sähköpostien ja niihin liittyvien sähköisten asiakirjojen kirjaamisen ja kirjaamisen käytäntöjen käyttöönotto [99] .
Smithsonian Institution Archives oli ensimmäisten organisaatioiden joukossa, joka kehitti sähköpostin säilytyskäytäntöjä. Kokoelmissaan arkisto ylläpitää sähköpostitietueita, jotka ovat peräisin 1980-luvulta ja jotka on luotu ELM :llä . Siitä lähtien Smithsonian on käyttänyt useita sähköpostisovelluksia ja -muotoja, mukaan lukien PINE, cc:Mail , Lotus Notes , GroupWise ja muut sovellukset. Smithsonianin työntekijöitä määrättiin tulostamaan sähköpostit kirjaamista varten, kuten muissa organisaatioissa ja yrityksissä tuolloin oli käytäntö. Koska tuolloin ei käytännössä ollut organisaatioita, jotka toimisivat sähköpostitietojen tallentamisen alalla, vuonna 2005 luotiin erityisprojekti Rockefeller Archive Centerin kanssa - Collaborative Electronic Records Project (CERP). Hanke kesti kolme vuotta ja johti standardien ja käytäntöjen luomiseen sähköisen viestinnän arkistointia varten [100] [99] .
Vuoden 2008 alusta Harvardin yliopistossa on toiminut työryhmä, joka on määritellyt strategioita sähköisten viestien säilyttämiselle. Vuonna 2015 sen pohjalta käynnistettiin EAS, kumppanuushanke Harvard University Library Office for Information Systems (OIS) ja useiden Harvardin kirjastojaostojen kuraattoriorganisaatioiden välillä [101] . EAS tekee yhteistyötä Wordshackin kanssa tietojen tallennusprosessin automatisoimiseksi. Esimerkiksi pitkäaikaista säilytystä varten valitut sähköpostiviestit ja liitteet lähetetään automaattisesti DRS:ään, Harvardin yliopiston Electronic Repository Service -palveluun [101] .
XENA on Australian kansallisarkiston kehittämä ilmainen avoimen lähdekoodin ohjelmisto elektronisten asiakirjojen pitkäaikaiseen säilyttämiseen. XENAn päätehtävä on määrittää digitaalisten tietueiden tiedostomuoto ja muuntaa se sopivaan säilytysmuotoon avoimien standardien pohjalta . Xena-ohjelmisto edistää digitaalista säilytystä suorittamalla kaksi tärkeää tehtävää: määrittää digitaalisten objektien tiedostomuodot ja muuntaa ne avoimiin säilytysmuotoihin [102] .
Videopelien säilytys tapahtuu arkistoinnin avulla lähdekoodikehityksiä , videopelien digitaalisia kopioita, pelikonsoliemulointia , erikoistuneiden videopelilaitteistojen ylläpitoa ja säilyttämistä sekä videopelien esidigitointia sisältävien lehtien ja kirjojen digitointia . Videopelien säilyttäminen mahdollistaa alan historian tutkimisen lisäksi myös tietyn pelin tuotannon teknisten ja luovien näkökohtien analysoinnin [103] .
Pelien luomiseen käytetty tekniikka on muuttunut merkittävästi 1990-luvun alusta, ja monissa tapauksissa alkuperäisiä sen ajan pelejä ei voida pelata muodon vanhenemisen vuoksi [104] . Samaan aikaan pelejä julkaistiin pääsääntöisesti tietylle konsolille, mikä vaikeutti suuresti niiden myöhempää säilyttämistä [105] . Siksi tänä aikana alkoi ilmestyä aloitteita videopelien perinnön säilyttämiseksi. Pelimuseoita on perustettu, kuten The Strong New Yorkiin [106] , Museum of Art and Digital Entertainment Aucklandiin [ 107] , Berliinin tietokonepelimuseo [108] , Museum of Soviet Arcade Koneet Moskovassa ja Pietarissa [ 109] . Yhdysvaltoihin perustettiin myös Video Game History Foundation, joka on omistettu paitsi pelien, myös aiheeseen liittyvien lehtien, oppaiden ja mainosmateriaalien säilyttämiseen. Muita suuria aloitteita ovat digitaalinen jakelupalvelu GOG.com ja kokoelma selainpohjaisia pelihalliemulaattoreita Internet-arkistossa [105] . YK on vuodesta 2015 lähtien tukenut Open Digital Library on Traditional Games -projektia, jonka tavoitteena on arkistoida ja suojella perinteisiä alkuperäiskansojen pelejä sähköisesti luetteloimalla ja rakentamalla yhteinen tietokanta, josta myöhemmin luodaan videopelejä [110] [111] .
1990-luvun puolivälistä lähtien tiedemaailmassa alkoi kehittyä avoimen tieteen liike - yhä useammat tutkijat vastustivat maksumuureja ja akateemisen kirjallisuuden kohtuuttoman korkeita kustannuksia kirjastojen vähentyneen rahoituksen taustalla. Yksi liikkeen kannattajien vaatimuksista oli pääsyn avaaminen tieteellisille julkaisuille, pääasiassa julkaisemalla Internetissä [112] [113] . Pian ilmestyivät ensimmäiset verkkotietovarastot ja sähköiset kirjastot. Näitä olivat sellaiset suuret projektit kuin arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [114] . Elokuussa 2021 Directory of Open Access Journals sisältää yli 15 900 avoimen pääsyn aikakauslehteä ja yli 5 miljoonaa artikkelia [115] . Samaan aikaan tieteellisten julkaisujen arkistoinnin logiikka kussakin hankkeessa voi olla hyvinkin erilainen. Esimerkiksi digitaalinen JSTOR - tietokanta luotiin vuonna 1995 painettujen aikakauslehtien digitaalisten kopioiden tallentamiseksi. Tietokanta sisältää vain ne tieteelliset aikakauslehdet, joissa julkaisu tapahtuu vertaisarviointijärjestelmän kautta . Tärkeää on myös tämän lehden tilaavien organisaatioiden määrä ja viittausindeksi . Arkistointi tapahtuu "liikkuva seinä" (Moving Wall) -periaatteella - numerot sijoitetaan järjestelmään julkaisun luomishetkestä ja 3-5 vuoden ajalle nykypäivään. JSTORiin lähetetty sisältö ei aina ole julkista ja saattaa olla piilotettu maksumuurin taakse . Tällaisten materiaalien käyttö on mahdollista laitostilausjärjestelmän [116] [117] [118] kautta . Yhdysvaltain kansallisen lääkekirjaston luoma biolääketieteellisen kirjallisuuden arkisto PubMed Central otettiin käyttöön helmikuussa 2000. Pääsy sivustolle lähetettyyn materiaaliin on ilmainen ja rajoittamaton [119] . Vuonna 1991 avatussa arXiv.org-portaalissa tutkijat puolestaan julkaisevat itsenäisesti esiprinttejä tai vapaasti jaettuja kopioita julkaistuista fysiikan , matematiikan , tähtitieteen , tietojenkäsittelytieteen ja muiden eksaktien tieteiden töistä. Artikkeleita ei vertaisarvioida ennen julkaisua , mutta moderaattorit tarkistavat ne ensin [120] .
Sähköisten kirjastojen myötä digitaalisten tieteellisen kirjallisuuden kokoelmien pitkäaikaissäilytyksen ongelma on myös noussut esiin - resurssien saatavuuden varmistaminen tuleville sukupolville vaatii erityisiä ponnisteluja ja jatkuvia investointeja [121] [122] . Avoin aineisto ei yleensä loukkaa tekijänoikeuksia tai omistusoikeuksia – kirjastot eivät tarvitse erityistä lupaa säilyttääkseen niitä. Avoimen kirjallisuuden säilyttämiseksi pitkällä aikavälillä organisaatioita kannustetaan noudattamaan avoimia kansainvälisiä standardeja ja ottamaan käyttöön avoimia formaatteja, mukaan lukien odt ja xml [113] .
Yksi sähköisen arkistoinnin suurimmista ongelmista on teknologioiden vanhentuminen - laitteiden ja ohjelmistomuotojen nopean muutoksen ja kehityksen vuoksi pääsy sähköisiin arkistoihin voi kadota [27] . Keskimäärin tallennusvälineet vanhenevat kerran vuosikymmenessä ja ne korvataan uusilla, tehokkaammilla tavoilla tietojen tallentamiseen ja sitä kautta uusiin laitteistoihin ja ohjelmistoihin. Samaan aikaan vanhat mediatyökalut lopetetaan. Lisäksi tallennusvälineet ovat alttiina virheille ja epäonnistumisille, virushyökkäyksille ja fyysiselle heikkenemiselle [65] . Organisaatioita kehotetaan käyttämään sähköisessä arkistointissa ei-omistusoikeuksia, pysyviä muotoja, jotka ovat riippumattomia kolmannen osapuolen ohjelmistoista [123] [124] .
Tietojen säilyttämisen käytäntöä vaikeuttaa myös yhtenäisen lainsäädännön, politiikkojen, strategioiden ja tietoisuuden puute sähköisen arkistoinnin alalla. Esimerkiksi lainsäätäjät eivät välttämättä ole tietoisia sähköisen arkistoinnin vaatimuksista, minkä seurauksena lainsäädännössä ei oteta huomioon tai säännellä kokonaan digitaalisen tiedon säilyttämistä. Tämä aiheuttaa lisäongelmia tekijänoikeuksien suhteen [27] . Immateriaalioikeudet ja muut lakisääteiset velvoitteet voivat estää digitaalisten resurssien sisällön kopioimisen, tallentamisen, muuttamisen ja käytön pitkäaikaista säilytystä varten [82] . Digitaalisten aineistojen tekijän- ja immateriaalioikeuksia koskeva kysymys on paljon monimutkaisempi kuin perinteisen fyysisen materiaalin. Perinteisen arkistoinnin alalla kirjasto tai arkisto sai automaattisesti kopiointi- ja säilytysoikeuden yhdessä fyysisen kopion kanssa [19] . Useimmat sähköiset arkistointimenetelmät edellyttävät kuitenkin yksinoikeuksien olemassaoloa ja käyttöä teokseen, mukaan lukien oikeus kopioida [125] . Lisäksi julkaisijat voivat kieltää julkaisujen kopioinnin teknisin keinoin - mikä on sallittua ja kirjattu tekijänoikeuslaissa sekä Yhdysvalloissa että Euroopan unionissa. Lisäksi yksittäisellä materiaalilla voi olla useita tekijänoikeuksien haltijoita (mukaan lukien muut kustantajat, kirjailijat, taiteilijat, kolmannen osapuolen ohjelmistotoimittajat), mikä voi vaikeuttaa julkaisijoiden mahdollisuuksia myöntää säilytysoikeuksia kirjastoille ja muille toimijoille. Jos julkaisun "ulkonäkö ja tuntuma" tai toiminnallisuus kuitenkin muuttuu kopioimisen seurauksena, tekijät ja tekijät saattavat kokea, että heidän oikeuksiaan on loukattu, voi olla vaikeaa todistaa, että julkaisujen säilytetyt kopiot ovat vain kopioita eivätkä kokonaan. uudet versiot [126] . Mahdollisten ratkaisujen joukossa tähän ongelmaan tutkijat mainitsevat lisenssisopimusten mahdollisen käyttöönoton, joissa määritellään erityisesti suojeluehdot [127] .
Vaikeuksia ovat myös inhimillinen tekijä , tietokonevirukset, luonnonkatastrofit, media- ja ohjelmistovirheet [128] [27] .