Digital Dark Age on käsite, joka kuvaa historiallisen tiedon mahdollista katoamista informaation aikakaudella sähköisten asiakirjojen saatavuuden menettämisen vuoksi. Sähköisten arkistointikäytäntöjen puute, tiedostomuotojen ja tallennusvälineiden vanhentuminen voivat johtaa tähän skenaarioon . Termi "Digital Dark Age" viittaa termiin " pimeä aikakausi ", jota käytetään usein kuvaamaan keskiaikaa .
Ongelmasta alettiin puhua jo 1990-luvun lopulla, kun vanhaan muotoon tallennettuja tiedostoja ei enää ollut saatavilla ja magneettinauhat ja -levyt alkoivat huonontua, mikä johti monien suurten tietokantojen katoamiseen. Ajan myötä pääsy menetti myös asemiin ja tietovälineisiin, jotka vähitellen poistuivat liikenteestä, mukaan lukien levykkeet , zip-asemat ja CD -levyt . Viitatakseen tiedon katoamiseen vuonna 1997 Kansainvälisen kirjastoyhdistysten ja instituutioiden liiton konferenssissa ehdotettiin termin "digitaalinen pimeä aika" käyttöä.
"Pimeän aikakauden" alkamisen estämiseksi tutkijat ehdottavat sähköisen arkistoinnin käytännön kehittämistä ja paperikopioiden luomista digitaalisista tiedoista.
Perinteisesti munkit ja luostarit osallistuivat tiedon arkistointiin ja säilyttämiseen. Heidän työnsä varmisti tiedon säilymisen kreikkalaisten , roomalaisten ja arabien kulttuurien perinnöstä . Painamisen leviämisen myötä 1400-luvulla [1] nämä tehtävät siirtyivät vähitellen yksityisten ja julkisten kirjastojen [2] kirjastonhoitajille ja arkistonhoitajille , jotka pitävät kirjaa omistusoikeuksista, veroasiakirjoista, tuonnista ja viennistä . Tietoajan alkuun 1900-luvun lopulla suurin osa materiaalista säilytettiin paperilla. Huolimatta sivujen kellastumisen vaarasta ja mahdollisesta tulen, veden ja ajan aiheuttaman tuhoutumisvaarasta, tällaiset asiakirjat olivat yleisesti saatavilla [3] [4] .
Tietojen aikakauden alkaessa tiedonvaihdosta on tullut pääosin digitaalista [4] . Siksi yhä useammat tutkijat alkoivat ihmetellä, mitä tapahtuisi, jos siirrytään kokonaan sähköiseen muotoon, vaikka fyysisiä kopioita, kuten painettuja asiakirjoja ja valokuvia, ei ollut. Heidän mielestään on olemassa vaara, että monet tiedot katoavat jonakin päivänä eivätkä tulevat sukupolvet pääse niihin käsiksi [2] .
1990-luvun lopulla sähköisten asiakirjojen arkistoinnin puutteet tulivat ilmi. Joten vanhoissa muodoissa tallennetut tiedostot eivät enää olleet saatavilla, ja magneettinauhat ja -levyt alkoivat huonontua, mikä johti monien suurten tietokantojen katoamiseen [5] . Ajan myötä pääsy asemiin ja tietovälineisiin, jotka vähitellen poistuivat liikenteestä, katosivat, mukaan lukien levykkeet , zip-asemat ja CD -levyt [6] [7] .
Vuonna 1997 kansainvälisen kirjastoyhdistysten ja instituutioiden liiton konferenssissa tutkijat ehdottivat ensimmäisen kerran termin Digital Dark Age käyttöä kuvaamaan tätä ongelmaa. Ilmaus "pimeä ikä" viittaa keskiaikaan - ajanjaksoon, jolle oli ominaista lähes täydellinen kirjallisten todisteiden puuttuminen [4] [8] . Muut asiantuntijat kutsuvat 2000-lukua "informaation mustaksi aukoksi" peläten, että tulevaisuuden ohjelmistot ja tietokoneet eivät pysty toistamaan meidän aikanamme luotua dataa [9] . Vuonna 2015 amerikkalainen tiedemies ja Googlen varapresidentti Vinton Cerf antoi lausunnon, että ihmiskunta on siirtymässä kohti "digitaalista pimeää aikaa". Washingtonin National Press Clubissa pitämässään puheessa hän ilmaisi huolensa sähköisen materiaalin yleisestä säilyvyydestä ja kannatti käytäntöjen kehittämistä sähköisten tietojen arkistointiin tekijänoikeuslain mukaisesti [10] [11] [12] [13] .
Digitaalisen tiedon arkistointiin liittyy kaksi päähaastetta 2000-luvulla. Ensimmäinen on tarve pitää fyysinen media toimintakunnossa. Poliittiset kriisit sekä luonnonkatastrofit, kuten tulvat ja maanjäristykset, voivat häiritä laitteiden huoltoa ja kunnossapitoa [4] .
Toinen syy liittyy formaattien vanhentumiseen – monet niistä voivat tulevaisuudessa osoittautua lukukelvottomaksi. Tämä johtuu ohjelmistojen kehityksestä, uusien tiedostomuotojen syntymisestä ja vanhojen tiedostomuotojen tuen päättymisestä [14] [15] .
Vuonna 1986 BBC käynnisti BBC Domesday -projektin (tai Doomsday) juhlistaakseen Domesday Bookin 900-vuotisjuhlaa, vuonna 1086 William Valloittajan käskystä kirjoitettua materiaalia . Kuningas tilasi yksityiskohtaisen selvityksen valtakuntansa maatiloista ja kokosi tulokset viisiosaiseksi painokseksi, joka on tällä hetkellä Ison-Britannian kansallisarkistossa . BBC-projektiin osallistui yli miljoona ihmistä, mukaan lukien lapset noin 9 000 koulusta eri puolilla Yhdistynyttä kuningaskuntaa, ja heitä pyydettiin dokumentoimaan kotikaupunkinsa. Yleisöstä saatu tieto yhdistettiin ammattimaisiin valokuviin, karttoihin, videokierroksiin historiallisista kohteista ja koko vuoden 1981 väestönlaskennasta. Myöhemmin kaikki tiedot ladattiin useille laserlevyille. 2000-luvun alkuun mennessä kuitenkin kävi ilmi, että lähes kaikki Domesday-projektin fyysiset mediat olivat rikki tai kadonneet ja tiedot katosivat peruuttamattomasti [6] .
Toinen esimerkki on NASAn Lunar Or -ohjelma , joka on ottanut yksityiskohtaisia valokuvia kuun pinnasta . Kaikki kuvat tallennettiin magneettinauhoille , joita voitiin lukea vain harvinaisella LTO -mallilla [16] . Tästä syystä pääsy materiaaleihin menetettiin useiksi vuosikymmeniksi, ja sitä jatkettiin vasta pitkän aikavälin tietojen analysoinnin ja magneettinauhoille tietoja tallentavien koneiden toimintamekanismin tutkimuksen jälkeen [4] .
Vuonna 1995 Yhdysvaltain hallitus melkein menetti pääsyn joihinkin kansallisiin väestölaskentatietoihin vanhentuneen tiedonhakutekniikan vuoksi [5] .
Vuonna 2019 tuli tunnetuksi, että sosiaalinen verkosto Myspace poisti kaiken sivustolle ladatun musiikin vuosina 2003–2015. Noin 53 miljoonaa tiedostoa on poistettu. Peruuttamaton tietojen menetys aiheutti laajaa julkista vastareaktiota [17] [18] .
Joulukuussa 2018 Mainen hallitus ilmoitti menettäneensä suuren määrän asiakirjoja, jotka kuvernöörien Angus Kingin ja John Baldaccin hallinto oli tuottanut vuosilta 2005–2011 . Kadonneet tiedot sisälsivät suurimman osan ennen vuotta 2008 osavaltion hallituksen puolesta lähetetyistä sähköposteista [3] .
Vuonna 2019 sosiaalinen verkosto Google+ lopetti toimintansa poistamalla yrityksen perustajien ja johtavien työntekijöiden Sundar Pichain , Eric Schmidtin , Sergey Brinin ja Larry Pagen profiilit [19] . Tämä johti tietojen menettämiseen joistakin Googlen historian tärkeimmistä päätöksistä, kuten yrityksen PRISM-ohjelmaa koskevan politiikan selvennyksistä vuonna 2013 [20] .
Yksi tärkeimmistä edellytyksistä sähköisten arkistointikäytäntöjen laajalle leviämiselle on yhteisten standardien kehittäminen digitaalisen aineiston säilyttämiselle. Näin ollen kansainvälinen standardi Open Archival Information System (OAIS) , joka julkaistiin ensimmäisen kerran vuonna 1997, määrittelee lähestymistapoja ja ratkaisuja sähköisen arkistoinnin alalla [21] . OAIS sisältää kuvauksen "arkistopaketista" ja "digitaalisista objekteista". Myöhemmin standardista tuli prototyyppi tuleville aloitteille luoda sähköisiä tietovarastoja , pääsyä olemassa oleviin tietokantoihin ja metatietoihin [22] . Vuonna 2003 OAIS hyväksyttiin kansainväliseksi standardiksi IISO 14721:2003 "Avoimen arkistotietojärjestelmän perusmalli" (Open Archival Information System) l (OAIS) [23] .
Toinen perustavanlaatuinen standardi on DOD 5015.2, joka on luotu useiden kansainvälisten yhteistyöhankkeiden tuloksena InterPARES Project , jonka British Columbian yliopisto aloitti vuosina 1994-1997 yhdessä Yhdysvaltain puolustusministeriön ja Yhdysvaltain kansallisen arkisto- ja asiakirjahallinnon kanssa. [24] [25] [26] [27] .
"Digitaalinen pimeä aikakausi" voidaan estää ottamalla käyttöön useita teknisiä strategioita sähköisten asiakirjojen säilyttämiseksi. Yksi näistä strategioista on säilyttäminen – materiaalien työstäminen alkuperäisessä muodossa ja alkuperäisellä medialla. Tämän seurauksena alkuperäiset tiedot ovat saatavilla alkuperäisessä muodossa [28] .
Muita arkistointimenetelmiä ovat emulointi (toiminnallisen järjestelmän toisto, joka mahdollistaa pääsyn vanhentuneisiin tiedostoihin ja muotoihin) [21] [28] , kapselointi (asiakirjan teknisen kuvauksen sisällyttäminen itse digitaaliseen objektiin, mikä vähentää sen riippuvuutta ulkoisesta ympäristö) [21] [29] sekä migraatio (sähköisten asiakirjojen siirto muihin tietovälineisiin tai toiseen käyttöjärjestelmään, esimerkiksi magneettinauhalta CD-levylle). Jälkimmäinen menetelmä on yksi suosituimmista, koska sen avulla voit säilyttää digitaalisen materiaalin eheyden ja käyttäjien kyvyn löytää ja käyttää tietoa, eikä se ole riippuvainen teknologioiden vanhentumisesta [28] [30] [31] . Joissakin tapauksissa käytetään digitaalista arkeologiaa tai sellaisten elektronisten esineiden pelastusta, jotka ovat tulleet saavuttamattomiksi teknologisen vanhenemisen ja/tai fyysisen huonontumisen vuoksi. Korkeiden kustannusten ja takaisinperintää koskevien takeiden puutteen vuoksi tällaisen menetelmän käyttöä pidetään kuitenkin yleensä tarpeellisena toimenpiteenä [31] [21] .
Vuonna 1996 amerikkalainen tietokoneohjelmoija Brewster Cale perusti voittoa tavoittelemattoman Internet-arkiston San Franciscoon . "Arkiston" toiminnan tarkoituksena on arkistoida kaikki Internetissä koskaan julkaistut tiedot. Kokoelma koostuu useista arkistoiduista verkkosivuista, digitoiduista kirjoista, ääni- ja videotiedostoista, peleistä, ohjelmistoista. Vuonna 2001 Cale lanseerasi erillisen palvelun, Wayback Machinen , joka tallentaa verkkosivut hakurobottien tai indeksointirobottien avulla [32] . Arkistoidut kuvat näytetään HTML- , JavaScript- ja CSS -muodossa [33] [34] . Heinäkuussa 2021 Wayback Machine tarjosi pääsyn yli 591 miljardille tallennetulle verkkosivulle [35] [36] .
Muita vastaavia projekteja ovat Harvard Law School Library -portaali Perma.cc [37] , archive.today [38] ja WebCite [39] .
Vuonna 2007 Ison-Britannian kansallisarkisto ja Microsoft ilmoittivat yhteistyön aloittamisesta tietojen arkistoinnin alalla. Osana yhteistä projektia yritys työskenteli British Libraryn kanssa asentaakseen Virtual PC :n, visualisointiohjelmistopaketin, jonka avulla käyttäjät voivat käyttää useita käyttöjärjestelmiä samanaikaisesti ja käyttää vanhaa Microsoft Office -muotoa . Siten vain Ison-Britannian arkistoissa on noin 580 teratavua tietoa Officen vanhemmista versioista [40] .
Vuonna 2018 Davosissa järjestetyn vuotuisen Maailman talousfoorumin tulosten jälkeen päätettiin perustaa Global Center for Cybersecurity. Keskuksen toiminnalla pyritään estämään digitaalisen pimeän aikakauden alkamista [41] . Digitaaliset säilytyspalvelut, kuten LOCKSS , HathiTrust ja Portico [42] , työskentelevät elektronisten materiaalien pitkäaikaisessa hallinnassa ja ylläpidossa .
Osana taistelua digitaalisen tiedon häviämistä vastaan monet julkaisut arkistoivat omia lehtiään. Esimerkiksi The Economist on toimittanut sähköisiä kopioita jokaisesta numerosta sen ensimmäisen numeron jälkeen vuonna 1843 [43] , ja The New York Times on käynnistänyt projektin online-sisällön säilyttämiseksi. Sanomalehden virallisilla verkkosivuilla on kopio HTML - sivuista niiden ensimmäisestä julkaisuhetkestä lähtien, mutta malli säilyy [44] .
Yksi ensimmäisistä organisaatioista, joka kehitti sähköpostin säilytyskäytäntöjä, oli Smithsonian Institution Archives . Arkisto säilyttää kokoelmissaan 1980-luvulta peräisin olevia sähköpostitietueita, jotka on luotu ELM :llä [45] . Library of Congressin johdolla National Digital Information Infrastructure and Preservation Program oli arkistointiohjelma, joka jakoi tietoa digitaalisen tiedon säilyttämisen ongelmista [46] .
Tieteellisten töiden arkistointiin osallistuvat projektit, kuten Jstor , DSpace [47] , arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [48] . Lokakuussa 2021 Directory of Open Access Journals sisältää yli 16 900 avoimen pääsyn lehteä ja yli 5 miljoonaa artikkelia [49] .
Yksittäiset tutkijat ja toimittajat huomauttavat, että arkipäiväinen digitaalinen data ei tarvitse lisäarkistointia, koska Internet on jo täynnä tietoa, jota ihmiset lisäävät sosiaalisen median tileilleen. Siksi seuraavilla sukupolvilla ei ole ongelmia tiedonsaannissa [50] . Toiset ovat kritisoineet termiä sen oletetun "hälyttävän" luonteen vuoksi. Tämän teorian kannattajien mukaan tietojen säilyttämisen alalla on jo tapahtunut merkittävää edistystä, ja tällaisen retoriikan käyttö vain liioittelee ongelmaa ja vääristää tarkoituksella tilannetta [51] .