Projekti Gutenberg | |
---|---|
Englanti Projekti Gutenberg | |
URL-osoite | gutenberg.org |
kaupallinen | Ei |
Sivuston tyyppi | Digitaalinen kirjasto |
Rekisteröinti | on ilmainen |
Kieli (kielet) | Englanti |
Omistaja | Projekti Gutenberg |
Tekijä | Michael Hart |
Työn alku | 1971 |
Nykyinen tila | toimii |
Maa | |
Mediatiedostot Wikimedia Commonsissa |
Project Gutenberg ( englanniksi Project Gutenberg tai PG ) on voittoa tavoittelematon julkinen aloite, jonka tarkoituksena on luoda ja levittää julkisesti saatavilla olevaa digitaalista kokoelmaa . Gutenbergiä pidetään maailman vanhimpana digitaalisena kirjastona. Suurin osa teoksista on vapaaehtoisten digitoimia, ja ne ovat ladattavissa ilmaiseksi.
Projekti luotiin 4. heinäkuuta 1971, kun Illinoisin yliopiston opiskelija Michael Hart kirjoitti käsin Yhdysvaltain itsenäisyysjulistuksen tekstin ja lähetti sen muille käyttäjilleen ARPANETin tuolloin 15 solmusta koostuvan verkkonsa käyttäjille . Internetin edeltäjä [1] [2] . Seuraavien 20 vuoden aikana Hart painoi uudelleen noin 100 kirjaa. Internetin leviämisen myötä 1990-luvun alussa yliopistojen vapaaehtoistyöntekijät ja jo 2000-luvulla Distributed Proofreaders -järjestöt liittyivät teosten digitalisointiin . Hart hoiti hallintotyötä ja varainhankintaa ylläpitääkseen verkkosivustoa. Vuonna 1997 kokoelman teoksia oli 1000, vuonna 2003 - 10 000 , vuonna 2011 - 40 000 . Vuodelle 2021 hankkeen kokoelmassa on yli 60 000 kirjaa [1] .
Kaikki sähköiset tekstit digitoidaan 7-bittisellä amerikkalaisella standardinmukaisella ASCII -koodilla nimeltä Plain Vanilla. Tämä muoto on luettavissa kaikilla laitteilla ja on yhteensopiva 99 %:n ohjelmiston kanssa. Projekti Gutenberg luo myös 7-bittisen ASCII-version, jossa on aksenttimerkit [3] kirjoille, joissa on aksenttimerkkejä, kuten saksan ja ranskan kielellä . Plain Vanilla ASCII:n lisäksi Gutenberg käyttää muita muotoja, mukaan lukien HTML , XML , RTF , Unicode [3] .
Projektin virallinen luomispäivä on 4. heinäkuuta 1971, jolloin Illinoisin yliopiston opiskelija Michael Hart kirjoitti manuaalisesti uudelleen Yhdysvaltain itsenäisyysjulistuksen tekstin ja lähetti sen muille ARPANET -verkon käyttäjille . 15 solmua ja noin 100 rekisteröityä käyttäjää [2] . Tuolloin 5 kilotavun tiedoston lähettäminen olisi aiheuttanut verkkokatkoksen, joten Hart lähetti digitaalisen tekstin tallennuspaikan, jonka jälkeen kuusi käyttäjää latasi sen [3] [4] .
Projektin toteuttaminen tuli mahdolliseksi, koska Hart sai mahdollisuuden työskennellä Xerox Sigma 5 -mainframe tietokoneen kanssa - myöhemmin projektin luoja arvioi, että hänelle osoitettu tietokoneaika oli noin 100 miljoonaa dollaria . Opiskelija halusi viettää tämän ajan "kannattavaan" projektiin, mutta häntä ei kiinnostanut tietojenkäsittely - tuolloin tietokoneiden pääalue [5] [6] .
Michael Hartin kirjallisesta haastattelusta [4]Pysähdyin vahingossa matkan varrella paikalliseen IGA-ruokakauppaamme. Amerikan 200 - vuotisjuhla oli juuri tulossa , ja tuotteiden rinnalle laitettiin minulle tekopergamentista tehtyjä historiallisia dokumentteja. Joten kun kaivelin repussani jotain syötävää, löysin Yhdysvaltain itsenäisyysjulistuksen ja päähäni iski idea. Mietin hetken, voisinko keksiä jotain, mitä voisin tehdä tietokoneella, joka olisi tärkeämpää kuin itsenäisyysjulistuksen antaminen - jotain, joka olisi olemassa vielä 100 vuoden kuluttua. En kuitenkaan voinut ajatella mitään, ja Project Gutenberg syntyi.
Hartia kutsutaan "ensimmäiseksi tiedon tarjoajaksi", koska hän alkoi ymmärtää verkkoa uudenlaisena joukkomediana lähes 20 vuotta ennen kuin Tim Berners-Lee muotoili World Wide Webin käsitteen [7] . Itsenäisyysjulistus oli ensimmäinen e-kirja maailmassa [4] . Myöhemmin Hart alkoi etsiä ja digitoida kirjaston kirjoja, jotka olivat jo julkisia . Pohjimmiltaan nämä olivat Yhdysvaltojen historian perusteoksia - Bill of Rights , Constitution , King James Bible , William Shakespearen täydelliset teokset, Lewis Carrollin " Liisa ihmemaassa , " Peter Pan " James Barry ja muut teokset. Kaikki nämä kirjat digitoitiin käsin, Hart ja vapaaehtoiset kirjoittivat koneella [8] [7] [3] [9] .
Projektin filosofia perustuu uskomukseen, että tietotekniikan suurin arvo on tiedon säilyttämisessä ja levittämisessä. Projektin alkuperäinen tavoite oli digitoida 10 000 suosituinta kirjaa [10] .
Internetin kehityksen ja laajan käyttöönoton myötä 1980-luvun lopulla projekti saavutti suuren suosion. Vuoteen 1990 mennessä Illinoisin yliopistoon perustettiin vapaaehtoispiiri auttamaan Hartia kirjoittamaan tekstejä. Heidän työnsä nopeus kiihtyi vähitellen, ja vuoteen 1995 mennessä projektin kokoelmaa täydennettiin keskimäärin 16 tekstillä kuukaudessa. Samaan aikaan otettiin käyttöön optinen merkintunnistustekniikka . 1990-luvulla hankkeen ensimmäinen verkkosivusto luotiin ja Pittsburghin Carnegie Mellon -yliopiston kanssa tehtiin sopimus hankkeen rahoituksesta [7] .
2000-luvun alussa Charles Franksin vuonna 2000 perustama Distributed Proofreaders -liike alkoi auttaa projektia . Yli tuhat vapaaehtoista useissa maissa työskenteli tuottamaan ja julkaisemaan verkkotekstejä julkisesti, joilla oli merkittävää kulttuurista merkitystä. Tämän yhteistyön ansiosta Gutenbergin luettelo sai vuonna 2017 150-200 kirjaa kuukaudessa [7] . Vertailun vuoksi, vuoden 2004 ensimmäisten 11 viikon aikana Gutenberg-projekti lisäsi 313 uutta e-kirjaa, kun taas ensimmäisten 313 e-kirjan valmistuminen kesti noin 26 vuotta [4] . Kevääseen 2002 mennessä hankkeen kokoelma sisälsi lähes neljänneksen kaikista Internetissä saatavilla olevista julkisista teoksista [3] . Jo lokakuussa 2003 hankkeessa oli 10 000 e-kirjaa [11] .
Vuonna 2007 Wattpad ja Gutenberg kehittivät ja käynnistivät yhdessä projektin, jossa 17 000 kirjaa oli ladattavissa useimmilla matkapuhelimilla [12] .
2000-luvun alussa Michael Hart yritti yhdessä World eBook Libraryn perustajan John Guallardon kanssa käynnistää Project Gutenberg 2:n. Aloitetta ei kuitenkaan toteutettu, koska hanke sisälsi yksittäisten teosten maksullisia latauksia, mikä ei herättänyt innostusta. käyttäjien keskuudessa [10] .
Hart kuoli vuonna 2011. Vuonna 2021 projektin toimitusjohtaja oli Gregory Newby [13] [14] .
Hanke harjoittaa julkisesti saatavilla olevien teosten digitalisointia. Kokoelman täydennysprosessi tapahtuu kolmessa päävaiheessa - skannauksen, tunnistuksen ja korjauksen kautta. Kun teoksen oikeudellinen asema ja sen lisensoitu puhtaus on ratkaistu, projektin osallistujat skannaavat asiakirjan ja suorittavat optisen merkintunnistusohjelman . Tämän jälkeen vapaaehtoiset tarkistavat, lukevat uudelleen ja korjaavat tekstin vertaamalla sitä sekä skannattuun versioon että alkuperäiseen sivuun. Vapaaehtoiset löytävät keskimäärin noin 10 virhettä sivua kohden jopa parannetulla OCR-ohjelmistolla. Jokaisen kirjan tarkistaa kaksi erilaista vapaaehtoista, jotka tekevät tarvittavat korjaukset. Jos alkuperäinen teos on huonokuntoinen, mitä usein tapahtuu vanhojen kirjojen kanssa, teksti syötetään käsin. Projektihenkilöstö on vakuuttunut siitä, että ihmisten tekemä korjausaste on yksi tärkeimmistä, koska pelkkä teoksen skannaus ja sen saattaminen julkisuuteen ei mahdollista tekstien hakua [3] [15] . Yhden tekstin työstämiseen kuluu keskimäärin noin 50 tuntia [3] .
Kaikki sähköiset tekstit digitoidaan 7-bittisellä amerikkalaisella standardinmukaisella ASCII -koodilla nimeltä Plain Vanilla. Tämä muoto on luettavissa kaikilla laitteilla ja on yhteensopiva 99 %:n ohjelmiston kanssa. Projekti Gutenberg luo myös 7-bittisen ASCII-version, jossa on aksenttimerkit [3] kirjoille, joissa on aksenttimerkkejä, kuten saksan ja ranskan kielellä . Plain Vanilla ASCII:n lisäksi Gutenberg käyttää muita muotoja, mukaan lukien HTML , XML , RTF , Unicode [3] .
Näemme e-kirjoja uutena välineenä, jolla ei ole todellista yhteyttä paperiin, paitsi saman sisällön esittämiseen. En kuitenkaan ymmärrä, miten paperi voi kilpailla sähköisten versioiden kanssa, varsinkin jos jokainen löytää oman kätevän tavan käyttää sähköisiä tekstejä varsinkin kouluissa.Michael Hart [3]
Tekstintunnistuksen avulla käyttäjät voivat etsiä kirjallisuutta hakutoiminnolla, joka on käytettävissä missä tahansa selaimessa ja missä tahansa tekstinkäsittelyohjelmassa. Tarkennetussa haussa voit täyttää useita kenttiä: tekijä, otsikko, aihe, kieli, luokka (mikä tahansa, äänikirja, musiikki, kuvat), LoCC ( Library of Congress katalogiluokitus ), tiedostotyyppi (teksti, PDF, HTML, XML , JPEG jne.) e.) ja sähköisen tekstin/e-kirjan numero [3] . Teoksen lukeminen verkossa tai lataaminen ei vaadi maksua tai rekisteröitymistä [10] .
Portaalipalvelimet sijaitsevat ja rekisteröityvät Yhdysvalloissa. Tästä syystä tekijänoikeuden määrittämiseen käytetään Yhdysvaltain lakia . Tekijänoikeuslaki on kuitenkin hajanainen ja voi vaihdella huomattavasti lainkäyttöalueen mukaan. Tämä voi johtaa siihen, että Yhdysvalloissa oleva vapaasti jaettava kirja on tekijänoikeudella suojattu toisessa maassa. Portaalissa kuvataan erityisesti "käyttöehdot", joissa määrätään, että Yhdysvaltojen ulkopuolella olevien käyttäjien tulee tarkistaa maansa tekijänoikeusehdot ennen e-kirjojen lataamista tai jakelua projektista [16] .
LukotHanketta vastaan nostettiin vuonna 2015 oikeusjuttu Saksassa tekijänoikeuksien noudattamatta jättämisen vuoksi kirjaston kokoelmassa olevien 18 saksalaisen julkaisun osalta, jotka olivat vapaasti saatavilla Yhdysvalloissa, mutta olivat samanaikaisesti tekijänoikeudella suojattuja Saksassa [16] . Kanne nostettiin kustantajien S. Fischer Verlag and GmbH:n puolesta, jonka omistaa Holtzbrinck Publishing Group [17] . Saksalainen tuomioistuin päätti 9. helmikuuta 2018, että Gutenbergin on estettävä pääsy 18 teokseen, toimitettava luettelo käyttäjistä, jotka ovat ladanneet nämä teokset, ja maksettava osa kantajan oikeudenkäyntikuluista. Vastauksena sivusto esti väliaikaisesti kaikki IP-osoitteet Saksasta [18] [19] .
Italian Internet-palveluntarjoajat estivät Gutenberg-projektin vuonna 2020 tekijänoikeusrikkomussyytösten vuoksi [20] .
vuosi | Digitalisoituja kirjoja |
---|---|
1997 | 1000 |
1999 | 2000 |
2000 | 3000 |
2001 | 4000 |
2002 | 5000 |
2003 | 10 000 |
2005 | 15 000 |
2008 | 24 000 |
2009 | 34 000 |
2015 | 48 000 |
2018 | 56 000 |
2021 | 60 000 |
Vuodesta 1991 vuoteen 1996 julkaistujen teosten määrä noin kaksinkertaistui. Kirjojen digitalisoinnin lisäksi Michael Hart alkoi koordinoida kymmenien vapaaehtoisten työtä [3] . Elokuussa 1998 Hart asetti itselleen tavoitteen laittaa verkkoon noin 10 000 sähköistä tekstiä, ja lokakuuhun 2003 mennessä hän oli saavuttanut sen. Seuraava tavoite oli 1 000 000 teoksen digitalisointi [3] .
Vuonna 1993 kokoelma jaettiin kolmeen pääluokkaan: "kevyt kirjallisuus" (enimmäkseen kaunokirjallisuus); "raskas kirjallisuus", kuten Raamattu , Shakespeare tai Moby Dick ; sekä "viitekirjallisuus" - Rogerin tesaurus sekä joukko tietosanakirjoja ja sanakirjoja [3] [9] .
Tammikuussa 2005 hankkeen kokoelmaan kuului 15 000 e-kirjaa ja vuonna 2015 yli 49 200 ilmaista e-kirjaa, jotka kaikki olivat aiemmin arvostettujen kustantajien julkaisemia [10] .
Koska hanke sijaitsee Yhdysvalloissa, se oli alun perin suunnattu englanninkieliselle yleisölle ja digitoi kirjoja yksinomaan englanniksi. Lokakuusta 1997 lähtien Hart on kuitenkin päättänyt laajentaa kokoelmaansa ja julkaista e-kirjoja muilla kielillä, pääasiassa englanniksi, ranskaksi, saksaksi, espanjaksi, suomeksi, hollanniksi ja kiinaksi [3] . Jo vuoteen 2004 mennessä kokoelman teoksia esiteltiin 25 kielellä ja heinäkuussa 2005 - 42 kielellä, mukaan lukien irokeesi- , sanskrit- , maya -kieli [3] .
Huhtikuussa 1995 ensimmäiset kuvat ilmestyivät Gutenbergin kokoelmaan - ranskalaiset luolamaalaukset , jotka marraskuussa 2000 tulivat yleisön saataville XHTML -muodossa [3] .
CD ja DVDElokuussa 2003 Gutenberg julkaisi CD :n "Best of Gutenberg", jossa on 600 kirjaston kokoelman suosituinta teosta. Joulukuussa 2003 DVD "Project Gutenberg" koottiin 9400 nimikkeellä - mikä tuolloin vastasi lähes koko "Gutenbergin" kokoelmaa. Heinäkuussa 2007 julkaistiin uusi DVD-versio, jossa oli 17 000 kirjaa, ja huhtikuussa 2010 päivitetty kaksikerroksinen DVD , jossa on 30 000 teosta. Käyttäjät voivat ladata ISO-kuvia tai pyytää ilmaisen kopion postitse. Lokakuuhun 2010 mennessä projekti on lähettänyt noin 40 000 levyä. Vuodelle 2021 ISO-otokset ovat ladattavissa, mutta CD-levyjen ilmainen toimitus on lopetettu [21] [22] .
Projektin kokoelmaa pidetään maailman vanhimpana elektronisena kirjastona, ja Michael Hart on ensimmäisen digitaalisen kirjan luoja [3] [9] . Kirjasto toimi prototyyppinä useille muille projekteille, mukaan lukien [23] [3] :
Gutenberg tekee myös yhteistyötä Internet-arkiston ja LibriVoxin kanssa [31] .
Useat aloitteet ovat jo päättyneet - Project Gutenberg Filippiineillä, Project Europe, jota johtaa serbialainen Rastko Project, Project Gutenberg Russia (kutsutaan myös "Rutenbergiksi" Venäjän keskiaikaisen eurooppalaisen Ruthenia -nimen mukaan ), Project Gutenberg Taiwanissa , valvoo e-kirjojen kokoelmaa englanniksi ja kiinaksi [32] [3] .
Vuonna 2016 julkaistiin Android - sovellus, joka perustuu Gutenberg-kokoelmaan [33] .
Erilliset hankkeet harjoittavat hankkeen digitalisoitujen teosten muuntamista muihin sähköisiin muotoihin. Siten Blackmask Online muuntaa teoksia kahdeksaan eri muotoon Open eBookin pohjalta . Manybooks.net on muuntanut Projektin e-kirjat PDA -luetettaviin muotoihin . Bookshare , Yhdysvaltojen johtava näkövammaisten digitaalinen kirjasto, muuntaa kirjat pistekirjoitukseksi ja DAISY -kirjoitukseksi [3] . LibriVox -projekti käyttää monia tekstejä äänikirjojen luomiseen [34] .
Sosiaalisissa verkostoissa | ||||
---|---|---|---|---|
Temaattiset sivustot | ||||
Sanakirjat ja tietosanakirjat | ||||
|
laitteet ja asiakirjat ) | E-kirjat (|
---|---|
Laitesarja | |
Tiedostomuodot | |
Katalogit | |
Kirjastot | |
Katso myös |