Gutenberg projekt | |
---|---|
angol Gutenberg projekt | |
URL | gutenberg.org |
Kereskedelmi | Nem |
Webhely típusa | Digitális Könyvtár |
Bejegyzés | ingyenes |
nyelvek) | angol |
Tulajdonos | Gutenberg projekt |
Szerző | Michael Hart |
A munka kezdete | 1971 |
Jelenlegi állapot | művek |
Ország | |
Médiafájlok a Wikimedia Commons oldalon |
A Project Gutenberg ( angolul Project Gutenberg , vagy PG ) egy nyilvános, non-profit kezdeményezés, amelynek célja a közkincsben lévő művek digitális gyűjteményének létrehozása és terjesztése . Gutenberg a világ legrégebbi digitális könyvtára. A legtöbb alkotást önkéntesek digitalizálták, és ingyenesen letölthetők.
A projekt 1971. július 4-én jött létre, amikor az Illinoisi Egyetem hallgatója, Michael Hart kézzel begépelte az Egyesült Államok Függetlenségi Nyilatkozatának szövegét, és elküldte az akkori ARPANET 15 csomópontjából álló hálózatának többi felhasználójának. az internet őse [1] [2] . A következő 20 év során Hart mintegy 100 könyvet adott ki újra. Az 1990-es évek elején az internet elterjedésével egyetemi önkéntesek és már a 2000-es években a Distributed Proofreaders szervezetek is bekapcsolódtak a művek digitalizálásába . Hart adminisztratív munkát és adománygyűjtést végzett a webhely működésének fenntartása érdekében. 1997-ben 1000, 2003-ban 10 000 , 2011-ben 40 000 mű volt a gyűjteményben . 2021-re a projekt több mint 60 000 könyvet tartalmaz [1] .
Az összes elektronikus szöveget a 7 bites amerikai szabványos ASCII kóddal , Plain Vanilla digitalizálják. Ez a formátum bármely eszközön olvasható, és bármilyen szoftver 99%-ával kompatibilis. Az ékezetes karaktereket tartalmazó könyvekhez, például a német és a francia nyelvűekhez, a Project Gutenberg egy 7 bites, ékezetes ASCII-verziót is készít [3] . A Plain Vanilla ASCII mellett a Gutenberg más formátumokat is használ, köztük a HTML , XML , RTF , Unicode [3] formátumot .
A projekt létrehozásának hivatalos dátuma 1971. július 4., amikor az Illinoisi Egyetem egyik hallgatója, Michael Hart manuálisan újragépelte az Egyesült Államok Függetlenségi Nyilatkozatának szövegét, és elküldte az ARPANET hálózat többi felhasználójának. 15 csomópont és körülbelül 100 regisztrált felhasználó [2] . Akkoriban egy 5 kilobájtos fájl elküldése hálózati kimaradást okozott volna, ezért Hart kiküldött egy digitális szövegtároló helyet, ami után azt hat felhasználó töltötte le [3] [4] .
A projekt megvalósítása annak köszönhetően vált lehetségessé, hogy Hart lehetőséget kapott a Xerox Sigma 5 mainframe -mel dolgozni - később a projekt létrehozója úgy vélte, hogy a neki szánt számítógépes idő körülbelül 100 millió dollárt ér . A hallgató ezt az időt egy "érdemes" projekttel akarta tölteni, de nem vonzotta az adatfeldolgozás - akkoriban a számítógépek fő területe [5] [6] .
Michael Hart írásos interjújából [4]Véletlenül megálltam útközben a helyi IGA élelmiszerboltunknál. Épp Amerika bicentenáriumának megünneplése volt , és a termékek mellé műpergamenből készült történelmi dokumentumokat is tettek nekem. Így hát miközben a hátizsákomban turkáltam valami ennivaló után, megtaláltam az Egyesült Államok Függetlenségi Nyilatkozatát, és egy ötlet jutott a fejembe. Egy ideig azon töprengtem, hogy ki tudnék-e találni valamit, amit meg tudnék csinálni egy számítógéppel, ami fontosabb lenne, mint a Függetlenségi Nyilatkozat kiadása – valami olyasmi, ami még 100 év múlva is ott lesz. Azonban nem jutott eszembe semmi, és megszületett a Project Gutenberg.
Hartot "az első információszolgáltatónak" nevezik, mivel csaknem 20 évvel azelőtt Tim Berners-Lee megfogalmazta a World Wide Web koncepcióját [7] , hogy a webet újfajta tömegmédiaként kezdte megérteni . A Függetlenségi Nyilatkozat volt a világ első e-könyve [4] . Ezt követően Hart elkezdte felkutatni és digitalizálni a már nyilvános könyvtári könyveket . Alapvetően ezek voltak az Egyesült Államok történelmének alapvető alkotásai – a Bill of Rights , az Alkotmány , a King James Biblia , William Shakespeare teljes művei, Lewis Carroll „ Alice Csodaországban , „ Pán Péter ”. James Barry és más művek. Mindezeket a könyveket kézzel digitalizálták, Hart és önkéntesek gépelték [8] [7] [3] [9] .
A projekt filozófiája azon a meggyőződésen alapul, hogy a számítástechnika legnagyobb értéke az információk megőrzésében és terjesztésében rejlik. A projekt eredeti célja a 10 000 legnépszerűbb könyv digitalizálása volt [10] .
Az 1980-as évek végén az internet fejlődésével és széles körű bevezetésével a projekt nagy népszerűségre tett szert. 1990-re az Illinoisi Egyetemen önkéntes kört hoztak létre, hogy segítsenek Hartnak szövegeket írni. Munkájuk sebessége fokozatosan nőtt, és 1995-re havonta átlagosan 16 szöveggel bővült a projekt gyűjteménye. Ezzel egyidőben bevezették az optikai karakterfelismerő technológiát is . Az 1990-es években létrehozták a projekt első weboldalát, és megállapodást kötöttek a pittsburghi Carnegie Mellon Egyetemmel a projekt pénzügyeinek átvételéről [7] .
A 2000-es évek elején a Charles Franks által 2000-ben alapított Distributed Proofreaders mozgalom elkezdte segíteni a projektet . Több országban több mint ezer önkéntes dolgozott azon, hogy jelentős kulturális jelentőséggel bíró online szövegeket hozzon létre és tegye közzé a nyilvánosság számára. Ennek az együttműködésnek köszönhetően 2017-ben havonta 150-200 könyv érkezett a Gutenberg-katalógusba [7] . Összehasonlításképpen: 2004 első 11 hetében a Project Gutenberg 313 új e-könyvet adott hozzá, míg az első 313 e-könyv elkészítése hozzávetőlegesen 26 évig tartott [4] . 2002 tavaszára a projekt gyűjteménye az interneten elérhető összes köztulajdonban lévő alkotás közel negyedét tartalmazta [3] . A projektnek már 2003 októberében 10 000 e-könyve volt [11] .
2007-ben a Wattpad és Gutenberg közösen kidolgozott és elindított egy projektet, amely 17 000 könyvet tett letölthetővé a legtöbb mobiltelefonra [12] .
A 2000-es évek elején Michael Hart a World eBook Library alapítójával, John Guallardóval együtt megpróbálta elindítani a Project Gutenberg 2-t. A kezdeményezés azonban nem valósult meg, mert a projekt az egyes művek fizetős letöltését jelentette, ami nem váltott ki lelkesedést. felhasználók között [10] .
Hart 2011-ben elhunyt. 2021-ben a projekt vezérigazgatója Gregory Newby [13] [14] volt .
A projekt nyilvánosan elérhető művek digitalizálásával foglalkozik. A gyűjtemény feltöltésének folyamata három fő szakaszban történik - szkennelés, felismerés és javítás révén. A mű jogi státuszával és engedélyezett tisztaságával kapcsolatos probléma megoldása után a projekt résztvevői beszkennelik a dokumentumot, és futtatják az optikai karakterfelismerő programot . Az önkéntesek ezután ellenőrzik, újraolvassák és kijavítják a szöveget, összehasonlítva a beolvasott verzióval és az eredeti oldallal. Átlagosan még továbbfejlesztett OCR-szoftver mellett is körülbelül 10 hibát találnak az önkéntesek oldalanként. Minden könyvet két különböző önkéntes ellenőriz, akik elvégzik a szükséges javításokat. Abban az esetben, ha az eredeti mű rossz állapotban van, ami gyakran előfordul a régi könyveknél, a szöveg manuálisan kerül beírásra. A projekt munkatársai meg vannak győződve arról, hogy az emberek általi javítás szakasza az egyik legfontosabb, hiszen a mű egyszerű beszkennelése és közkinccsé tétele nem teszi lehetővé a szövegek közötti keresést [3] [15] . Átlagosan körülbelül 50 órát vesz igénybe egy szövegen dolgozni [3] .
Az összes elektronikus szöveget a 7 bites amerikai szabványos ASCII kóddal , Plain Vanilla digitalizálják. Ez a formátum bármely eszközön olvasható, és bármilyen szoftver 99%-ával kompatibilis. Az ékezetes karaktereket tartalmazó könyvekhez, például a német és a francia nyelvűekhez, a Project Gutenberg egy 7 bites, ékezetes ASCII-verziót is készít [3] . A Plain Vanilla ASCII mellett a Gutenberg más formátumokat is használ, köztük a HTML , XML , RTF , Unicode [3] formátumot .
Az e-könyvekre úgy tekintünk, mint egy új médiumra, amelynek nincs valódi kapcsolata a papírral, csak az azonos tartalom bemutatását. Nem látom azonban, hogy a papír hogyan versenyezhetne az elektronikus változatokkal, különösen, ha mindenki megtalálja a maga kényelmes módját az elektronikus szövegek használatának, különösen az iskolákban.Michael Hart [3]
A szövegfelismeréssel a felhasználók bármely böngészőben és bármilyen szövegszerkesztő szoftverben elérhető kereső funkcióval kereshetnek a szakirodalomban. Az összetett keresésben több mezőt is kitölthet: szerző, cím, tárgy, nyelv, kategória (bármilyen, hangoskönyv, zene, képek), LoCC ( Library of Congress katalógus osztályozás ), fájltípus (szöveg, PDF, HTML, XML , JPEG stb.). e.) és az elektronikus szöveg / e-könyv száma [3] . A mű online olvasásához vagy letöltéséhez sem díj, sem regisztráció nem szükséges [10] .
A portálszerverek az Egyesült Államokban találhatók és regisztráltak. Emiatt az Egyesült Államok törvényei alapján határozzák meg a szerzői jogokat . A szerzői jogi törvény azonban töredezett, és joghatóságonként jelentősen eltérhet. Ez azt eredményezheti, hogy egy köztulajdonban lévő könyv az Egyesült Államokban egy másik országban szerzői jogvédelem alá esik. A portál kifejezetten leírja a „használati feltételeket”, amelyek előírják, hogy az Egyesült Államokon kívüli felhasználóknak ellenőrizniük kell az országukban érvényes szerzői jogi feltételeket, mielőtt letöltenék vagy terjesztenék a projektből származó e-könyveket [16] .
ZárakA projekt ellen 2015-ben pert indítottak Németországban a szerzői jogok be nem tartása miatt a könyvtár gyűjteményében található 18 német kiadvány kapcsán, amelyek az Egyesült Államokban szabadon hozzáférhetők voltak, ugyanakkor Németországban szerzői jogi védelem alatt álltak [16]. . A pert a Holtzbrinck Publishing Group [17] tulajdonában lévő S. Fischer Verlag és GmbH. kiadók nevében nyújtották be . 2018. február 9-én egy német bíróság úgy döntött, hogy Gutenbergnek le kell tiltania a hozzáférést 18 műhöz, meg kell adnia azon felhasználók listáját, akik feltöltötték ezeket a műveket, és meg kell fizetnie a felperes jogi költségeinek egy részét. Válaszul az oldal ideiglenesen blokkolta az összes Németországból érkező IP-címet [18] [19] .
2020-ban a Gutenberg-projektet az olasz internetszolgáltatók blokkolták a szerzői jogok megsértésével kapcsolatos vádak miatt [20] .
Év | Digitalizált könyvek |
---|---|
1997 | 1000 |
1999 | 2000 |
2000 | 3000 |
2001 | 4000 |
2002 | 5000 |
2003 | 10 000 |
2005 | 15 000 |
2008 | 24 000 |
2009 | 34 000 |
2015 | 48 000 |
2018 | 56 000 |
2021 | 60 000 |
1991 és 1996 között a megjelent művek száma megközelítőleg megduplázódott. Michael Hart a könyvek digitalizálása mellett több tucat önkéntes munkáját kezdte koordinálni [3] . 1998 augusztusában Hart azt a célt tűzte ki maga elé, hogy mintegy 10 000 elektronikus szöveget tegyen fel a világhálóra, és 2003 októberére ezt elérte. A következő cél 1 000 000 mű digitalizálása volt [3] .
1993-ban a gyűjteményt három fő kategóriába sorolták: "könnyű irodalom" (főleg szépirodalom); „nehéz irodalom”, mint a Biblia , Shakespeare vagy Moby Dick ; valamint a "referencia irodalom" - Roger tezaurusz , valamint enciklopédiák és szótárak [3] [9] .
2005 januárjában a projekt gyűjteménye 15 000 e-könyvet, 2015-ben pedig több mint 49 200 ingyenes e-könyvet tartalmazott, amelyek mindegyike korábban tekintélyes kiadóknál jelent meg [10] .
Mivel a projekt az USA-ban működik, eredetileg az angol nyelvű közönséget célozta meg, és kizárólag angol nyelvű könyveket digitalizált. 1997 októbere óta azonban Hart úgy döntött, hogy bővíti a gyűjteményt, és más nyelveken is kiad e-könyveit, főleg angol, francia, német, spanyol, finn, holland és kínai nyelven [3] . A gyűjtemény alkotásait már 2004-ben 25, 2005 júliusában pedig 42 nyelven mutatták be, köztük irokéz , szanszkrit , maja nyelven [3] .
1995 áprilisában jelentek meg az első képek a Gutenberg gyűjteményben - French cave paintings , amely 2000 novemberében XHTML formátumban vált elérhetővé a nagyközönség számára [3] .
CD és DVD2003 augusztusában Gutenberg kiadta a "Best of Gutenberg" című CD -t, amely a könyvtár gyűjteményének 600 legnépszerűbb művét tartalmazza. 2003 decemberében a "Project Gutenberg" DVD -t 9400 címmel állították össze - ami akkoriban majdnem a teljes "Gutenberg" gyűjteményt jelentette. 2007 júliusában megjelent egy új DVD-verzió 17 000 könyvvel, 2010 áprilisában pedig egy frissített , kétrétegű DVD , 30 000 művel. A felhasználók letölthetnek ISO képeket , vagy ingyenes másolatot kérhetnek e-mailben. 2010 októberéig a projekt mintegy 40 000 lemezt küldött ki. 2021-re az ISO képfájlok letölthetők, de az ingyenes CD-szállítás megszűnt [21] [22] .
A projekt gyűjteményét a világ legrégebbi elektronikus könyvtárának tekintik, és Michael Hart az első digitális könyv megalkotója [3] [9] . A könyvtár számos más projekt prototípusaként szolgált, köztük [23] [3] :
Gutenberg együttműködik az Internet Archívummal és a LibriVoxszal is [31] .
Számos kezdeményezés már véget ért – a Fülöp-szigeteken a Gutenberg projekt, a Szerb Rastko Project által működtetett Project Europe, a Project Gutenberg Russia (Rutenbergnek is nevezik Oroszország középkori európai elnevezése után a Ruthenia ), a Gutenberg projekt Tajvanon , angol és kínai nyelvű e-könyvek gyűjteményének felügyelete [32] [3] .
2016-ban megjelent egy Android alkalmazás a Gutenberg gyűjtemény alapján [33] .
Külön projektek foglalkoznak a projekt által digitalizált művek más elektronikus formátumba konvertálásával. Így a Blackmask Online nyolc különböző formátumba konvertálja a műveket az Open eBook alapján . A Manybooks.net a projekt e-könyveit PDA -val olvasható formátumokká alakította át . A Bookshare , a látássérültek első számú digitális könyvtára az Egyesült Államokban, a könyveket Braille- és DAISY -írásra alakítja [3] . A LibriVox projekt számos szöveget használ hangoskönyvek létrehozására [34] .
A közösségi hálózatokon | ||||
---|---|---|---|---|
Tematikus oldalak | ||||
Szótárak és enciklopédiák | ||||
|
eszközök és dokumentumok ) | E-könyvek (|
---|---|
Készülék sorozat | |
Fájlformátumok | |
Katalógusok | |
Könyvtárak | |
Lásd még |