Az elektronikus archiválás ( digitális megőrzés ) gyakorlatok, stratégiák és munkafolyamatok összessége az elektronikus dokumentumok elavulása és információvesztés elleni védelmére. A digitális archiválási tevékenység célja a digitális információk integritásának létrehozása, fenntartása és megőrzése. Az elektronikus archiválás gyakorlatára utalva több kifejezést használnak - digitális megőrzés (szó szerint - elektronikus vagy digitális megőrzés), digitális archiválás (elektronikus vagy digitális archiválás) vagy digitális kezelés (digitális adatkezelés). Ezeket a fogalmakat gyakran felcserélhetően használják, de az egyes kifejezések használata országonként eltérő.
Az elektronikus archiválás gyakorlata az 1990-es évek közepén kezdett megjelenni, amikor az információs technológia és az új típusú digitális adathordozók fejlődésével egyre inkább felvetődött a digitális objektumok hosszú távú tárolásának szükségessége. Ennek igénye a digitális adathordozók viszonylag rövid élettartama miatt merült fel - például a hajlékonylemezeken és a memóriakártyákon történő információtárolás megbízhatósága mindössze néhány év, az optikai lemezek esetében pedig 3-20 év. A mágnesszalagok az információtárolás legstabilabb módjai , amelyeken az adatok 15-30 évig megbízhatóan tárolhatók. Az 1990-es évek elejéig a digitális információkat papíralapú másolatokban sokszorosították. Azonban nem minden anyagot archiváltak ilyen módon – a nyilvánosság előtt zárva sok elektronikus dokumentum nem volt archiválás tárgya.
Az elektronikus archiválási tevékenységeket számos elfogadott nemzetközi szabvány és munkacsoport-jelentés szabályozza, beleértve az Open Archival Information System (OAIS) modellt, a Trusted Digital Repository, a Digital Preservation Network (DPN), az InterPARES Project , a PRONOM és mások. A digitális anyagok archiválásának folyamata megőrzési stratégiák (eredeti formátumú anyagokkal és eredeti adathordozón való munka, eredeti technológia vagy korábban használt hardver és szoftver használata), emuláció (egy elavult rendszer funkcionalitásának reprodukálása az elavult anyagokkal való munkavégzés biztosítása érdekében) segítségével történik. adatformátumok), tokozás (a dokumentum műszaki leírásának belefoglalása magába a digitális objektumba, ezáltal csökkentve annak a külső környezettől való függőségét, mivel ez az információ lehetővé teszi az eredeti környezet reprodukálását vagy a dokumentum újba való átvitelét) , migráció (elektronikus dokumentumok átvitele más adathordozóra vagy más operációs rendszerre - például mágnesszalagról CD-re), digitális régészet (olyan anyagok archiválási módszere, amely a technológiai elavulás miatt elérhetetlenné vált digitális tárgyak mentését jelenti és/vagy fizikai leépülés), megújulási stratégiák (transzfer információk egyik tartós adathordozóról a másikra) vagy internetes archiválás ( webhelyek és anyagok összegyűjtésének, megőrzésének és az internetről való kinyerésének folyamata annak érdekében, hogy azokat elektronikus archívumban helyezzék el a jövő generációi számára).
A cselekmények automatizálására tett első próbálkozások a 14. századra vezethetők vissza, amikor feltalálták a harangjátékokat – mechanikus haranglábokat, amelyeket egy pedálmechanizmus vezérel, és a karokat a kívánt sorrendbe állította, ahogy forogtak a fémhengerhez csapokkal történő rögzítés következtében [1]. . Ezt a dobautomatizálási elvet utólag vezették be a textiliparban - a 18. században megalkották az első lyukasztott kártyát vagy papírszalagot, amelyen áthaladtak a siklók [2] . Hamarosan a lyukkártyákat kezdték használni a számítások automatizálására, ezek képezték az alapját Charles Babbage elemzőmotorjának [3] , majd később az első generációs tabulátoroknak és számítógépeknek [4] [5] .
Az 1970-es évekig a lyukkártyákat széles körben használták adatok tárolására és bevitelére – akár 80 karaktert is lehetett rájuk kódolni. A számítógépek gyors fejlődése azonban az adatok tárolásának és automatizálásának alternatív módjainak megjelenéséhez vezetett [6] . 1954-ben elkészült az első mágneses adathordozó, az IBM 350 , 1956-ban pedig a merevlemez [7] . A lyukkártyát már az 1960-as években felváltotta a mágnesszalag , amely a rögzítés és az automatizált információfeldolgozás vezető módszerévé vált [8] [9] . Az információk tárolására és rögzítésére szolgáló mágneslemezek és flash memóriák fejlesztésével és bevezetésével ezek kapacitása és teljesítménye jelentősen megnőtt. Megjelent azonban az adathordozók törékenységének problémája, ami negatívan befolyásolta az adatok biztonságát. Így a mágneslemezeken és flash kártyákon történő információtárolás megbízhatósága csak néhány év – ezek az adathordozók instabilak mind 100 ℃ feletti hőmérsékleten, mind erős elektromágneses mezőben . Az optikai lemezeken lévő információk fokozatosan törlődnek 50-70 ℃ hatására, 3-20 évig képesek tárolni az adatokat. Az információtárolás legmegbízhatóbb módjai a mágnesszalagok, amelyeken 15-30 évig tárolhatók az adatok [10] .
Az információs technológia és az új típusú digitális médiák fejlődésével egyre aktuálisabbá vált az elektronikus információk hosszú távú tárolásának kérdése. Az 1990-es évek elejéig a legtöbb digitális információ papíralapú másolatokon készült. Azonban nem minden anyagot archiváltak ilyen módon, és sok elektronikus dokumentumot nem kellett papíron archiválni, mivel a nyilvánosság elől elzárták [11] [12] . Az első elektronikus archiválási projektek az 1990-es évek második felében kezdtek megjelenni. Így 1996-ban az ausztrál projekt, a Preserving Access to Digital Information (PADI) állami támogatást kapott. Végrehajtásával az Ausztrál Nemzeti Könyvtárat bízták meg . A PADI a legkülönfélébb témákban publikált projektjelentéseket és folyóiratcikkeket, és a digitális megőrzés területén szakmai közösség is kialakult [13] . Ugyanebben az évben indult a Brewster Keil által alapított Internet Archívum [14] webarchiválási projekt , a Svéd Nemzeti Könyvtár (Kulturarw Heritage Project) és az Ausztrál Nemzeti Könyvtár (PANDORA Project) projektjei [15] . 1998-ban számos európai nemzeti könyvtár megalakította a Networked European Deposit Library-t (NEDLIB) az elektronikus objektumok könyvtári rendszerben való megőrzésére [16] . Ezzel egy időben a hatékony archiválási stratégiák kidolgozását célzó projektek is elkezdődtek – az Arts and Humanities Data Service (1999) és a Project CAMiLEON (1999). A 2000-es évektől mindenhol bevezették az elektronikus adatmegőrzési gyakorlatot. Így 2000-ben a Kongresszusi Könyvtár kezdeményezte a Minerva Initiative kezdeményezést az elektronikus információk gyűjtésére és archiválására, a holland Digital Preservation Testbed projekt pedig a digitális információk megőrzését célzó nemzeti program részévé vált. 2001-ben megalakult a Digital Preservation Coalition – szervezetek koalíciója az Egyesült Királyságban és más országokban az elektronikus archiválási gyakorlatok megvalósítására. 2006-ban egy hasonló projektet alapítottak - a Digital Preservation Europe [17] [18] .
A világszerte alkalmazott e-archiválási stratégiák megváltoztatták az információk archiválásáért hagyományosan felelős könyvtárak, archívumok és kiadók szerepét. A 2000-es évektől magánszervezetek, tudományos adatközpontok, non-profit szervezetek is részt vesznek az elektronikus iratok megőrzésében [19] .
2003-ban az UNESCO megkísérelte egyesíteni a nemzetközi erőfeszítéseket az elektronikus archiválás szisztematikus megközelítésének megteremtésére a Digitális megőrzési charta közzétételével, felhívva a világ közösségét, hogy hajtson végre stratégiákat a veszélyeztetett elektronikus objektumok megőrzésére. 2012-ben az UNESCO Világemlékezet programjának konferenciáján ismételten elhangzott, hogy egységes nemzetközi erőfeszítésre van szükség az elektronikus örökség megőrzésére és hozzáférésének biztosítására. Ennek eredményeként jött létre 2013-ban a PERSIST program, amelynek célja a világ dokumentumfilmes örökségének megőrzése [20] [21] .
A digitális örökség megőrzésének célja a nyilvánosság számára hozzáférhetővé tétele. Ezért a digitális örökség anyagaihoz, különösen a közkincsekhez való hozzáférésnek mentesnek kell lennie az ésszerűtlen korlátozásoktól. Ugyanakkor védelmet kell nyújtani a bizalmas és magánjellegű információbiztonság bármilyen formájával szemben.[...]
Fennáll a veszélye annak, hogy a világ digitális öröksége helyrehozhatatlanul elveszhet a jövő generációi számára. Ebben közrejátszik a digitális anyagokhoz való hozzáférést biztosító berendezések és programok elavultsága, az erőforrás-ellátás bizonytalansága, a megőrzés és megőrzés biztosításának felelőssége és módszerei, a megfelelő jogalkotási aktusok hiánya.[...
] az uralkodó fenyegetések megelőzésére irányuló intézkedések meghozatalának elmulasztása a digitális örökség gyors és elkerülhetetlen elvesztéséhez vezet. Az örökség megőrzését célzó jogi, gazdasági és műszaki jellegű intézkedések elfogadása a tagállamok számára előnyös. Sürgősen fel kell hívni a figyelmet és növelni kell az érdekképviseletet, fel kell hívni a döntéshozók figyelmét, és fel kell kelteni a közérdeklődést mind a digitális médiában rejlő lehetőségek, mind a digitális megőrzés gyakorlati szempontjai iránt.
Számos kifejezést használnak az elektronikus archiválási gyakorlatok megjelölésére - digitális megőrzés ( angolul - "elektronikus / digitális megőrzés"), digitális archiválás ( angolul - "elektronikus / digitális archiválás") vagy digitális kezelés ( angolul - "management of electronic / digital archiválás"). digitális adatok"). Ezeket a fogalmakat gyakran felcserélhetően használják, de az egyes kifejezések használata országonként eltérő. Például az Egyesült Államokban a "digitális megőrzés" ( digitális megőrzés ) kifejezést gyakrabban használják, és általában az elektronikus archívumok kezelésével kapcsolatos összes tevékenységet lefedi a létrehozásuk pillanatától kezdve. A „digitális megőrzés” kifejezést először 1992-ben használták a Theatre Crafts magazinban a digitális megőrzés új típusairól szóló cikkben. Ezzel szemben az Egyesült Királyságban a "digitális adatkezelés" ( digitális menedzsment ) kifejezést az elektronikus dokumentumok életciklusának kezelésével kapcsolatos gyakorlatokra, a digitális megőrzésre pedig az elérhetőségük biztosítását célzó tevékenységekre használják. a jövőben. Ugyanakkor az angol nyelvben a preservation vagy „preservation” kifejezést gyakrabban használják, mint az archiválást vagy „archiválást”, mivel ez utóbbi a fizikai dokumentumok meglévő anyagtárolókban való megőrzését jelenti. Emiatt a megőrzést gyakrabban nevezik elektronikus objektumoknak [23] [24] [25] .
A 2007-ben alapított American Library Association munkacsoport az elektronikus archiválást stratégiák, elvek és gyakorlatok kombinációjaként határozta meg, amelyek célja a hitelesített tartalom időbeli hű reprodukálása, függetlenül a médiaproblémáktól és a tárolási technológiák változásaitól. A koncepció az eredetileg elektronikus formátumban készült dokumentumokra és a digitalizált anyagokra egyaránt vonatkozik [26] . Más szóval ez az információ kiválasztásának, tárolásának és megőrzésének tevékenysége annak érdekében, hogy a jövő generációi számára hozzáférést biztosítsanak azokhoz [27] [28] . A Cornell Egyetemi Könyvtár az elektronikus archiválást olyan tevékenységek széles skálájaként határozza meg, amelyek célja a géppel olvasható számítógépes fájlok élettartamának meghosszabbítása, valamint az adathordozó meghibásodása, a fizikai elvesztés és az elavulás elleni védelem [27] [29] .
Az elektronikus archiválás célja az információk védelme és megőrzése a jövő generációi számára [30] [31] [29] . Az elektronikus megőrzési tevékenység középpontjában a digitális információk létrehozása, karbantartása és integritásának megőrzése áll. A létrehozás magában foglalja a fájlok teljes és egyértelmű specifikációinak meghatározását, megbízható törzsfájlok és elegendő leíró, adminisztratív és szerkezeti metaadatok létrehozását a jövőbeni hozzáférés biztosításához. A karbantartás a fájlokon végrehajtott összes művelet dokumentálása és a változások teljes nyomon követése. Az információk megőrzése magában foglalja egy megbízható számítástechnikai és hálózati infrastruktúra létrehozását, amely lehetővé teszi az anyagok tárolását és szinkronizálását több helyen, valamint folyamatos nyomon követést és az adatvesztés megelőzésére szolgáló stratégiák fejlesztését [26] [32] .
Az elektronikus archiválás a céltól függően lehet hosszú távú (határozatlan ideig biztosított a hozzáférés), középtávú (meghatározott ideig tartó hozzáférés) és rövid távú (digitális anyagokhoz való hozzáférés meghatározott ideig, ill. / vagy amíg elérhetetlenné válik - például technológiai változások miatt) [28] [33] . Az elektronikus archiválásnak három fő infrastrukturális összetevője van [24] :
Ugyanakkor az elektronikus archiválás technológiai vonatkozásai a következő csoportokra oszthatók [34] :
A digitális objektumok archiválásának szükségességével kapcsolatos döntések tartós értékük értékelésén alapulnak . Az értékelés csak egy a stratégiák közül, a levéltárosok statisztikai mintavételi és kockázatelemzési módszereket is alkalmaznak a megőrzésre szánt anyagok kiválasztásához. A statisztikai mintavétel statisztikai módszerekre támaszkodik a reprezentatív minta létrehozásához és a papír és digitális dokumentumok megfelelő kiválasztásához megőrzésre vagy digitalizálásra. A kockázatelemzési módszer célja, hogy felmérje a digitális erőforrásokkal végzett munka során felmerülő lehetséges nehézségeket, valamint ezek lehetséges következményeit - például a fájl- és médiaformátum elavulásának kockázatát, a digitális erőforrások megőrzésének elmulasztásával kapcsolatos veszteségek kockázatát. , stb. A kockázatelemzést általában más kiválasztási kritériumokkal, például költségbecslésekkel együtt végzik [35] .
Az 1980-as évekre egyre több levéltáros kezdett odafigyelni arra, hogy a digitális tárgyak és bármilyen elektronikus irat létrehozása a hosszú távú megőrzés követelményeinek figyelembevétele nélkül történjen. Az 1990-es évek elején nyilvánvalóvá vált a szoftverek elavultságának problémája, és ennek megfelelően a segítségével létrejött információk megbízható archiválásának lehetetlensége. Az elektronikus archiválás bevezetésével megjelentek az első kísérletek a folyamat szabályozására. Így létrejött az InterPARES projekt munkacsoportja, amely az archiválandó elektronikus objektumok kiválasztásának modelljének kidolgozásával foglalkozott [36] [37] .
Makro- és mikroértékelés kiosztása. A makroértékelés alatt az archiválásra szánt dokumentumoknak a kontextus fontossága alapján történő kiválasztását értjük – az egyes szervezetek, szereplők által vagy adott időszakban létrehozott összes erőforrás fontosnak és értékesnek minősül [35] . Az InterPARES által kidolgozott modell szerint az elektronikus iratok kontextusának értékelése négy fő lépésből áll:
Az iratok archiválására vonatkozó döntés meghozható a jogi-adminisztratív kontextus (az anyagok létrehozásának jogi és közigazgatási rendszere), a pénzügyi kontextus (az létrehozó szerv, hatásköre, felépítése és funkciói), az eljárási kontextus (az üzleti folyamat, amely során az iratok létrejönnek ), dokumentáris kontextus (struktúra és kapcsolatok más dokumentumokkal) vagy technológiai kontextus (elektronikus rendszerek műszaki összetevői, amelyekben digitális objektumokat hoznak létre) [36] .
A levéltárosok adatokat gyűjtenek az elektronikus anyagok maradandó értékéről és hitelességéről is. Egy tárgy maradandó értékét az határozza meg, hogy az iratok mennyire képesek az alkotók és a társadalom érdekeit vagy igényeit szolgálni. Megkérdőjelezhető olyan esetekben, amikor az anyagok megőrzése sérülhet. Ha az értékelő alapos okkal gyanítja, hogy az iratok elvesztették hitelességüket, és eltérnek az eredeti változatuktól, akkor azok archiválása megkérdőjeleződik [36] .
Az InterPARES munkacsoport javaslatai szerint a konzerválás lehetőségének meghatározása több lépcsőben történik. Először a szakértő határozza meg az anyagok tartalmát és azokat a műszaki elemeket, amelyeket a hitelesség követelményeinek megfelelően meg kell őrizni. Az értékelő ezután ezeket a megőrzési követelményeket összhangba hozza az archivált iratok tartós megőrzéséért felelős szervezet lehetőségeivel [36] .
A korábbi kritériumértékelések alapján a dokumentum [36] megőrzésére vonatkozó döntést alkalmazzák .
A mikroértékelés célja az egyes dokumentumok értékének meghatározása. Legfontosabb kritériuma, hogy az irat megfelel-e a letétkezelő gyűjtési szabályzatának - e kritériumok be nem tartása miatt az elektronikus archiválás iránti kérelem még értékes források esetén is elutasításra kerülhet. Az Earth Resources Observation and Science (EROS) például megtagadta a hozzáférést az Apollo űrprogram ezer felvételből álló adatkészletéhez , amelyet a NASA készített a küldetés során. Annak ellenére, hogy a felvételek vitathatatlan értéket képviselnek az Egyesült Államok számára, az EROS felhagyott vele, mivel a filmek többségét űrhajóról vagy a Hold felszínéről forgatták , míg a szervezet küldetése az, hogy megőrizze az országról készült filmeket és fényképeket. Föld. A második legfontosabb értékelési kritérium a digitális erőforrások értéke, amely lehet elsődleges és másodlagos is. Elsődleges érték alatt adminisztratív, fiskális és jogi értékeket kell érteni. A másodlagos érték az anyagok hasznosságában, használhatóságában és elérhetőségében rejlik. A harmadik értékelési szempont a költség, ami döntő tényező lehet egyazon anyag több változatának kiválasztásánál. A levéltárosok figyelembe veszik az archiválás megvalósíthatóságát is, mivel egyes konzervátorok bizonyos fájlformátumokban vagy adathordozókon nem fogadják el a digitális forrásokat, mert nem tudják biztosítani az egyes anyagok hosszú távú megőrzését [35] .
Az elektronikus archiválást elsősorban a digitális környezetben létrehozott vagy digitalizált objektumokra alkalmazzák. Az első kategóriába tartoznak valamilyen digitális technológia segítségével létrehozott adatok. A digitalizált anyagokon olyan adatokat értünk, amelyeket analógból digitálisra alakítanak át szkenneléssel vagy formátumváltással [38] . Az elektronikus archiválást leggyakrabban a következőkkel kapcsolatban alkalmazzák [27] :
Az elektronikus adattárak vagy adattárházak az elektronikus archiválás egyik központi eleme. A tárak mindenféle digitális objektumot tárolnak a hozzájuk tartozó leíró és adminisztratív metaadatokkal együtt. Digitális objektumok lehetnek egy elektronikus folyóiratban megjelent cikkek, fényképek digitalizált képei, numerikus adatok, digitális videók, könyvek teljes verziói [32] . A nyílt hozzáférésű mozgalom részeként a repozitóriumok az önarchiválás „ zöld ” útjához vagy gyakorlatához kapcsolódnak – a tudományos anyagok szerzői önállóan helyezhetik el cikkeiket az elektronikus archívum megfelelő részében, és rövid leírással látják el [39] [40] . Az egyik első nagy tematikus adattár, az arXiv.org 1991-ben jelent meg. Hozzáférést biztosít a matematika, fizika, számítástechnika és kvantitatív biológia tudományos közleményeihez . A repozitóriumok nemcsak hozzáférést tesznek lehetővé a művek elektronikus másolatainak gyűjteményeihez, hanem automatikusan hozzáadják a publikációkat a Citebase adatbázishoz , amely biztosítja az idézettségi index figyelését [41] .
Az adattárak lehetnek intézményi, fegyelmi (vagy tematikus) vagy országosak. A tematikus repozitóriumok egy vagy több területen biztosítanak hozzáférést a szakirodalomhoz, míg az intézményi adattárak egyazon intézményen belül megjelent műveket tárolnak - ezek általában szakmai beszámolók, szakdolgozatok, adatbázisok, cikkek, nyomtatott kiadványok. Az intézményi adattárak példája az MIT DSpace [42] . Különálló adattárak jöttek létre a jelentősebb tudományos publikációkkal való együttműködés eredményeként – például a Springer Nature támogatja az In Review szolgáltatást, az Elsevier pedig a ChemRN-t. Ezenkívül a non-profit Center for Open Science égisze alatt számos nemzeti adattár működik, köztük az Arabirxiv ( arab országokból származó előnyomatok ), a Frenxiv ( francia szerver), az INArxiv ( indonéz ), az Indiarxiv ( indiai ). A latin-amerikai országok előnyomatai is megjelennek a SciELO adattárában [43] [44] .
A szervezetek nyílt forráskódú szoftvercsomagokat használnak az intézményi adattárak létrehozására és megvalósítására. Ezek közé tartozik az Eprints és a DSpace . A 2002-ben kiadott DSpace egy nyílt forráskódú univerzális adattáralkalmazás, amelyet a HP Labs és a Massachusetts Institute of Technology Libraries közösen fejlesztett ki multidiszciplináris kutatószervezetek számára. A DSpace a megfelelő Dublin Core metaadat-szabványt használja a digitális objektumok leírására, és támogatja az Open Archives Initiative Protocol for Metadata Harvesting protokollt is [44] . További jelentős tárgytárak közé tartozik az 1996-ban alapított PubMed , ahol orvostudományi és biológiái tanulmányokat publikálnak, a PhilSci-Archive filozófiai tanulmányokat, és a Social Science Research Network (SSRN), amely társadalom- és bölcsészettudományi tanulmányokat tesz közzé. 1994 óta [40] . Az egyik legnagyobb nyílt hozzáférésű archívum a 2003-ban létrehozott Archive of European Integration Az oldal az Európai Unió dokumentumait teszi közzé , amelyeket nyilvános terjesztésre szánnak. 2016 januárjában az archívum több mint 41 800 uniós dokumentumot és mintegy 7 300 magánművet tartalmazott [45] . Számos ország valósított meg nemzeti kezdeményezéseket az adattárak infrastrukturális támogatása érdekében, mint például a SHERPA projekt az Egyesült Királyságban , a DARE Hollandiában és 12 millió dolláros ausztrál kormányzati projekt az adattárak népszerűsítésére. Az egyes szervezetek olyan szolgáltatásokat is vásárolhatnak, amelyek hozzáférést biztosítanak egyetlen felhő-erőforráshoz. Tehát az Amazon egyszerre több felhőszervert kínál, köztük az Amazon S3 -at fájltárhelyhez [46] .
Ezzel párhuzamosan olyan rendszereket fejlesztenek, amelyek egyszerre több adattárban keresnek. Ilyen rendszer például az OAIster , amelyen keresztül több mint 200 adattárról tekinthet meg információkat [47] [48] [42] . Az OpenDOAR közel 3000 nyilvánosan jegyzett adattár tartalmában keres a világ minden tájáról [49] .
A metaadatokat szabályozó egyik fő szabvány a Dublin Core (DCMES), amelynek fő készlete 15 jellemzőből áll [50] :
A Dublin Core az objektumok katalogizálásának általános szabványa. A DCMES általános természete miatt azonban nehéz lehet bonyolult gyűjteményobjektumokat leírni. Emiatt a legtöbb esetben a Dublin Core-t más szabványokkal kombinálják [51] .
Az integritás és a rugalmasság az archivált digitális objektumok alapvető jellemzői. Az integritás az adatok pontosságának és megbízhatóságának fenntartását jelenti azok teljes életciklusa során. Adatátvitel vagy replikáció során eltörhet. Az integritás megőrzése az elektronikus archiválás egyik legfontosabb feladata [52] [53] . A perzisztencia azt jelenti, hogy a fájl változatlan marad az elektronikus archiválási folyamat során, és abban a formában marad meg, amelyben létrehozták [54] .
A PREMIS nemzetközi szabvány a metaadatokat úgy definiálja, mint "olyan információkat, amelyeket egy adattár a digitális megőrzési folyamat támogatására használ". A metaadatok az adatokkal kapcsolatos információk, például a fájlformátum, a szoftver és a változástörténet leírása. Ideális esetben a metaadatokat a digitális objektumok teljes életciklusa során kell gyűjteni és frissíteni [55] . A metaadatok elsődleges szerepe, hogy azonosítsák, leírják és intelligens hozzáférést biztosítsanak a digitális gyűjtemény tartalmához. Különféle metaadatokra van szükség az erőforrások leírásához, a digitális objektumok felfedezéséhez, visszakereséséhez, használatához, ábrázolásához és megőrzéséhez. A legfontosabb metaadatok a szöveges leírás nélkül nehezen azonosítható képi, hang- és animációs anyagokkal ellátott gyűjtemények rendszerezésére szolgálnak. Többféle metaadat létezik [24] :
A metaadatokat szabályozó egyik fő szabvány a Dublin Core (DCMES), amelynek fő készlete 15 jellemzőből áll [50] :
A Dublin Core az objektumok katalogizálásának általános szabványa. A DCMES általános természete miatt azonban nehéz lehet bonyolult gyűjteményobjektumokat leírni. Emiatt a legtöbb esetben a Dublin Core-t más szabványokkal kombinálják [51] .
Egy másik alapvető szabvány a VRA Core. A DCMES-től eltérően a VRA Core lehetővé teszi a műalkotások (vagy eredeti tárgyak) és azok helyettesítői (digitális képek) különböző kategóriákba sorolását. Ez a megoldás lehetővé teszi a tárgyak pontosabb leírását, és például mindkét mű – az eredeti mű és fényképe – létrehozásának dátumának feltüntetését [51] .
Preservation Metadata: Implementation Strategies vagy PREMIS-t az OCLC és az RLG munkacsoport fejlesztette ki 2005-ben. A szabvány meghatározza a fájlok lerakatokban való tárolásához szükséges metaadat egységeket. 2021-ben a PREMIS-t a Kongresszusi Könyvtár tartja fenn és támogatja . A szabvány két fő részből áll - az adatmodellből és a szótárból. A PREMIS többféle metaadatot határoz meg, beleértve a leíró, szerkezeti, műszaki és adminisztratív adatokat. A szótár nagy hangsúlyt fektet a digitális eredet (egy objektum történetének) és kapcsolatok dokumentálására, különösen a tárolókban lévő különböző digitális objektumok között [24] . A PREMIS szabvány szerint a tárolóknak automatikusan módosítaniuk kell a metaadatokat minden egyes elektronikus objektumhoz, és meg kell őrizniük egy fájl változástörténetét [56] [57] .
Az elektronikus adatarchiválás alapelvei a 90-es évek végén és a 2000-es évek elején számos szabványban és kezdeményezésben megfogalmazódtak.
1994-ben a Commission on Preservation and Access (CPA) non-profit szervezet a Research Libraries Group könyvtári konzorciummal közösen külön bizottság létrehozását kezdeményezte, amelynek tevékenysége az elektronikus dokumentumok hosszú távú archiválására, ill. megfelelő ajánlások kidolgozása. A munkabizottság további célja az alternatív archiválási gyakorlatok kialakítása volt - a bizottság tagjai ahelyett, hogy az adathordozók akkoriban elfogadott új verzióira átkerülnének, a migrációs módszer alkalmazását és az elektronikus objektumok új merevlemezekre és szoftverekre való áthelyezését javasolták. 1996 májusában egy 21 tagú testület Donald Waters és John Garrett elnökletével kiadta a Preserving Digital Information című zárójelentést. A jelentés két fő ajánlást tartalmazott: a tartalomkészítők bevonását és kijelölését az elektronikus archiválási gyakorlatba, valamint a megbízható és tanúsított elektronikus archívumok hálózatának létrehozásának szükségességét [58] . Ez a dokumentum a témával kapcsolatos későbbi gyakorlati ajánlások alapja lett [59] [34] . 1997-ben a CPA és az RLG együttműködése eredményeként létrejött a Könyvtári és Információs Erőforrások Tanácsa [60] .
Az RLG számos gyakorlati kezdeményezést hajtott végre a jelentés főbb elveinek gyakorlati megvalósítása érdekében. Ezek egyike a Studies in Scarlet volt, a Harvard Law School Library-vel közösen megvalósított projekt, amelynek célja az Amerikából, Nagy-Britanniából és Írországból származó, 1815 és 1914 között a családon belüli erőszakról , a házasságkötési ígéret megszegéséről, a gyámságról , a nemi erőszakról és a nemi erőszakról szóló akták megőrzése volt. gyilkosság [61] . Egy másik jelentős projekt a Global Bevándorlási Projekt volt, amely a bevándorlási ügyeket digitalizálta. Mindkét projekt a digitalizálásra és az adatmegőrzésre irányult, azonban a megőrzés logikája mindkét esetben eltérő volt. Így a Studies in Scarlet projekt dokumentumainak archiválása abból az igényből fakadt, hogy az RLG alapelveit a repository infrastruktúrára vonatkozóan a gyakorlatba kell ültetni, a Globális Bevándorlási Projekt esetében pedig a bevándorlási adatok digitalizálásának és elérhetővé tételének igényéből fakadt. kapcsolódó gyűjtemények, amelyek minősége gyorsan romlott. A projektek szervezeti modelljei is eltérőek voltak. A Scarletben végzett tanulmányok központosított modellel készültek – az összes anyagot együtt nyújtották be, és a bevándorlási projekt archívuma számos, egymástól eltérő gyűjteményből állt, amelyeket 11 résztvevő intézményben tartottak az Egyesült Államokban, az Egyesült Királyságban és Kanadában . Ezzel egy időben az RLG elindította az Arches projektet, amelynek középpontjában a digitális források online tárházának és az archív anyagokhoz való nemzetközi hozzáférést biztosító szoftverkörnyezet létrehozása állt [62] . Az Arches egy nyílt forráskódú szoftverplatform, amelyet a Getty Conservation Institute és a World Monuments Fund együttműködésével fejlesztettek ki természetvédelmi intézmények számára szerte a világon. Az Arches régészeti lelőhelyekről, épületekről és építményekről, kultúrtájokról, városi együttesekről ad információt [63] [64] .
Az elektronikus archiválás területén a modern megközelítések és megoldások az OAIS [65] nemzetközi szabványban megfogalmazott koncepciókon és funkcionális modulokon alapulnak . 1990-ben a Nemzetközi Szabványügyi Szervezet (ISO) felkérésére az Űradatrendszerek Nemzetközi Tanácsadó Bizottsága hivatalos szabványokat kezdett kidolgozni az űrmissziók során keletkezett információk hosszú távú elektronikus archiválására. 1995-ben egy sor nemzetközi szemináriumot tartottak, melynek eredményeként megjelent az Open Archival Information System (OAIS) referenciamodell. Az első változat 1997-ben jelent meg, az utolsó pedig 2002-ben (frissítve 2012-ben). Az OAIS volt az első olyan rendszer, amely leírta az archív csomag és a digitális objektumok fogalmát. Ezt követően a szabvány az elektronikus adattárak létrehozásával , a meglévő adatbázisokhoz és metaadatokhoz való hozzáféréssel kapcsolatos jövőbeni projektek prototípusává vált [58] . 2003-ban az OAIS-t az ISO 14721:2003 „Adat- és információátviteli rendszerek a világűr számára” nemzetközi szabványként hagyták jóvá. Nyílt archív információs rendszer. Referenciamodell” (Téradat- és információátviteli rendszerek – Nyílt archív információs rendszer – Referenciamodell (OAIS)) [66] . A szabvány elsőként vezetett be semleges szókészletet, amely leírja a szereplők szerepét és felelősségét a tárolók karbantartásában és a felhasználói hozzáférés szabályozásában [34] . Így az OAIS szabvány közös szókincs, információs modell és magas szintű digitális megőrzési architektúra biztosításával meghatározta és megalapozta a fenntartható digitális megőrzési program kidolgozását [67] . Az OAIS három fő koncepción alapul - "OAIS környezet", "OAIS információ", "OAIS külső interakciók". Az első kategória az OAIS archívumát körülvevő környezetben lévő „termelőkből”, „fogyasztókból” és „menedzserekből” áll. Előállítók lehetnek a rendszerbe való betöltéshez adatokat szolgáltató magánszemélyek és rendszerek is. A menedzserek azok a szereplők, akik nem vesznek részt az archívum napi működésében, de befolyásolják az OAIS általános politikáját. Más OAIS archívumok vagy nem OAIS-kompatibilis rendszerek „gyártóként” vagy „fogyasztóként” léphetnek kapcsolatba az OAIS archívumával [68] .
Az OAIS szerint egy archivált objektum információs csomagjának a következő információkat kell tartalmaznia [69] [66] :
Ezenkívül az OAIS referenciamodell háromféle információs csomagot ír le [69] [66] :
2000-ben az RLG és az Online Computer Library Center (OCLC) együttműködésbe kezdett a nemzetközi OAIS szabványon alapuló Trusted Digital Repository (TDR vagy Trusted Electronic Repository ) létrehozása érdekében. A projekt jelentését 2001 augusztusában tették közzé. A dokumentum szerint az RLG és az OCLC munkacsoportja nemzeti és nemzetközi elektronikus adattárrendszerek létrehozását javasolja, amelyek feladata lesz a nyilvános, társadalmi, gazdasági, kulturális és szellemi örökséghez való hozzáférés biztosítása. A jelentés ajánlásai szerint az RLG, az OCLC és más szervezetek tevékenységének az elektronikus adattárak tanúsításának fejlesztésére, a digitális anyagok megőrzésre szánt fontos tulajdonságainak azonosítására szolgáló eszközök tanulmányozására és létrehozására kell irányulnia; együttműködési hálózatok és adattárszolgáltatások modelljeinek kutatása és fejlesztése [58] [70] . Ezzel a definícióval együtt adták a TDR fő jellemzőit - adminisztratív felelősséget, szervezeti életképességet, pénzügyi stabilitást, technológiai és eljárási kompatibilitást és rendszerbiztonságot [58] .
A megbízható digitális adattár az, amelynek feladata, hogy megbízható, hosszú távú hozzáférést biztosítson a kezelt digitális erőforrásokhoz egy meghatározott közösség számára most és a jövőben [34] .
2003-ban a Research Library Group közös munkacsoportot hozott létre az Egyesült Államok Nemzeti Levéltári és Irattári Igazgatóságával az elektronikus adattárak tanúsításának konkrét kritériumainak kidolgozására. 2005-ben az RLG és a Center for Research Libraries megkezdte az alapelvek gyakorlati tesztelését, majd két évvel később a kutatás eredményei alapján kiadták a Trustworthy Repositories Audit & Certification dokumentumot , amely az alapját képezte. Az ISO 16363 szabványnak megfelelően, és meghatározta a digitális adattárak létrehozásának és kezelésének alapelveit [71] .
2012-ben az Egyesült Államokban létrehozták a Digital Preservation Network (DPN) közösséget, amely mintegy 60 szervezetből állt össze, hogy megosszák egymással a technológiát, a szakértelmet és a pénzügyi erőforrásokat egy átlátható és hosszú távú elektronikus archiválási szolgáltatás létrehozása érdekében. A DPN non-profit szervezetben csak az elektronikus információk hosszú távú megőrzésében érdekelt amerikai szervezetek vehettek részt [71] . Amikor csatlakoztak a DPN-hez, egy megosztott tárolóhálózatba kerültek, amely öt fő adattáron keresztül működött: Academic Preservation Trust (APTrust), Chronopolis, HathiTrust , Stanford Digital Repository (SDR) és University of Texas Digital Repository (UTDR). Minden adattár a DPN-szervezetek hálózatának „csomópontjának” számított, amely az Egyesült Államok különböző részein található, és saját architektúrával, hardverplatformjával és szervezeti/pénzügyi struktúrájával rendelkezett. A DPN tevékenysége az anyagok fenntartható tárolási rendszerének kialakítására irányult [72] . 2018-ban a DPN feloszlott [73] .
Az InterPARES Project nemzetközi együttműködések sorozata, amelyek 1994 óta zajlanak UBC Project néven. A projektet a University of British Columbia kezdeményezte az Egyesült Államok Védelmi Minisztériumával és az Egyesült Államok Nemzeti Levéltári és Irattári Hivatalával együttműködésben 1994-1997 között. Fő célja egy olyan elektronikus archiválási módszertan kidolgozása volt, amely lehetővé teszi az anyagok hosszú távú hiteles formában való megőrzését [74] . 1999-ben az InterPARES az UBC Project alapján jött létre, Luciana Duranti és Terry Eastwood kutatók vezetésével . A projekt első szakasza (1999-2001) az adatbázisokban és dokumentumkezelő rendszerekben létrehozott és karbantartott iratok hosszú távú megőrzését szolgálta. A projekt második szakaszában (2002-2007) a kutatók tudományos, művészeti és kormányzati tevékenység során keletkezett rekordokat elemezték. A projekt harmadik szakaszában (2007-2012) a megszerzett gyakorlati ismereteket kis- és közepes levéltári intézményekben tesztelték. Az utolsó szakaszt (2013-2018) a felhasználók maguk által az internetre feltöltött elektronikus nyilvántartások szentelték [75] [76] . A projekt eredményeként létrejött a DOD 5015.2 szabvány egy nyilvántartási rendszerhez [71] [74] .
2002-ben a Nagy-Britannia Nemzeti Levéltárának Digitális Megőrzési Osztálya létrehozta a PRONOM műszaki nyilvántartást, amely információkat tartalmaz a fájlformátumokról , a szoftverekről és az adattárak műszaki összetevőiről. A nyilvántartás folyamatosan frissül, és a ritka és védett fájlformátumokkal dolgozó kutatók is beadhatják a pályázatokat. Kezdetben a PRONOM a Nagy-Britannia Nemzeti Levéltárának belső forrásának számított, később azonban nyílt nemzetközi portállá változott [56] [77] .
1996 és 2010 között az Ausztrál Nemzeti Könyvtár lebonyolította a Preserving Access to Digital Information (PADI) projektet, amelynek célja a digitális objektumok archiválására és elérésére vonatkozó stratégiák és iránymutatások népszerűsítése az összes ausztrál kulturális örökség intézménye számára . A projekt eredményeként egy közös tematikus portál jött létre, amelyen keresztül az intézmények szabadon cserélhettek információkat, illetve hozzáférhettek a szükséges elektronikus forrásokhoz [56] .
2000 decemberében az Egyesült Államok Kongresszusa 100 millió dollárt különített el a National Digital Information Infrastructure and Preservation Program (NDIIPP) létrehozására, amelyet a Kongresszusi Könyvtárnak adtak át . A pénzt az elektronikus iratok hosszú távú archiválására irányuló nemzeti erőfeszítésekre, valamint más szövetségi, kutatói, könyvtári és üzleti szervezetekkel való együttműködésre fordították [78] .
2011 októberében a moszkvai "Elektronikus információ megőrzése az információs társadalomban: problémák és kilátások" című nemzetközi konferencia keretében nyilatkozatot fogadtak el a digitális információ megőrzéséről, amely később a terület egyik alapvető dokumentumává vált. az elektronikus archiválás [79] . A Nyilatkozat felvázolta a digitális információk megőrzésének kiemelt területeit, és számos javaslatot tett az UNESCO, a nemzetállamok és a kormányzati struktúrák számára a dokumentumok digitalizálására vonatkozó gyakorlatok bevezetésére [80] .
A digitális adatmegőrzés módszere, hogy eredeti formátumban és eredeti adathordozón, eredeti technológiával vagy korábban használt hardverrel és szoftverrel dolgozunk az anyagokkal. Ebben az esetben az úgynevezett „számítógépes múzeumok” jönnek létre, ahol az anyagok vizualizációját és tartalmát az eredeti formátumban, eredeti funkcionalitással tartják fenn. A megőrzést ideiglenes elektronikus archiválási stratégiának nevezték, bár egyes digitális adatok esetében ez a módszer a legjobb megoldás, mivel képes megőrizni az eredeti hozzáférési eszközöket, például szoftvereket [65] [81] [82] . Hosszú távon a stratégia problémát jelent az esetleges karbantartási problémák és bizonyos fájltípusok elérhetővé tételének költségei miatt. A megőrzés korlátozza az erőforrás hordozhatóságát is, ami ebben az esetben közvetlenül függ az egyes helyeken tárolt berendezésektől [81] .
EmulációAz emuláció a rendszer funkcióinak reprodukálására utal , hogy biztosítsa az örökölt adatformátumokkal való működést. Az emuláció egy virtuális gép létrehozását jelenti a számítógépen, amely lehetővé teszi az eredeti hardver- és szoftverkörnyezet funkcionalitásának reprodukálását [65] . Bizonyos szempontból az emuláció hasonlít a megőrzési stratégiához , mivel magában foglalja az eredeti alkalmazási program megőrzését. Az emuláció célja a digitális objektum megjelenésének és funkcionalitásának megőrzése az erőforrás műszaki tartalmának másolásával és az eredeti objektum vagy az eredeti objektum frissített másolatának a jövőbeni felhasználásával [81] . Az emulációs szoftvereket az 1990-es évek eleje óta fejlesztik a PC-játékok szerelmesei, de a 2000-es évek eleje óta felkeltette az érdeklődést a digitális megőrzési közösségben is. Annak ellenére, hogy eleinte az emulációt technológiailag bonyolult rendszernek tekintették, ráadásul nehezen reprodukálhatónak, fokozatosan a módszer az elektronikus archiválás egyik főjévé vált – új fejlesztések, többek között az emulátor beépítése közvetlenül a böngészőbővítménybe . , jelentősen leegyszerűsítette a használatát. Az emulátor úgy van programozva, hogy utánozza a régebbi hardverplatformok és operációs rendszer szoftverek, például játékok és fájlok viselkedését. Ez a stratégia azonban nem foglalja magában az örökölt hardver és az eredeti szoftver megtartását. Példa erre a Java Virtual Machine [81] [83] . Az emuláció alkalmazásra és operációs rendszerre, valamint hardverplatformokra egyaránt vonatkozik [84] .
Számos előnnyel jár az emuláció használata a fájlformátumok és a régi szoftverek eléréséhez. Ezek közé tartozik az összetett digitális objektumok elérése, beleértve a játékokat, a virtuális valóságot és az alkalmazásokat. Azáltal, hogy lehetővé teszi a felhasználók számára, hogy a digitális objektumokkal az eredeti környezetben kommunikáljanak, az emuláció értékes kontextust biztosít a kutatóknak arról a környezetről, amelyben az alkotó akkoriban dolgozott. Ha nagy méretben használják, hozzáférést biztosít a gyűjtemény nagy részeihez [83] . Az emuláció használatát azonban nehezítik az esetleges jogi problémák – a régebbi szoftverekre és operációs rendszerekre vonatkozó licencfeltételek nem mindig teszik lehetővé az emulációt, mivel ez a módszer másolást foglal magában. Az emuláció választása elektronikus archiválási stratégiaként az emulátorok elavultságától való függőséget is eredményezhet, és idővel a berendezések teljesítményvesztesége miatti korlátozásokra utal [82] .
EncapsulationA beágyazási módszer magában foglalja a dokumentum műszaki leírásának belefoglalását a digitális objektum összetételébe, ezáltal csökkentve annak külső környezettől való függőségét, mivel ez az információ lehetővé teszi az eredeti környezet reprodukálását vagy a dokumentum újba való átvitelét . 65] [85] . A legtöbb alkalmazott információtárolási módban a különböző elektronikus adatkomponensek különböző helyeken (például adatbázisban vagy fájlrendszerben) tárolódnak különböző digitális objektumok részeként. A különböző összetevők közötti kapcsolatok hivatkozásokon, mutatókon és fájlneveken keresztül valósulnak meg. Az informatika rohamos fejlődése azonban megköveteli, hogy a digitális objektumok közötti kapcsolat stabilabb legyen - az elektronikus irat összetevőinek elkülönített tárolása mindig kockázattal jár, és amint a kapcsolat megszakad és nem állítható helyre, a rekordot figyelembe veszik. elveszett. Az irattáros ezt a kockázatot elkerülheti, ha metaadatokat foglal a dokumentumokat tartalmazó számítógépes fájlokban. Ha két komponenst egy fizikai objektumban kombinálunk, a rekord és a metaadatok közötti kapcsolat nem vész el [86] . A beágyazás olyan digitális forrásokra alkalmazható, amelyek formátuma jól meghatározott és széles körben használt [81] . Ezen túlmenően ez a stratégia legyőzi a fájlformátumok technológiai elavultságának problémáját, mivel a metaadatok tartalmaznak egy módot egy eredeti alkalmazás létrehozására a hozzáféréshez fejlettebb számítógépes platformokon [87] [81] .
Az OAIS nemzetközi szabvány leírja azokat a kiegészítő információk típusait is, amelyeket bele kell foglalni egy beágyazott fájlba – eredet (az objektum forrásának leírására), kontextus (az objektum és a „tárolón” kívüli egyéb információk kapcsolatának leírása), hivatkozás egy vagy több azonosítóra (egy objektum egyedi azonosítására) [81] .
MigrációA migrációs módszer az elektronikus dokumentumok átvitele más adathordozóra vagy másik operációs rendszerre – például mágnesszalagról CD-re. Ez a stratégia az egyik legnépszerűbb gyakorlat az elektronikus archiválásban, mivel megőrzi a digitális anyagok integritását, valamint azt, hogy a felhasználók megtalálják és felhasználják az információkat anélkül, hogy az elavult technológiák befolyásolnák [81] [88] [82] .
Az OAIS nemzetközi szabvány a migráció négy fő típusát különbözteti meg: frissítés, replikáció, újracsomagolás és átalakítás. A frissítés biztosítja a bitfolyam megbízható másolatának megőrzését, míg a replikáció és újracsomagolás biztosítja, hogy az objektum felügyelt csomagja elérhető legyen [81] . Ez a stratégia az átvitt objektum tartalmának megőrzésére irányul, miközben egyes technológiai tulajdonságok elveszhetnek [81] [89] [90] .
Digitális régészetA digitális régészet az anyagok archiválásának költséges módszere, amely a technológiai elavulás és/vagy fizikai leromlás miatt hozzáférhetetlenné vált digitális tárgyak mentéséből áll. A magas költségek és az adatok teljességének helyreállítására vonatkozó garanciák hiánya miatt egy ilyen stratégia alkalmazása szükséges intézkedésnek tekinthető [82] [65] .
FrissítésA frissítési stratégia magában foglalja az információk átvitelét az egyik tartós adathordozóról a másikra – például egy elhasználódó 4 mm-es DAT szalagról egy új 4 mm-es DAT szalagra, vagy egy régi CD-RW- ről egy új CD-RW-re. A frissítés minden sikeres e-archiváló program szükséges eleme, de önmagában nem stratégia. A módszer megoldja az adathordozó kopásának és elavulásának problémáját, de nem tekinthető fenntartható, hosszú távú archiválási módszernek [82] [91] [27] .
Weboldal archiválásA webarchiválás az a folyamat, amely során weboldalakat és anyagokat gyűjtenek, őriznek meg és kinyernek az internetről abból a célból, hogy azokat elektronikus archívumban helyezzék el a jövő generációi számára. Ez a stratégia a hálózat dinamikája és az engedélyezési feltételek változása miatti információvesztés problémáját kívánja leküzdeni az interneten. Az egyik legnagyobb és leghíresebb internetes archiválási kezdeményezés az 1996- ban alapított non-profit Internet Archívum volt . Az Archívum gyűjtemény archivált webhelyek, digitalizált könyvek, hang- és videofájlok, játékok és szoftverek számos algyűjteményéből áll . 2001-ben az Archívum elindította a Wayback Machine nevű szolgáltatást, amely a "nyitott" internet nagy részének megőrzésére hivatott. A Wayback Machine felhasználói nyomon követhetik a kiválasztott webhelyeken végbemenő változásokat, és összehasonlíthatják a szerkesztések különböző verzióit. 2021 augusztusában a Wayback Machine több mint 581 milliárd mentett weboldalhoz biztosított hozzáférést [92] [93] [82] [94] .
A szervezetek szelektív webes archiváló programokat használhatnak. E szolgáltatások közül a legnagyobb a PANDAS (PANDORA Digital Archiving System), amelynek úttörője az Ausztrál Nemzeti Könyvtár. A PANDAS egy Java és Perl nyelven írt webalkalmazás , amely felületet biztosít a webes archiválási folyamat kezeléséhez. Hasonló szerepet tölt be a The Web Creator Tool, a szelektív webarchiválás kezelésére szolgáló nyílt forráskódú munkafolyamat-eszköz, amelyet az Új-Zélandi Nemzeti Könyvtár és a British Library az Oakleigh Consultinggel közösen fejlesztett ki [95] .
Stratégia | Előnyök | Hibák | Alkalmazás |
---|---|---|---|
Megőrzés | Megőrzi a megjelenést. Lehetővé teszi, hogy eredeti formátumokkal és szoftverekkel dolgozzon. | A fájl karbantartásának magas költsége. A biztonság a felszereléstől függ. | Elavult formátumú fájlok, szoftverek, erőforrások, amelyek megjelenése számít. |
Emuláció | Megőrzi a megjelenést. | Az emulátor létrehozásának bonyolultsága. Rengeteg adatot kell tárolni. Az információhoz való hozzáférés archaikus szoftvert igényel. | Szoftver; összetett digitális erőforrások (például futtatható fájlokat tartalmazó); olyan erőforrások, amelyek értéke ismeretlen, és amelyek felhasználása a jövőben nem valószínű; források, amelyek megjelenése számít. |
Egységbezárás | Információkat tárol a fájlról és a lejátszás módjáról. | A fájllal és lejátszási rendszerével kapcsolatos ismeretek megmaradnak. | Hozzáférhetetlen erőforrások és ismert formátumú erőforrások. |
Migráció | Nem szükséges az eredeti alkalmazások mentése. Támogatja az aktív hozzáférést és vezérlést. | Magas költség a hosszú távú megőrzésért. A metaadatok mentési képességének hiánya. Folyamatos frissítés és munka igénye a levéltárosok részéről. | Aktívan elérhető és kezelt erőforrások, például tudományos adatok vagy adatbázisok. Erőforrások gyakran használt formátumokkal. |
Digitális régészet | Lehetővé teszi olyan elektronikus objektumok rekonstrukcióját, amelyekhez a hozzáférés elveszett. | Magas költség és nincs garancia a fájlok helyreállítására. | Elveszett fájlok. |
Frissítés | Foglalkozik a kopás és a média elavultságának problémájával. | A módszer csak rövid távú megoldásként hatékony. | Olyan források, amelyek médiáját az elavulás veszélye fenyegeti. |
Webes archiválás | Megoldja a hálózatfejlesztés dinamikájából és az engedélyezési feltételek változásából adódó internetes információvesztés problémáját. | A szerzői joggal kapcsolatos lehetséges jogi bonyodalmak. | Minden fájl és webhely, amelyet az interneten talált, és amelyet a konzerváló szereplő archiválásra érdemesnek ítél. |
Az elektronikus archiválási gyakorlatok hatékony megvalósítása érdekében a szervezeteket strukturális változtatásokra is ösztönzik. Így a technológiai elavulás digitális médiára gyakorolt negatív hatásának csökkentése érdekében olyan nemzetközi szabványok elfogadására és betartására van szükség, amelyek szabályozzák a szoftverek átvételével kapcsolatos kérdéseket, és csökkentik a szoftverfejlesztők frissítéseitől való függést. A digitális megőrzésre és archiválásra vonatkozó nyílt szabványokat hivatalos szabványügyi testületek és nemzetközi konzorciumok határozzák meg, köztük a National Digital Stewardship Alliance (NDSA), a World Wide Web Consortium (W3C), a Nemzetközi Szabványügyi Szervezet és az International Internet Preservation Consortium (IIPC). Az NDSA 2010-ben alakult, és a digitális információk hosszú távú megőrzésével foglalkozó szervezetek konzorciuma. A World Wide Web Consortium 1994 óta működik, és egy nemzetközi közösség, amelynek tagszervezetei webes szabványok fejlesztésén dolgoznak. A 2003-ban a Bibliothèque nationale de France -ban alapított IIPC-ben számos szervezet vesz részt, köztük a Chilei Nemzeti Könyvtár és a Kongresszusi Könyvtár, amelyek szabványokat és eszközöket fejlesztenek a webarchiváláshoz [82] .
A digitális anyagok megőrzése jelentős beruházást igényel a digitális archiválási tevékenységet támogató technológiai infrastruktúrába. Az információk hosszú távú megőrzése érdekében szükséges a felhasznált adathordozók helyes kiválasztása, amelyek hosszú ideig lehetővé teszik az információkhoz való hozzáférést. Például a 2000-es évek óta nem tartják indokoltnak a mágneses és optikai adathordozók használatát. A média kiválasztásának kritériumai között szerepelnie kell az olyan kérdések elemzésének, mint az elavulás, a szabványosítás, a költségek. A 2010-es évek óta népszerűek a perzisztens helyi vagy felhőalapú tárolási rendszerek [82] .
Az elektronikus archiválási gyakorlatok sikeres és hosszú távú megvalósításához jobb együttműködés szükséges a szervezetek, a szakértői csoportok és a digitális objektumok alkotói között. Ehhez léteznek nemzetközi konzorciumok, szervezetek tematikus hálózatai és nyílt forráskódú szoftverek – például az Open Journal Systems és a DSpace [82] .
A digitális megőrzés szempontjából minden egyes e-mail, amely fejlécből, üzenettörzsből és mellékletekből áll, egy összetett kommunikációs csomag, amely egyedi forrásanyagot tartalmaz, gyakran potenciális történelmi, jogi és adminisztratív értékkel [96] . Az internetes forgalom jelentős részét képezi az e-mailek cseréje, de az elektronikus archiváló programok részévé viszonylag ritkán kerül sor. Például az Egyesült Államok Kongresszusi Könyvtára a világ minden tájáról gyűjti össze a nyilvános tweeteket , az Egyesült Királyság Web Archívuma, az Internet Archívum és az Internet Memory Foundation részt vett a weboldalak megőrzésében és a webhelyekről származó információk gyűjtésében; azonban egyik projekt sem gyűjt e-mailben továbbított információkat [97] . Ennek fő okai az e-mailek esetleges bizalmas kezelése, az e-mail kliens formátumai közötti különbségek, valamint az üzenetek tárolására szolgáló szabványos formátum hiánya [97] [98] [96] .
Számos e-mail archiválási projekt létezik:
2012-től kezdődően a Manchester University Library tulajdonában lévő Carcanet Press archívumban elkezdték tárolni a híres költőkkel, kritikusokkal, szerkesztőkkel, fordítókkal és művészekkel folytatott elektronikus levelezést. A Carcanet Press Email Preservation Project hagyományos archiválási módszereket és új szabványokat használt a digitális megőrzéshez:
1999 és 2003 között az Antwerpeni Városi Levéltár és a KU Leuven Jogi és Informatikai Interdiszciplináris Központja együttműködésének eredményeként a DAVID projekt aktív volt. A projekt célja egy elektronikus archiválási kézikönyv létrehozása volt. A munkatársak áttekintették az e-mailek archiválására vonatkozó jogi és archiválási követelményeket, és rámutattak néhány lehetséges archiválási stratégiára. A jelentés elméleti értéke mellett abban is volt fontos, hogy miután megkezdte az e-mailek és kapcsolódó elektronikus dokumentumok nyilvántartásának és nyilvántartásának gyakorlatát [99] .
A Smithsonian Institution Archives az elsők között volt, amely kifejlesztette az e-mailek megőrzésének gyakorlatát. Az Archívum gyűjteményeiben az 1980-as évekre visszamenőleg és az ELM -mel készített e-mail rekordokat őriz . Azóta a Smithsonian számos e-mail alkalmazást és formátumot használt, köztük a PINE, cc:Mail , Lotus Notes , GroupWise és más alkalmazásokat. A Smithsonian alkalmazottait arra utasították, hogy nyomtassák ki az elektronikus leveleket nyilvántartási vezetés céljából, ahogy az akkoriban más szervezeteknél és vállalkozásoknál volt. Mivel akkoriban gyakorlatilag nem volt olyan szervezet, amely az e-mail adatok tárolásával foglalkozott volna, 2005-ben a Rockefeller Archive Centerrel egy speciális projektet hoztak létre - Collaborative Electronic Records Project (CERP). A projekt három évig tartott, és az elektronikus kommunikáció archiválására vonatkozó szabványok és gyakorlatok létrehozását eredményezte [100] [99] .
2008 eleje óta a Harvard Egyetemen munkacsoport működik az elektronikus üzenetek megőrzésének stratégiáinak meghatározására. 2015-ben ennek alapján indult útjára az EAS, a Harvard University Library Office for Information Systems (OIS) és a Harvard könyvtári részlegeinek számos kurátori szervezete közötti partnerségi projekt [101] . Az EAS együttműködik a Wordshackkel az adatmentési folyamat automatizálása érdekében. Például a hosszú távú tárolásra kiválasztott e-mail üzenetek és mellékletek automatikusan elküldésre kerülnek a DRS-nek, a Harvard Egyetem Electronic Repository Service-jének [101] .
A XENA egy ingyenes és nyílt forráskódú szoftver, amelyet az Ausztrál Nemzeti Levéltár fejlesztett ki az elektronikus iratok hosszú távú megőrzésére. A XENA fő funkciója, hogy meghatározza a digitális iratok fájlformátumát, és nyílt szabványok alapján a megfelelő formátumra konvertálja a megőrzéshez . A Xena szoftver két fontos feladat végrehajtásával járul hozzá a digitális megőrzéshez: a digitális objektum fájlformátumok meghatározásával és megőrzésre szolgáló nyílt formátumokká konvertálásával [102] .
A videojátékok megőrzése a forráskód- fejlesztések archiválásával, a videojátékok digitális másolataival, a játékkonzol-emulációval , a speciális videojáték-hardver karbantartásával és megőrzésével, valamint a digitális videojátékok nyomtatott magazinjainak és könyveinek digitalizálásával valósul meg . A videojátékok megőrzése nemcsak az ipar történetének feltárását teszi lehetővé, hanem egy-egy játék gyártásának technikai és kreatív szempontjainak elemzését is [103] .
A játékok készítéséhez használt technológia az 1990-es évek eleje óta jelentősen megváltozott, és sok esetben a korabeli eredeti játékok nem játszhatók a formátum elavulása miatt [104] . Ugyanakkor a játékokat rendszerint egy adott konzolra adták ki, ami nagymértékben megnehezítette a későbbi megőrzésüket [105] . Ezért ebben az időszakban kezdtek megjelenni kezdeményezések a videojátékok örökségének megőrzésére. Játékmúzeumokat hoztak létre, mint például a The Strong New Yorkban [ 106] , a Museum of Art and Digital Entertainment Aucklandben [107] , a Berlin Computer Games Museum [108] , a Museum of Soviet Arcade Gépek Moszkvában és Szentpéterváron [109 ] . Megalakult az egyesült államokbeli Video Game History Foundation is, amely nemcsak a játékok, hanem a témával foglalkozó magazinok, kézikönyvek és promóciós anyagok megőrzését hivatott megőrizni. További jelentős kezdeményezések közé tartozik a GOG.com digitális terjesztési szolgáltatás és az Internet Archívumban található böngészőalapú játéktermi emulátorok gyűjteménye [105] . Az Egyesült Nemzetek Szervezete 2015 óta támogatja az Open Digital Library on Traditional Games projektet, amelynek célja a hagyományos bennszülött játékok elektronikus archiválása és védelme katalogizálás és közös adatbázis felépítése révén, amelyből később videojátékokat készítenek [110] [111] .
Az 1990-es évek közepétől a tudományos világban kezdett kibontakozni a nyílt tudomány mozgalma – egyre több kutató ellenezte a fizetőfalakat és az akadémiai irodalomhoz való hozzáférés túlzottan magas költségeit a könyvtárak csökkentett finanszírozásának hátterében. A mozgalom támogatóinak egyik követelése a tudományos publikációkhoz való hozzáférés megnyitása volt , elsősorban az interneten [112] [113] . Hamarosan megjelentek az első online adattárak és elektronikus könyvtárak. Ezek között olyan nagy projektek szerepeltek, mint az arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [114] . 2021 augusztusában a Directory of Open Access Journals több mint 15 900 nyílt hozzáférésű folyóiratot és több mint 5 millió cikket tartalmaz [115] . Ugyanakkor a tudományos publikációk archiválásának logikája az egyes projektekben nagyon eltérő lehet. Például a JSTOR digitális adatbázist 1995-ben hozták létre nyomtatott magazinok digitális másolatainak tárolására. Az adatbázisban csak azok a tudományos folyóiratok szerepelnek, amelyekben a publikáció szakértői értékelési rendszeren keresztül történik . Szintén fontos a folyóiratra előfizető szervezetek száma és a hivatkozási index . Az archiválás a "mozgó fal" (Moving Wall) elve szerint történik - a kiadások a kiadvány keletkezésének pillanatától, legfeljebb 3-5 évig jelennek meg a rendszerben. A JSTOR-ra közzétett tartalom nem mindig nyilvános, és előfordulhat, hogy fizetőfalak mögé rejtőzik . Az ilyen anyagokhoz való hozzáférést intézményi előfizetési rendszer [116] [117] [118] biztosítja . Az Egyesült Államok Nemzeti Orvosi Könyvtára által létrehozott PubMed Central 2000 februárjában indult útjára az orvosbiológiai irodalom archívumának. Az oldalon közzétett anyagokhoz való hozzáférés ingyenes és korlátlan [119] . Az 1991-ben elindított arXiv.org portálon viszont a kutatók egymástól függetlenül teszik közzé a fizika , a matematika , a csillagászat , a számítástechnika és más egzakt tudományok területén publikált munkáik előnyomatait vagy szabadon terjesztett példányait. A cikkeket publikálás előtt nem vizsgálják felül , de kezdetben a moderátorok ellenőrzik őket [120] .
Az elektronikus könyvtárak megjelenésével a tudományos irodalom digitális gyűjteményeinek hosszú távú tárolásának problémája is felmerült - a források jövő generációk számára való elérhetőségének biztosítása különleges erőfeszítéseket és folyamatos befektetést igényel [121] [122] . A nyílt hozzáférésű anyagok általában nem sértik a szerzői jogokat vagy a tulajdonjogokat – a könyvtáraknak nincs szükségük külön engedélyre a megőrzésükhöz. A nyílt hozzáférésű irodalom hosszú távú megőrzése érdekében a szervezeteket arra ösztönzik, hogy kövessék a nyílt nemzetközi szabványokat, és alkalmazzanak nyílt formátumokat, beleértve az odt -t és az xml -t [113] .
Az elektronikus archiválás egyik fő problémája a technológiák elavulása - a berendezések és szoftverformátumok gyors változása és fejlődése miatt az elektronikus adattárakhoz való hozzáférés elveszhet [27] . Átlagosan évtizedenként egyszer elavulnak az adathordozók, helyettük új, hatékonyabb adattárolási módok, ennek megfelelően új hardverek és szoftverek lépnek fel. Ezzel egyidejűleg a régi médiaeszközöket megszüntetik. Ezen túlmenően, az adathordozók ki vannak téve hibáknak és meghibásodásoknak, vírustámadásoknak és fizikai leépülésnek [65] . Az elektronikus archiváláshoz a szervezeteknek nem szabadalmaztatott, perzisztens formátumok használatát javasolják, amelyek függetlenek a harmadik féltől származó szoftverektől [123] [124] .
Az elektronikus archiválás területén az egységes jogszabályok, politikák, stratégiák és tudatosság hiánya is nehezíti az információmegőrzés gyakorlatát. Előfordulhat például, hogy a jogalkotók nincsenek tisztában az elektronikus archiválás követelményeivel, és ennek következtében a jogszabályok figyelmen kívül hagyják vagy nem szabályozzák teljes mértékben a digitális adatok megőrzését. Ez további problémákat vet fel a szerzői jogok tekintetében [27] . A szellemi tulajdonjogok és egyéb jogi kötelezettségek akadályozhatják a digitális források tartalmának másolását, tárolását, módosítását és hosszú távú megőrzés céljából történő felhasználását [82] . A digitális anyagok szerzői és szellemi tulajdonjogainak kérdése sokkal összetettebb, mint a hagyományos fizikai anyagoké. A hagyományos archiválás területén a fizikai másolattal együtt a könyvtár vagy levéltár automatikusan másolási és megőrzési jogot szerzett [19] . A legtöbb elektronikus archiválási módszer azonban megköveteli a műre vonatkozó kizárólagos jogok meglétét és gyakorlását , beleértve a sokszorosítási jogot is [125] . Ezen túlmenően a kiadók megtilthatják a kiadványok műszaki eszközökkel történő másolását – ami megengedett és a szerzői jogi törvényben is szerepel, mind az Egyesült Államokban , mind az Európai Unióban. Ezenkívül az egyes anyagoknak több szerzői jog tulajdonosa is lehet (beleértve más kiadókat, szerzőket, művészeket, külső szoftverszállítókat), ami megnehezítheti a kiadók számára, hogy megőrzési jogokat biztosítsanak könyvtáraknak és más szereplőknek. Ha azonban a másolás következtében megváltozik egy kiadvány megjelenése és funkcionalitása, a szerzők és alkotók úgy érezhetik, hogy jogaik sérültek, akkor nehéz lehet bizonyítani, hogy a kiadványok megőrzött példányai csupán másolatok, és nem teljesen új verziók [126] . A probléma lehetséges megoldásai között a kutatók olyan licencszerződések lehetséges bevezetését említik, amelyek konkrétan meghatározzák a megőrzési feltételeket [127] .
A nehézségek közé tartozik még az emberi tényező , a számítógépes vírusok, a természeti katasztrófák, a média- és szoftverhibák [128] [27] .