Weboldal archiválás

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. május 17-én felülvizsgált verziótól ; az ellenőrzések 3 szerkesztést igényelnek .

A weboldal archiválása ( web archiválás , angol  web archiválás ) a weboldalak és teljes webhelyek összegyűjtésének és „megkettőzésének” folyamata az információk mentése és a jövőbeni hozzáférés érdekében, ha a forrás nem áll rendelkezésre. A webarchiválás fejlődésének előfeltétele a linkek kihalásának problémája és a digitális sötét korszak lehetséges beköszöntése volt . 1996-ban létrehozták az " Internet Archívumot " - az első non-profit szervezetet , amely azt a célt tűzte ki maga elé, hogy "pillanatképeket" készítsen az interneten található összes oldalról. 2001-ben az Archívum elindította a Wayback Machine webhelyarchiválási szolgáltatást , amelyen keresztül 2021-ig több mint 600 milliárd weboldalt mentettek el.

A 2000-es évek eleje óta számos országban – így állami szinten is – aktívan alkalmazzák a weboldal-megőrzési gyakorlatokat. Ugyanakkor léteznek fórumok a webes archiválás területén a szabványok és közös gyakorlatok kidolgozására, köztük az International Internet Archiving Workshop (IWAW) (2001 óta) és az International Internet Preservation Consortium (2003 óta).

Leggyakrabban a statikus webhelyekről származó információkat keresőrobotok (például Heritrix , Webrecorder, HTTrack ) segítségével gyűjtik össze, amelyek HTTP kéréseket küldenek a webszervereknek, és „elfogják” a továbbított tartalmat és az összes hiperhivatkozást a bejárt weboldalakról. Ezzel szemben a dinamikus webhelyek szkriptjei , sablonjai és tartalma külön erőforrásként tárolódik a webszervereken, így az ilyen portálok archiválása sokkal nehezebb. A folyamat két fő lépésben zajlik – a fájl adatainak mentése a webhely könyvtárstruktúrájából, majd az információk archiválása az adatbázisból.

Definíció

A webes archiválás és a webmegőrzés ( eng.  web preservation ) kifejezéseket gyakran felcserélhetően használják, de van közöttük egy fontos különbség: az első egy internetes erőforrás mentésének teljes folyamatát határozza meg, a második pedig csak az egyik szakaszt [1 ] . Az International Internet Preservation Consortium (IIPC) a webes archiválást a következőképpen határozza meg:

[...] a világháló egyes részeinek összegyűjtése, a gyűjtemények archív formátumban történő tárolása, majd az archívumok karbantartása, elérhetővé és használhatóvá tétele.

Háttér

Az 1990-es évek eleje óta az információk létrehozása, tárolása és terjesztése elsősorban digitális környezetben zajlik. Az 1990-es évek közepén már a korábban népszerű adathordozók , mint például a mágnesszalagok , hajlékonylemezek , zip-meghajtók és CD -k kezdenek elavulni , és a régi fájlformátumokhoz való hozzáférés is nehézkessé vált [2] [3] . Sok olyan nagy adatbázis, amelyet nem másoltak át más adathordozóra vagy nem sokszorosítottak papíron, eltűnni kezdett [4] . Így az 1980-as években több mint egymillió ember részvételével lebonyolított nagyszabású BBC Domesday Project összes adata több lemezre került, amelyek a 2000-es évek elejére vagy eltörtek, vagy elvesztek [5] [ 6] .

Az adatok széles körben elterjedt elvesztése arra késztetett néhány kutatót, hogy megvitassák a „digitális sötét korszak ” lehetőségét – egy olyan  időszakot, amelyet az írásos bizonyítékok szinte teljes hiánya jellemez [7] [8] . Egyes kutatók a 21. századot "információs fekete lyuknak" nevezik, mert attól tartanak, hogy a jövő szoftverei és számítógépei nem lesznek képesek reprodukálni a korábban létrehozott adatokat [9] . 2003-ban az UNESCO kiadta a "Chartát a digitális örökség megőrzéséről" [10] , meghatározva a digitális adatok lefoglalásának fontosságát, amelyek elvesztése az emberi örökség "elszegényedéséhez" vezethet [11] [12]. . 2015-ben Vinton Cerf amerikai tudós és a Google alelnöke kijelentette, hogy az emberiség a „digitális sötét korszak” felé halad [13] [14] [15] [16] .

A webes archiválás fejlesztésének másik előfeltétele a hivatkozások kioltása , olyan helyzet, amikor az oldalak elérhetetlenné válnak ugyanazon az URL -en, vagy megváltozik a tartalmuk [17] [18] [19] . A portugál kutatók által 2017-ben végzett elemzés kimutatta, hogy az internetes oldalak körülbelül 80%-a nem érhető el eredeti formájában egy évvel a megjelenés után, míg a tudományos cikkekben található linkek 13%-a átlagosan 27 hónap elteltével tűnt el [11] . 2021-ben a Harvard Law School tudósai a The New York Times (NYT) újságíróival együtt elemezték a linkek életképességét a NYT által 2000 és 2017 között több mint 550 000 online kiadványban – a felhasznált URL-ek körülbelül egynegyede "kihalt" " [20 ] [21] [22] [23] [24] . Egy weboldal átlagos élettartama 44-100 nap, és a híroldalakon és a közösségi oldalakon még gyorsabban tűnhetnek el az információk [25] [26] .

Az interneten található információk más okokból eltűnhetnek. Így 2015-ben az Egyesült Államok Külügyminisztériuma és az Egyesült Államok Nemzetközi Fejlesztési Ügynöksége kezdeményezte az afganisztáni háborúval kapcsolatos anyagok eltávolítását, hogy megvédje az amerikai hatóságokkal együttműködő embereket a tálibok üldöztetésétől [27] . Egy másik példa a Roszkomnadzor 2021 decemberében előterjesztett követelése, hogy távolítsák el számos orosz médiából a korábban nemkívánatos szervezetként elismert Proekt -kiadvány [28] [29] vizsgálatával kapcsolatos anyagot .

Fejlesztés

Az 1980-as évektől az egyes archívumok és könyvtárak megkezdték az elektronikus források megőrzését, hogy dokumentálják az aktuális események krónikáját. A webes archiválás kiindulópontjának azonban az „ Internet Archive ” 1996-os létrehozását tekintik – egy non-profit szervezetnek , amely ambiciózus célt tűzte ki maga elé, hogy megőrizze a teljes Internet összes weboldalát, amely akkoriban. viszonylag kevés volt [30] [1] . Az 1990-es évek végén és a 2000-es évek elején számos fejlett ország kormánya megkezdte a webes archiválási gyakorlatok alkalmazását, és azok fenntartását azokra a nemzeti könyvtárakra hárította, amelyek rendelkeznek az archiváláshoz szükséges tapasztalattal és eszközökkel [31] [11] [12] . 2000-re számos országban megjelentek a nemzeti webarchívumok, köztük az Egyesült Királyságban , Új-Zélandon , az Egyesült Államokban és a Cseh Köztársaságban [32] [33] [19] .

Azóta a webarchiválási projektek száma évről évre nő [11] . 2011-ben 42 program működött a világon, amelyek többsége regionális internetes források gyűjtésével foglalkozott [12] . Egy 2020-as tanulmány exponenciális növekedést mutatott a saját adattárral rendelkező intézmények számában , amelyet bérelt szakemberek és speciális berendezések támogatnak. A legtöbb ilyen adattárat az önarchiválás elve szerint töltenek fel - a szerzők önállóan helyezik el az anyagaikat [34] . 2019-re az Európai Unió szinte minden országában bevezették a nemzeti szintű webarchívumot , leggyakrabban a nemzeti könyvtárak munkájának részeként [32] [35] .

Szervezetek

Internetes archívum

Az első jelentős internetes archiválási kezdeményezés az Internet Archive volt, egy 1996-ban létrehozott non-profit szervezet, amely az interneten közzétett összes anyagot megőrzi [19] . Az alkotó az amerikai Brewster Keil programozó volt, aki egyszerre indította el az "Archívumot" és az Alexa Internet kereskedelmi webarchiváló rendszert . 1997-ben kifejlesztett egy böngészőbővítményt , amelyen keresztül az Alexa Internet automatikusan azonosította és az "Archívumban" tárolta az "értékes" weboldalakat , a látogatások, a keresztlinkek és a "kattintások" száma szerint rangsorolva [36] . 1998 óta 3-6 havonta megduplázódott az archiválandó oldalak száma [37] .

2001. október 24-én az Internet Archívum elindította a Wayback Machine -t, amelyen keresztül a felhasználók több mint 10 milliárd archivált weboldalhoz férhettek hozzá. Akkoriban az adatokat a Hewlett Packard és az uslab.com szervereken tárolták, és a FreeBSD és Linux operációs rendszereken keresztül kezelték [37] .

2021-re az Archívum gyűjtemény archivált webhelyek, digitalizált könyvek, hang- és videofájlok, játékok, szoftverek számos algyűjteményéből állt [38] ; míg az archivált weboldalak száma meghaladta a 622 milliárdot [39] .

WebCite

A 2003-ban elindított WebCite volt az első webes archiváló eszköz, amely lehetővé tette a felhasználók számára, hogy igény szerint elmentsék webhelyeiket. A WebCite gyorsan népszerűvé vált, és 2005-re körülbelül 200 folyóirat kérte a szerzőket, hogy a kéziratok benyújtása előtt archiválják weboldalaikat a WebCite-on keresztül [40] . A szolgáltatás nem használ keresőrobotokat az oldalak "rögzítésére", az archiválás közvetlenül a felhasználó kérésére történik [40] .

2013-ban a WebCite-ot a finanszírozás hiánya miatt a bezárás fenyegette, de az alkotó, Günter Eisenbach nyilvános adománygyűjtő kampányának köszönhetően a portál további hat évig működött. 2019 óta csak olvashatóvá vált, és már nem fogadja az archiválási kéréseket [41] [42] .

Archívum.today

Az archive.today szolgáltatást (létrehozásakor - archive.is) 2012-ben indította el egy azonos nevű nonprofit szervezet [43] . A projektet magánszponzorok finanszírozzák. A WebCite-hoz hasonlóan az archive.today is elmenti a weboldalakat a felhasználók kérésére [44] [45] azáltal, hogy nyilvánosan elérhetővé teszi a weboldal funkcionális másolatát, valamint egy képernyőképet , amely az oldal statikus PNG -megjelenítését ábrázolja [46] . Az összes képet tartalmazó archivált oldal mérete nem haladhatja meg az 50 MB -ot [43] .

Az archive.today készítői egy Mozilla Firefox böngészőbővítményt is elindítottak, amely automatikusan menti és megosztja a felhasználó által hozzáadott minden könyvjelzővel ellátott weboldal másolatát [46] [47] .

web-archive.ru

Az Orosz Föderáció saját orosz nyelvű webarchívumot is létrehozott - https://web-arhive.ru/ _

Nemzeti Könyvtárak

A legtöbb fejlett ország rendelkezik kötelező letéti törvényekkel, amelyek a nemzeti könyvtárakat jogilag felelőssé teszik az adott országban megjelent nyomtatott kiadványok egy példányának megőrzéséért. Az elektronikus hírközlés széles körű fejlődésével a törvény a weboldalakra is kiterjedt [1] [48] . Így a Public Records Act 1967 értelmében a Nagy-Britannia és Írország Nemzeti Levéltára köteles megőrizni az Egyesült Királyság kormányának minden fontos előírását . Ahogy a tisztviselők egyre gyakrabban teszik közzé jelentéseiket az interneten, havonta több mint 100 millió felhasználó keresi fel a webarchívumot (2013-tól) [25] .

1996-ban a Svéd Nemzeti Könyvtár kezdeményezte a Kulturar projektet, amely a teljes svéd domain hálózat nagyarányú megőrzését végezte el [49] . 2005 elejéig több mint 350 000 webhelyet, vagyis körülbelül 10 terabájtnyi adatot gyűjtöttek össze, így a webarchívum akkoriban a legnagyobb a világon [19] . 1997-ben Dánia , Finnország , Izland , Norvégia és Svédország nemzeti könyvtárai közös kezdeményezést hoztak létre Nordic Web Archive (NWA) néven. Az NWA eszközöket fejleszt és megvitatja a webes archiválási módszereket az északi országok számára. 2004-ben az NWA kiadott egy szoftvercsomagot az archivált webdokumentumok elérésére, amely ezt követően az IIPC Toolkit [19] [50] alapját képezte . Ugyanebben az évben az Ausztrál Nemzeti Könyvtár elindította a Pandorát – a digitális források megőrzését célzó projektet Ausztráliában [51] [52] [19] . 2019-ben a Pandora gyűjtemény bekerült az Australian Web Archive -be, amely a világ egyik legnagyobb nemzeti webarchívuma [53] .

Együttműködések

2001-ben létrejött az International Internet Archiving Workshop (IWAW) [54] - a webarchiválás terén végzett kutatások és tapasztalatok cseréjének platformja [55] , majd 2003-ban az Internet Archívum kezdeményezésére a Nemzetközi Megalakult az Internet Preservation Consortium , amely szabványokat és eszközöket fejleszt a webarchiváláshoz [37] [56] . Az „Archívum” mellett az IIPC magában foglalta Franciaország , Ausztrália , Kanada , Dánia , Finnország , Izland , Olaszország , Norvégia , Svédország , Nagy-Britannia és az USA nemzeti könyvtárait . 2008-ban az IIPC kifejlesztette a Web ARChive -ot vagy a WARC -t, a webes erőforrások archiválására szolgáló formátumot [12] . 2021-ben az IIPC-nek több mint 50 tagja van [57] .

A szervezetek gyakran együttműködnek az egységes webarchívumok létrehozásában. Így 2004-től 2018-ig az Európai Digitális Archívum (későbbi nevén Internet Memory Foundation ) működött, amely az Európai Unió országaiban gyűjtötte az elektronikus dokumentumokat [58] [19] [12] . Ide tartozott többek között a Nagy-Britannia Nemzeti Levéltára, a Max Planck Társaság , a Berlini Műszaki Egyetem , a Southamptoni Egyetem , az Institut Mines-Télécom . A 2000-es évek elején a heidelbergi és leideni egyetemek sinológiai tanszékei közösen elindították a DACHS webarchívumot, amely a sinológiával kapcsolatos elektronikus anyagokat tartalmazza [59] [19] . Az olyan konzorciumok, mint az NWA és az UKWAC, együttműködési adatgyűjtési programokat működtetnek más szervezetekkel együttműködve [60] [19] [61] . Az 1990-es évek végén az Európai Bizottság finanszírozta a Networked European Deposit Library (NEDLIB) létrehozását, amely projekt az elmentett európai weboldalak összegyűjtésére, leírására, tárolására és elérhetővé tételére irányul [62] . A 2000-ben kiadott NEDLIB Harvester az egyik első keresőrobot volt, amelyet kifejezetten adatarchiválásra terveztek. Ezt követően számos projektben használták, beleértve a holland , észt és izlandi webdomainekről való adatgyűjtést [19] [63] .

2011 júliusában a Nagy-Britannia Nemzeti Levéltára az Internet Memory Foundation alapítvánnyal közösen kísérleti projektet indított a helyi hatóságok webalapú digitális archiválására. A projekt hét települési levéltárban működött, több mint 20 helyi hatóságra kiterjedően. A munkatársak ingyenes képzésben részesültek egy kurált webarchívum létrehozására szakterületükön [64] .

A fejlett országok egyetemei is részt vesznek a webarchiválás fejlesztésében. Például Michigan , Indiana , Kalifornia , Illinois és más egyetemek kínálnak kurzusokat a digitális archiválásról [54] , és több intézmény is létrehozott saját webarchívumot kutatási célokra - Stanford WebBase Archívum ( Stanford Egyetem ), Socio-Sense ( University of Tokió ), Web Információs Központ ( Peking Egyetem ) [12] .

Sourcing

Az archiválás megkezdése előtt minden szervezet meghatározza a források „kiválasztásának” kritériumait. A szervezet méretétől és célkitűzéseitől függően egy vagy több ilyen kritérium létezhet [19] [65] . Egyes webarchívumok, például az Internet Archívum célja, hogy az összes lehetséges weboldalt összegyűjtsék. Ezt a megközelítést nem szelektívnek vagy széleskörű letapogatásnak nevezik . A világháló összekapcsoltságának elvén alapul , miszerint egy témát csak úgy lehet igazán „megőrizni”, ha összegyűjtjük az összes létező weboldalt, hiszen ezek mind összefüggenek. Emellett a weboldal kiválasztása költséges és időigényes folyamat, amely szubjektív mintavételhez is vezethet [19] . Az "Archívum" megközelítést azonban a gyakorlatban megvalósíthatatlannak tartják - a szerzői jogi korlátozások miatt az összes oldal mentése lehetetlen, sőt az "Internet Archívum" is csak a nyilvánosság számára elérhető anyagokat menti el [66] .

A nem szelektív kiválasztási megközelítés alternatívája a szelektív megközelítés, vagy az erőforrások kiválasztása az előre meghatározott kritériumokhoz való tartozásuk alapján - tartomány (például .gov vagy .edu ), téma, esemény, médiatípus vagy műfaj [19] . A szelektív megközelítést gyakran széles körű vizsgálati gyakorlatokkal kombinálják – például ha egy szervezet az összes portált egy adott tartománynévvel archivál. Így 1996 óta a Svéd Nemzeti Könyvtár összegyűjti az összes „ .se ” tartományú webhelyet [19] [67] , a Great Britain Nemzeti Könyvtár pedig archiválja a „.gov.uk”, „.org” domainnel rendelkező webhelyeket. .uk” és „.co.uk”. A Goddard Űrrepülési Központ NASA könyvtára karbantartja az összes weboldalt a Központ domain nevével [19] . A szelektív archiválás fő előnye, hogy ezzel a megközelítéssel jobban kezelhető gyűjtemények hozhatók létre a kapcsolódó erőforrásokkal [19] .

Szelektív megközelítést alkalmaznak a tematikus gyűjtemények létrehozásához is. A DACHS például társadalmi és kulturális forrásokat gyűjt a sinológiáról, a Kongresszusi Könyvtár pedig az Internet Archívummal együttműködve webarchívumot állított össze az amerikai elnökválasztásról és a szeptember 11-i eseményekről . A British Library a "nemzeti kulturális értékkel bíró" weboldalakra specializálódott [67] . Az Ausztrál Nemzeti Könyvtár Pandora projektje [19] [54] is ezt a megközelítést alkalmazza . 2006-ban az Internet Archívum elindította az Archive It nevű web-alapú gyűjtőszolgáltatást [68] , amelyet gyakran használnak egyes szervezetek, például a National Museum of Women's Art [69] .

Egyes szervezetek a bemutatott forrás típusa alapján archiválják az erőforrásokat. A Goddard Space Flight Center könyvtár például elkerüli a nagy videofájlok és szoftvertermékek beolvasását. Éppen ellenkezőleg, más webprojektek archiválják a videókat a Youtube -on , vagy gyűjtenek blogokat, virtuális újságokat – például a Francia Nemzeti Könyvtár külön webgyűjteményt hozott létre a LiveJournals számára [54] .

Adatgyűjtés

Statikus oldalak

Minél egyszerűbb és statikusabb az oldal, annál egyszerűbb az archiválása [70] - az adatok másolatai letöltésre kerülnek a webszerverről fájlokként, amelyek később más formátumba konvertálhatók [71] [72] [73] .

A weblapok keresőrobotokon keresztül történő automatikus gyűjtésének folyamatát webbegyűjtésnek vagy „szkennelésnek” nevezik. A robot kap egy URL-listát, amelyet követően HTTP kéréseket küld a webszervereknek, és "elfogja" a továbbított tartalmat és az összes hiperhivatkozást a szkennelt weboldalakról [73] . Az automatizált szoftver ezután WARC formátumba konvertálja az információkat, ami egy olyan fájlt eredményez, amely lejátszható olyan eszközökkel, mint a Wayback Machine [74] . Példák a bejárókra az Internet Archívum által 2004-ben kifejlesztett Heritrix [75] , valamint a HTTrack [76] és a Wget [77] . A „szkennerek” hálózata lehetővé teszi a szervezetek számára, hogy rendszeres időközönként, például naponta vagy évente másolatokat mentsenek a kiválasztott oldalakról [74] . A célzottabb archiváláshoz kisebb eszközöket használnak, mint például a HTTrack , amely lehetővé teszi a webhelyek másolatainak letöltését a helyi számítógépre [74] .

Dinamikus webhelyek

A dinamikus webhelyek archiválása sokkal nehezebb, mint a statikus webhelyek, mivel a tartalom, a szkriptek és a sablonok külön erőforrásokként vannak tárolva a webszerveren. az oldal megjelenése és tartalma pedig a kliens böngésző és szerver beállításaitól függően alakul. A statikus webhelyekkel ellentétben a HTTP kérés automatikus feldolgozása nem elegendő, mivel az oldal a szerver oldaláról generál tartalmat egy adatbázis segítségével [71] . Ezért az ilyen erőforrások megőrzése két lépésben történik - a webhely címtárstruktúrájában található fájladatok mentése és az adatbázis információinak archiválása [71] . A dinamikus oldalak esetében a keresőrobotok használatának vannak korlátai [19] . A dinamikus tartalom webes archiváló eszközei közé tartozik a svájci szövetségi levéltár által kifejlesztett Software Independent Archiving of Relational Databases (SIARD) és a Francia Nemzeti Könyvtár DeepArc . A SIARD automatikusan elemzi és megjeleníti a forrásadatbázis szerkezetét. Ezután a struktúrát szövegfájlként exportálja, amely az SQL , a relációs adatbázisok leírásának nemzetközi szabványa segítségével leírt adatdefiníciót tartalmazza . Ezt követően a tartalom egyszerű szöveges fájlként exportálódik, a metaadatok pedig XML - dokumentumként kerülnek mentésre [19] .

Közösségi média archiválás

Az első közösségimédia-archiválási projektek 2008-tól kezdtek megjelenni szisztematikus széles platform vizsgálatként. Így az Új-Zélandi Nemzeti Könyvtár munkába állt a Twitteren közzétett üzenetek archívumának létrehozásán , a Francia Nemzeti Könyvtár pedig átvizsgálta a Facebookot . Az előállított tartalom nagy mennyisége, az információgyűjtés és -tárolás technikai szabványainak hiánya, valamint a portálok működésének folyamatosan változó technikai részletei miatt azonban a szervezetek ezt követően szelektíven kezdtek el hozzálátni a közösségi hálózatok webes archiválásához és mentéséhez. csak konkrét eseményekről vagy vészhelyzetekről szóló üzenetek. Az egyének, mint például a Bibliothèque Nationale de France vagy a Kanadai Nemzeti Könyvtár, folyamatosan automatizált gyűjteményt indítottak a hírekből és a közösségi médiából, hogy felfogják az emberek reakcióit az előre nem látható eseményekre. A kiválasztás adott hashtagek vagy kulcsszavak alapján történik , egy bizonyos időszakra vagy egy adott platformra [78] [79] .

Eszközök

A webhelyek összegyűjtésére különféle webes archiváló eszközöket használnak. A legelterjedtebb bejáró a Heritrix , egy általános célú webrobot, amely ingyenes szoftverlicenc alatt érhető el, a webarchiválást szem előtt tartva. A Heritrix a fájlokat WARC formátumban menti, és kiválóan alkalmas nagyszabású szkennelési műveletekre, de kevésbé valószínű, hogy „elfog” dinamikus webhelyeket vagy közösségi oldalakat. A Heritrix NetarchiveSuite alapján további szolgáltatásokat nyújt a hosszú távú tárolás és az anyagokhoz való hozzáférés terén [1] .

A Webrecorder a böngésző segítségével gyűjti össze a weboldalak tartalmát, ezzel megoldva más keresőrobotok gyakori problémáit – dinamikus tartalom rögzítése, Adobe Flash , multimédia . A program „rögzíti” a weblapokat, ahogy a felhasználó azokat böngészi, így kiválóan alkalmas szelektív szkennelésre. A tartalom WARC [1] formátumban is elmentésre kerül . Egy másik bejáró, a Brozzler [80] a Google Chrome böngészőmotort használja az oldalak gyűjtésére, és ugyanazokat az előnyöket kínálja, mint a Webrecorder, de nem igényel felhasználói beavatkozást a feltérképezés során [1] .

A HTTrack lehetővé teszi a webhelyek másolatainak letöltését a helyi számítógépre, majd a felhasználó böngészőn keresztül megtekintheti azokat [81] . A Wget és a hasonló Wpull eszköz sokoldalú parancssori eszközök, amelyek a HTTrackhez hasonló beépített webes feltérképezési funkciókkal rendelkeznek. A Wpull alkalmasabb nagyméretű archiválásra [1] .

A közösségi oldalak dinamikus szerkezete miatt archiválásukhoz speciális eszközökre van szükség. A webes archiválás általában a fejlesztők által biztosított alkalmazásprogramozási felületek vagy API -k segítségével történik . Az F(b)arc egy parancssori eszköz, amellyel a Facebook Graph felületén archiválhatunk adatokat. A Twarc egy parancssori eszköz és könyvtár, amely megkönnyíti a Twitter API-k használatát. A Social Feed Manager lehetővé teszi, hogy adatokat gyűjtsön a Twitter, a Tumblr , a Flickr és a Sina Weibo oldalakról [1] .

A leggyakrabban használt archiválási formátumok az ARC és a WARC . A legtöbb kezdeményezés Lucene -alapú megoldásokat használ a teljes szöveges keresés támogatására , beleértve a NutchWAX-ot vagy a Solr -t , a Wayback Machine -t az URL-keresés támogatására és az archivált tartalom megjelenítésére [11] . A JWAT , node-warc , WARCAT , warcio és warctools eszközök használhatók a WARC fájlok metaadatainak olvasására és kinyerésére [1] .

Felbontás

Az, hogy egy szervezet megfelel -e a robot-kivételi szabványnak , vagy engedélyt kér-e az archiválásra a webhelytulajdonosoktól, számos tényezőtől függ – a tartalom típusától, a webes archiválás mértékétől, a jogi környezettől [54] [1] . Azonban még az engedélykéréskor is csak a webhelytulajdonosok körülbelül 30-50%-a válaszol a kérelemre [82] .

Általánosságban elmondható, hogy a nyilvános iratok megőrzésére törvényes joggal rendelkező kormányzati szerveknek (például a National Archives and Records Administration (USA) és az Egyesült Királyság Nemzeti Levéltárának) nincs szükségük engedélyre a szkenneléshez. A 2006-os francia szerzői jogi törvény szerint a Francia Nemzeti Könyvtár figyelmen kívül hagyhatja a robotokat a nemzeti domainekkel rendelkező webhelyek feltérképezésekor [54] [1] . Más szervezetek, mint például az Internet Archívum is alkalmazzák munkájuk során az opt-out elvet – az adatok eltávolítása a gyűjteményből a szerzői jog jogosultjainak kérésére történik, akik a szerzői jogot az anyag leírásával, a pályázó elérhetőségei és aláírt nyilatkozat [83] [54] [25] .

Metaadatok

A webarchívumok rendszerint hierarchikus felépítésűek – egy feltérképezési munkamenet számos webhelyet rögzít, amelyek mindegyike külön weboldalra vezet, amely video-, szöveg- és képfájlokat tartalmaz. Mindegyik „szinthez” metaadatok jönnek létre [54] [84] .

A metaadatok létrehozásának megközelítése a szervezet méretétől és erőforrásaitól függ. Például a nagy webarchívumok gyakran támaszkodnak az automatikus metaadatok generálására. Egyes metaadatokat, beleértve a gyűjtési időt, az állapotkódot (például a 404 -et a nem található vagy a 303-ast az átirányításhoz), a méretet bájtokban , az URI -t vagy a MIME -típust (például a szöveget/ HTML -t), a feltérképező robotok automatikusan „elfogják”. A HTML oldalak [54] [84] metacímkéiből is kinyerhető az információ .

A kis webarchívumok manuálisan is generálhatnak metaadatokat. A University of California, Los Angeles Literature Archive részletes feljegyzéseket használ, amelyeket a munkatársak a weboldalak gyűjtése és elemzése során készítettek a metaadatok létrehozásához [54] [85] . A Tajvani Nemzeti Egyetem webarchívumának háromszintű hierarchikus besorolása van. A metaadatok egyéni címkék, megjegyzések vagy értékelések segítségével is létrehozhatók [54] [85] [86] .

Problémák

A felhasználók különféle okokból fordulnak a webarchívumokhoz – kutatás elvégzése, saját adatbázis összeállítása vagy az egyes webes erőforrások régebbi verzióinak megtekintése céljából. Az ilyen gyűjteményekhez való hozzáférést azonban gyakran nehezíti az általános keresés hiánya az elérhető adatbázisokban és a kényelmetlen felület. A tárolt információk elérése és feldolgozása gyakran speciális fájlformátumokkal kapcsolatos technikai ismereteket igényel [87] [61] [88] . Egyes kutatók úgy vélik, hogy ezen okok miatt a webarchívumokra mutató hivatkozások még mindig ritkán találhatók tudományos közleményekben, és a gyűjteményeket nem tanulmányozzák [89] [90] .

A webarchívum gyűjtemény hiányos vagy elfogult lehet a "zárt" oldalak archiválásának képtelensége és/vagy az archiválási stratégiák szakszerűtlen kidolgozása miatt – például amikor csak a nagy nyugati országok angol nyelvű portáljait archiválják. Bár néhány archívumnak törvényes joga van figyelmen kívül hagyni a robotkivételi szabványt , más szervezetek gyűjteményei jelentősen korlátozottak, ha megfelelnek a szabványnak [70] [91] [70] .

A webrobotok használatával végzett automatizált webarchiválás nagy mennyiségű információt rögzít [34] , azonban egyes interaktív JavaScript -elemek nem menthetők, és az archivált verzió elveszti funkcionalitását [70] [92] .

Jegyzetek

  1. 1 2 3 4 5 6 7 8 9 10 11 Chambers, 2019 , pp. 85-111.
  2. Veronica Greenwood. A digitális sötét középkor  . Yale Alumni Magazine (2020. június). Letöltve: 2021. december 9. Az eredetiből archiválva : 2021. október 15.
  3. Dan Greene. A személyes tulajdon eróziója  . Vox (2021. április 21.). Letöltve: 2021. december 9. Az eredetiből archiválva : 2021. szeptember 26..
  4. A Digital Domesday Book 15 évig tart, nem  1000 . The Guardian (2002. március 3.). Letöltve: 2021. december 11. Az eredetiből archiválva : 2013. január 20.
  5. Veronica Greenwood. A digitális sötét középkor  . Yale Alumni Magazine (06-2020). Letöltve: 2021. szeptember 27. Az eredetiből archiválva : 2021. október 15.
  6. Lamont Wood. A digitális sötét középkor kivédése: Az archívum tárolásának  kérdése . ComputerWorld (2010. augusztus 26.). Letöltve: 2021. december 11. Az eredetiből archiválva : 2021. január 26.
  7. Giaretta, 2011 .
  8. Panos, 2003 .
  9. Adam Wernick. A tudósok arra figyelmeztetnek, hogy „digitális sötét kort  ” hozunk létre . A világ (2018. január 1.). Letöltve: 2021. december 10. Az eredetiből archiválva : 2021. augusztus 16.
  10. Digitális megőrzési  charta . ENSZ. Letöltve: 2021. december 12. Az eredetiből archiválva : 2021. augusztus 23.
  11. 1 2 3 4 5 Costa, 2017 , pp. 191-205.
  12. 1 2 3 4 5 6 Toyoda, 2012 , pp. 1441-1443.
  13. ↑ A digitális sötét korszak elkerülése érdekében minden érdekelt félnek össze kell tennie a fejét  . The Times of India (2020. szeptember 17.). Letöltve: 2021. szeptember 27. Az eredetiből archiválva : 2021. szeptember 8..
  14. Lauren Maffeo. A Google Vint Cerf a digitális sötét korszak  megelőzéséről . The Guardian (2015. május 29.). Letöltve: 2021. november 27. Az eredetiből archiválva : 2021. november 19.
  15. Dave Smith. Az internet atyja: „Ha most nem mozdulunk el, fennáll annak a veszélye, hogy elveszítjük a 21. században létrehozott összes adatunkat  ” . Business Insider (2015. február 20.). Letöltve: 2021. november 28. Az eredetiből archiválva : 2021. november 19.
  16. Nyikolaj Udincev. A nap idézete: Miért kezdődhet a digitális sötét  korszak ? Nézz rám (2015. február 13.). Letöltve: 2021. november 28. Az eredetiből archiválva : 2021. november 19.
  17. Adoghe, 2013 , pp. 598-603.
  18. Perkel, 2015 , pp. 111-112.
  19. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Brown, 2006 , pp. 1-256.
  20. Rodosz, 2010 , pp. 581-597.
  21. Fehér, 2019 , pp. 29-43.
  22. A kutatók rámutatnak az internetes hivatkozások "kihalásának" problémájára  (eng.) . Hírek (2021. május 21.). Letöltve: 2021. szeptember 28. Az eredetiből archiválva : 2021. november 23.
  23. Bowers, 2021 .
  24. Mitchell Clark. Az új kutatások azt mutatják, hogy az interneten hány fontos link vész el az  időben . The Verge (2021. május 21.). Letöltve: 2021. október 10. Az eredetiből archiválva : 2021. június 20.
  25. 1 2 3 Pennock, 2013 .
  26. Nick Bilton. Egy link  élettartama . The New York Times (2011. szeptember 7.). Letöltve: 2021. december 10. Az eredetiből archiválva : 2021. szeptember 28..
  27. Matthew Gault. Az Egyesült Államok eltávolítja az afganisztáni háború feljegyzéseit az  internetről . Vice (2015. július 17.). Letöltve: 2021. december 11.
  28. A Roszkomnadzor azt követelte a médiától, hogy távolítsák el a nemkívánatos szervezetként elismert „Projekt” vizsgálatairól szóló publikációkat . BBC (2021. december 18.). Letöltve: 2021. december 20. Az eredetiből archiválva : 2021. december 18..
  29. Tasya Elfimova. A Roszkomnadzor azt követelte, hogy a The Village, a Meduza és a Dozhd távolítsák el a Projekt vizsgálataival kapcsolatos hírek tucatjait . A falu (2021. december 18.). Letöltve: 2021. december 19. Az eredetiből archiválva : 2021. december 18..
  30. Patel, 2020 , pp. 1-10.
  31. Balatskaya, 2021 , p. 12-16.
  32. 12. Pretoro , 2013 , pp. 63-67.
  33. Single Sites Web Archive - Minerva - Library of Congress Web  Archive . Európai Történelem Elsődleges Források. Letöltve: 2021. december 13. Az eredetiből archiválva : 2021. május 6..
  34. Rockwell 12 , 2020 , pp. 1-17.
  35. Mark Pesce. A World Wide Web  archiválása . Kozmosz (2021. október 29.). Letöltve: 2021. december 11. Az eredetiből archiválva : 2021. november 25.
  36. Kimpton, 2006 .
  37. 1 2 3 Masanes, 1998 , pp. 201-212.
  38. Rory Carroll. Brewster billiói : Az Internet Archive arra törekszik, hogy életben tartsa az internetes történelmet  . The Guardian (2013. április 26.). Letöltve: 2021. december 11. Az eredetiből archiválva : 2021. december 15.
  39. Wayback  Machine . visszautasító gép. Hozzáférés időpontja: 2021. június 7.
  40. 12 Trudel , 2005 .
  41. Alap WebCite (http://www.webcitation.org  ) . FundRz. Letöltve: 2021. december 18.
  42. Archiválás most (archivenow  ) . GitHub. Letöltve: 2021. december 20. Az eredetiből archiválva : 2021. december 20.
  43. 1 2 GYIK  . _ archívum.ph. Letöltve: 2021. december 10. Az eredetiből archiválva : 2021. október 27.
  44. Salman Ravoof. Webhely archiválása : Mamut útmutatónk webhelye mentéséhez  . Kinsta (2021. november 3.). Letöltve: 2021. december 7. Az eredetiből archiválva : 2021. november 5..
  45. Jason Koebler. Kedves GamerGate ! Kérem, hagyja abba a szarunk ellopását  . Vice (2014. október 29.). Letöltve: 2021. december 7. Az eredetiből archiválva : 2021. november 27.
  46. 12 Martin Brinkmann . Nyilvánosan elérhető weboldal-archívumok létrehozása az Archive.is segítségével . G Hacks (2015. április 22.). Letöltve: 2021. december 12. Az eredetiből archiválva : 2019. április 12.  
  47. Webes archiválási szolgáltatások  összehasonlítása . Weboldal archiválás. Letöltve: 2021. december 10.
  48. Egyesült Királyság elektronikus kötelespéldány-  rendszere . Információs és elemző folyóirat Egyetemi Könyv (2013. szeptember 21.). Letöltve: 2021. december 18. Az eredetiből archiválva : 2020. október 24.
  49. A Kulturarw3 projekt  . Jeremy Norman információs története. Letöltve: 2021. december 10.
  50. ↑ Megjelent az NWA Toolset 1.1RC10  . N.W.A. Letöltve: 2021. december 11. Az eredetiből archiválva : 2018. április 26..
  51. Előzmények  _ _ Pandora. Letöltve: 2021. december 11. Az eredetiből archiválva : 2020. június 4.
  52. Webb, 2000 , pp. 154-172.
  53. George Nott. A National Library elindítja Ausztrália internetének „hatalmas” archívumát  . Computer World (2019. március 11.). Letöltve: 2021. december 10. Az eredetiből archiválva : 2021. november 24.
  54. 1 2 3 4 5 6 7 8 9 10 11 Niu, 2012 .
  55. IWAW 2010: A 10. nemzetközi internetes archiválási  műhely . WikiCfP. Letöltve: 2021. december 15. Az eredetiből archiválva : 2021. április 27.
  56. Nemzetközi Internet Preservation  Consortium . Nemzetközi Internet Preservation Consortium. Letöltve: 2021. december 14. Az eredetiből archiválva : 2021. december 14.
  57. IIPC  tagok . Nemzetközi Internet Preservation Consortium. Letöltve: 2021. december 13. Az eredetiből archiválva : 2021. december 16.
  58. Európai  archívum . Kongresszusi Könyvtár. Letöltve: 2021. december 13.
  59. A DACHS-ről  . Bereichbibliother Ostaasien. Letöltve: 2021. december 13. Az eredetiből archiválva : 2021. október 17.
  60. Steve Bailey, Dave Thompson. Az Egyesült Királyság első nyilvános  webarchívumának készítése . Dlib Magazin (2006). Letöltve: 2021. december 18. Az eredetiből archiválva : 2021. november 23.
  61. 1 2 Dooley, 2017 , pp. 1-15.
  62. Johan Steenbakkers. Előadások  _ _ Európai Könyvtárautomatizálási Csoport. Letöltve: 2021. december 13. Az eredetiből archiválva : 2021. december 29.
  63. Hakala, 2001 , pp. 211-216.
  64. Duncan Jefferies. Webarchívumok használata a múlt megőrzésére . The Guardian (2012. március 9.). Letöltve: 2021. december 11. Az eredetiből archiválva : 2021. június 10.
  65. Alam, 2020 , pp. 1-251.
  66. Broussard, 2021 , p. 276.
  67. 12 Chambers , 2019 .
  68. Povroznik, 2020 , p. 95-102.
  69. Slania, 2013 , pp. 112-126.
  70. 1 2 3 4 João Miranda. Webes begyűjtés és  archiválás . Web Ist UTL. Letöltve: 2021. december 17. Az eredetiből archiválva : 2021. december 29.
  71. 1 2 3 Rumianek, 2013 .
  72. Brunelle, 2012 .
  73. 2013. 12. Pretoro .
  74. 1 2 3 Az internet  megőrzése . Digitális megőrzés online. Letöltve: 2021. december 17. Az eredetiből archiválva : 2021. szeptember 14.
  75. Mohr, 2004 , pp. 1-15.
  76. Justin Kulesza. Webhely archiválása  . atomi tárgy. Letöltve: 2021. december 14. Az eredetiből archiválva : 2016. június 23.
  77. ↑ A parancs, amellyel egyetlen webhelyet  archiválok . GitHub. Letöltve: 2021. december 15. Az eredetiből archiválva : 2021. december 23.
  78. Michel, 2021 , pp. 107-128.
  79. Redkina, 2019 , p. 52.
  80. internetarchívum /brozzler  . GitHub. Letöltve: 2021. december 16. Az eredetiből archiválva : 2021. december 10.
  81. Útmutató az offline böngészőkhöz. 2. rész . IXBT.com. Letöltve: 2021. december 17. Az eredetiből archiválva : 2019. augusztus 2..
  82. Jogi  problémák . Nemzetközi Internet Preservation Consortium. Letöltve: 2021. december 16. Az eredetiből archiválva : 2021. december 16.
  83. Berčič, 2005 , pp. 17-24.
  84. 12. Brown , 2006 , pp. 1-256.
  85. 12. Barna , 2006 .
  86. Olson, 2009 , pp. 181-196.
  87. Ayala, 2021 , pp. 89-106.
  88. Brügger, 2017 , pp. 45-61.
  89. Rogers, 2019 , p. 49.
  90. Niels, 2021 , pp. 145-168.
  91. Kalev Leetaru. Miért kell a webarchívumoknak  együttműködniük a kutatókkal ? Forbes (2019. május 7.). Letöltve: 2021. december 11. Az eredetiből archiválva : 2021. december 29.
  92. Kalev Leetaru. A webarchívumok kudarcot vallanak a modern webben: videók, közösségi média, dinamikus oldalak és mobilweb . Forbes (2017. február 24.). Letöltve: 2021. december 11. Az eredetiből archiválva : 2021. december 29.

Irodalom

  • Adoghe A., Onasoga K., Dike D., Ajayi O. Web-archiválás: technikák, kihívások és megoldások  (angol) . - 2013. - Kt. 5 , iss. 3 . - P. 598-603 .
  • Alam S. Mementomap: webarchívum profilalkotási keretrendszer a hatékony  mementóútválasztáshoz . — 2020.
  • Ayala B. Amikor az elvárások találkoznak a valósággal: gyakori tévhitek a webarchívumokkal kapcsolatban és kihívások a tudósok számára  (angol)  // International Journal of Digital Humanities. - 2021. - Iss. 2 . - 89-106 . o .
  • Berčič B. Személyes adatok és szerzői joggal védett anyagok védelme a weben: A Google és az internetes archívum esetei  //  Kommunikációs technológiai törvény. - 2005. - 20. évf. 14 , iss. 1 . - P. 17-24 . - doi : 10.1080/1360083042000325283 .
  • Brown A. A weboldalak archiválása gyakorlati útmutató információkezelési szakemberek számára  . Facet közzététel. - 2006. - 256 p. - ISBN 978-1-85604-553-7 .
  • Brügger N., Schroeder R. Élő versus archívum: Webarchívum összehasonlítása weboldalak  sokaságával (angol) . - 2017. - P. 45-61 . - doi : 10.2307/j.ctt1mtz55k.8 .
  • Brügger N. Digitális humán tudományok és webarchívumok: Lehetséges új utak az adatkészletek kombinálásához  //  International Journal of Digital Humanities. - 2021. - Iss. 2 . - 145-168 . o .
  • Broussard M. Adatújságírás archiválása  //  Yhe Data Journalism Handbook. - 2021. - 274-278 . o . - doi : 10.2307/j.ctv1qr6smr.40 .
  • Brunelle J., Nelson M. A SiteStory tranzakciós webarchívum értékelése az ApacheBench eszközzel   // ArXiv.org . — 2012.
  • Costa M., Gomes D., Silva M. The evolution of web archiving  (angol)  // Int J Digit Libr. - 2017. - Iss. 18 . - P. 191-205 . - doi : 10.1007/s00799-016-0171-9 .
  • Dooley JM, Farrell K., Kim T., Venlet J. Developing Web Archiving Metadata Best Practices to Meet User Needs  //  Journal of Western Archives. - 2017. - Kt. 8 , iss. 2 .
  • Hakala J. The NEWLIB harvester  (angol)  // Zeitschrift für Bibliothekswesen und Bibliographie. - 2001. - Vol. 48 , iss. 3 . - P. 211-216 .
  • Giaretta D. Avoiding a Digital Dark Age for data: Why publishers to care about digital preservation  //  Learned Publishing. - 2011. - P. 1-18 .
  • Kimpton M., Ubois J. Évről évre: Az Internet archívumától az Internet archívumáig // Webes archiválás. - 2006. - S. 201-212 .
  • Masanes J. Webes archiválás  . — Springer. - 1998. - P. 1-234. — ISBN 3-540-23338-5 .
  • Mohr G., Stack M., Ranitovic I., Avery D., Kimpton M. An Introduction to Heritrix. Nyílt forráskódú, archív minőségű webrobot // 4th International Web Archiving Workshop. - 2004. - S. 1-15 .
  • Niu J. A webarchiválás áttekintése  //  School of Information Faculty Publications. - 2012. - P. 1-13 . - doi : 10.1045/march2012-niu1 .
  • Ogden J., Maemura E. „Go fish”: A nemzeti webarchívumok digitális kutatásba való bevonásával járó kihívások koncepciója  //  International Journal of Digital Humanities. — Iss. 2 . - P. 43-63 . - doi : 10.1007/s42803-021-00032-5 .
  • Olson J. 14. fejezet – Az archív adattár  //  Adatbázis-archívum. - 2009. - P. 181-196 . - doi : 10.1016/B978-0-12-374720-4.00014-5 .
  • Panos P. The Internet Archive: An End to the Digital Dark Age  (angol)  // Journal of Social Work Education. - 2003. - 1. évf. 39 , iss. 2 . - P. 343-347 . - doi : 10.1080/10437797.2003.10779139 .
  • Patel K., Phillips M., Caragea C., Fox N. Dokumentumok azonosítása a webarchívumból származó gyűjtemény hatókörében   // arXiv . — 2020.
  • Pennock M. Web-  archiválás . - DPC Technology Watch Report 2013. március 13-01. - 2013. - doi : 10.7207/twr13-01 .
  • Perkel, J. A referencia rothadás problémája. (angol)  // Természet. - 2015. - Iss. 521 . - 111-112 . o . - doi : 10.1038/521111a .
  • Pretoro E., Geeraert F., Soyez S. Behind the scenes of web archiving metadata of harvested websites  //  Trust and Understanding: the value of metadata in a digitally joined-up world. - 2013. - P. 63-74 .
  • Rhodes S. Link Rot lebontása: A Chesapeake Project Legal Information Archive Examination of URL Stability  //  Law Library Journal. - 2010. - 20. évf. 102 , iss. 4 . - P. 581-597 .
  • Rockwell G., Tchoh B. Adatbázis-vezérelt webhelyek archiválása jövő digitális régészeinek: A TAPoR archiválása  //  CSDH-SCHN 2020. - 2020. - doi : 10.17613/v412-8896 . )
  • Rogers R. Periodizing Web Archiving: Életrajzi, eseményalapú, nemzeti és önéletrajzi hagyományok  //  The SAGE Handbook of Web History. - 2019. - P. 42-57 .
  • Rumianek M. Adatbázis-vezérelt webhelyek archiválása és helyreállítása  //  D-Lib Magazin. - 2013. - Kt. 19 , iss. 1/2 . - doi : 10.1045/january2013-rumianek .
  • Slania H. Online Art Ephemera: Web Archiving at the National Museum of Women in the Arts  //  Art Documentation: Journal of the Art Libraries Society of North America. - 2013. - Kt. 32 , iss. 1 . - 112-126 . o .
  • Toyoda M., Kitsuregawa M. {{{title}}}  (angol)  // Invited Paper. - 2012. - doi : 10.1109/JPROC.2012.2189920 .
  • Eysenbach G., Trudel M. Going, Going, Still There: A WebCite szolgáltatás használata idézett weboldalak tartós archiválására // J Med Internet Resources. - 2005. - doi : 10.2196/jmir.7.5.e60 .
  • Zittrain J., Bowers J., Stanton C. The Paper of Records Meets an Ephemeral Web: An Examination of Linkrot and Content Drift in The New York Times  //  Library Innovation Lab. – 2021.
  • Webb C. Mert mindannyiunkra tartozik: National Arrangements for Digital Preservation in Australian Libraries  (angol)  // Australian Academic & Research Libraries. - 2000. - P. 154-172 . - doi : 10.1080/00048623.2000.10755132 .
  • Vlassenroot E., Chambers S., Mechant P. Webarchívumok mint adatforrás a digitális tudósok számára  //  International Journal of Digital Humanities. - 2019. - 1. évf. 1 , iss. 85 . - P. 85-111 . - doi : 10.1007/s42803-019-00007-7 .
  • Vlassenroot E., Chambers S., Lieber S., Michel A., Geeraert F., Pranger J., Birkholz J. Web-archiving and social media: an exploratory analysis  //  International Journal of Digital Humanities. - 2021. - Kt. 2 . - 107-128 . o .
  • White J. Link Rot, Reference Rot és Link Resolves  //  Új csúcstechnológiák, amelyeket minden könyvtárosnak tudnia kell. - 2019. - P. 29-43 .
  • Balatskaya N.M., Martirosova M.B. Webarchiválás , mint az országos és helytörténeti bibliográfia feladata  // Biblioszféra. - 2021. - Kiadás. 3. sz . - S. 12-17 .
  • Povroznik G.G. Webarchívumok a virtuális múzeumok történetének rekonstrukciójában: lehetőségek és korlátok  // Bulletin of the Perm University. - 2020. - T. 51 , sz. 4 . - S. 95-102 .
  • Redkina N.S. A könyvtárak fejlődésének világtrendjei. Optimizmus vs pesszimizmus (külföldi szakirodalom alapján)  // Biblioszféra. - 2019. - Kiadás. 1 . - S. 49-58 .