Adatkészlet (IBM)

Az adatkészlet ( rus. Dataset , néha átírva "Dataset" is) az IBM nagyszámítógépes fájlrendszerére használt kifejezés ; egy sorként tárolt logikai rekordok gyűjteménye . Az adatkészlet összehasonlítható egy fájllal , de a fájlokkal ellentétben az adatkészlet egyszerre könyvtár és fájl is a fájlrendszerben, és nem tartalmazhat más készleteket.

A gyakorlatban gyakran találhatunk egy szóban ( adatkészlet ) írást, ami szigorúan véve hibás, de elfogadható. Ez a gyakorlat abból a tényből adódott, hogy a szót magának a halmaz nevének kontextusában kell használni, ami nem támogatja a karakterek közötti szóközt.

Leírás

A nagyszámítógépes fájlrendszer a rekordok tárolására összpontosít , amelyek oszthatatlan tárolóegységek .  A rekordok egy csoportját egyesítik, amelyeket adathalmazoknak neveznek. Egy készleten kívül a rekord nem tárolható. Az adatkészletekben lévő rekordokat az alkalmazások használják például bemenetként, vagy egy alkalmazás rekordokat generálhat munkája eredményeként. Tehát az adatkészlet rekordjai lehetnek szöveges adatok (például programforráskódok), objektumfájlok , betölthető modulok, konfigurációs változókkal rendelkező rekordok stb.

Egy adatkészletre úgy lehet hivatkozni, ha megadja a pontos tárolási helyet, vagy ha korábban fájlrendszernevet foglaltak le a készlethez, név szerint. Az egyedi nevű adatkészleteket katalogizáltnak nevezzük .  Az adathalmazok nem tudnak egymásba fészkelni, ezért a nevekhez minősítőrendszert használnak: a név nyolc karakterből álló minősítőkből áll, amelyeket egymástól pont választ el, míg a halmaz neve például nem haladhatja meg a 44 karaktert . Fizikailag a készletek különböző típusú adathordozókon (mágneses lemezeken vagy szalagos kazettákon) tárolhatók, emellett a készletek virtuális memóriában is elhelyezhetők . USER.MYDIR.PROJ.SOURCE

A nagyszámítógépekben a közvetlen adathozzáférést támogató tárolóeszközök a DASD ( Direct Access Storage Device ) kifejezést használják .  A DASD-eszközök logikailag fel vannak osztva kötetekre ( angol kötetek ), amelyek különböző típusú készleteket tárolnak. Annak érdekében, hogy a rendszer tudja, mely készleteket tárolja egy adott DASD eszköz, egy speciális "mesterkönyvtárat" tart fenn, vagy más szóval a katalogizált készletek listáját.  

Maga az adatkészlet nemcsak egyesíti a rekordokat, hanem meghatározza ezekre a rekordokra vonatkozó szabályokat (tárolási formátum). A tárolási formátum paraméterei között szerepel a rekordblokk mérete (blokk típusa), egy beállított rekord maximális mérete. Meg kell határozni magának az adathalmaznak a típusát is, amelytől függ, hogy logikailag hogyan kerül megjelenítésre (folyamatos rekordsorozatként, egymástól elválasztott tagként ( English  Members ) stb.).

A készletek elhelyezésének módjai

Egyetlen DASD-eszköz kötetei sok különböző típusú készletet tartalmazhatnak. A készletneveknek egyedinek kell lenniük ugyanazon a tárolóeszközön belül. A készülék minden egyes kötete sávokra van osztva .  A nulla sávban, a nulla hengerben, a DASD címke tárolódik, amely jelzi a VTOC kötet tartalomjegyzékének helyét ( English Volume Table of Contents ) - az MBR és a GPT egyidejű analógja . A VTOC tárolja a kötetben tárolt összes készlet nevét, a műsorszámok számát, ahonnan az egyes készletek kezdődnek, a méreteket és a hozzáférési korlátozásokat. Mivel a készletek a köteteikhez vannak kötve, egy készlet keresése során az operációs rendszer először átnézi a látható kötetek listáját, majd a kívánt kötet megtalálásakor hozzáfér a VTOC-jához.  

A halmaz legkisebb egysége, amint azt korábban említettük, a logikai rekord, amelyet a méret korlátoz LRECL. Az egy halmazt tartalmazó kötet összefüggő sávjai kiterjedést alkotnak . Általában a tárolóeszköz-vezérlő megpróbálja lefoglalni a kiterjedéskészleteket, mivel ez gyorsabbá teszi a hozzáférést. Ennek a stratégiának a megvalósítása érdekében a VTOC nyilvántartást vezet a szomszédos szabad sávokról.

A mainframe fájlrendszer egy adathalmaz beolvasásakor nem magára az adat bájtjaira támaszkodik, hanem a beállított formátumra vonatkozó információkat ( RECFM) használja fel. A formátum határozza meg, hogy hány bájtnyi adat írható egy meghatározott méretű blokkba BLKSIZE. Az IBM nagyszámítógépek a következő formátumokat használják:

A virtuális memóriára leképezett készletek (úgynevezett VSAM-készletek) rekordjait szintén a DASD-eszköz tárolja, de a nem VSAM-készletektől elkülönítve, az úgynevezett Control  Intervals (CI) kiterjedésben, és külön katalogizálva vannak. A CI egy kicsit bonyolultabb, és hasonló a blokkhoz: egy terület képviseli, amelyben a rekordok egymás után helyezkednek el, ezt követik az RDF mezők a rekordok számával ( Rekorddefiníciós  mezők ) és egy CIDF mező ( Control Interval Definition ). Mező ) .  Az első RDF-mező és az utolsó bejegyzés között szóköz lehet. Az RDF mezők egy halmaz rekordjait egyenként írják le, míg a CIDF a vezérlési intervallum egészét írja le. A VSAM-okat az alkalmazások belsőleg használják.

Toborzó szervezet

A halmaz másik jellemzője a szervezettsége DSORG, amely azt sugallja, hogy milyen sorrendben kell olvasni és frissíteni. A következő típusú szervezetek léteznek:

Minden szervezettípushoz az operációs rendszer által biztosított hozzáférési módok közül egy vagy több alkalmazható. Például a PS szervezettel rendelkező készletekhez a BSAM (alap szekvenciális hozzáférési módszer) és a QSAM (Queued szekvenciális hozzáférési módszer) hozzáférési módszerek alkalmazhatók; A PO készletek BPAM (alap particionált hozzáférési módszer), a DA készletek pedig BDAM (Basic közvetlen hozzáférési módszer) módszert használnak.

A virtuális memória megjelenésével kifejezetten erre a célra szerveztek készleteket, például KSDS, LDS, RRDS stb., amelyekhez saját hozzáférési módszert használnak - VSAM (Virtual storage access method).

Irodalom