Adatkészlet (IBM)

Az adatkészlet ( rus. Dataset , néha átírva "Dataset" is) az IBM nagyszámítógépes fájlrendszerére használt kifejezés ; egy sorként tárolt logikai rekordok gyűjteménye . Az adatkészlet összehasonlítható egy fájllal , de a fájlokkal ellentétben az adatkészlet egyszerre könyvtár és fájl is a fájlrendszerben, és nem tartalmazhat más készleteket.

A gyakorlatban gyakran találhatunk egy szóban ( adatkészlet ) írást, ami szigorúan véve hibás, de elfogadható. Ez a gyakorlat abból a tényből adódott, hogy a szót magának a halmaz nevének kontextusában kell használni, ami nem támogatja a karakterek közötti szóközt.

Leírás

A nagyszámítógépes fájlrendszer a rekordok tárolására összpontosít , amelyek oszthatatlan tárolóegységek . A rekordok egy csoportját egyesítik, amelyeket adathalmazoknak neveznek. Egy készleten kívül a rekord nem tárolható. Az adatkészletekben lévő rekordokat az alkalmazások használják például bemenetként, vagy egy alkalmazás rekordokat generálhat munkája eredményeként. Tehát az adatkészlet rekordjai lehetnek szöveges adatok (például programforráskódok), objektumfájlok , betölthető modulok, konfigurációs változókkal rendelkező rekordok stb.

Egy adatkészletre úgy lehet hivatkozni, ha megadja a pontos tárolási helyet, vagy ha korábban fájlrendszernevet foglaltak le a készlethez, név szerint. Az egyedi nevű adatkészleteket katalogizáltnak nevezzük . Az adathalmazok nem tudnak egymásba fészkelni, ezért a nevekhez minősítőrendszert használnak: a név nyolc karakterből álló minősítőkből áll, amelyeket egymástól pont választ el, míg a halmaz neve például nem haladhatja meg a 44 karaktert . Fizikailag a készletek különböző típusú adathordozókon (mágneses lemezeken vagy szalagos kazettákon) tárolhatók, emellett a készletek virtuális memóriában is elhelyezhetők . USER.MYDIR.PROJ.SOURCE

A nagyszámítógépekben a közvetlen adathozzáférést támogató tárolóeszközök a DASD ( Direct Access Storage Device ) kifejezést használják . A DASD-eszközök logikailag fel vannak osztva kötetekre ( angol kötetek ), amelyek különböző típusú készleteket tárolnak. Annak érdekében, hogy a rendszer tudja, mely készleteket tárolja egy adott DASD eszköz, egy speciális "mesterkönyvtárat" tart fenn, vagy más szóval a katalogizált készletek listáját.

Maga az adatkészlet nemcsak egyesíti a rekordokat, hanem meghatározza ezekre a rekordokra vonatkozó szabályokat (tárolási formátum). A tárolási formátum paraméterei között szerepel a rekordblokk mérete (blokk típusa), egy beállított rekord maximális mérete. Meg kell határozni magának az adathalmaznak a típusát is, amelytől függ, hogy logikailag hogyan kerül megjelenítésre (folyamatos rekordsorozatként, egymástól elválasztott tagként ( English Members ) stb.).

A készletek elhelyezésének módjai

Egyetlen DASD-eszköz kötetei sok különböző típusú készletet tartalmazhatnak. A készletneveknek egyedinek kell lenniük ugyanazon a tárolóeszközön belül. A készülék minden egyes kötete sávokra van osztva . A nulla sávban, a nulla hengerben, a DASD címke tárolódik, amely jelzi a VTOC kötet tartalomjegyzékének helyét ( English Volume Table of Contents ) - az MBR és a GPT egyidejű analógja . A VTOC tárolja a kötetben tárolt összes készlet nevét, a műsorszámok számát, ahonnan az egyes készletek kezdődnek, a méreteket és a hozzáférési korlátozásokat. Mivel a készletek a köteteikhez vannak kötve, egy készlet keresése során az operációs rendszer először átnézi a látható kötetek listáját, majd a kívánt kötet megtalálásakor hozzáfér a VTOC-jához.

A halmaz legkisebb egysége, amint azt korábban említettük, a logikai rekord, amelyet a méret korlátoz LRECL. Az egy halmazt tartalmazó kötet összefüggő sávjai kiterjedést alkotnak . Általában a tárolóeszköz-vezérlő megpróbálja lefoglalni a kiterjedéskészleteket, mivel ez gyorsabbá teszi a hozzáférést. Ennek a stratégiának a megvalósítása érdekében a VTOC nyilvántartást vezet a szomszédos szabad sávokról.

A mainframe fájlrendszer egy adathalmaz beolvasásakor nem magára az adat bájtjaira támaszkodik, hanem a beállított formátumra vonatkozó információkat ( RECFM) használja fel. A formátum határozza meg, hogy hány bájtnyi adat írható egy meghatározott méretű blokkba BLKSIZE. Az IBM nagyszámítógépek a következő formátumokat használják:

F (Fixed) - fix, amelyben egy fizikai blokk egy logikai rekordnak felel meg, azaz. BLKSIZE = LRECL.
FB (Fixed Blocked) - rögzített, blokk, amelyben n logikai rekordot egyesítenek egy fizikai blokkba ( BLKSIZE = n · LRECL).
V (Variable) - változó, amelyben egy fizikai blokk egy logikai rekordnak felel meg, de a blokk első négy bájtja a leírására van fenntartva. A négy bájtból kettő kódolja a blokk méretét, így a készlet minden egyes bejegyzésének mérete LRECL4 és 32 760 bájt között változhat ( LRECL = 4 + <размер данных>).
VB (Variable Blocked) - változó, blokk, amelyben több változó hosszúságú logikai blokk van elhelyezve egy fizikaiban, vagy más szóval egy fizikai blokk több V-blokkot tárol. A V-boxok fizikai blokkméretének leírásához szintén 4 bájt van fenntartva a leíráshoz ( BLKSIZE = 4 + n · LRECL).
U (Undefined) - határozatlan, amelyben a logikai rekordok és a fizikai blokkok is változó hosszúságúak. Ezt a formátumot használják például a végrehajtható modulokban.

A virtuális memóriára leképezett készletek (úgynevezett VSAM-készletek) rekordjait szintén a DASD-eszköz tárolja, de a nem VSAM-készletektől elkülönítve, az úgynevezett Control Intervals (CI) kiterjedésben, és külön katalogizálva vannak. A CI egy kicsit bonyolultabb, és hasonló a blokkhoz: egy terület képviseli, amelyben a rekordok egymás után helyezkednek el, ezt követik az RDF mezők a rekordok számával ( Rekorddefiníciós mezők ) és egy CIDF mező ( Control Interval Definition ). Mező ) . Az első RDF-mező és az utolsó bejegyzés között szóköz lehet. Az RDF mezők egy halmaz rekordjait egyenként írják le, míg a CIDF a vezérlési intervallum egészét írja le. A VSAM-okat az alkalmazások belsőleg használják.

Toborzó szervezet

A halmaz másik jellemzője a szervezettsége DSORG, amely azt sugallja, hogy milyen sorrendben kell olvasni és frissíteni. A következő típusú szervezetek léteznek:

PS (Physical Sequential) – a rekordok egymás után kerülnek elhelyezésre és sorban olvashatók. Ez a felépítés jellemző a mágnesszalagokon tárolt készletekre.
PO (Partitioned Organisation) - egy készlet az adathordozón több részre tagolható, amelyek mindegyike külön-külön elérhető.
DA (Direct Access) - a beállított rekordok bármilyen sorrendben elhelyezhetők. Minden bejegyzés relatív címekkel érhető el.
IX (indexelt szekvenciális) - a készlet rekordjai kulcsonként íródnak és kerülnek lekérésre.

Minden szervezettípushoz az operációs rendszer által biztosított hozzáférési módok közül egy vagy több alkalmazható. Például a PS szervezettel rendelkező készletekhez a BSAM (alap szekvenciális hozzáférési módszer) és a QSAM (Queued szekvenciális hozzáférési módszer) hozzáférési módszerek alkalmazhatók; A PO készletek BPAM (alap particionált hozzáférési módszer), a DA készletek pedig BDAM (Basic közvetlen hozzáférési módszer) módszert használnak.

A virtuális memória megjelenésével kifejezetten erre a célra szerveztek készleteket, például KSDS, LDS, RRDS stb., amelyekhez saját hozzáférési módszert használnak - VSAM (Virtual storage access method).

Irodalom

Mike Ebbers , John Kettner , Wayne O'Brien , Bill Ogden Bevezetés az új nagyszámítógépbe: z/OS Basics. - 2011. - P. 792. - ISBN 0738435341 .
z/OS DFSMS: Adatkészletek használata. - 2017. - 704. o.