Az OLAP ( angolul online analytical processing , interactive analytical processing) egy olyan adatfeldolgozási technológia, amely többdimenziós elv szerint strukturált nagy adattömbökön összefoglaló (aggregált) információk készítéséből áll. Az OLAP technológia megvalósításai a Business Intelligence osztályba tartozó szoftvermegoldások összetevői [1] .
Az OLAP kifejezés alapítója – Edgar Codd 1993 -ban javasolta „12 szabályt a valós idejű analitikai feldolgozáshoz” (hasonlóan a korábban megfogalmazott „ 12 szabály a relációs adatbázisokhoz ”).
Az OLAP használatának oka a lekérdezések feldolgozásához a sebesség. A relációs adatbázisok külön táblákban tárolják az entitásokat, amelyek általában jól normalizáltak. Ez a struktúra kényelmes az operatív adatbázisokhoz ( OLTP -rendszerekhez ), de az összetett többtáblás lekérdezések viszonylag lassúak benne.
Az éles adatokból létrehozott OLAP-struktúrát OLAP-kockának nevezzük . A kocka a csillagséma vagy a hópehelyséma használatával összekapcsolt táblákból jön létre . A csillagséma közepén a ténytábla található, amely a lekérdezésekhez szükséges legfontosabb tényeket tartalmazza. Egy ténytáblázathoz több mérettáblázat is kapcsolódik. Ezek a táblázatok bemutatják, hogyan elemezhetők az összesített A lehetséges összesítések számát az határozza meg, hogy az eredeti adatok milyen módon jeleníthetők meg hierarchikusan.
Például az összes vásárló város vagy ország régiója szerint csoportosítható (nyugat, kelet, észak és így tovább), így 50 város, nyolc régió és két ország alkotja a 60 tagú hierarchia három szintjét. A vevőket a termékek alapján is csoportosíthatjuk; ha 250 termék van 20 kategóriában, három termékcsoportban és három termékdivízióban, akkor az aggregátumok száma 16 560. Ha dimenziókat adunk a sémához, a lehetséges opciók száma gyorsan eléri a tízmilliókat vagy még többet.
Az OLAP-kocka alapvető adatokat és dimenzióinformációkat (aggregátumokat) tartalmaz. A kocka potenciálisan tartalmaz minden olyan információt, amelyre a kérdések megválaszolásához szükség lehet. Hatalmas számú egység esetén gyakran csak egyes méréseknél történik teljes számítás, a többinél „igény szerint” történik.
Háromféle OLAP létezik: [2]
A MOLAP az OLAP klasszikus formája, ezért gyakran egyszerűen OLAP-nak nevezik. Összegző adatbázist használ, és létrehozza a szükséges többdimenziós adatsémát, megőrizve mind az alapul szolgáló adatokat, mind az aggregátumokat.
A ROLAP közvetlenül egy relációs adatbázissal működik , a tények és a dimenziótáblák relációs táblákban tárolódnak, és további relációs táblák jönnek létre az aggregátumok tárolására.
A HOLAP relációs táblákat használ az alapadatok és többdimenziós táblák az aggregátumok tárolására.
A ROLAP speciális esete a Real-time ROLAP ( R-ROLAP ). A ROLAP-pal ellentétben az R-ROLAP nem hoz létre további relációs táblákat az aggregátumok tárolására, hanem az aggregátumok kiszámítása a lekérdezés időpontjában történik. Ebben az esetben az OLAP rendszerhez intézett többdimenziós lekérdezés automatikusan SQL lekérdezéssé alakul relációs adatokra.
Mindegyik tárolótípusnak megvannak bizonyos előnyei, bár a különböző gyártók nem értenek egyet az értékelésükben. A MOLAP a legalkalmasabb kis adatkészletekhez, gyorsan kiszámítja az aggregátumokat és visszaadja a válaszokat, de hatalmas mennyiségű adatot generál. A ROLAP skálázható megoldásnak tekinthető, tárhely szempontjából gazdaságosabb, de az analitikai feldolgozási képességek korlátozottak. A HOLAP e két megközelítés közepén helyezkedik el, elég jól skálázódik , és számos korlátot leküzd. Az R-ROLAP architektúra lehetővé teszi az OLTP adatok valós idejű többdimenziós elemzését.
Az OLAP használatának bonyolultsága a lekérdezések létrehozásából, a mögöttes adatok kiválasztásából és a séma tervezéséből adódik, aminek eredményeként a legtöbb OLAP-termék nagyszámú előre konfigurált lekérdezést tartalmaz. Egy másik probléma az alapadatokkal van, ezeknek teljesnek és konzisztensnek kell lenniük.
Történelmileg az első többdimenziós adatbázis-kezelő rendszer, amely lényegében OLAP implementáció, az Express rendszer volt, amelyet 1970 -ben fejlesztett ki az IRI (később a termék jogait az Oracle Corporation szerezte meg, és az Oracle Database OLAP opciójává változtatta ) [3] . Az OLAP kifejezést Edgar Codd vezette be a Computerworldben megjelent 1993 -as publikációjában [4] , amelyben az analitikus feldolgozás 12 elvét javasolta, hasonlóan az általa egy évtizeddel korábban megfogalmazott 12 relációs adatbázisokra vonatkozó szabályhoz , mint referenciaterméket, amely megfelel a követelményeknek. Codd rámutatott az Arbor Essbase rendszerére (amelyet 1997-ben vett át a Hyperion , amelyet viszont az Oracle vásárolt meg 2007-ben). Nevezetesen, hogy a kiadványt később esetleges összeférhetetlenség miatt eltávolították a Computerworld archívumából, mivel Codd később tanácsadói szolgáltatásokat nyújtott az Arbor számára [5] .
A megvalósítás szempontjából "fizikai OLAP"-ra és "virtuális"-ra (relációs, eng. Relational OLAP , ROLAP ) vannak felosztva . A "fizikai" viszont a megvalósítástól függően többdimenziós ( angolul Multidimensional OLAP , MOLAP ) és hibrid - ( angol hibrid OLAP , HOLAP ) részekre oszlik.
Az első esetben van egy program, amely az adatok OLAP-ba való előtöltésének szakaszában elvégzi az aggregátumok előzetes számítását (számításokat több kezdeti értékre, például „hónapra összesen”), amelyeket aztán egy speciális többdimenziós adatbázis, amely gyors lekérdezést és gazdaságos tárolást biztosít.
A hibrid megvalósítás egy kombináció: magát az adatokat egy relációs adatbázisban, az aggregátumokat pedig egy többdimenziósban tároljuk.
A ROLAP megvalósításokban az összes adatot relációs adatbázis-kezelő rendszerekben tárolják és dolgozzák fel, és előfordulhat, hogy aggregációk egyáltalán nem léteznek, vagy az adatbázis vagy az analitikai szoftver gyorsítótárának első kérésére jönnek létre.
A felhasználó szemszögéből a lehetőségeket tekintve minden opció hasonlónak tűnik. Az OLAP a pénzügyi tervezési termékekben, adattárházakban és üzleti intelligencia osztályú megoldásokban találja a legnagyobb felhasználást .
A kereskedelmi termékek közé tartoznak a következők: Microsoft SQL Server Analysis Services , Essbase , Oracle Database OLAP Option , IBM Cognos TM1 ; számos ingyenes megoldás létezik, köztük Mondrian és Palo [6] .
Adattár | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
| ||||||||||||||
| ||||||||||||||
Kategória |