Adatfúzió

Az adatfúzió az adatforrások kombinálásának folyamata, hogy konzisztensebb, pontosabb és hasznosabb információt állítsanak elő, mint az egyetlen forrásból származó információ [1] .

Az adategyesítési folyamatokat gyakran alacsony, közepes vagy magas egyesítésű csoportokba sorolják, attól függően, hogy az összevonás melyik feldolgozási szakaszban történik [2] . Az alacsony szintű adatfúzió egyesít néhány nyers adatforrást más nyers adatok előállítására. Az egyesített adatoknak informatívabbnak és szintetikusabbnak kell lenniük , mint az eredeti adatok.

Például az érzékelőktől származó adatok gyűjtése és összegzése (több szenzoros) adatfúzióként ismert, és az információfúzió részhalmaza .

Emberek, mint példa az adatfúzióra

Az adatfúzió közvetlen példája az emberek. Emberként nagymértékben támaszkodunk érzékszerveinkre, például a látásra, a szaglásra, az ízlelésre, a hangra és a fizikai mozgásra. Mindezen érzékek kombinációja folyamatosan kombinálódik, hogy segítsen nekünk a legtöbb, ha nem az összes feladat elvégzésében mindennapi életünkben. Vagyis ez az adatfúzió közvetlen példája. Az étel szagának, ízének és tapintásának fúziójára hagyatkozunk, hogy megbizonyosodjunk arról, hogy az étel ehető. Hasonlóképpen a látásunkra, valamint arra a képességünkre támaszkodunk, hogy halljuk és irányítsuk testünk mozgását, ha járni vagy autót vezetni, és végrehajtani életünk legtöbb feladatát. Mindezekben az esetekben az agy összeolvad, és irányítja, hogy mit kell tennünk a következő pillanatban. Agyunk a fenti érzékszervek által gyűjtött adatok fúziójára támaszkodik [3] .

Térinformatikai alkalmazások

A térinformatikai kutatási tartományban ( GIS ) az adatfúzió gyakran az adatintegráció szinonimája . Ezekben az alkalmazásokban gyakran van szükség a különböző adatkészletek egyesített adathalmazba való egyesítésére, amely az összes adatpontot tartalmazza. Az egyesített adatkészletek abban különböznek az egyszerű összekapcsolástól, hogy az egyesített adatkészletben lévő pontok olyan attribútumokat és metaadatokat tartalmaznak , amelyekkel az eredeti adatkészlet pontjai nem feltétlenül rendelkeznek.

Az alábbiakban ennek a folyamatnak egy egyszerűsített példája látható, ahol az α adatkészletet egyesítik a β adatkészlettel, így egy δ egyesített adatkészletet alkotnak. Az α halmaz adatpontjai X és Y térbeli koordinátákkal, valamint A1 és A2 attribútumokkal rendelkeznek. A β halmaz adatpontjai X és Y térbeli koordinátákkal, valamint B1 és B2 attribútumokkal rendelkeznek. Az egyesített adatkészlet az összes pontot és attribútumot tartalmazza.

α bemeneti adatkészlet Bemeneti adatkészlet β Egyesített adatkészlet δ
Pont x Y A1 A2
α1 tíz tíz M N
α2 tíz harminc M N
α3 harminc tíz M N
α4 harminc harminc M N
Pont x Y B1 B2
β1 húsz húsz K R
β2 húsz 40 K R
β3 40 húsz K R
β4 40 40 K R
Pont x Y A1 A2 B1 B2
δ1 tíz tíz M N K? R?
δ2 tíz harminc M N K? R?
δ3 harminc tíz M N K? R?
δ4 harminc harminc M N K? R?
δ5 húsz húsz M? N? K R
δ6 húsz 40 M? N? K R
δ7 40 húsz M? N? K R
δ8 40 40 M? N? K R

Az egyszerű esetben, amikor minden attribútum egységes az egész területen, az attribútumok egyszerűen hozzárendelhetők: M?, N?, Q?, R? M, N, Q, R. A tényleges alkalmazásokban az attribútumok nem egységesek, és általában valamilyen interpolációra van szükség az attribútumok helyes hozzárendeléséhez az egyesített halmaz adatpontjaihoz.

Egy sokkal összetettebb alkalmazásban a tengeri állatkutatók az állatok mozgási adatainak fúzióját használták a batimetriai és meteorológiai adatokkal, a tengerfelszín hőmérsékletével az állatok élőhelyével, hogy megtekintsék és megértsék az állatok viselkedését külső hatásokra, például időjárásra és vízhőmérsékletre adott válaszként. Ezen adatkészletek mindegyike eltérő térbeli rácsot és mintavételi gyakoriságot képvisel, így az adatok egyszerű kombinációja valószínűleg ésszerűtlen feltételezéseket ad, és összezavarná az elemzést. Az adatok összevonásával azonban az összes adat és attribútum egy entitásba kerül, ami teljesebb képet alkot a környezetről. Ez lehetővé teszi a tudósok számára, hogy pontosan meghatározzák a kulcsfontosságú helyeket és időpontokat, és új betekintést nyerjenek a környezet és az állatok viselkedése közötti kölcsönhatásba.

A jobb oldali képen homárokat vizsgálnak a Tasman-tenger partjain. Hugh Pederson, a Tasmany Egyetem munkatársa adatfúziós programokkal egyesítette a déli sziklahomár mozgásának nyomon követési adatait a képen sárgával és feketével kódolva nappali, illetve éjszakai) a batimetrikus és élőhelyi adatokkal a homár viselkedésének egy 4 dimenziós mintájává.

Adatintegráció

A térinformatikai tartományokon kívüli alkalmazásokban az adatintegráció és az adatfúzió kifejezések használata eltérő. Az olyan területeken, mint például az üzleti intelligencia, az "adatintegráció" kifejezést használják az adatok kombinációjának leírására, míg az "adatfúzió" kifejezés egy integrációt, amelyet tömörítés és adatcsere követ. Az adatintegráció egy halmazkombinációként fogható fel, amelyben egy nagyobb halmaz megmarad, míg a fúzió egy megnövelt megbízhatóságú halmazredukciós technika.

JDL/DFIG modell

Az 1980-as évek közepén a Joint  Directors of Laboratories (JDL) megalakította a Data Fusion Subcommittee-t (amely később Data Fusion Group , DFG néven vált ismertté ) .  A World Wide Web megjelenésével az adatfúzió kezdett magában foglalni a szenzorfúziót és az információfúziót. A JDL/DFIG csoport egy adatfúziós modellt vezetett be, amely különböző folyamatokra bontható. Jelenleg hat szintje van a Data Fusion Information Group ( DFIG ) modellnek:  

0. szint: Forrás előfeldolgozása / tárgy értékelése 

1. szint : Objektum értékelés _ 

2. szint : Helyzetértékelés _ _ 

3. szint : Hatásvizsgálat ( vagy fenyegetés finomítása ) _ _  

4. szint : Folyamatfinomítás _ _ 

5. szint : Felhasználói finomítás vagy kognitív finomítás _ _ _  

Bár a JDL-modell (1-4. szintek) ma is használatos, gyakran kifogásolják, hogy megköveteli, hogy a szinteket a megadott sorrendben kell megvalósítani, és hogy nem reprezentálja megfelelően az emberi részvételt. A DFIG modell (0-5. szint) figyelembe veszi a környezettudatosság, a felhasználói fejlesztések és a munkamenedzsment hatását [4] . Hiányosságaik ellenére a JDL/DFIG modellek hasznosak az adatfúzió folyamatának megjelenítésére, ami elősegíti a vitát és a közös megértést [5] , és fontosak az információfúzió rendszerszintű fejlesztéséhez is [4] .

Alkalmazások

Különféle forgalomérzékelőkből az úton

A különböző szenzortechnológiák adatai intelligensen kombinálhatók a forgalom pontos állapotának meghatározásához. Az útból származó akusztikai, képi és szenzoradatokat használó adatfúziós megközelítés a különböző egyedi módszerek kombinálásának előnyeit mutatja [6] .

Megoldások kombinálása

Sok esetben a földrajzilag szétszórt érzékelők energiafogyasztása és teljesítménye erősen korlátozott. Ezért az adott jelenségre vonatkozó nyers adatok gyakran minden érzékelőnél több bitre redukálódnak. Bináris esemény (vagyis vagy ) következtetése esetén a szélsőséges esetben csak a bináris megoldást küldi el az érzékelő a döntési pool-központba, és kombinálja a jobb osztályozás érdekében [7] [8] [9] .

A kontextuális tudatosság javítása érdekében

A nagyszámú beépített érzékelővel, beleértve a mozgásérzékelőket, környezetérzékelőket, helyzetérzékelőket, a modern mobileszközök jellemzően lehetővé teszik a mobilalkalmazások számára, hogy nagy mennyiségű szenzoradathoz férhessenek hozzá, amelyek felhasználhatók a kontextuális tudatosság javítására. A jelfeldolgozási és adatfúziós technikák, például a jellemzők generálása, a megvalósíthatósági értékelés és a főkomponens - elemzés alkalmazása az ilyen érzékelőadatok elemzésére jelentősen javítja a mozgások osztályozását és az eszköz kontextuális állapotát [10] .


Jegyzetek

  1. Haghighat, Abdel-Mottaleb, Alhalabi, 2016 , p. 1984-1996.
  2. Klein, 2004 , p. 51.
  3. Penn State WebAccess biztonságos bejelentkezés:  (eng.) . ieeexplore-ieee-org.ezaccess.libraries.psu.edu . Letöltve: 2018. június 27.
  4. 1 2 Blasch, Bosse, Lambert, 2012 .
  5. Liggins, Hall, Llinas, 2008 .
  6. Joshi, Rajamani, Takayuki, Prathapaneni, Subramaniam, 2013 .
  7. Ciuonzo, Papa, Romano, Salvo Rossi, Willett, 2013 , p. 861–864.
  8. Ciuonzo, Salvo Rossi, 2014 , p. 208–212.
  9. Ciuonzo, De Maio, Salvo Rossi, 2015 , p. 1249–1253.
  10. Guiry, van de Ven, Nelson, 2014 , p. 5687–5701.

Irodalom

Idézetek

Források

Linkek

  1. Haghighat, Abdel-Mottaleb, Alhalabi, 2016 , p. 1984-1996.