Konvergenciamérések mátrixa

A konvergenciamértékek  mátrixa az objektumok mint elemek hasonlósági mértékeit tartalmazó mátrix . A mátrix az objektumok páronkénti hasonlóságát tükrözi. A hasonlóság ordinális skálán mért mutató , ezért csak „nagyobb, mint”, „kisebb, mint” vagy „egyenlő” alakú kapcsolatokat lehet meghatározni.

Az abszolút konvergencia mértékeinek mátrixa

Az adatmátrix alapján könnyen kiszámítható az abszolút konvergencia mértékeinek mátrixa, amely például véges és leíró halmazok esetén megfelel egy méretű metszésponti mátrixnak . A valószínűségek esetében ennek a mátrixnak az analógját az együttes valószínűségek mátrixának , az információs értelmezésnél pedig az információs függvények mátrixának nevezik . A mátrix szimmetrikus az átlóhoz képest [1] :


Ez a típusú mátrix a vizsgálat fő "dokumentuma" (az elsődleges adatmátrix után), mivel a metszésponti mátrix információkat tartalmaz az egyes objektumok jellemzőinek számáról (az átlón) és az egyes jellemzők számáról. összehasonlított objektumpár (a megfelelő oszlop és sor metszéspontjában). Ennek a mátrixnak az az előnye, hogy ennek a mátrixnak az adatai szerint más típusú mátrixok (befogadási, hasonlósági, tranzitív lezárási mátrixok stb.) kiszámítására is van lehetőség, azaz megvalósítható a reprodukálhatóság elve. . A metszésponti mátrix elemeit a következő képlet határozza meg (a százalékos hasonlóság mértékeként ismert):

,

hol  vannak az elsődleges adatmátrix elemei. Ha a mátrixelemeket normalizáljuk, akkor a konvergencia mértékeinek relatív mátrixát kapjuk, amely nagyon könnyen kiszámítható (más konvergenciamátrixokkal összehasonlítva).

A relatív aszimmetrikus konvergencia mértékeinek mátrixa

Ez a mátrix nem szimmetrikus az átlóhoz képest. Közismert nevén inklúziós mátrix Kétféleképpen nyerhető: két nem szimmetrikus hasonlósági mérték meghatározásával minden objektumpárra, vagy mátrixot kapunk az abszolút konvergencia mértékeinek mátrixából. A második lehetőséghez el kell osztani a metszésponti mátrix minden sorának elemeit az ennek a sornak megfelelő átlós elemmel:


A kétértelműség feloldásához meg kell jelölni az egyik objektum másikba való beillesztésének irányát. Általában nyíl jelzi, és a beillesztés balról jobbra történik. Ebből a mátrixból egy bizonyos közelségi küszöb mellett irányított zárványhasonlósági gráfokat kaphatunk. Ebben a mátrixban jól láthatóak az objektumok közötti kapcsolatok, amelyekben a jellemzők száma nagymértékben eltér (különböző méretű objektumok). Külön meg kell jegyezni, hogy az aszimmetrikus mértékek általában informatívabbak, különösen a jellemzők számát tekintve különböző méretű objektumok esetében, mint a szimmetrikus mértékek, mivel az utóbbiak valójában átlagos mutatók, és ezért elveszítenek bizonyos információkat. tárgyakról, és az aszimmetrikus mértékek (befoglalások ) megfelelően értékelik a természetben gyakoribb, nem tranzitív kapcsolatokat. Például előfordulhat, hogy az első elem 100%-ban szerepel a másodikban, és a második lista csak 10%-ban. Ugyanakkor egy szimmetrikus mérték nem képes megfelelően tükrözni ezeket az összefüggéseket, mivel például egy 10 jellemzőt tartalmazó objektumnál 10 közös jellemző jelentős, egy 100 jellemzőt tartalmazó nagy objektumnál viszont nem annyira. A Sorensen hasonlóságának mértéke ebben az esetben körülbelül 20% lesz.

A relatív szimmetrikus konvergencia mértékeinek mátrixa

Közismertebb nevén a hasonlósági mátrix [2] . Ez a mátrix szimmetrikus az átlóhoz képest. Kétféleképpen is beszerezhető: minden objektumpárhoz szimmetrikus hasonlósági mértéket kell meghatározni, vagy aszimmetrikus konvergenciamértékek mátrixából számítani. A második módszer a befogadási mátrix szimmetrizálása két aszimmetrikus mérték átlagolásával, és megköveteli az azonos ekvivalenciaosztályon belüli mértékek konzisztenciáját. Általában a mátrix így néz ki:


Átlósan 1, mivel az objektum önmagával való hasonlósága maximális. Leginformatívabb azoknál az objektumoknál, amelyek lényegében azonos méretűek, vagyis olyan objektumoknál, amelyek jellemzőinek száma nem tér el jelentősen. Grafikailag a hasonlósági kapcsolatokat általában gráfklaszterező algoritmusok fejezik ki . Elvileg a mátrix kettős a távolságmátrixszal , és ennek megfelelően nullák vannak a távolságmátrixban az átló mentén.

Jegyzetek

  1. Semkin B. I., Kulikova L. S. A rovarfajok listájának matematikai elemzésének módszerei természetes és kulturális biocenózisokban. Vlagyivosztok: TIG DVNTs AN SSSR, 1981. 73 p.
  2. Duran B., Odell P. Klaszteranalízis. — M.: Statisztika, 1977. — 128 p.