Jaccard együttható

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2020. szeptember 21-én felülvizsgált verziótól ; az ellenőrzések 2 szerkesztést igényelnek .

A Jaccard mérték (florisztikai közösség együtthatója, francia  együttható de communaute , németül  Gemeinschaftskoeffizient ) a hasonlóság bináris mértéke , amelyet Paul Jaccard javasolt 1901-ben. [1]  : , ahol a  az első kísérleti parcellán lévő fajok száma, b  a második kísérleti parcellán lévő fajok száma, c  az 1. és 2. parcellán közös fajok száma. Ez az első ismert hasonlósági együttható . Az együttható szerzőjének vezetéknevét a szakirodalomban Jacquardnak vagy Jacquardnak is fordították. A Jaccard-együtthatót különféle módosításokban és rekordokban aktívan használják az ökológiában, a geobotanikában, a molekuláris biológiában , a bioinformatikában , a genomikában , a proteinomikában, az informatikában és más területeken. A Jaccard mérték ekvivalens (egy monotonan növekvő függőséggel összefügg) a Sørensen mértékkel és a véges halmazok Sokal-Sneath mértékével (többszörös értelmezés):

A különbség mértékét, amely a Jaccard hasonlósági együttható 1-es komplementere, a florisztikai kontraszt mértékének nevezzük [2] [3] . A leíró halmazok (leíró értelmezés) esetében az ökológiában ezek bőség szerinti minták , ennek a mértéknek analógja a Ruzicka-mérték [4] :

.

Egy adott esetben, amikor Boole-vektorok komponenseit használjuk, azaz olyan komponenseket, amelyek csak két értéket vesznek fel, 0 és 1, a mértéket Tanimoto-együtthatónak vagy kiterjesztett Jaccard-együtthatónak nevezik [5] . Ha az objektumokat a fajok előfordulása alapján hasonlítjuk össze (valószínűségi értelmezés), azaz figyelembe vesszük a találkozási valószínűségeket, akkor a Jaccard-mérték analógja az Iversen -féle valószínűségi mérték [6] :

.

Az információelemző értelmezéshez a Raisky -féle kölcsönös függés mértékét [7] [8] [9] használjuk :

A különbség mértéke, amely egyenértékű a Jaccard-féle hasonlóság mértékével, a távolság:

Lásd még

Irodalom

  1. Jaccard P. Distribution de la flore alpine dans le Bassin des Dranses et dans quelques regions voisines // Bull. szoc. Vaudoise sci. Natur. 1901. V. 37. Bd. 140. S. 241-272.
  2. Mirkin B. M., Rosenberg G. S. A modern fitocenológia magyarázó szótára. — M.: Nauka, 1983. — 134 p.
  3. Mirkin B. M., Rosenberg G. S., Naumova L. G. A modern fitocenológia fogalmainak és kifejezéseinek szótára. — M.: Nauka, 1989. — 223 p.
  4. Ružička MK Anwendung mathematiseh-statistiseher Methoden in der Geobotanik (sintetischa Bearbeitung von Aufnahmen) // Biológia. 1958. Roč. 13.ch. 9. S. 647-661.
  5. Tanimoto TT IBM belső jelentés, november 17. 1957.
  6. Iversen J. Über die Korrelationen zwischen den Pflanzenarten in einem grönlandischen Talgebiet // Vegetation. 1954. V. 5-6. P. 238-246.
  7. Raijski C. A diszkrét valószínűségi eloszlások metrikus tere // Információ és vezérlés. 1961. V. 4. No. 4. P. 371-377.
  8. Raijski C. Entrópia és metrikus terek // C. Cherry (szerk.). információelmélet. London: Butterworths, 1961, 41-45.
  9. Eliseeva I. I., Rukavishnikov V. O. Csoportosítás, korreláció, mintafelismerés: (statisztikai módszerek a kapcsolatok osztályozására és mérésére). — M.: Statisztika, 1977. — 143 p.