A klaszterezés illúziója

A klaszterezési illúzió kognitív torzítás,  az a tendencia, hogy tévesen feltételezik, hogy a véletlenszerű eloszlásokból származó kis mintákban előforduló elkerülhetetlen "sávok" vagy "klaszterek" nem véletlenszerűek. Ezt az illúziót az okozza, hogy az emberek hajlamosak alábecsülni a változékonyság mértékét, amely a véletlenszerű vagy pszeudo-véletlen adatok kis mintájában megjelenhet.

Essence

A klaszteresedés illúziója az emberi hajlam arra, hogy a véletlenszerű események szabályosabbnak vagy egységesebbnek tűnjenek, mint amilyenek valójában, ami ahhoz a feltételezéshez vezet, hogy az adatok klaszterei vagy mintái nem tudhatók pusztán a véletlenszerűségnek.

A csoportosulás fontos példája, hogy az éjszakai égbolt csillagai bizonyos területeken fényesebbnek és zsúfoltabbnak tűnnek, míg más területeken "üres" foltok vannak. A halmazillúzióban egyszerűen azt várjuk, hogy legyen valami fizikai magyarázata rá (például a csillagoknak fizikailag kell csoportosulniuk az űrben), mivel „nem tűnnek igazán véletlennek”. A csillagok helyzete azonban véletlenszerű, és a rendszerről alkotott elképzelésünk téves.

Kutatás

Thomas Gilovich , a téma korai kutatója azzal érvelt, hogy a klaszterezés illúziója különféle véletlenszerű eltérések esetén fordul elő, beleértve a kétdimenziós adatokat, például a V-1 bombázási helyeken lévő klasztereket London térképein a második világháború alatt ; vagy a tőzsdei árfolyamok időbeli ingadozásainak mintázatainak értékelése során [1] .

Bár a londoniak sajátos elméleteket dolgoztak ki a londoni bombázások természetéről, R. D. Clarke statisztikai elemzése, amelyet először 1946 -ban tettek közzé , kimutatta, hogy a bombák eloszlása ​​közel állt a matematikai véletlenszerűséghez [2] [3] [4] [5] .

A matematika Ramsey-elméletként ismert ága szerint a teljes véletlenszerűség egyetlen fizikai rendszerben sem lehetséges. Helyesebb lenne azonban azzal érvelni, hogy a klaszteres illúzió az emberi természetes hajlamra utal, hogy valamilyen értéket bizonyos mintázatokhoz társítson, amelyeknek elkerülhetetlenül meg kell jelenniük minden kellően nagy adathalmazban.

Például a legtöbb ember azt állítja, hogy az „OXXXOXXXOXXOOOXOOXXOO” sorozat nem véletlenszerű, ha valójában számos olyan tulajdonsággal rendelkezik, amelyek egyben annak a jellemzői is lehetnek, amit egy „véletlen” értékfolyamban látunk, mint például az azonos számú értékkel. minden értéket, és azt a tényt, hogy az azonos kimenetelű szomszédos klaszterek száma egyenlő mindkét lehetséges kimenetelre. Az ilyen szekvenciáktól úgy tűnik, hogy az emberek több változást várnak el, mint amennyit statisztikailag előre jeleznek. Valójában néhány kísérletben a változékonyság és a nem véletlenszerű "klaszterek" meglehetősen valószínűek.

Egy másik példa a SAT válaszai , egy szabványos feleletválasztós teszt az Egyesült Államokban , amelyben a kérdések szándékosan vannak elosztva, hogy ne tartalmazzon hosszú sorozatokat. Ennek eredményeként a tanuló nyomást érezhet, hogy rossz választ válassza.

Egy adathalmaz emberi értékelésében előforduló minták megléte gyakran statisztikai elemzéssel vagy akár kriptoanalízis technikákkal is megállapítható.

Tekintsük a „XXOXOXOOOXOXOOOXOX” sorozatot; ő véletlenszerű? A válasz nem; ha a karakterláncban lévő "X" pozíciót prímszámokhoz, az "O"-t pedig összetett számokhoz társítja, a 2-es számmal kezdődően, a minta nyilvánvaló. Az adatokat olvasó és tömörítő számítógépes programok bizonyos értelemben "mintákat keresnek" az adatokban, és olyan alternatív reprezentációkat hoznak létre, amelyekből az eredeti adatok a tömörített formából rekonstruálhatók. A nem véletlenszerű "klasztereket" tartalmazó nagy adatkészletek várhatóan jól tömöríthetők a megfelelő kódolási algoritmussal. Másrészt, ha nincs valódi fürtözés vagy minta egy adott adatkészletben, akkor várhatóan rosszul tömörül, ha egyáltalán lesz.

A klaszterezés illúziója központi szerepet játszott Thomas Gilovich, Robert Vallone és Amos Tversky nagy nyilvánosságot kapott kutatásában . Következtetésük megcáfolta a "forró kéz" illúzióját a kosárlabdában azzal, hogy megállapította, hogy az eredmények eloszlása ​​megkülönböztethetetlen a véletlenszerűségtől [6] . Állítólag neves trénerek, köztük Bobby Knight is kigúnyolták az ötletet.

Hasonló kognitív torzulások

Ennek a kognitív torzításnak az ok-okozati összefüggés vizsgálatában való használata hibákhoz vezethet, többek között a mesterlövészek körében is.

A mintafelismerő hibák gyakoribb formái a pareidolia és az apothenia . A kapcsolódó torzítások a kontroll illúziójához kapcsolódnak, amelyhez a klaszteres illúzió hozzájárulhat, valamint a mintaméret érzéketlenségéhez, amelyben az emberek nem várnak nagyobb változást a kis mintákban. A véletlenszerű információáramok félreértésével összefüggő másik kognitív torzítást a játékos hibájának nevezik .

Lehetséges okok

Daniel Kahneman és Amos Tversky rájött ennek az illúziónak az okaira, és megállapította, hogy a klaszterezésen alapuló helytelen előrejelzést a heurisztikus reprezentativitás okozza (amelynek úttörője is volt). A befektetők számára problémát jelenthet a sorok vagy sorozatok látszólagos jelenléte az adatok elosztásában, ahol ezek nincsenek. Ennek az az oka, hogy a befektető a magas hozam időszakát trendként értelmezheti, holott ez valójában csak egy töredéke a normál hozamváltozásnak. A klaszteresedés illúziója csapdákat teremt a befektetők számára. Az áremelkedések rövid távú adatai (több hónaptól több évig) meggyőzhetnek bennünket egy bizonyos befektetési osztály – például részvények, kötvények vagy ingatlanok – vonzerejéről.

Ez befolyásolhatja a befektetés stílusát – például alacsony vagy magas kapitalizációjú befektetés, vagy növekedés és érték befektetés. Még arról is meggyőzhet egy befektetőt, hogy egy adott pénzkezelő tévedhetetlen zseni, ha eredményeit csak a tiszta szerencsének köszönhetik.

Emellett a tudományos kutatás során nyert statisztikai adatok értékelésekor figyelembe kell venni a klaszterezés illúzióját is. Az, hogy egy látszólagos „minta” valójában mennyire releváns és pontos, gyakran attól függ, hogy mekkora volt az eredeti populációs mintaméret.

Például egy adott etnikai csoportban a skizofrénia prevalenciájának becslésekor megbízhatóbb lenne egy néhány ezer fős mintát vizsgálni, mint egy 100 fős mintát. Csak 100 ember kiválasztásával és tizenöt skizofréniás ember megfigyelésével a kutató arra a következtetésre juthat, hogy a lakosság 15%-a skizofréniában szenved – ez a csoportosulási illúzió újabb megnyilvánulása lenne. Míg ezer ember kiválasztása nagy valószínűséggel valódi, tipikus 1%-os skizofréniát eredményezne, ami a legtöbb etnikai ember esetében így van. A nagy populációs minta megkönnyíti a pontos számok extrapolálását, és elkerüli a klaszterezés illúzióját.

Jegyzetek

  1. Kahneman, Daniel; Amos Tversky. Szubjektív valószínűség: A reprezentativitás ítélete  (angol)  // Kognitív Pszichológia : folyóirat. - 1972. - 1. évf. 3 , sz. 3 . - P. 430-454 . - doi : 10.1016/0010-0285(72)90016-3 .
  2. Clarke, R.D. A Poisson-eloszlás alkalmazása  (határozatlan)  // Journal of the Institute of Actuaries. - 1946. - T. 72 . - S. 481 .
  3. Gilovich, 1991 p. 19
  4. Mori, Kentaro Minták látása . Letöltve: 2012. március 3. Az eredetiből archiválva : 2020. február 24.
  5. London bombázása (downlink) . Hozzáférés dátuma: 2012. március 3. Az eredetiből archiválva : 2012. február 21. 
  6. Gilovich, T., Vallone, R. & Tversky, A. (1985). A forró kéz a kosárlabdában: A véletlenszerű sorozatok félreértéséről. Kognitív Pszichológia 17, 295-314.

Lásd még