Minta

A minta vagy mintakészlet az általános elemkészlet  része, amelyet egy kísérlet (megfigyelés, felmérés) lefed.

A minta jellemzői:

Mintavétel a matematikai statisztikában

A statisztikai kísérletek összes lehetséges eredményének megfelelő független valószínűségi változók sorozatát, amelyek egy valószínűségi változóval azonos valószínűség-eloszlási törvényt tartalmaznak, egy valószínűségi változó által generált mintanagyságnak nevezzük [1] . Ha  egy diszkrét valószínűségi változó , akkor a térfogat mintája a térfogat általános sokaságának objektumainak bármely részhalmaza , amelyet egyenlő valószínűséggel választanak ki az összes ilyen részhalmaz közül [1] .

Mintaméret

A mintanagyság  a mintában szereplő esetek száma.

A minták feltételesen oszthatók nagyra és kicsire, mivel a matematikai statisztikában a minta méretétől függően eltérő megközelítéseket alkalmaznak. Úgy gondolják, hogy a 30-nál nagyobb minták nagyok közé sorolhatók [2] .

Függő és független minták

Két (vagy több) minta összehasonlításakor fontos paraméter a függőségük. Ha lehetséges- e homomorf pár létesítése (azaz amikor az X mintából egy eset felel meg egy esetnek és csak egy eset az Y mintából és fordítva) minden esetben két mintában (és ez a kapcsolati alap fontos a tulajdonság szempontjából a mintákban mérve), az ilyen mintákat függőnek nevezzük . Példák a függő választásokra:

Ha nincs ilyen kapcsolat a minták között, akkor ezeket a mintákat függetlennek tekintjük , például:

Ennek megfelelően a függő minták mindig azonos méretűek, míg a független minták mérete eltérő lehet.

A mintákat különböző statisztikai kritériumok alapján hasonlítják össze :

Reprezentativitás

A minta tekinthető reprezentatívnak vagy nem reprezentatívnak. A minta reprezentatív lesz nagy embercsoport vizsgálatakor, ha ezen a csoporton belül különböző alcsoportok képviselői vannak, csak így lehet helyes következtetéseket levonni.

Példa egy nem reprezentatív mintára

Az Egyesült Államokban a nem reprezentatív mintavétel egyik leghíresebb történelmi példája az 1936 - os elnökválasztás során történt eset [3] . A több korábbi választás eseményeit sikeresen megjósoló Litrery Digest tévesen ítélte meg jóslatait, tízmillió próbaszavazatot küldött ki előfizetőinek, valamint az egész ország telefonkönyvéből kiválasztott személyeknek, illetve az autónyilvántartási listákról. A visszaküldött szavazatok 25%-án (közel 2,5 millió) a szavazatok a következőképpen oszlottak meg:

Mint ismeretes, a tényleges választásokat Roosevelt nyerte meg a szavazatok több mint 60%-ával. A Litreary Digest hibája a következő volt: a minta reprezentativitását akarták növelni – mivel tudták, hogy előfizetőik többsége republikánusnak tartja magát – telefonkönyvekből és regisztrációs listákból kiválasztott emberekkel bővítették a mintát. Nem vették azonban figyelembe a mai valóságot, sőt még több republikánust toboroztak: a nagy gazdasági világválság idején többnyire a közép- és felsőosztály (vagyis a legtöbb republikánus, nem demokrata) engedhette meg magának, hogy telefont és autót tartson .

A mintákból csoportok felépítésének tervtípusai

A csoportépítési tervnek több fő típusa van [4] :

  1. Tanulmányozás kísérleti és kontrollcsoportokkal, amelyek különböző körülmények között vannak elhelyezve.
    • Tanulmányozás kísérleti és kontrollcsoportokkal, páros kiválasztási stratégiával
  2. Csak egy csoportot használó tanulmány - kísérleti.
  3. Vegyes (faktoriális) tervet alkalmazó vizsgálat - minden csoport különböző körülmények közé kerül.

Mintatípusok

A minták két típusra oszthatók:

Valószínűségi minták

Egyszerű újramintavételezés

Egy ilyen minta használata azon a feltételezésen alapul, hogy minden válaszadó azonos valószínűséggel kerül be a mintába. Az általános sokaság listája alapján kártyákat állítanak össze a válaszadók számával. Egy pakliba teszik, megkeverik, és véletlenszerűen kivesznek belőlük egy kártyát, felírnak egy számot, majd visszaadják. Továbbá az eljárást annyiszor ismételjük meg, ahány mintaméretre szükségünk van. Mínusz: a kiválasztási egységek ismétlése.

Az egyszerű véletlenszerű minta elkészítésének eljárása a következő lépéseket tartalmazza:

1) be kell szerezni a lakosság teljes listáját, és meg kell számozni ezt a listát. Az ilyen listát, visszahívást mintavételi keretnek nevezzük;

2) határozza meg a várható mintanagyságot, azaz a válaszadók várható számát;

3) vegyünk ki annyi számot a véletlenszámok táblázatából, ahány mintaegységre van szükségünk. Ha a minta 100 főből áll, akkor 100 véletlenszerű számot veszünk ki a táblázatból. Ezeket a véletlen számokat számítógépes program generálhatja.

4) válassza ki az alaplistából azokat a megfigyeléseket, amelyek száma megfelel a felírt véletlenszámoknak

  • Egy egyszerű véletlenszerű mintának nyilvánvaló előnyei vannak. Ez a módszer rendkívül könnyen érthető. A vizsgálat eredményei kiterjeszthetők a vizsgált populációra. A statisztikai következtetések legtöbb megközelítése magában foglalja az információgyűjtést egy egyszerű véletlenszerű minta segítségével. Az egyszerű véletlenszerű mintavételi módszernek azonban legalább négy jelentős korlátja van:

1) gyakran nehéz olyan mintavételi keretet létrehozni, amely lehetővé tenné az egyszerű véletlenszerű mintát.

2) egy egyszerű véletlen minta alkalmazásának eredménye lehet nagy sokaság, vagy nagy földrajzi területen elosztott sokaság, ami jelentősen megnöveli az adatgyűjtés idejét és költségét.

3) az egyszerű véletlenszerű minta alkalmazásának eredményeit gyakran alacsony pontosság és nagyobb standard hiba jellemzi, mint más valószínűségi módszerek alkalmazásának eredményeit.

4) az SRS alkalmazása következtében nem reprezentatív minta alakulhat ki. Bár az egyszerű véletlenszerű kiválasztással kapott minták átlagosan megfelelően reprezentálják az általános sokaságot, néhányuk rendkívül helytelenül reprezentálja a vizsgált sokaságot. Ennek valószínűsége különösen nagy kis mintaméret mellett.

Egyszerű nonreplay letöltés

A minta felépítésének menete megegyezik, csak a válaszadók számát tartalmazó kártyák nem kerülnek vissza a pakliba.

  1. Szisztematikus valószínűségi mintavétel. Ez egy egyszerű valószínűségi minta egyszerűsített változata. Az általános sokaság listája alapján a válaszadókat meghatározott időközönként (K) választják ki. A K értékét véletlenszerűen határozzuk meg. A legmegbízhatóbb eredményt homogén általános populációval érjük el, ellenkező esetben a minta lépésnagysága és néhány belső ciklikus mintázata egybeeshet (mintakeverés). Hátrányok: ugyanaz, mint egy egyszerű valószínűségi mintában.
  2. Soros (beágyazott) mintavétel. A mintavételi egységek statisztikai sorozatok (család, iskola, csapat stb.). A kiválasztott elemeket folyamatos vizsgálatnak vetjük alá. A statisztikai egységek kiválasztása a véletlenszerű vagy szisztematikus mintavétel típusa szerint szervezhető. Hátrányok: nagyobb homogenitás lehetősége, mint az általános populációban.
  3. Zónás minta. Heterogén sokaság esetén a valószínűségi mintavétel bármilyen szelekciós technikával történő alkalmazása előtt javasolt a sokaságot homogén részekre bontani, az ilyen mintát zónás mintának nevezzük. A zónacsoportok lehetnek természetes képződmények (például városrészek) és bármely, a vizsgálat alapjául szolgáló elem. Azt a jelet, amely alapján a felosztást végrehajtják, a rétegződés és a zónázás jelének nevezik.
  4. "Kényelmes" választás. A „kényelmes” mintavételi eljárás a „kényelmes” mintavételi egységekkel – egy diákcsoporttal, egy sportcsapattal, barátokkal és szomszédokkal – való kapcsolatfelvételből áll. Ha információt kell szerezni az emberek reakcióiról egy új koncepcióra, egy ilyen minta meglehetősen ésszerű. A „kényelmi” mintavételt gyakran használják a kérdőívek előzetes tesztelésére.

Hihetetlen minták

A kiválasztás egy ilyen mintában nem a véletlen elvei szerint, hanem szubjektív kritériumok szerint történik - hozzáférhetőség, tipikusság, egyenlő reprezentáció stb.

  1. Kvóta mintavétel  - a mintavétel olyan modellként épül fel, amely a vizsgált jellemzők kvótái (arányai) formájában reprodukálja az általános sokaság szerkezetét. A vizsgált jellemzők eltérő kombinációjával rendelkező mintaelemek számát úgy határozzuk meg, hogy az megfeleljen a teljes sokaságon belüli részesedésüknek (arányuknak). Tehát például, ha az általános népességünk 5000 fő, ebből 2000 nő és 3000 férfi, akkor a kvótamintában 20 nő és 30 férfi, vagy 200 nő és 300 férfi lesz. A kvótaminták leggyakrabban demográfiai kritériumokon alapulnak: nem, életkor, régió, jövedelem, iskolai végzettség és mások. Hátrányok: általában az ilyen minták nem reprezentatívak, mivel lehetetlen egyszerre több társadalmi paramétert figyelembe venni. Előnyök: könnyen hozzáférhető anyag.
  2. Hógolyó módszer. A minta a következőképpen épül fel. Minden válaszadót az elsőtől kezdve arra kérünk, hogy vegye fel a kapcsolatot barátaival, kollégáival, ismerőseivel, akik megfelelnének a kiválasztási feltételeknek és részt tudnának venni a vizsgálatban. Így az első lépés kivételével a minta kialakítása maguknak a vizsgálati tárgyaknak a részvételével történik. A módszert gyakran alkalmazzák, ha nehezen elérhető válaszadói csoportokat kell megtalálni és megkérdezni (például magas jövedelmű válaszadók, azonos szakmai csoporthoz tartozó válaszadók, hasonló hobbikkal/szenvedélyekkel rendelkező válaszadók stb. )
  3. Spontán mintavétel  – mintavétel az úgynevezett „első jövevényről”. Gyakran használják a televíziós és rádiós szavazásokban. A spontán minták mérete és összetétele nem ismert előre, és egyetlen paraméter határozza meg - a válaszadók aktivitása. Hátrányok: nem lehet meghatározni, hogy a válaszadók milyen általános populációt képviselnek, így a reprezentativitás sem határozható meg.
  4. Útvonal felmérés  – gyakran használják, ha a vizsgálati egység a család. A település térképén, ahol a felmérést végzik, minden utca számozott. A véletlen számokat tartalmazó táblázat (generátor) segítségével nagy számokat választunk ki. Minden nagy szám 3 összetevőből áll: utcaszám (2-3 első szám), házszám, lakásszám. Például a 14832-es szám: 14 az utcaszám a térképen, 8 a házszám, 32 a lakásszám.
  5. Zónás mintavétel a tipikus objektumok kiválasztásával. Ha a zónázást követően mindegyik csoportból kiválasztunk egy tipikus objektumot, vagyis olyan objektumot, amely a vizsgálatban vizsgált jellemzők többségénél megközelíti az átlagot, akkor egy ilyen mintát a tipikus objektumok kiválasztásával zónásnak nevezünk.
  6. modális kiválasztás.
  7. Szakértői minta.
  8. heterogén minta.

Csoportépítési stratégiák

A csoportok kiválasztása a pszichológiai kísérletben való részvételhez különféle stratégiák felhasználásával történik, amelyek szükségesek ahhoz, hogy a lehető legmagasabb szintű megfelelést biztosítsák a belső és külső érvényességnek [5] .

Randomizálás

A véletlenszerű kiválasztást egyszerű véletlen minták létrehozására használják . Egy ilyen minta használata azon a feltételezésen alapul, hogy a sokaság minden tagja azonos valószínűséggel kerül be a mintába. Például egy 100 egyetemi hallgatóból álló véletlenszerű minta készítéséhez egy kalapba helyezheti az összes egyetemista nevével ellátott dolgozatot, majd kivesz belőle 100 darab papírt – ez véletlenszerű kiválasztás lesz (Goodwin J., p. . 147)……

Páronkénti kijelölés

A páros szelekció  a mintacsoportok felépítésére szolgáló stratégia, amelyben az alanyok csoportjait olyan alanyok alkotják, amelyek a kísérlet szempontjából jelentős mellékparaméterek tekintetében egyenértékűek. Ez a stratégia hatékony olyan kísérleteknél, ahol kísérleti és kontrollcsoportokat használnak a legjobb lehetőséggel - ikerpárok vonzásával ( egy- és kétpetéjű ).

Sztratometrikus kiválasztás

Sztratometrikus szelekció  - randomizálás a rétegek (vagy klaszterek ) kiválasztásával. Ezzel a mintavételi módszerrel az általános sokaságot csoportokra (rétegekre) osztják, amelyek bizonyos jellemzőkkel rendelkeznek ( nem , életkor , politikai preferenciák, iskolai végzettség , jövedelmi szint stb.), és kiválasztják a megfelelő jellemzőkkel rendelkező alanyokat.

Hozzávetőleges modellezés

Hozzávetőleges modellezés  - korlátozott minták készítése és a mintára vonatkozó következtetések általánosítása egy nagyobb populációra. Például, amikor egy 2. éves egyetemi hallgatók vizsgálatában vesznek részt, ennek a tanulmánynak az adatait kiterjesztjük „17 és 21 év közötti emberekre”. Az ilyen általánosítások megengedhetősége rendkívül korlátozott.

A közelítő modellezés egy olyan modell kialakítása, amely a rendszerek (folyamatok) egyértelműen meghatározott osztályára vonatkozóan elfogadható pontossággal írja le annak viselkedését (vagy kívánt jelenségeit).

Jegyzetek

  1. 1 2 Matalickij M.A., Khatskevich G.A. Valószínűségszámítás, matematikai statisztika és véletlenszerű folyamatok. - Minszk: Felsőiskola, 2012. - S. 518. - 720 p.
  2. Ivanovsky R. Valószínűségszámítás és matematikai statisztika. Alapok, alkalmazott szempontok példákkal és feladatokkal a Mathcad környezetben. - S. 528. - 528 p. — ISBN 978-5-9775-0199.
  3. Pszichológiai kutatás: módszerek és tervezés / J. Goodwin. - Szentpétervár: Péter, 2004. S. 146.
  4. Druzhinin V. N. Kísérleti pszichológia. - 2. kiadás, add. - Szentpétervár: Péter, 2002. S. 92
  5. Lásd uo. 93-95.

Irodalom

Linkek