A minta vagy mintakészlet az általános elemkészlet része, amelyet egy kísérlet (megfigyelés, felmérés) lefed.
A minta jellemzői:
A statisztikai kísérletek összes lehetséges eredményének megfelelő független valószínűségi változók sorozatát, amelyek egy valószínűségi változóval azonos valószínűség-eloszlási törvényt tartalmaznak, egy valószínűségi változó által generált mintanagyságnak nevezzük [1] . Ha egy diszkrét valószínűségi változó , akkor a térfogat mintája a térfogat általános sokaságának objektumainak bármely részhalmaza , amelyet egyenlő valószínűséggel választanak ki az összes ilyen részhalmaz közül [1] .
A mintanagyság a mintában szereplő esetek száma.
A minták feltételesen oszthatók nagyra és kicsire, mivel a matematikai statisztikában a minta méretétől függően eltérő megközelítéseket alkalmaznak. Úgy gondolják, hogy a 30-nál nagyobb minták nagyok közé sorolhatók [2] .
Két (vagy több) minta összehasonlításakor fontos paraméter a függőségük. Ha lehetséges- e homomorf pár létesítése (azaz amikor az X mintából egy eset felel meg egy esetnek és csak egy eset az Y mintából és fordítva) minden esetben két mintában (és ez a kapcsolati alap fontos a tulajdonság szempontjából a mintákban mérve), az ilyen mintákat függőnek nevezzük . Példák a függő választásokra:
Ha nincs ilyen kapcsolat a minták között, akkor ezeket a mintákat függetlennek tekintjük , például:
Ennek megfelelően a függő minták mindig azonos méretűek, míg a független minták mérete eltérő lehet.
A mintákat különböző statisztikai kritériumok alapján hasonlítják össze :
A minta tekinthető reprezentatívnak vagy nem reprezentatívnak. A minta reprezentatív lesz nagy embercsoport vizsgálatakor, ha ezen a csoporton belül különböző alcsoportok képviselői vannak, csak így lehet helyes következtetéseket levonni.
Az Egyesült Államokban a nem reprezentatív mintavétel egyik leghíresebb történelmi példája az 1936 - os elnökválasztás során történt eset [3] . A több korábbi választás eseményeit sikeresen megjósoló Litrery Digest tévesen ítélte meg jóslatait, tízmillió próbaszavazatot küldött ki előfizetőinek, valamint az egész ország telefonkönyvéből kiválasztott személyeknek, illetve az autónyilvántartási listákról. A visszaküldött szavazatok 25%-án (közel 2,5 millió) a szavazatok a következőképpen oszlottak meg:
Mint ismeretes, a tényleges választásokat Roosevelt nyerte meg a szavazatok több mint 60%-ával. A Litreary Digest hibája a következő volt: a minta reprezentativitását akarták növelni – mivel tudták, hogy előfizetőik többsége republikánusnak tartja magát – telefonkönyvekből és regisztrációs listákból kiválasztott emberekkel bővítették a mintát. Nem vették azonban figyelembe a mai valóságot, sőt még több republikánust toboroztak: a nagy gazdasági világválság idején többnyire a közép- és felsőosztály (vagyis a legtöbb republikánus, nem demokrata) engedhette meg magának, hogy telefont és autót tartson .
A csoportépítési tervnek több fő típusa van [4] :
A minták két típusra oszthatók:
Egy ilyen minta használata azon a feltételezésen alapul, hogy minden válaszadó azonos valószínűséggel kerül be a mintába. Az általános sokaság listája alapján kártyákat állítanak össze a válaszadók számával. Egy pakliba teszik, megkeverik, és véletlenszerűen kivesznek belőlük egy kártyát, felírnak egy számot, majd visszaadják. Továbbá az eljárást annyiszor ismételjük meg, ahány mintaméretre szükségünk van. Mínusz: a kiválasztási egységek ismétlése.
Az egyszerű véletlenszerű minta elkészítésének eljárása a következő lépéseket tartalmazza:
1) be kell szerezni a lakosság teljes listáját, és meg kell számozni ezt a listát. Az ilyen listát, visszahívást mintavételi keretnek nevezzük;
2) határozza meg a várható mintanagyságot, azaz a válaszadók várható számát;
3) vegyünk ki annyi számot a véletlenszámok táblázatából, ahány mintaegységre van szükségünk. Ha a minta 100 főből áll, akkor 100 véletlenszerű számot veszünk ki a táblázatból. Ezeket a véletlen számokat számítógépes program generálhatja.
4) válassza ki az alaplistából azokat a megfigyeléseket, amelyek száma megfelel a felírt véletlenszámoknak
1) gyakran nehéz olyan mintavételi keretet létrehozni, amely lehetővé tenné az egyszerű véletlenszerű mintát.
2) egy egyszerű véletlen minta alkalmazásának eredménye lehet nagy sokaság, vagy nagy földrajzi területen elosztott sokaság, ami jelentősen megnöveli az adatgyűjtés idejét és költségét.
3) az egyszerű véletlenszerű minta alkalmazásának eredményeit gyakran alacsony pontosság és nagyobb standard hiba jellemzi, mint más valószínűségi módszerek alkalmazásának eredményeit.
4) az SRS alkalmazása következtében nem reprezentatív minta alakulhat ki. Bár az egyszerű véletlenszerű kiválasztással kapott minták átlagosan megfelelően reprezentálják az általános sokaságot, néhányuk rendkívül helytelenül reprezentálja a vizsgált sokaságot. Ennek valószínűsége különösen nagy kis mintaméret mellett.
Egyszerű nonreplay letöltésA minta felépítésének menete megegyezik, csak a válaszadók számát tartalmazó kártyák nem kerülnek vissza a pakliba.
A kiválasztás egy ilyen mintában nem a véletlen elvei szerint, hanem szubjektív kritériumok szerint történik - hozzáférhetőség, tipikusság, egyenlő reprezentáció stb.
A csoportok kiválasztása a pszichológiai kísérletben való részvételhez különféle stratégiák felhasználásával történik, amelyek szükségesek ahhoz, hogy a lehető legmagasabb szintű megfelelést biztosítsák a belső és külső érvényességnek [5] .
A véletlenszerű kiválasztást egyszerű véletlen minták létrehozására használják . Egy ilyen minta használata azon a feltételezésen alapul, hogy a sokaság minden tagja azonos valószínűséggel kerül be a mintába. Például egy 100 egyetemi hallgatóból álló véletlenszerű minta készítéséhez egy kalapba helyezheti az összes egyetemista nevével ellátott dolgozatot, majd kivesz belőle 100 darab papírt – ez véletlenszerű kiválasztás lesz (Goodwin J., p. . 147)……
A páros szelekció a mintacsoportok felépítésére szolgáló stratégia, amelyben az alanyok csoportjait olyan alanyok alkotják, amelyek a kísérlet szempontjából jelentős mellékparaméterek tekintetében egyenértékűek. Ez a stratégia hatékony olyan kísérleteknél, ahol kísérleti és kontrollcsoportokat használnak a legjobb lehetőséggel - ikerpárok vonzásával ( egy- és kétpetéjű ).
Sztratometrikus szelekció - randomizálás a rétegek (vagy klaszterek ) kiválasztásával. Ezzel a mintavételi módszerrel az általános sokaságot csoportokra (rétegekre) osztják, amelyek bizonyos jellemzőkkel rendelkeznek ( nem , életkor , politikai preferenciák, iskolai végzettség , jövedelmi szint stb.), és kiválasztják a megfelelő jellemzőkkel rendelkező alanyokat.
Hozzávetőleges modellezés - korlátozott minták készítése és a mintára vonatkozó következtetések általánosítása egy nagyobb populációra. Például, amikor egy 2. éves egyetemi hallgatók vizsgálatában vesznek részt, ennek a tanulmánynak az adatait kiterjesztjük „17 és 21 év közötti emberekre”. Az ilyen általánosítások megengedhetősége rendkívül korlátozott.
A közelítő modellezés egy olyan modell kialakítása, amely a rendszerek (folyamatok) egyértelműen meghatározott osztályára vonatkozóan elfogadható pontossággal írja le annak viselkedését (vagy kívánt jelenségeit).