A pszichometria (pszichometria) a pszichológia , a kognitív tudományok , az oktatás és a matematika metszéspontjában álló tudományág , amely a pszichológiai mérések elméletét és módszertanát tanulmányozza, beleértve a tudás, képességek, attitűdök és személyiségjegyek mérését. A pszichometria a pszichodiagnosztika egyik ága . Ez a terület elsősorban a mérőeszközök – például kérdőívek, tesztek, személyiségleíró (értékelési) módszerek – létrehozását és validálását érinti, de a számítógépes viselkedéstudományok egy részeként a viselkedés és az építkezés egyes területeinek leírására koncentrálhat. elméleti és matematikai modelljeik . Három fő kutatási feladatot tartalmaz, nevezetesen:
A pszichometriában részt vevők lehetnek pszichológusok (gyakran életkorral kapcsolatosak), matematikusok, valamint fejlesztési vagy HR -szakemberek . Gyakran nincs szükség speciális, külön pszichometriai végzettségre. Ausztráliában azonban az Ausztrál Oktatáskutatási Tanács (ACER) egyes tesztjeihez való hozzáféréshez és azok használatához az engedélyezett képesítés igazolása szükséges. Az Egyesült Államokban a pszichometriát egyetemi, posztgraduális és doktori szinten tanítják.
A pszichometriai korai kutatások nagy része az intelligencia mérésének vágyán alapult. A "pszichometria atyjaként" ismert Francis Galton mentális méréseket épített be az antropometriai adatokba. A pszichometria eredete is a pszichofizikához kötődik . A pszichometria két másik úttörője , James McKean Cattell és Charles Spearman Wilhelm Wundt lipcsei pszichofizikai laboratóriumában doktorált .
Louis Thurstone pszichometrikus , a Psychometric Society alapítója és első elnöke 1936-ban kidolgozta a mérés elméleti megközelítését, amely az összehasonlító ítéletek törvényeként ismert . Ez a megközelítés szorosan összefügg Ernst Weber és Gustav Fechner pszichofizikai elméleteivel . Spearman és Thurstone is nagyban hozzájárult a faktoranalízis fejlesztéséhez .
Karl Pearson , Henry Kaiser , George Rush , Johnson O'Connor , Frederick Lord , Ledyard Tucker , Arthur Jensen is jelentős mértékben hozzájárult a pszichometria fejlesztéséhez.
A pszichometria területe a tesztadatok elemzésének kvantitatív megközelítéséhez kapcsolódik. A pszichometriai elmélet olyan matematikai modellekkel látja el a kutatókat és pszichológusokat, amelyeket az egyes feladatokra vagy tesztelemekre adott válaszok, általában tesztek és tesztsorozatok elemzéséhez használnak. Az alkalmazott pszichometria ezen modellek és analitikai eljárások konkrét vizsgálati adatokra történő alkalmazásával foglalkozik. A pszichometriai elemzés négy területe a normalizálás és egyenlítés, a megbízhatóság értékelése, az érvényesség értékelése és a tételelemzés . Ezen területek mindegyike tartalmaz bizonyos elméleti rendelkezéseket és egyedi eljárásokat, amelyeket a teszt minőségének minden egyes esetben történő értékelésére használnak. Ugyanakkor mindannyian összekapcsolódnak, és aktívan fejlődnek az európai-amerikai pszichológiai paradigma keretein belül. A teszt érvényességének megértésének modern megközelítései szerint nem magát a tesztet, hanem az abból levont következtetéseket jellemzi. Ez azt jelenti, hogy ugyanaz az eszköz érvényesen (a fejlesztők által meghatározott céloknak és korlátozásoknak megfelelően) és érvénytelenül is használható. Ebben a megközelítésben a teszt minőségének elemzésének valamennyi „különálló” művelete a levont következtetés érvényességének összetevője, és a válaszadóra vonatkozó következtetés bizonyítására szolgál.
A mérés társadalomtudományi definíciója hosszú múltra tekint vissza. A Stanley Smith Stevens (1946) által kínált jelenlegi tág definíció szerint a mérés „számok hozzárendelése tárgyakhoz vagy eseményekhez valamilyen szabály szerint”. Ezt a definíciót egy tanulmányban mutatták be, amelyben Stevens négy skálát javasolt. Bár ez a meghatározás széles körben elfogadott, eltér a fizika mérésének klasszikusabb definíciójától, amely szerint a mérés egy mennyiség numerikus értékelése és kifejezése egy másik mennyiséghez viszonyítva (Michel, 1997).
Valójában Stevens definícióját válaszul terjesztették elő a brit Ferguson-bizottságnak, amelynek elnöke, A. Ferguson fizikus volt. A bizottságot 1932-ben a British Association for the Advancement of Science nevezte ki, hogy megvizsgálja az érzékszervi észlelések számszerűsítésének lehetőségét. Bár elnöke és többi tagja fizikus volt, a bizottságban több pszichológus is helyet kapott. A bizottság jelentése hangsúlyozta a dimenzió meghatározásának fontosságát. Míg Stevens válasza az volt, hogy új definíciót javasol, amely jelentős hatással lenne a területre, nem ez volt az egyetlen válasz a jelentésre. Egy másik, gyökeresen eltérő válasz a klasszikus definíció átvételét szorgalmazta, amint azt a következő kijelentés tükrözi: "A mérés a pszichológiában és a fizikában semmiféle értelemben nem különbözik egymástól. A fizikusok akkor tudnak méréseket végezni, ha találnak olyan műveleteket, amelyek alapján megtalálják a szükséges kritériumot A pszichológusoknak nem kell aggódniuk a „mérés” jelentésének rejtélyes különbségei miatt a két tudományban. (Reese, 1943, 49. o.).
A tesztek normalizálása - szabványosításuk szerves része, általában magában foglalja az egyének reprezentatív mintájának felmérését, a tesztteljesítmény különböző szintjének meghatározását és a nyers tesztpontszámok közös mutatórendszerré alakítását. A tesztek néha igazodnak, ha ugyanannak a tesztnek különböző formái vannak. Az igazítás minden formán a pontszámokat egy közös skálára hozza.
4 fő összehangolási stratégia létezik. Az első módszer szerint a teszt minden egyes formáját a válaszadók egyenértékű (például véletlenszerűen kiválasztott) csoportján végzik el, majd ezeken a különböző űrlapokon a pontszámokat úgy állítják be, hogy az egyenlő pontszámok azonos százalékos rangot kapjanak (a válaszadók azonos aránya ugyanazt kapja). vagy alacsonyabb értékelés). Egy pontosabb módszer szerint minden válaszadó kitölti a teszt minden formáját, és egyenleteket használnak a mutatók egyenértékűségének meghatározására. A harmadik általánosan használt módszer egy általános teszt vagy a teszt egy részének elvégzése az összes válaszadó részvételével. Ez az általános kiértékelési eljárás „összekapcsolási” tesztként szolgál, amely lehetővé teszi, hogy minden további mérés egyetlen skálához legyen kötve. Ha egy felmérést ugyanazon teszt különböző formáival hajtanak végre, mindegyik több "horgonyfeladatot" tartalmaz, amelyek egy ilyen "összekötő" teszt funkcióját látják el.
A megbízhatóság és az érvényesség a teszteredmények általánosíthatóságához kapcsolódik – annak meghatározásához, hogy a teszteredményekre vonatkozó következtetések mely következtetések érvényesek. A megbízhatóság a mérés konzisztenciájára vonatkozó következtetésekre vonatkozik. A konzisztenciát sokféleképpen definiálják: időbeli stabilitásként, egyenértékűnek vélt tesztek közötti hasonlóságként, egyetlen teszten belüli homogenitásként vagy szakértői pontszámok összehasonlíthatóságaként. A teszt-újrateszt módszer alkalmazásakor a teszt megbízhatóságát bizonyos idő elteltével ugyanazzal a csoporttal megismételve állapítjuk meg. A két eredményhalmazt ezután összehasonlítják, hogy meghatározzák a köztük lévő hasonlóság mértékét. A felcserélhető formák módszerének alkalmazásakor két párhuzamos mérést végeznek egy mintán. A szakértők ("értékelők") bevonása a teszt párhuzamos formáinak minőségének értékelésébe a megbízhatóság mértékét adja, ún. az értékelők megbízhatósága. Ezt a módszert gyakran alkalmazzák, ha szakértői értékelésre van szükség.
Az érvényesség a mérési eljárás eredményei alapján levont következtetések minőségét jellemzi.
Érvényességnek tekintjük a teszt azon képességét, hogy megfeleljen a kitűzött céloknak, és igazolja az eredmény alapján hozott döntések megfelelőségét. A nem kellően érvényes teszt nem tekinthető mérőeszköznek és nem használható a gyakorlatban, mivel a kapott eredmény gyakran súlyosan befolyásolhatja a vizsgált személy jövőjét.
A teszt érvényességének három típusa van.
Konstrukciós (fogalmi) érvényesség . Meg kell határozni, ha a teszt olyan tulajdonságot mér, amely absztrakt jellegű, azaz nem alkalmas közvetlen mérésre. Ilyen esetekben olyan fogalmi modellt kell alkotni , amely ezt a tulajdonságot megmagyarázza. Ez a modell megerősíti vagy cáfolja a tesztet.
Kritériumok (empirikus) érvényessége . Megmutatja, hogy a teszteredmények hogyan viszonyulnak valamilyen külső kritériumhoz. Az empirikus érvényesség két formában létezik: aktuális kritérium érvényessége – a vizsgálati eredmények és a jelenleg létező kiválasztott kritérium közötti korreláció ; prediktív kritérium érvényessége - az eredmények korrelációja a jövőben megjelenő kritériummal. Meghatározza, hogy a teszt mennyire jelzi előre a mért minőség jövőbeni megnyilvánulását, figyelembe véve a külső tényezők hatását és a vizsgált saját tevékenységét.
Tartalom érvényessége . Meghatározza, hogy a teszt mennyire releváns a tárgykörében, azaz azt a minőséget méri-e, amelyet reprezentatív mintán mérni szándékoznak. Egy teszt tartalmi érvényességének megőrzéséhez rendszeresen ellenőrizni kell a megfelelőséget, mivel egy adott minőség megnyilvánulásának valós képe idővel változhat a mintában. A tartalom érvényességét a teszt tárgykörének szakértőjének kell értékelnie.
A teszt validálási folyamata nem az érvényességére vonatkozó bizonyítékok gyűjteménye, hanem az érvényesség növelésére irányuló intézkedések összessége.
A Klasszikus Tesztelméletben a legtöbb feladatelemzési eljárás az alábbiakat foglalja magában: a) azon alanyok számának regisztrálása, akik egy adott feladatra helyes vagy helytelen választ adtak; b) az egyes feladatok korrelációja más változókkal; c) a feladatok szisztematikus hiba (vagy "elfogultság") ellenőrzése. A teszt feladatával megbirkózó alanyok arányát a feladat nehézségének nevezzük. A feladatok javításának egyik módja, ha egy feleletválasztós feladatnál kiszámítjuk az egyes válaszlehetőségek százalékos arányát; hasznos kiszámítani az egyes lehetőségeket választó alanyok átlagos tesztpontszámát is. Ezek az eljárások lehetővé teszik annak ellenőrzését, hogy a válaszlehetőségek a felkészületlen alanyok számára elfogadhatónak tűnjenek, de a leginkább hozzáértők számára ne tűnjenek helyesnek. Az általános tesztpontszámmal erősen korreláló elemek kiválasztása maximalizálja a teszt belső konzisztenciájának megbízhatóságát, míg a külső kritériummal erősen korreláló elemek kiválasztása maximalizálja a teszt prediktív érvényességét. Ezen összefüggések leíró analóg modelljét alapjel jelleggörbének nevezzük ; tipikus esetekben ez a grafikon azon alanyok arányáról, akik helyesen válaszoltak a kérdésre a teljes tesztpontszámon. A hatékony feladatokhoz ezek a grafikonok pozitív növekvő görbék, amelyek nem csökkennek a képesség növekedésével.