Évfolyam statisztika

A becslési statisztika ( Estimation Statistics ) az adatelemzés olyan  megközelítése, amely a következő módszerek kombinációját foglalja magában: hatásméret , konfidenciaintervallumok , tervezési pontosság és metaanalízis a kísérletek tervezéséhez , adatok elemzéséhez és eredmények értelmezéséhez. [1] Ez a megközelítés eltér a nullhipotézis szignifikancia teszttől (NHST), amely kevésbé informatív. [2] [3] A pontozási statisztikát, vagy egyszerűen pontozást , más néven új statisztikákat [3] a pszichológiában , az orvosi kutatásban, az élettudományokban és számos más kísérleti tudományban használják, ahol a A nullhipotézis még mindig elterjedt megközelítés, [4] annak ellenére, hogy az elmúlt néhány évtizedben a becslési statisztikákat javasolták előnyben részesített megközelítésnek. [5] [6]

A becslési statisztika fő célja, hogy jelentse a hatás méretét (pontbecslés) a konfidenciaintervallumával együtt , amely a becslés pontosságához kapcsolódik. [7] A konfidenciaintervallum a fő populációs hatás valószínű értékeinek tartományát összegzi. A pontozási statisztika támogatói a p-szignifikancia szintjei helyett inkább a hatásméreteket a konfidenciaintervallumokkal jelzik [8] , és úgy gondolják, hogy a pontozási statisztikáknak fel kell váltaniuk az adatelemzés szignifikancia - vizsgálati módszerét . [9]

Történelem

A fizika régóta használja a súlyozott átlagok módszerét , hasonlóan a metaanalízishez . [tíz]

A becslési statisztikák története Jacob Cohen által az 1960-as években kidolgozott szabványos hatásméretekkel kezdődött. Az első értékelő statisztikákat használó tanulmányok úttörője Gene W. Glass volt, a metaanalízis módszerének kifejlesztésével együtt az 1970-es években. [11] Azóta Larry Hedges, Michael Borenstein, Doug Altman, Martin Gardner, Jeff Cumming és mások finomították a becslési statisztikai módszereket. A metaanalízissel kombinált szisztematikus áttekintés egy rokon módszer, amelyet széles körben alkalmaznak az orvosi kutatásban. A metaanalízis széles körben elterjedt alkalmazása ellenére a pontozásos statisztikai megközelítést még mindig nem alkalmazzák következetesen a mainstream orvosbiológiai kutatásokban. [négy]

Az 1990-es években Kenneth Rothman szerkesztő betiltotta a p-értékek használatát az Epidemiology folyóiratban ; a szerzők támogatták a kezdeményezést, de ez nem befolyásolta elemző gondolkodásukat a kutatás során. [12]

Újabban az értékelési statisztikai módszereket olyan területeken alkalmazzák, mint az idegtudomány , az oktatáspszichológia és a pszichológia . [13]

Az American Psychological Association publikációs irányelvei a hipotézisek tesztelése (tesztelése) helyett inkább becslést (becslést) javasolnak. [14] A Biomedical Journalsba benyújtott kéziratok egységes követelményei című dokumentum hasonló ajánlást tesz: „Ne hagyatkozzon kizárólag statisztikai hipotézisvizsgálatokra, például p-értékekre , amelyek nem közvetíthetnek fontos információkat a hatások méretéről .” [tizenöt]

2019-ben a Society for Neuroscience folyóirat, az eNeuro olyan irányelvet vezetett be, amely a pontszám statisztikai diagramok használatát javasolja az adatok bemutatásának preferált módszereként. [16]

Módszertan

Sok szignifikanciatesztnek van megfelelője az értékelési statisztikákban. [17] Szinte minden esetben a teszt eredménye (vagy annak p-értéke ) egyszerűen helyettesíthető egy hatásmérettel és egy precíziós pontszámmal . Például a Student-féle t-próba használata helyett egy elemző összehasonlíthat két független csoportot az átlagos különbség és annak 95%-os konfidenciaintervallumának kiszámításával . Megfelelő módszerek használhatók páros t-próbára és többszörös összehasonlításra. Hasonlóképpen a regressziós elemzéshez az elemzőnek a determinációs együtthatót (R 2 ) és a modell egyenletét kell megadnia a modell p-értéke helyett .

Az értékelő statisztika hívei azonban a numerikus számítások mellett az adatok adatvizualizációval történő elemzését és bemutatását javasolják. [2] [6] [7] Példák a megfelelő vizualizációkra a regressziós szórásdiagram és a két független csoport Gardner-Altman diagramja. [18] Míg a klasszikus cselekmények (például hisztogramok , bajuszdobozok és hegedűrajzok) nem mutatnak összehasonlítást, a pontszámstatisztikai diagramok egy második tengelyt adnak hozzá az effektus méretének egyértelmű megjelenítéséhez . [19]

Gardner-Altman telek

A Gardner-Altman átlagos különbség diagramot először Martin Gardner és Doug Altman írta le 1986-ban [18] Ez a statisztikai diagram két független csoport adatait jeleníti meg. [6] A gráfnak van egy olyan változata is, amely alkalmas linkelt mintákra . A diagram elkészítéséhez a legfontosabb utasítások a következők: (1) ábrázolja egymás mellett az összes megfigyelt értéket mindkét csoporthoz; (2) helyezze el a második tengelyt jobbra, eltolva azt, hogy az átlagos különbségi skálát mutassa ; és (3) ábrázolja az átlagos különbséget a konfidenciaintervallumával , mint egy hibaértékkel rendelkező markert . [3] A Gardner-Altman parcellák egyéni kóddal generálhatók a Ggplot2 , seaborn vagy DABEST csomagok használatával ; alternatív megoldásként az elemző használhat egy praktikus szoftvert, például a Becslési Statisztikák alkalmazást .

Cumming diagramja

Több csoport esetén Jeff Cumming egy további panelt vezetett be két vagy több átlagos különbség és azok konfidenciaintervallumának ábrázolására , amelyet a megfigyelt értékek első panelje alá helyeztek [3] : ez az elrendezés megkönnyíti az átlagos különbségek ("delták") összehasonlítását . több adatcsoporton keresztül. Cumming diagramok generálhatók az ESCI , a DABEST vagy az Estimation Stats alkalmazás segítségével .

Egyéb módszertanok

Az átlagos különbségen kívül számos más típusú hatásméret létezik , amelyeknek megvannak a maga előnyei egymáshoz képest. A fő típusok közé tartozik a Cohen-féle d típusú hatásméret és a determinációs együttható (R 2 ) a regressziós elemzéshez . A nem normál eloszlások esetében számos robusztusabb módszer létezik a hatásméretek kiszámítására , beleértve a Cliff-deltát és a Kolmogorov-Smirnov statisztikát .

Gyengeségek a hipotézisvizsgálatban

A hipotézisvizsgálat során a statisztikai számítások fő célja egy p-érték ,  egy adott eredmény látásának valószínűsége vagy egy szélsőségesebb eredmény megszerzése, ha feltételezzük, hogy a nullhipotézis igaz. Ha a p -érték alacsony (általában <0,05), a statisztikusnak azt tanácsoljuk, hogy utasítsa el a nullhipotézist . A becslési statisztikák támogatói a következő okok miatt utasítják el a hipotézisvizsgálati megközelítés érvényességét [3] [7] :

Az értékelési statisztikák előnyei

A konfidenciaintervallumok előnyei

A bizalmi intervallumok kiszámíthatóan viselkednek. Definíció szerint a 95%-os konfidenciaintervallumok 95%-os eséllyel rögzítik a populáció átlagát (μ). Ez a funkció a minta méretének növekedésével változatlan marad ; ami változik, hogy az intervallum kisebb lesz (pontosabban). Ezen túlmenően a 95%-os konfidenciaintervallumok egyben 83%-os előrejelzési intervallumok is: egyetlen kísérleti konfidenciaintervallum 83%-os eséllyel rögzíti bármely jövőbeli kísérlet átlagát . [3] Így egy egyedi kísérlet 95%-os konfidenciaintervallumának ismerete az elemző számára elfogadható tartományt ad a populáció átlagához és a későbbi replikációs kísérletekből származó valószínű eredményekhez .

Bizonyítékokon alapuló statisztikák

A statisztikák észlelésével kapcsolatos pszichológiai tanulmányok azt mutatják, hogy a pontozási intervallumok pontosabban érzékelik az adatokat, mint a p-értékekről szóló jelentések . [25]

Precíziós tervezés

A becslés pontosságát formálisan 1/ varianciaként definiálják , és akárcsak a hatványt , amely a minta méretével növekszik. Az erőhöz hasonlóan a nagy pontosság is munkaigényes. A kutatási támogatási kérelmeknek ideális esetben pontossági/költségelemzést kell tartalmazniuk. A becslési statisztika támogatói úgy vélik, hogy a pontossági tervezésnek kell felváltania a hatalmat , mivel maga a statisztikai teljesítmény fogalmilag összefügg a szignifikanciavizsgálattal . [3]

Jegyzetek

  1. Ellis, Paul Hatásméret GYIK . Letöltve: 2021. január 20. Az eredetiből archiválva : 2021. január 26.
  2. ↑ 1 2 Cohen, Jacob A föld kerek (p<.05) . Letöltve: 2021. január 20. Az eredetiből archiválva : 2017. október 11..
  3. 1 2 3 4 5 6 7 Cumming, Geoff. Az új statisztikák megértése: hatásméretek, megbízhatósági intervallumok és metaanalízis. – New York: Routledge, 2012.
  4. 1 2 Button, Katherine; John P. A. Ioannidis; Claire Mokrysz; Brian A. Nosek; Jonathan Flint; Emma SJ Robinson; Marcus R. Munafò (2013). "Áramkimaradás: miért ássa alá a kis mintaméret az idegtudomány megbízhatóságát." Nature Reviews Neuroscience . 14 (5): 365-76. DOI : 10.1038/nrn3475 . PMID23571845  . _
  5. Altman, Douglas. Gyakorlati statisztikák az orvosi kutatáshoz . – London: Chapman és Hall, 1991.
  6. ↑ 1 2 3 Magabiztos statisztika / Douglas Altman. – London: Wiley-Blackwell, 2000.
  7. 1 2 3 Cohen, Jacob (1990). „Amit tanultam (Eddig)” . amerikai pszichológus . 45 (12): 1304. DOI : 10.1037/0003-066x.45.12.1304 . Archiválva az eredetiből, ekkor: 2021-01-21 . Letöltve: 2021-01-20 . Elavult használt paraméter |deadlink=( súgó )
  8. Ellis, Paul Miért nem tudom megítélni az eredményt a p érték alapján? (2010. május 31.). Letöltve: 2013. június 5. Az eredetiből archiválva : 2021. január 28..
  9. Claridge-Chang, Ádám; Assam, Pryseley N (2016). „A becslési statisztikáknak fel kell váltaniuk a szignifikanciatesztet” . Természeti módszerek . 13 (2): 108-109. DOI : 10.1038/nmeth.3729 . PMID26820542  _ _ S2CID  205424566 . Archiválva az eredetiből, ekkor: 2021-01-22 . Letöltve: 2021-01-20 . Elavult használt paraméter |deadlink=( súgó )
  10. Hedges, Larry (1987). "Milyen kemény a kemény tudomány, milyen puha a puha tudomány . " amerikai pszichológus . 42 (5): 443. CiteSeerX  10.1.1.408.2317 . DOI : 10.1037/0003-066x.42.5.443 .
  11. Hunt, Morton. Hogyan értékeli a tudományt: a metaanalízis története . - New York: The Russell Sage Foundation, 1997. - ISBN 978-0-87154-398-1 .
  12. Fidler, Fiona (2004). „A szerkesztők elvezethetik a kutatókat bizalmi időközökhöz, de nem tudják elgondolkodtatni őket” . Pszichológiai tudomány . 15 (2): 119-126. DOI : 10.1111/j.0963-7214.2004.01502008.x . PMID  14738519 . S2CID  21199094 .
  13. Cumming, Geoff ESCI (Exploratory Software for Confidence Intervals) . Letöltve: 2021. január 20. Az eredetiből archiválva : 2013. december 29.
  14. Az American Psychological Association kiadványi kézikönyve, hatodik kiadás . Hozzáférés dátuma: 2013. május 17. Az eredetiből archiválva : 2013. március 5.
  15. Egységes követelmények az orvosbiológiai folyóiratokba benyújtott kéziratokra (lefelé mutató link) . Letöltve: 2013. május 17. Az eredetiből archiválva : 2013. május 15. 
  16. A jelentéskészítési, értelmezési és megvitatási mód megváltoztatása a kutatásunkba vetett bizalom újraépítése érdekében . Letöltve: 2021. január 20. Az eredetiből archiválva : 2021. január 22.
  17. Cumming, Geoff. Bevezetés az új statisztikákba: Becslés, nyílt tudomány és azon túl / Geoff Cumming, Robert Calin-Jageman. - Routledge, 2016. - ISBN 978-1138825529 .
  18. ↑ 12 Gardner , MJ; Altman, DG (1986-03-15). „P-értékek helyett megbízhatósági intervallumok: becslés, nem hipotézisvizsgálat” . British Medical Journal (Clinical Research Edit.) . 292 (6522): 746-750. DOI : 10.1136/bmj.292.6522.746 . ISSN  0267-0623 . PMC  1339793 . PMID  3082422 .
  19. Ho, Joses; Tumkaya; Arial; Choi; Claridge-Chang (2018). „P-értékeken túl: mindennapi adatelemzés becslési diagramokkal” . bioRxiv : 377978. doi : 10.1101 /377978 . Archiválva az eredetiből, ekkor: 2018-07-28 . Letöltve: 2021-01-20 . Elavult használt paraméter |deadlink=( súgó )
  20. Baril GL, Cannon JT Mekkora a valószínűsége annak, hogy a nullhipotézis tesztelés értelmetlen? (angol). – 1995.
  21. Cohen, Jacob (1994). „A föld kerek (p < .05)”. amerikai pszichológus . 49 (12): 997-1003. DOI : 10.1037/0003-066X.49.12.997 .
  22. Ellis, Paul. A hatásméretek alapvető útmutatója: statisztikai erő, metaanalízis és a kutatási eredmények értelmezése. – Cambridge: Cambridge University Press, 2010.
  23. A szignifikanciateszt vita: Olvasó / Denton E. Morrison, Ramon E. Henkel. - Aldine Tranzakció, 2006. - ISBN 978-0202308791 .
  24. Cumming, Geoff A p értékek tánca . Letöltve: 2021. január 20. Az eredetiből archiválva : 2021. február 13.
  25. Beyth-Marom, R; Fidler, F.; Cumming, G. (2008). „Statisztikai megismerés: A statisztikában és a statisztikai oktatásban a bizonyítékokon alapuló gyakorlat felé”. Statisztikai Oktatási Kutatólap . 7 , 20-39.