Mintavétel (matematikai statisztika)

A mintavétel a matematikai statisztikában általánosított elnevezése a kezdeti minta vezérlésének ismert modellezési célú módszereinek, amelyek lehetővé teszik egy stacionárius ergodikus véletlenszerű folyamat legjobb statisztikai modelljének strukturális-paraméteres azonosítását.

Leírás

A mintavételi módszer tudományos újdonsága abban rejlik, hogy hatékony technika a minta statisztikai tulajdonságainak és a modellezés céljának logikai szemantikai összekapcsolására. A mintavétel ugyanakkor növeli a kritériumtér dimenzióját, és egyúttal a Pareto-optimalitás problémájának megoldását is szolgálja azáltal, hogy bizonyos kritériumokat elkülönít és rangsorol (a strukturális kritérium magasabb rangú, mint a parametrikusé , így ezek a kritériumok nem ütköznek egymással). N. N. Chubukov a következő példát adja [1] . Legyen a véletlenszerű folyamat egy méretű mintával ábrázolva . Három feladatot kell megoldani:

  1. Futtasson feltételesen hosszú távú előrejelzést a következőre: ;
  2. Futtasson feltételesen rövid távú előrejelzést a következőhöz: ;
  3. Határozzon meg egy függvényt az érték visszaállításához a kijelölés bármely pontján.

Ha a modellezés hagyományos megközelítését alkalmazzuk, a folyamat statisztikai tulajdonságai leírásának egyediségére összpontosítva, akkor három teljesen azonos függvény lesz az eredmény. Az a helyzet, hogy a modell minőségi kritériumának számítási szabálya nem vette figyelembe a lényeges részleteket: az előrejelzési horizontot, a véletlenszerű folyamatok mintaadatokkal reprezentált statisztikai trendjeinek jellegét, a feladatok célspecifikusságát figyelmen kívül hagyva .

Sokszínűség elve

Ebből a nehézségből a kiutat a mintavételen belüli diverzitás elvének alkalmazása jelentheti, amely ismert és használható mérnöki problémák megoldására az adatok keresztellenőrzési módszerének alkalmazásával, például a bootstrap analízissel [2] . argumentumok csoportos elszámolása [3] stb. A diverzitás elvének megnyilvánulása a statisztikai problémák megoldásában az, hogy az algoritmus a kezdeti adatok valószínűségi tulajdonságainak tudatlanságára különféle generált modellstruktúrákkal válaszol, amelyek mindegyike keresztezésnek van kitéve. -optimalitás ellenőrzése egy bizonyos, minden modellre jellemző séma szerint.

Feladatok

A mintavétel egy modern módszer, amely gyakorlatilag hasznos lehet matematikai statisztika problémák megoldásában, beleértve az inverz és rosszul feltett problémákat [4] . A mintavétel megvalósítja a diverzitás elvét, és a statisztikai elemzési eszközök teljes skáláját általánosíthatja a forrásadatok kezelése alapján. A mintavétel alatt olyan technikák összességét értjük, amelyek a kiindulási mintát munka- és vezérlőszakaszra osztják a modellezés céljainak megfelelő szabályok szerint. A munkaszakaszokon a "versenyző" modellek paramétereit számítják ki, a kontrollokon pedig értékelik, hogy képesek-e visszaállítani azokat az értékeket, amelyeket nem használtak a paraméterek kiszámításához.

A módszeresen helyes mintavétel „megkerüli” a fő akadályt, amely objektíve az inverz problémákban jelen van. Ennek oka abban keresendő, hogy a változó paramétere és a modelloptimalitási kritérium számértéke között nem lehet szigorú matematikai kapcsolatot megállapítani. Ugyanakkor a mintavételezés a modell szerkezeti-paraméteres azonosításának algoritmusát a szigorúan matematikai kategóriából a heurisztika osztályába helyezi át, és ígéretessé teszi a mesterséges intelligencia rendszerek létrehozására .

A fenti példával kapcsolatban az első eset  - a mintán kívüli "hosszú" extrapoláció - a mintavételi változatnak felel meg, a sorban az utolsó tíz mintaérték kizárásával a modellparaméterek számításából. A tizedik szám lesz a kontroll. A munka alminta az összes értéket tartalmazza, kivéve ezt a tízet. Ezután alternatív felsorolással meghatározzák a legjobb modellt, amely a legpontosabban jelezte előre a kontrollpontot. A kizárt minták helyzetének megváltoztatásával, számuk és folytonosságuk megsértése nélkül maradványstatisztika keletkezik, amely alkalmas az eredmény megbízhatóságának értékelésére szolgáló statisztikai stabilitási kritérium és „cső” kiszámítására. Az algoritmus egy adott mélységig extrapolálással „megvizsgálja” a modelleket, és kiválasztja belőlük azt, amelyik a legpontosabban rögzíti a tízmintás késleltetésű értékekre vonatkozó információkat tartalmazó „hosszú” trendeket. Ebben az esetben a "rövid lövésű" modellek hátrányos megkülönböztetésben részesülnek.

A második feladat a mintavételnek felel meg egy ellenőrző pont számításából való kizárásával, az előző értékek számának és sorrendjének kombinációjával, amelyet az előrejelzéshez figyelembe veszünk. Ebben az esetben a "hosszú trendű" modellek "elnyomódnak", és éppen ellenkezőleg, előnyben részesítik azokat a modelleket, amelyek pontos rövid távú előrejelzést adnak.

A harmadik feladatban a minta áthatoló blokkokra való felosztása lesz indokolt, amikor a kontrollértékek „szétszórtak” a dolgozók között. Az ilyen blokkok hosszának és áthatolásuk mélységének figyelembe kell vennie a tartomány szomszédos pontjai közötti intervallumokat, a becslések szükséges stabilitását és pontosságát. Így a harmadik feladat megfelelhet minden harmadik minta számításból való kizárásának és a kizárt adatok ellenőrzési célú felhasználásának a kontroll és a munkarészminták ciklikus átsorolásával.

A mintavétel típusai

Lásd még

Jegyzetek

  1. Chubukov N. N. Mechatronikai rendszerek kalibrálásának algoritmizálása mintavétellel // Mechatronika, avtomatizatsiya, upravlenie. 2013. 7. sz.
  2. Efron B. A többváltozós statisztikai elemzés nem hagyományos módszerei: Szo. cikkek: Per. angolból / Előszó: Yu. P. Adler, Yu. A. Koshevnik. - M .: Pénzügy és statisztika, 1988. - 263 p. beteg.
  3. Ivakhnenko, 1971 .
  4. Tikhonov A.N., Arszenin V.Ya. A rosszul feltett problémák megoldásának módszerei. - M .: Nauka, 1979. - S. 283 p.

Irodalom