Statisztikai becslés és tulajdonságai. Pontbecslés és tulajdonságai. Az eloszlási paraméterek pontbecslése

A fejezet tanulmányozása után a tanuló meg fogja tenni tud, hogy egy minta egy általános sokaság empirikus analógjának tekinthető, hogy a mintaadatok segítségével megítélhető egy általános sokaság tulajdonságai és értékelhető jellemzői, a statisztikai becslések eloszlásának alapvető törvényei, képesnek lenni pont- és intervallumbecsléseket készít a populációs paraméterekről a momentumok és a maximális valószínűség módszerével, saját a kapott becslések pontosságának és megbízhatóságának meghatározásának módjai.

A statisztikai becslések típusai

Az általános sokaság paramétereiről annyit tudunk, hogy objektíven léteznek, de közvetlenül nem lehet őket meghatározni, mivel az általános sokaság vagy végtelen, vagy túl nagy. Ezért a kérdés csak e jellemzők értékeléséről szólhat.

Korábban megállapítást nyert, hogy egy általános sokaságból kinyert mintára a reprezentativitás feltételei mellett lehetőség van az általános sokaság jellemzőivel analóg jellemzők meghatározására.

cjp Definíció 8.1. A mintából talált eloszlási paraméterek hozzávetőleges értékeit paraméterbecslésnek nevezzük.

Jelöljük a valószínűségi változó (általános sokaság) becsült paraméterét 0-val, a minta felhasználásával kapott becslését pedig 0-val.

A 0 pont véletlenszerű változó, mivel bármely minta véletlenszerű. A különböző mintákra kapott becslések eltérnek egymástól. Ezért a 0-t a mintától függő függvénynek tekintjük: 0 = 0(X in).

ShchR Meghatározás 8.2. A statisztikai értékelést ún gazdag, ha a valószínűség szerint a becsült paraméterre hajlik:

Ez az egyenlőség azt jelenti, hogy a 0=0 esemény megbízhatóvá válik, ha a minta mérete korlátlanul növekszik.

Példa erre egy esemény relatív gyakorisága A, ami ennek az eseménynek a valószínűségének konzisztens becslése a Poisson-tétellel összhangban (lásd a (6.1) képlet 1. részét).

Meghatározás 8.3. A statisztikai becslés akkor tekinthető hatékonynak, ha a legkisebb szórással rendelkezik azonos mintaméretek esetén.

Fontolja meg az értékelést M x matematikai elvárás M x valószínűségi változó X. Ilyen becslésként választunk X. Határozzuk meg egy valószínűségi változó matematikai elvárását X.

Először is tegyünk egy fontos megállapítást: tekintettel arra, hogy minden valószínűségi változó X, ugyanabból a populációból származnak X, ami azt jelenti, hogy ugyanolyan eloszlásúak, mint X,írható:

Most keressük meg M(X in):


Így a minta átlaga egy valószínűségi változó matematikai elvárásának statisztikai becslése. Ez a becslés konzisztens, mert a Csebisev-tétel következményével összhangban a valószínűségben konvergál a matematikai elváráshoz (6.3).

Megállapítottuk, hogy a vizsgált esetben a választott becslésünk (véletlenszerű változó) matematikai elvárása megegyezik magával a becsült paraméterrel. Az ezzel a tulajdonsággal rendelkező becslések különleges helyet foglalnak el a matematikai statisztikában; elfogulatlannak nevezik őket.

Meghatározás 8.4. A © statisztikai becslést torzítatlannak nevezzük, ha a matematikai elvárása megegyezik a becsült paraméterrel

Ha ez a követelmény nem teljesül, akkor a becslést torzítottnak nevezzük.

Így a minta átlaga a várható érték torzítatlan becslése.

Elemezzük a minta variancia torzítását D, ha az általános variancia becsléseként van kiválasztva Dx. Ehhez nézzük meg, hogy teljesül-e a (8.2) feltétel?:


Alakítsuk át a kapott két tagot:

Itt az egyenlőséget használták M(X.) = M(X 2), méltányos ugyanazon okból, mint (8.1).

Nézzük a második kifejezést. A négyzetösszeg képlet segítségével P feltételeket kapunk


Figyelembe véve ismét a (8.1) egyenlőséget, valamint azt, hogy X és X független valószínűségi változók, írjuk

és végül megkapjuk:

Helyettesítsük be a kapott eredményeket (8.3)-ba!

Az átalakulás után megkapjuk

Ebből arra következtethetünk, hogy a minta szórása az kiszorított az általános variancia becslése.

A kapott eredményt figyelembe véve feladatul tűztük ki az általános variancia olyan becslésének megalkotását, amely kielégíti a (8.2) torzítatlan feltételt. Ehhez vegyük figyelembe a valószínűségi változót

Könnyen belátható, hogy ennél a mennyiségnél teljesül a (8.2) feltétel:

Vegye figyelembe, hogy a mintavariancia és a korrigált mintavariancia közötti különbségek jelentéktelenné válnak nagyobb mintaméreteknél.

A valószínűségi változók jellemzőire vonatkozó becslések kiválasztásakor fontos ismerni azok pontosságát. Bizonyos esetekben nagy pontosságra van szükség, és néha elegendő egy durva becslés. Például egy csatlakozó járat tervezésekor fontos, hogy minél pontosabban ismerjük a csatlakozási pontra érkezés tervezett időpontját. Egy másik helyzetben például, ha otthon vagyunk és várunk egy futárt a megrendelt áruval, nem fontos számunkra az érkezési időpont nagy pontossága. Mindkét esetben a valószínűségi változó az érkezési idő, a minket érdeklő valószínűségi változó jellemzője pedig az átlagos utazási idő.

Kétféle értékelés létezik. Az első esetben a paraméter meghatározott számértékének megszerzése a feladat. Egy másik esetben meghatározunk egy intervallumot, amelybe a számunkra érdekes paraméter adott valószínűséggel esik.

Az előadás vázlata:

    Az értékelés fogalma

    A statisztikai becslések tulajdonságai

    Pontbecslések megtalálásának módszerei

    Intervallum paraméterbecslés

    Egy normális eloszlású sokaság ismert varianciájával rendelkező matematikai várakozás konfidencia intervalluma.

    Khi-négyzet eloszlás és Student-féle t-eloszlás.

    Konfidenciaintervallum egy ismeretlen varianciájú, normális eloszlású valószínűségi változó matematikai elvárására.

    A normál eloszlás szórásának konfidencia intervalluma.

Bibliográfia:

    Wentzel, E.S. Valószínűségszámítás [Szöveg] / E.S. Wentzel. – M.: Felsőiskola, 2006. – 575 p.

    Gmurman, V.E. Valószínűségszámítás és matematikai statisztika [Szöveg] / V.E. Gmurman. - M.: Felsőiskola, 2007. - 480 p.

    Kremer, N.Sh. Valószínűségszámítás és matematikai statisztika [Szöveg] / N.Sh. Kremer - M: EGYSÉG, 2002. – 543 p.

P.1. Az értékelés fogalma

Az olyan eloszlások, mint a binomiális, az exponenciális és a normál eloszláscsaládok, amelyek egy vagy több paramétertől függenek. Például egy valószínűségi sűrűségű exponenciális eloszlás egy λ paramétertől, egy normális eloszlástól függ
- két paraméterből més σ. A vizsgált probléma körülményeiből általában jól látható, hogy melyik eloszláscsaládról beszélünk. Ennek az eloszlásnak a paramétereinek konkrét értékei azonban, amelyek a számunkra érdekes eloszlási jellemzők kifejezéseiben szerepelnek, ismeretlenek maradnak. Ezért legalább ezeknek a mennyiségeknek a hozzávetőleges értékét tudni kell.

Határozzuk meg az általános sokaság eloszlási törvényét az eloszlásában szereplő paraméterek értékéig
, amelyek egy része ismert lehet. A matematikai statisztika egyik feladata az ismeretlen paraméterek becslése a megfigyelések mintájából
az általános lakosságból. Az ismeretlen paraméterek becslése egy függvény összeállításából áll
véletlenszerű mintából úgy, hogy ennek a függvénynek az értéke megközelítőleg egyenlő a becsült ismeretlen paraméterrel θ . Funkció hívott statisztika paraméter θ .

Statisztikai értékelés(a jövőben egyszerűen értékelés) paraméter θ Az elméleti eloszlást a választási adatoktól függően hozzávetőleges értékének nevezzük.

Fokozat egy valószínűségi változó, mert független valószínűségi változók függvénye
; Ha másik mintát készít, akkor a függvény általában más értéket vesz fel.

Kétféle becslés létezik: pont és intervallum.

Folt egy számmal meghatározott pontszámnak nevezzük. Kis számú megfigyelés esetén ezek a becslések durva hibákhoz vezethetnek. Ezek elkerülésére intervallumbecsléseket használnak.

Intervallum egy becslés, amelyet két szám határoz meg - annak az intervallumnak a végei, amelyben a becsült érték adott valószínűséggel található θ .

2. o. Statisztikai becslések tulajdonságai

Méret
hívott értékelési pontosság. A kevesebb
, minél jobb, annál pontosabban kerül meghatározásra az ismeretlen paraméter.

Bármely paraméter értékelése számos feltételhez kötött, amelyeket teljesítenie kell, hogy „közel” legyen a paraméter valódi értékéhez, pl. bizonyos értelemben „jóindulatú” értékelés. A becslés minőségét annak ellenőrzése határozza meg, hogy rendelkezik-e az elfogulatlanság, a hatékonyság és a konzisztencia tulajdonságaival.

Fokozat paraméter θ hívott kitelepítetlen(szisztematikus hibák nélkül), ha a becslés matematikai elvárása egybeesik a valódi értékkel θ :

. (1)

Ha az (1) egyenlőség nem teljesül, akkor a becslés hívott kiszorított(szisztematikus hibákkal). Ezt a torzítást mérési hibák, számlálási hibák vagy a minta nem véletlenszerű jellege okozhatja. A szisztematikus hibák túl- vagy alulbecsléshez vezetnek.

A matematikai statisztika egyes problémáinál több elfogulatlan becslés is létezhet. Általában azt részesítik előnyben, amelyik a legkisebb szórással (szórással) rendelkezik.

Fokozat hívott hatékony, ha a legkisebb szórással rendelkezik a paraméter összes lehetséges torzítatlan becslése között θ .

Hadd D() a minimális szórás, és
– bármely más elfogulatlan becslés szórása paraméter θ . Ezután a becslés hatékonysága egyenlő

. (2)

Ez egyértelmű
. Minél közelebb
1-re, annál hatékonyabb az értékelés . Ha
nál nél
, akkor a becslést nevezzük aszimptotikusan hatékony.

Megjegyzés: Ha a pontszám elfogult, akkor szórásának kicsinysége nem jelzi hibájának kicsinységét. Például a paraméter becsléseként θ valami szám , nulla szórással is becslést kapunk. Ebben az esetben azonban a hiba (hiba)
olyan nagy lehet, amennyit csak akar.

Fokozat hívott gazdag, ha növekvő mintaszámmal (
) a becslés valószínűségében a paraméter pontos értékéhez konvergál θ , azaz ha valakinek

. (3)

Az értékelés érvényessége paraméter θ azt jelenti, hogy a növekedéssel n mintanagyság az értékelés minősége fejlődik.

Tétel 1. A minta átlaga a matematikai elvárás torzítatlan és következetes becslése.

Tétel 2. A korrigált minta szórása a variancia torzítatlan és következetes becslése.

Tétel 3. Egy minta empirikus eloszlásfüggvénye egy valószínűségi változó eloszlásfüggvényének torzítatlan és konzisztens becslése.

Legyen szükséges egy általános populáció mennyiségi jellemzőjének vizsgálata. Tételezzük fel, hogy elméleti megfontolások alapján meg tudtuk állapítani, hogy pontosan milyen eloszlása ​​van a tulajdonságnak. A probléma az ezt az eloszlást meghatározó paraméterek becslésével vetődik fel. Például, ha előre tudjuk, hogy a vizsgált jellemző egy normális törvény szerint oszlik el az általános sokaságban, akkor meg kell becsülni a matematikai elvárást és a szórást, mivel ez a két paraméter teljesen meghatározza a normális eloszlást. Ha okkal feltételezhető, hogy egy jellemző Poisson-eloszlású, akkor meg kell becsülni azt a paramétert, amely alapján ez az eloszlás meghatározásra kerül. Általában csak a megfigyelésekből nyert mintaadatok állnak rendelkezésre: , , ... , . A becsült paraméter ezeken az adatokon keresztül fejeződik ki. Ha , , ... független valószínűségi változók értékei , , ... , , akkor azt mondhatjuk, hogy egy elméleti eloszlás ismeretlen paraméterének statisztikai becslése azt jelenti, hogy megtaláljuk a megfigyelt valószínűségi változók függvényét, ami közelítő értéket ad. a becsült paraméter értéke.

Így, statisztikai értékelés Egy elméleti eloszlás ismeretlen paraméterét a megfigyelt valószínűségi változók függvényének nevezzük. Egy ismeretlen populációs paraméter statisztikai becslését egy szám használatával hívjuk meg pont. A következő pontbecsléseket veszik figyelembe: elfogult és elfogulatlan, hatékony és következetes.

Ahhoz, hogy a statisztikai becslések jó közelítést adhassanak a becsült paraméterekről, bizonyos követelményeknek meg kell felelniük. Jelezzük ezeket a követelményeket. Legyen az elméleti eloszlás egy ismeretlen paraméterének statisztikai becslése. Tegyük fel, hogy egy térfogatmintából becslést találtunk. Ismételjük meg a kísérletet, azaz kivonunk egy másik, azonos méretű mintát az általános sokaságukból, és annak adatait felhasználva becslést, stb. Egyéb. Így a becslés egy valószínűségi változónak, a , , ... számok pedig lehetséges értékeinek tekinthetők.

Ha a becslés közelítő értéket ad többlettel, akkor a mintaadatokból talált szám ( ) nagyobb lesz, mint a valódi érték. Következésképpen a valószínűségi változó matematikai elvárása (átlagértéke) nagyobb lesz, mint , azaz . Ha közelítő értéket ad meg hátránnyal, akkor .

Így egy olyan statisztikai becslés használata, amelynek matematikai elvárása nem egyenlő a becsült paraméterrel, szisztematikus hibákhoz vezetne. Ezért szükséges megkövetelni, hogy a becslés matematikai elvárása egyenlő legyen a becsült paraméterrel. A követelménynek való megfelelés kiküszöböli a szisztematikus hibákat.

Elfogulatlan statisztikai becslésnek nevezzük, amelynek matematikai elvárása megegyezik a becsült paraméterrel, azaz.

Kitelepített statisztikai becslésnek nevezzük, amelynek matematikai elvárása nem egyenlő a becsült paraméterrel.

Tévedés azonban azt feltételezni, hogy a torzítatlan becslés mindig jó közelítést ad a becsült paraméterhez. Valójában a lehetséges értékek széles körben szóródhatnak az átlagértékük körül, vagyis az érték szórása jelentős lehet. Ebben az esetben például egy minta adataiból talált becslés nagyon távolinak bizonyulhat annak átlagértékétől, tehát magától a becsült paramétertől. Ha hozzávetőleges értéknek vennénk, nagy hibát követnénk el. Ha megköveteli, hogy egy mennyiség szórása kicsi legyen, akkor a nagy hiba lehetősége kiküszöbölhető. Ezért a statisztikai értékelésre hatékonysági követelmények vonatkoznak.

Hatékony egy statisztikai becslés, amely (adott mintaméret esetén) a lehető legkisebb szórással rendelkezik. Ha nagy mintákat veszünk figyelembe, statisztikai becslésekre van szükség ahhoz, hogy konzisztensek legyenek.

Gazdag statisztikai becslésnek nevezzük, amely valószínűség szerint a becsült paraméterhez hajlik. Például, ha egy torzítatlan becslés szórása nullára hajlik, akkor egy ilyen becslés konzisztensnek bizonyul.

Vizsgáljuk meg azt a kérdést, hogy mely mintajellemzők becsülik legjobban az általános átlagot és a variancia torzítatlansága, hatékonysága és konzisztenciája szempontjából.

Vizsgáljunk meg egy diszkrét általános sokaságot egy mennyiségi jellemző tekintetében. Általános Középfokú az általános sokaság jellemző értékeinek számtani átlagának nevezzük. Képletekkel, ill , ahol a térfogat általános sokaságának jellemző értékei, a megfelelő frekvenciák és .

Vegyünk egy térfogatmintát jellemző értékekkel az általános sokaságból egy mennyiségi jellemző független megfigyelésének eredményeként . Mintaátlag minta sokaságának számtani átlagának nevezzük. Képletekkel, ill , ahol a jellemző értékei a térfogat minta sokaságában vannak, a megfelelő gyakoriságok és .

Ha az általános átlag ismeretlen, és mintaadatok felhasználásával kell megbecsülni, akkor a mintaátlagot, amely egy elfogulatlan és konzisztens becslés, az általános átlag becslésének tekintjük. Ebből következik, hogy ha ugyanabból az általános sokaságból több kellően nagy méretű mintából találunk mintaátlagokat, akkor ezek megközelítőleg egyenlőek lesznek egymással. Ez az ingatlan a minta átlagának stabilitása.

Figyeljük meg, hogy ha két sokaság szórása megegyezik, akkor a mintaátlagok közelsége az általános átlagokhoz nem függ a mintanagyság és az általános sokaság méretének arányától. Ez a minta méretétől függ: minél nagyobb a minta mérete, annál kevésbé tér el a minta átlaga az általános átlagtól.

A populáció mennyiségi jellemzője értékeinek átlagos értéke körüli szórásának jellemzésére egy összefoglaló jellemzőt vezetünk be - az általános diszperziót. Általános variancia A sokaság jellemzői értékeinek átlagértékétől való négyzetes eltérésének számtani átlaga, amelyet a képletekkel számítanak ki: , vagy .

Egy minta mennyiségi jellemzőjének megfigyelt értékeinek átlagos értéke körüli szórásának jellemzésére egy összefoglaló jellemzőt vezetünk be - a minta variancia. Minta szórása egy jellemző megfigyelt értékeinek átlagértékétől való eltérésének négyzetes számtani átlaga, amelyet a következő képletekkel számítanak ki: , vagy .

A diszperzión kívül az általános (minta) populáció egy jellemzője értékeinek átlagos értéke körüli szórásának jellemzésére egy összefoglaló jellemzőt használnak - a szórást. Általános szórás az általános variancia négyzetgyökének nevezzük: . Minta szórása a minta variancia négyzetgyökének nevezzük:

Vegyünk egy térfogatmintát az általános sokaságból egy kvantitatív jellemző független megfigyelésének eredményeként. A mintaadatok alapján meg kell becsülni az ismeretlen általános varianciát. Ha a minta szórását az általános variancia becsléseként vesszük, akkor ez a becslés szisztematikus hibákhoz vezet, ami az általános variancia alulbecsült értékét adja. Ez azzal magyarázható, hogy a minta varianciája torzított becslés; más szóval, a minta variancia matematikai elvárása nem egyenlő a becsült általános variancia, hanem egyenlő .

Könnyen korrigálható a minta szórása úgy, hogy annak várható értéke egyenlő legyen a sokaságvarianciával. Ehhez elég egy törttel szorozni. Ennek eredményeként megkapjuk a korrigált szórást, amelyet általában jelölnek. A korrigált variancia a populáció variancia elfogulatlan becslése lesz: .

2. Intervallumbecslések.

A paraméterbecslés statisztikai elmélete a pontbecslés mellett az intervallumbecslés kérdéseivel is foglalkozik. Az intervallumbecslés problémája a következőképpen fogalmazható meg: mintaadatok alapján konstruáljunk meg egy numerikus semlegest, amelyhez képest előre kiválasztott valószínűséggel azt mondhatjuk, hogy a becsült paraméter ezen az intervallumon belül helyezkedik el. Az intervallumbecslés különösen kis számú megfigyelés esetén szükséges, amikor a pontbecslés nagyrészt véletlenszerű, és ezért nem túl megbízható.

Megbízhatósági intervallum egy paraméterre egy olyan intervallumot hívunk meg, amelyhez viszonyítva előre kiválasztott egységhez közeli valószínűséggel kijelenthetjük, hogy a paraméter ismeretlen értékét tartalmazza, pl. . Minél kisebb a kiválasztott valószínűség szám, annál pontosabb az ismeretlen paraméter becslése. És fordítva, ha ez a szám nagy, akkor ennek az intervallumnak a felhasználásával végzett becslésnek kevés haszna van a gyakorlatban. Mivel a konfidenciaintervallum végei a minta elemeitől függenek, a és értékei mintánként változhatnak. A valószínűséget általában megbízhatósági valószínűségnek (megbízhatóságnak) nevezik. Jellemzően a becslés megbízhatósága előre meg van adva, és értékként egy közeli számot veszünk. A megbízhatósági valószínűség megválasztása nem matematikai probléma, hanem a konkrét megoldandó probléma határozza meg. A leggyakrabban beállított megbízhatóság egyenlő ; ; .

Adjunk meg levezetés nélkül egy megbízhatósági intervallumot az általános átlaghoz a szórás ismert értékéhez, feltéve, hogy a valószínűségi változó (mennyiségi jellemző) normális eloszlású:

ahol egy előre meghatározott szám közeli egyhez, és a függvényértékek a 2. függelékben vannak megadva.

Ennek az összefüggésnek a jelentése a következő: megbízhatóan kijelenthető, hogy a konfidenciaintervallum ( ) lefedi az ismeretlen paramétert, a becslés pontossága egyenlő. A számot a vagy egyenlőségből határozzuk meg. A táblázat segítségével (2. melléklet) keresse meg azt az argumentumot, amelyre a Laplace-függvény értéke felel meg, egyenlő -val.

1. példa. A valószínűségi változó normális eloszlású, ismert szórással. Keressen konfidenciaintervallumokat az ismeretlen általános átlag becsléséhez a mintaátlagok alapján, ha adott a minta mérete és a becslés megbízhatósága.

Megoldás. Találjuk meg. A kapcsolatból azt kapjuk. A táblázat segítségével (2. melléklet) azt találjuk, hogy . Nézzük meg a becslés pontosságát . A konfidencia intervallumok a következők lesznek: . Például ha , akkor a konfidenciaintervallumnak a következő konfidenciahatárai vannak: ; . Így az ismeretlen paraméter értékei, összhangban a mintaadatokkal, kielégítik az egyenlőtlenséget .

Egy ismeretlen szórásértékű jellemző normál eloszlásának általános átlagának konfidencia intervallumát a kifejezés adja meg. .

Ebből következik, hogy megbízhatóan kijelenthető, hogy a konfidenciaintervallum lefedi az ismeretlen paramétert.

Vannak kész táblázatok (4. sz. melléklet), amelyek segítségével a megadottak ismeretében meg lehet találni a valószínűséget, és fordítva, a megadottak ismeretében.

2. példa. A populáció mennyiségi jellemzői normális eloszlásúak. A térfogatminta alapján megtaláltuk a minta átlagát és a korrigált szórást. Becsülj meg egy ismeretlen általános átlagot megbízhatósági intervallum segítségével.

Megoldás. Találjuk meg. A táblázat segítségével (4. melléklet) azt találjuk, hogy: . Keressük a bizalom határait:

Tehát a megbízhatóság mellett az ismeretlen paramétert a konfidencia intervallum tartalmazza.

3. A statisztikai hipotézis fogalma. A hipotézisvizsgálati probléma általános megfogalmazása.

A statisztikai hipotézisek tesztelése szorosan összefügg a paraméterbecslés elméletével. A természettudományban, a technológiában és a közgazdaságtanban egy-egy véletlenszerű tény tisztázása érdekében gyakran folyamodnak olyan hipotézisek megfogalmazásához, amelyek statisztikailag ellenőrizhetőek, vagyis véletlenszerű mintában végzett megfigyelések eredményei alapján. Alatt statisztikai hipotézisek olyan hipotéziseket értünk, amelyek egy valószínűségi változó eloszlásának típusára vagy egyedi paramétereire vonatkoznak. Így például a statisztikai hipotézis az, hogy az azonos munkát azonos feltételek mellett végző dolgozók munkatermelékenységének megoszlása ​​normális eloszlási törvényt tartalmaz. Statisztikus lesz az a hipotézis is, hogy a hasonló párhuzamos üzemű gépeken gyártott alkatrészek átlagos méretei nem térnek el egymástól.

A statisztikai hipotézist ún egyszerű, ha egyértelműen meghatározza a valószínűségi változó eloszlását, ellenkező esetben a hipotézis ún összetett. Például egy egyszerű hipotézis az a feltételezés, hogy egy valószínűségi változó normális eloszlású nullával egyenlő matematikai elvárással és eggyel egyenlő varianciával. Ha feltételezzük, hogy egy valószínűségi változó normális eloszlású, szórása eggyel egyenlő, és a matematikai elvárás egy szám az intervallumból, akkor ez egy összetett hipotézis. Egy másik példa egy összetett hipotézisre az a feltételezés, hogy egy folytonos valószínűségi változó valószínűleg értéket vesz fel az intervallumból, amely esetben a valószínűségi változó eloszlása ​​a folytonos eloszlások osztályának bármelyike ​​lehet.

Gyakran egy mennyiség eloszlása ​​ismert, és ennek az eloszlásnak a paramétereinek értékére vonatkozó feltevések tesztelése egy megfigyelési minta segítségével. Az ilyen hipotéziseket ún parametrikus.

A tesztelt hipotézist ún null hipotézistés ki van jelölve. A hipotézissel együtt az egyik alternatív (versenyző) hipotézist is figyelembe veszik. Például, ha azt a hipotézist teszteljük, hogy egy paraméter megegyezik egy adott értékkel, azaz: , akkor a következő hipotézisek egyike tekinthető alternatív hipotézisnek: : ; : ; : ; : , ahol a megadott érték, . Az alternatív hipotézis kiválasztását a probléma konkrét megfogalmazása határozza meg.

Azt a szabályt, amely alapján döntés születik egy hipotézis elfogadásáról vagy elutasításáról, ún kritérium. Mivel a döntés egy valószínűségi változó megfigyeléseiből vett minta alapján történik, megfelelő statisztikát kell kiválasztani, ebben az esetben tesztstatisztikának nevezzük. Egyszerű parametrikus hipotézis tesztelésekor: ugyanazt a statisztikát választjuk kritérium-statisztikaként, mint a paraméter becslésénél.

A statisztikai hipotézisvizsgálat azon az elven alapul, hogy az alacsony valószínűségű eseményeket lehetetlennek, a nagy valószínűségű eseményeket pedig megbízhatónak tekintik. Ez az elv a következőképpen valósítható meg. A minta elemzése előtt rögzítünk egy bizonyos kis valószínűséget, ún jelentőség szintje. Legyen statisztikaértékek halmaza, és olyan részhalmaz, amelyre, ha a hipotézis igaz, a kritérium statisztika beesésének valószínűsége egyenlő, azaz. .

Jelöljük a megfigyelések mintájából számított statisztika mintaértékével. A kritérium a következőképpen fogalmazódik meg: utasítsuk el a hipotézist, ha ; fogadja el a hipotézist, ha . Egy előre meghatározott szignifikanciaszint használatán alapuló kritériumot nevezünk szignifikancia kritérium. A kritériumstatisztika összes értékének halmazát, amelynél a hipotézis elutasításáról döntenek, az ún. kritikus terület; a területet hívják örökbefogadási terület hipotéziseket.

A szignifikancia szint határozza meg a kritikus régió méretét. A kritikus tartomány helyzete a statisztikai értékek halmazán az alternatív hipotézis megfogalmazásától függ. Például, ha a hipotézist teszteljük: , és az alternatív hipotézist a következőképpen fogalmazzuk meg: (), akkor a kritikus régió a statisztikai eloszlás jobb (bal) „farkában” helyezkedik el, azaz egyenlőtlenség alakja van: (), hol és vannak azok a statisztikai értékek, amelyeket ennek megfelelően valószínűségekkel fogadunk el, feltéve, hogy a hipotézis igaz. Ebben az esetben a kritériumot ún egyoldalú, jobbkezes, illetve balkezes. Ha az alternatív hipotézist a következőképpen fogalmazzuk meg: , akkor a kritikus tartomány az eloszlás mindkét „farkán” helyezkedik el, azaz egyenlőtlenségek és egyenlőtlenségek halmaza határozza meg; ebben az esetben a kritérium ún kétirányú.

ábrán. A 30. ábra a kritikus régió helyét mutatja különböző alternatív hipotézisek esetén. Itt van a kritériumstatisztika eloszlási sűrűsége, feltéve, hogy a hipotézis igaz, a hipotézis elfogadásának területe, .

Így a paraméteres statisztikai hipotézis szignifikancia-teszttel történő tesztelése a következő szakaszokra osztható:

1) tesztelhető () és alternatív () hipotéziseket fogalmaz meg;

2) rendeljen hozzá egy szignifikancia szintet; mivel nem egyeztethető össze a megfigyelések eredményeivel; ha , akkor fogadjuk el a hipotézist, azaz tételezzük fel, hogy a hipotézis nem mond ellent a megfigyelési eredményeknek.

A 4–7. lépések végrehajtásakor általában olyan statisztikákat használnak, amelyek kvantilisei táblázatban vannak: normál eloszlású statisztikák, Student statisztikák, Fisher statisztikák.

3. példa. Az autómotor útlevéladatai szerint az üzemanyag-fogyasztás per 100 km futásteljesítmény az 10 l. A motor kialakításának változása következtében az üzemanyag-fogyasztás várhatóan csökkenni fog. Az ellenőrzés érdekében teszteket végeznek 25 véletlenszerűen kiválasztott autók korszerűsített motorral, minta átlagfogyasztással per 100 km futásteljesítmény a teszteredmények szerint volt 9,3 l. Tételezzük fel, hogy a tüzelőanyag-fogyasztási mintát egy normális eloszlású sokaságból vettük átlaggal és szórással. Feltéve, hogy a kezdeti statisztika kritikus régió hipotézise igaz, azaz egyenlő a szignifikancia szinttel. Határozza meg az első és a második típusú hiba valószínűségét egy ilyen kritikus tartományú kritériumhoz! normális eloszlású, matematikai elvárása egyenlő és szórása egyenlő. Meghatározzuk egy második típusú hiba valószínűségét a (11.2) képlet segítségével:

Ezért az elfogadott kritériumnak megfelelően az autók 13,6%-a üzemanyag-fogyasztással 9 l tovább 100 km a futásteljesítményt az üzemanyag-fogyasztású járművek közé sorolják 10 l.

4. Elméleti és empirikus frekvenciák. Hozzájárulási feltételek.

Empirikus frekvenciák- a tapasztalat (megfigyelés) eredményeként kapott frekvenciák. Elméleti frekvenciák képletekkel számítják ki. A normál eloszlási törvényhez ezek a következők:

, (11.3)

egy elmozdult O. s. diszperzióra, hiszen ; mint elfogulatlan O. s. s 2 esetén általában a függvényt veszik fel


Lásd még Elfogulatlan becslés.

Az elfogulatlan O. s pontosságának mérésére. és a paraméternek leggyakrabban Da diszperziót vesszük.

O. s. a legkisebb szórással ún. a legjobb. A megadott példában a számtani átlag (1) a legjobb O.S. Ha azonban a valószínűségi változók X i eltér a normáltól, akkor O. s. (1) lehet, hogy nem a legjobb. Például ha a megfigyelések eredményei Xi egyenletesen elosztva az intervallumban ( időszámításunk előtt), akkor a legjobb O.s. matematikához. elvárások a=(b+c)/2 lesz a szélsőértékek fele összege

(3)

Jellemzőként a különböző O. pontosságának összehasonlítására. alkalmazza a legjobb becslés és az adott torzítatlan becslés hatékonyságát - szórását. Például ha a megfigyelések eredményei Xi egyenletes eloszlásúak, akkor az (1) és (3) becslések szórását a képletekkel fejezzük ki

És (4)

Mivel a (3) becslés a legjobb, az (1) becslés hatékonysága ebben az esetben az

A nagyszámú megfigyelésnél általában megkívánják, hogy a kiválasztott O. s. valószínûséggel a paraméter valódi értékéhez igazítva A, azaz úgy, hogy minden e > 0

ilyen O. s. hívott konzisztens (példa egy konzisztens O.-ra, - tetszőleges, melynek varianciája nullára hajlik; lásd még Következetes értékelés). Mivel ebben az esetben fontos szerepe van a határra való törekvésnek, az aszimptotikusan legjobbak az aszimptotikusan hatékony operációs rendszerek, vagyis azok az operációs rendszerek, amelyekre

Például, ha egyenlően oszlanak el normálisan, akkor az O. s. (2) egy aszimptotikusan hatékony becslés az ismeretlen paraméterre, mivel a becslés varianciája és a legjobb becslés szórása aszimptotikusan egyenértékű:

és emellett,

Alapvető jelentősége az O. s. elmélete szempontjából. és alkalmazásai az a tény, hogy az O. s. az a paramétert alulról egy bizonyos érték korlátozza (ezt az értéket R. Fischer javasolta a megfigyelések eredményeiben található ismeretlen a paraméterre vonatkozó információ mennyiségének jellemzésére). Például, ha függetlenek és azonos eloszlásúak p(x; A).és ha - O. s. egy bizonyos g(a) függvényre az a paraméteren, akkor az esetek széles osztályában

A b(a) függvényt meghívjuk eltolás, és az (5) egyenlőtlenség jobb oldalára fordított értéket nevezzük. információ mennyisége (Fisher szerint) a g(a) függvényre vonatkozóan , megfigyelések eredményeként tartalmazzák. Különösen, ha a egy elfogulatlan O. s. paraméter A, Hogy,

és az információ mennyiségét nIa ebben az esetben a megfigyelések számával arányosan (I(a) függvény. Az egy megfigyelésben foglalt információ mennyiségének nevezzük).

A fő feltételek, amelyek mellett az (5) és (6) egyenlőtlenségek érvényesek, az a becslés simasága a Xi, valamint azon pontok aset paraméterén is X, ahol p( x, a)=0. Az utolsó feltétel nem teljesül például egyenletes eloszlás esetén, tehát az O. s diszperziója. (3) nem elégíti ki a (6) egyenlőtlenséget [a (4) szerint ez a diszperzió n -2 nagyságrendű, míg a (6) egyenlőtlenség szerint nem lehet valamivel nagyobb, mint n -1].

Az (5) és (6) egyenlőtlenségek diszkrét eloszlású valószínűségi változókra is érvényesek X i csak az I(a) információt kell meghatározni. p(x; A).cserélje ki az esemény valószínűségével (X=x).

Ha az elfogulatlan O. s varianciája. a* az а paraméternél egybeesik a (6) egyenlőtlenség jobb oldalával, akkor ez a legjobb becslés. A fordított állítás általában véve hamis: a legjobb O. sz. varianciája. meghaladhatja. Ha azonban , akkor a legjobb becslés szórása aszimptotikusan ekvivalens (6) jobb oldalával, azaz. Így az információmennyiség felhasználásával (Fisher szerint) meg lehet határozni az aszimptotikumot. az elfogulatlan O. s. hatékonysága. és feltételezve

Az O. elméletének információs megközelítése különösen gyümölcsöző. befolyásolja, hogy a valószínűségi változók együttes eloszlásának sűrűsége (diszkrét esetben - ) mikor ábrázolható két h() függvény szorzataként x 1, x 2,..., x n).[y( x 1, x 2,..., x n);A] , amelyek közül az első nem függ attól A, a második pedig egy bizonyos valószínűségi változó eloszlási sűrűségét reprezentálja Z=y(X 1, X 2,....,X o), hívott elegendő statisztika vagy átfogó statisztikák.

Az egyik leggyakoribb módszer az O. s. pont megtalálására - pillanatok módszere. E módszer szerint az elméleti eloszlást, az ismeretlen paraméterektől függően, egy diszkrét mintába helyezzük, amelyet a megfigyelések eredményei határoznak meg X iés egy képzeletbeli valószínűségi változó valószínűségi eloszlását reprezentálja, amely egyenlő valószínűséggel egyenlő 1/n-nel (a mintavételi eloszlás az elméleti eloszlás O pontrendszerének tekinthető). Ahogy O. s. pillanatokig elméleti. az eloszlások a mintavételezési eloszlás megfelelő momentumait veszik fel; például a matematikához elvárások és variancia s 2 momentummódszer a következő OS-t adja: (1) és minta variancia (2). Az ismeretlen paramétereket általában több elméleti momentum függvényében fejezzük ki (pontosan vagy megközelítőleg). disztribúciók. Az elméletiek felváltása ezekben a függvényekben. a pillanatok szelektívek, a szükséges O.s.-t megkapjuk. Ez a gyakorlatban gyakran viszonylag egyszerű számításokhoz vezető módszer általában O.-t ad. alacsony aszimptotikus hatékonyság (lásd fent az egyenletes eloszlás matematikai elvárásának becslésére vonatkozó példát).

Egy másik módszer az O. s. megtalálására, elméletileg fejlettebb. nézőpontok,- a maximális valószínűség módszere, vagy maximum likelihood módszerrel. E módszer szerint az L(a) valószínűségi függvényt vesszük figyelembe, amely az ismeretlen a paraméter függvénye, és az argumentumok együttes eloszlásának sűrűségének cseréje eredményeként kapjuk meg. x i maguk a valószínűségi változók X i; Ha X i - független és azonos eloszlású p(x) valószínűségi sűrűséggel; A), Ez

(Ha X i diszkréten oszlanak el, akkor az L likelihood-függvény definíciójában a sűrűséget az események valószínűségeivel kell helyettesíteni. Ahogy O. s. egy ismeretlen paraméter maximális valószínűsége, egy olyan a értéket veszünk fel, amelynél L(a) éri el a legnagyobb értéket (ebben az esetben L helyett gyakran az ún. log-likelihood függvényt veszik figyelembe ; a logaritmus monotonitása miatt az L(a) és l(a) függvények maximális pontjai egybeesnek). Példák az O. s. a maximális valószínűségi becslések legkisebb négyzetek módszere.

Az O. s. fő előnye. A legnagyobb valószínűsége annak, hogy bizonyos általános feltételek mellett ezek a becslések konzisztensek, aszimptotikusan hatékonyak és megközelítőleg normális eloszlásúak.

A felsorolt ​​tulajdonságok azt jelentik, hogy ha a egy O.s. akkor a legnagyobb valószínűséggel

(ha X független, akkor ). Így a normalizált O. s eloszlásfüggvényére. korlátozó összefüggés van

Az O. s. előnyei. a maximális valószínűség indokolja az L (vagy l) függvény maximumának megtalálására irányuló számítási munkát . Egyes esetekben a számítási munka jelentősen csökken a következő tulajdonságok miatt: először is, ha a* olyan operációs rendszer, amelyre a (6) egyenlőséggé válik, akkor az operációs rendszer. a maximális valószínűség egyedi és egybeesik a*-val, másodszor, ha létezik Z, akkor O. s. a maximum likelihood függvény az Z.

Legyen például független és egyenlő normális eloszlású, így

Ezért

Koordináták a = a 0és s= s 0 az I( függvény A, s).elégítik az egyenletrendszert


Így, és ezért jelen esetben O. s. (1) és (2) a maximális valószínűség becslései, és a legjobb O.s. paraméter A, normál eloszlású (, ), és aszimptotikusan hatékony O.S. s paraméter 2 , megközelítőleg normálisan eloszlik nagy értékek esetén (). Mindkét becslés független, elégséges statisztika.

Egy másik példa, amelyben

Ez a sűrűség kielégítően írja le azoknak a részecskéknek az egyik koordinátájának eloszlását, amelyek elértek egy lapos képernyőt és kirepültek a képernyőn kívüli pontból (a - a forrás vetületének a képernyőre való vetületének koordinátáját - feltételezzük, hogy ismeretlen). A megadott eloszláshoz matek. az elvárás nem létezik, mert a megfelelő eltér. Ezért az O. s. A pillanatok módszerével ez lehetetlen. Formai használat, mint O. s. az (1) számtani átlag értelmetlen, mivel ebben az esetben ugyanolyan p(x; a) sűrűséggel oszlik el, mint minden egyes megfigyelési eredmény. A becsléshez kihasználhatja azt a tényt, hogy a kérdéses eloszlás szimmetrikus a pontra x=aés ezért, A - medián elméleti disztribúciók. Kissé módosítva a pillanatok módszerét, ahogy O. s. egy fogadja el az ún. minta medián m, él at torzítatlan O. s. a esetén, és ha nagy, akkor m megközelítőleg normális eloszlású a diszperzióval


Eközben

ezért és ezért a (7) szerint aszimptotikus. hatékonysága egyenlő . Így ahhoz, hogy m egyformán pontos legyen O. s. a esetében, valamint a maximális valószínűségi becslésnél a megfigyelések számát 25%-kal kell növelni. Ha a kísérlet költségei magasak, akkor az O.s.-t kell használni a meghatározásához. és ebben az esetben az egyenletként van meghatározva

Első közelítésként válasszunk egy 0 =u értéket, majd ezt a képlet segítségével egymás utáni közelítésekkel oldjuk meg

Lásd még Pontbecslés.

Intervallumbecslések. Az intervallumbecslést nevezzük. Egy ilyen operációs rendszer geometriailag a paramétertérhez tartozó pontok halmazaként ábrázolható. intervallum O. s. pontnak tekinthető O. s. Ez a halmaz a megfigyelések eredményeitől függ, ezért véletlenszerű; ezért minden intervallum O. s. a valószínűséget megfeleltetésbe helyezzük, amelyben ez a becslés „lefedi” az ismeretlen paramétert. pont. Ez a valószínűség általában véve ismeretlen paraméterektől függ; ezért az O. s intervallum megbízhatóságának jellemzőjeként. vegye bizalom – a megadott valószínűség legkisebb lehetséges értéke. Tartalmas statisztika. következtetések csak azon O. intervallumú oldalak megszerzését teszik lehetővé, amelyeknek a konfidencia együtthatója megközelíti az egységet.

Ha egy a paramétert becsülünk, akkor az O. s intervallumot. általában van egy bizonyos (b, g).(ún.), amelynek végpontjai (b és g a megfigyelési eredmények függvényei; a konfidencia együttható együttható ebben az esetben a definíció szerint a valószínűség egyidejű előfordulásának valószínűsége). két esemény (b< a} и (g >a) az a paraméter összes lehetséges értékére számítva:


Ha egy ilyen intervallum közepét O pontnak vesszük. s. az a paraméterre, akkor 0-nál nem kisebb valószínűséggel kijelenthető, hogy ez az O. s. nem haladja meg az intervallum hosszának felét. Más szóval, ha az abszolút hiba becslésének meghatározott szabálya vezérel bennünket, akkor átlagosan kevesebb téves következtetést vonunk le, mint esetek. Rögzített c konfidencia együttható mellett a legrövidebb konfidencia intervallumok a legelőnyösebbek, amelyekre matematikai a hossz elvárás eléri a legkisebb értékét.

Ha a valószínűségi változók eloszlása X i csak egy ismeretlen paramétertől függ A, akkor a konfidenciaintervallum felépítését általában valamilyen O. pont felhasználásával végezzük. A. A legtöbb gyakorlati szempontból érdekes esetre egy ésszerűen választott O.s eloszlásfüggvénye. és monoton függ a paramétertől A. Ilyen körülmények között az O. s intervallum meghatározásához. következik F(x; A)helyettes x= a . és meghatározzuk a gyökereket a 1 = a 1(a, w) és a 2 =a 2 (a, w) egyenletek

(9) hol

[folyamatos eloszlásokhoz]. Pontok koordinátákkal és korlátozzák a konfidencia intervallumot a w konfidencia együtthatóval. Természetesen egy ilyen egyszerű módon megszerkesztett intervallum sok esetben eltérhet az optimálistól (legrövidebb). Ha azonban a egy aszimptotikusan hatékony O.S. a-ra, akkor kellően nagy számú megfigyeléssel olyan intervallumot O. s. gyakorlatilag jelentéktelen mértékben eltér az optimálistól. Ez különösen igaz az O. s. legnagyobb valószínűséggel, mivel aszimptotikusan oszlik el normálisan (lásd (8)). Azokban az esetekben, amikor a (9) egyenlet nehéz, az O. s intervallumot. közelítőleg az O pont felhasználásával számolva. s. maximális valószínűség és arány (8):

Ahol X - az egyenlet gyöke

Ha , akkor az intervallumbecslés valódi konfidencia együtthatója w-ra hajlik. Általánosabban a megfigyelési eredmények eloszlása X i- több paramétertől függ a, b,.... Ilyen körülmények között a fenti konfidenciaintervallumok szerkesztésére vonatkozó szabályok gyakran alkalmatlannak bizonyulnak, mivel az O. s pont eloszlása. a , általában nem csak a, hanem más paraméterektől is függ. Gyakorlatilag érdekes esetekben azonban O. s. a a megfigyelési eredményekből egy ilyen függvénnyel helyettesíthető X iés ismeretlen paraméter i, az eloszlás nem függ (vagy „majdnem nem függ”) minden ismeretlen paramétertől. Ilyen függvény például a normalizált O. s. a legnagyobb valószínűség ; ha a nevező argumentumokat tartalmaz a, b,... cserélje ki őket a, b, maximális valószínűségi becslésekre. . . , akkor a határeloszlás ugyanaz marad, mint a (8) képletben. Ezért az egyes paraméterekhez külön-külön hozzávetőleges konfidenciaintervallumokat lehet létrehozni a következőképpen: azonos, mint egy paraméter esetében.

Ahogy fentebb megjegyeztük, ha ,... független és azonos normális eloszlású valószínűségi változók, akkor s 2 a legjobb valószínűségi változók. az a és s 2 paraméterekre. Eloszlási függvény O. s. képlettel fejezzük ki


és ezért nemcsak a-tól, hanem s-től is függ. Ugyanakkor az ún Diák t-aránya


nem függ sem a-tól, sem s-től, és

ahol az állandót úgy választjuk meg, hogy az egyenlőség teljesüljön . Így a konfidencia intervallum

megbízhatósági együtthatónak felel meg

Az s 2 becslés eloszlása ​​csak s 2-től és az O. s eloszlásfüggvényétől függ. s 2-t a képlet adja meg

ahol a D n-1 állandót a feltétel határozza meg (az ún. -eloszlás n-1 szabadságfokkal).

Mivel a valószínűség monoton növekszik s növekedésével, akkor O. intervallum felépítéséhez. (9) szabály érvényes. Így ha x 1és x 2 az egyenletek és = gyöke, majd a konfidencia intervallum

megfelel a w konfidencia együtthatónak. Ebből különösen az következik, hogy a relatív hiba konfidenciaintervallumát az egyenlőtlenségek adják meg

A tanulói és -eloszlási függvények részletes táblázatai a legtöbb matematika tankönyvben megtalálhatók. statisztika.

Eddig azt feltételezték, hogy a megfigyelési eredmények eloszlásfüggvénye több paraméter értékéig ismert. Az alkalmazásokban azonban gyakran előfordul, hogy az elosztási függvény ismeretlen. Ebben a helyzetben az úgynevezett paraméterek hasznosak lehetnek a paraméterek becsléséhez. nem paraméteres statisztikai módszerek(azaz olyan módszerek, amelyek nem függnek az eredeti valószínűségi eloszlástól). Tegyük fel például, hogy meg akarjuk becsülni az elméleti mediánt. független valószínűségi változók folyamatos eloszlása X 1, X 2,..., X p(szimmetrikus eloszlások esetén egybeesik a matematikai elvárással, ha természetesen létezik). Legyenek Y 1 ugyanazok az értékek X i hanem növekvő sorrendbe rendezve. Aztán ha k- az egyenlőtlenségeket kielégítő egész szám n/2, Azt

Így - intervallum O. s. járműveknél a megbízhatósági tényező w=w n,k. Ez igaz a valószínűségi változók bármilyen folytonos eloszlására Xi.

Fentebb megjegyeztük, hogy a mintavételezési eloszlás az O. s. az ismeretlen elméleti disztribúciók. Sőt, a mintavételezési eloszlás függvény Fn(x).- elfogulatlan O. s. a függvényelméleti eloszlások F(x) . Ugyanakkor, mint látható A. N. Kolmogorov, statisztikai eloszlás

nem függ az ismeretlen elmélettől eloszlás és a K(y) határeloszlásra hajlik , úgynevezett Kolmogorov-eloszlás. Így ha y - a K(y) = w egyenlet megoldása, akkor w valószínűséggel kijelenthetjük, hogy a függvények elméletiek. az F(y) eloszlást teljesen „lefedi” a függvények grafikonjai közé zárt sáv (az l n statisztika elő- és határeloszlása ​​közötti különbség gyakorlatilag jelentéktelen). Ilyen intervallum O. s. hívott bizalmi zóna. Lásd még Intervallumbecslés.

Statisztikai becslések a hibaelméletben. A hibaelmélet a matematikai statisztika egyik ága, amely az ismeretlen mennyiségek mérési eredményekből történő numerikus meghatározására szolgál. A mérési hibák véletlenszerűsége és talán a vizsgált jelenség véletlenszerűsége miatt nem minden ilyen eredmény egyforma: ismételt mérések esetén egyesek gyakrabban, mások ritkábban fordulnak elő.

A hibák elmélete a matematikán alapul. A vágás szerint a tapasztalatok előtt az összes elképzelhető mérési eredmény összessége egy bizonyos valószínűségi változó értékeinek halmazaként értelmeződik. Ezért az O. s. fontos szerepet játszik. A hibaelmélet következtetései statisztikai jellegűek. . Az ilyen következtetések jelentése és tartalma (mint valójában O.

Feltételezve, hogy az X mérési eredmény egy valószínűségi változó, a mérési hibák három fő típusát különböztetjük meg: szisztematikus, véletlenszerű és durva (az ilyen hibák minőségi leírását a 3. cikk tartalmazza. Hibaelmélet). Ebben az esetben az ismeretlen mennyiség mérésének hibája anaz. X-a, matek. ennek a különbségnek az elvárása E( Ha)=b hívott szisztematikus hiba (ha b = 0, akkor azt mondják, hogy a mérések szisztematikus hibáktól mentesek), és a különbség d = X- a-b hívott véletlenszerű hiba . Így ha az a érték független méréseit adjuk meg, akkor ezek eredményei egyenlőségek formájában írhatók fel

ahol a és b állandók, a d én- Véletlen változók. Általánosabb esetben

ahol b én- független d én nullával egyenlő valószínűségi változók egyhez nagyon közeli valószínűséggel (ezért más érték nem valószínű). Érték b én hívott egy baklövést.

A szisztematikus értékelés (és megszüntetés) feladata a hibák általában túlmutatnak a matematika keretein. statisztika. Kivételt képeznek az ún. a standard módszer, amely szerint b becsléséhez egy ismert a mennyiség mérési sorozatát végezzük (ebben a módszerben b- a becsült érték és a - szisztematikusan ismert. hiba), valamint lehetővé teszi a szisztematikus értékelést. eltérések több méréssorozat között.

A hibaelmélet fő feladata az O.-k megtalálása. ismeretlen a mennyiségre és a mérési pontosság értékelésére. Ha szisztematikus a hiba megszűnt (b=0) és a megfigyelések nem tartalmaznak durva hibákat, akkor a (10) szerint X én=a+d énés ezért ebben az esetben az értékelési feladat bizonyos értelemben az optimális működési rendszer megtalálására redukálódik. matematikához. azonos eloszlású valószínűségi változók elvárásai Xi. Amint az az előző részekből kiderült, az ilyen O. s. (pont vagy intervallum) jelentősen függ a véletlenszerű hibák eloszlási törvényétől. Ha ez a törvény több ismeretlen paraméter pontosságával ismert, akkor például a maximum likelihood módszer használható a becsléshez; ellenkező esetben először a megfigyelések eredményein kell alapulnia Xi keresse meg O.s. ismeretlen véletlen hibaeloszlási függvényhez d én(Egy ilyen függvény „nem paraméteres” O.S. intervallumát fent jeleztük). Gyakorlatban a munkában gyakran megelégszenek két O.-val. és (lásd (1) és (2)). Ha d én egyenlően normálisan oszlanak el, akkor ezek az O. s. a legjobb; más esetekben ezek az értékelések hatástalanok lehetnek.

A durva hibák jelenléte megnehezíti az a paraméter becslésének feladatát. Általában a megfigyelések aránya kicsi, és matematikai. nem nullára vár |b én| jelentősen meghaladja (durva hibák keletkeznek véletlen számítási hibából, mérőeszköz hibás leolvasásából stb.). A durva hibákat tartalmazó mérési eredmények gyakran jól láthatóak, mert nagyban különböznek más mérési eredményektől. Ilyen körülmények között a durva hibák azonosításának (és kiküszöbölésének) legmegfelelőbb módja a mérések közvetlen elemzése, az összes kísérlet körülményeinek változatlanságának gondos ellenőrzése, az eredmények „két kézben” rögzítése stb. Statisztikai. a durva hibák azonosítására szolgáló módszereket csak kétséges esetekben szabad alkalmazni.

Az ilyen módszerek legegyszerűbb példája a statisztikai módszer. azonosítani egy olyan megfigyelést, amely kiemelkedik, ha valamelyik gyanús lehet Y 1 = minX 1, vagy Y p =maxX i(feltételezzük, hogy a (11) egyenlőségben b=0 és az értékek eloszlási törvénye d én híres). Annak megállapítására, hogy egy durva hiba fennállásának feltételezése jogos-e, egy párra Y 1, Y n számítsuk ki az O. s ízületi intervallumot. (bizalom), hisz minden b én egyenlő nullával. Ha ez az O. s. "lefedi" a pontot koordinátákkal ( Y 1, Y n), akkor a durva hiba gyanúját statisztikailag megalapozatlannak kell tekinteni; egyébként a durva hiba jelenlétére vonatkozó hipotézist beigazoltnak kell tekinteni (ebben az esetben az elutasított megfigyelést általában elvetik, mivel statisztikailag lehetetlen egy megfigyelésből megbízhatóan megbecsülni a durva hiba nagyságát).

Egy valószínűségi változó eloszlását (a sokaság megoszlását) általában számos numerikus jellemző jellemzi:

  • normál eloszlás esetén N(a, σ) az a matematikai elvárás és a σ szórás;
  • egyenletes eloszlás esetén R(a,b) annak az intervallumnak a határa, amelyben ennek a valószínűségi változónak az értékeit megfigyeljük.
Az ilyen, általában ismeretlen numerikus jellemzőket nevezzük populációs paraméterek . Paraméterbecslés - a mintából számított megfelelő numerikus jellemző. A populációs paraméterek becslései két osztályba sorolhatók: pontÉs intervallum.

Ha egy pontszámot egyetlen szám határoz meg, akkor azt hívják pontbecslés. A pontbecslés a minta függvényében egy valószínűségi változó, és ismételt kísérletekkel mintánként változik.
A pontbecsléseknek vannak olyan követelményei, amelyeket teljesíteniük kell ahhoz, hogy bármilyen értelemben „jóindulatúak” lehessenek. Ez kitelepítetlen, hatékonyságÉs jólét.

Intervallumbecslések két szám határozza meg - a becsült paramétert lefedő intervallum végei. Ellentétben a pontbecslésekkel, amelyek nem adnak képet arról, hogy a becsült paraméter milyen messze lehet tőlük, az intervallumbecslések lehetővé teszik a becslések pontosságának és megbízhatóságának megállapítását.

A matematikai elvárás, szórás és szórás pontbecsléseként a minta jellemzőit, a minta átlagát, a minta szórását és a minta szórását használjuk.

Az elfogulatlan becslés tulajdonsága.
Az értékelés kívánatos követelménye a szisztematikus hiba hiánya, pl. a θ paraméter becslése helyett többszöri használatakor a közelítési hiba átlagos értéke nulla - ez az elfogulatlan becslés tulajdonsága.

Meghatározás. Egy becslést torzítatlannak nevezünk, ha a matematikai elvárása megegyezik a becsült paraméter valódi értékével:

A minta aritmetikai átlaga a matematikai elvárás és a minta varianciájának torzítatlan becslése - az általános variancia torzított becslése D. Az általános variancia torzítatlan becslése a becslés

Az értékelési konzisztencia tulajdonsága.
A becslés második követelménye - konzisztenciája - azt jelenti, hogy a becslés a minta méretének növekedésével javul.

Meghatározás. Fokozat konzisztensnek nevezzük, ha valószínűségében konvergál a becsült θ paraméterhez n→∞.


A valószínűség konvergenciája azt jelenti, hogy nagy mintaméret esetén kicsi a valószínűsége annak, hogy a becslés nagy mértékben eltér a valódi értéktől.

Hatékony becslési tulajdonság.
A harmadik követelmény lehetővé teszi a legjobb becslés kiválasztását ugyanazon paraméter több becslése közül.

Meghatározás. Egy torzítatlan becslő akkor hatékony, ha a legkisebb szórással rendelkezik az összes torzítatlan becslés között.

Ez azt jelenti, hogy az effektív becslés minimális szórással rendelkezik a paraméter valódi értékéhez képest. Vegyük észre, hogy effektív becslés nem mindig létezik, de két becslés közül általában ki lehet választani a hatékonyabbat, pl. kisebb szórással. Például egy N(a,σ) normál sokaság egy ismeretlen a paraméterére mind a minta aritmetikai átlaga, mind a minta mediánja torzítatlan becslésnek tekinthető. De a minta mediánjának szórása körülbelül 1,6-szor nagyobb, mint a számtani átlag varianciája. Ezért hatékonyabb becslés a minta számtani átlaga.

1. számú példa. Határozzuk meg valamely valószínűségi változó mérési szórásának elfogulatlan becslését egy eszközzel (szisztematikus hibák nélkül), melynek mérési eredménye (mm-ben): 13,15,17.
Megoldás. Táblázat a mutatók kiszámításához.

x|x - x av |(x - x átlag) 2
13 2 4
15 0 0
17 2 4
45 4 8

Egyszerű számtani átlag(a matematikai elvárások elfogulatlan becslése)


Diszperzió- átlagértéke körül jellemzi a szórás mértékét (a szóródás mértéke, azaz az átlagtól való eltérés - torzított becslés).


Elfogulatlan varianciabecslő- konzisztens varianciabecslés (korrigált variancia).

2. példa. Adja meg egy adott valószínűségi változó egy eszközzel történő mérésének matematikai elvárásainak torzítás nélküli becslését (szisztematikus hibák nélkül), amelynek mérési eredménye (mm-ben): 4,5,8,9,11.
Megoldás. m = (4+5+8+9+11)/5 = 7,4

3. példa. Határozza meg a korrigált S2 variancia értéket n=10 mintaméret esetén, ha a minta szórása D = 180.
Megoldás. S 2 = n*D/(n-1) = 10*180/(10-1) = 200

Cikkek a témában