Statistiskais novērtējums un tā īpašības. Punktu tāme un tās īpašības. Izplatības parametru punktveida novērtējums

Izpētījis šo nodaļu, students to darīs zināt, ka izlasi var uzskatīt par vispārējās kopas empīrisku analogu, ka ar izlases datu palīdzību var spriest par vispārējās populācijas īpašībām un novērtēt tās raksturlielumus, statistisko novērtējumu sadalījuma pamatlikumus, būt spējīgam veikt vispārējās populācijas parametru punktu un intervālu novērtējumus pēc momentu un maksimālās iespējamības metodes, pašu iegūto aplēšu precizitātes un ticamības noteikšanas metodes.

Statistisko aplēšu veidi

Par vispārējās populācijas parametriem mēs zinām, ka tie objektīvi eksistē, taču tos nav iespējams noteikt tieši tādēļ, ka kopējā populācija ir vai nu bezgalīga, vai pārmērīgi liela. Tāpēc jautājums var būt tikai par šo īpašību novērtējumu.

Iepriekš tika konstatēts, ka izlasei, kas iegūta no vispārējās populācijas, ievērojot reprezentativitātes nosacījumus, ir iespējams noteikt raksturlielumus, kas ir analogi vispārējās populācijas pazīmēm.

cjp Definīcija 8.1. Paraugā atrastās aptuvenās sadalījuma parametru vērtības sauc par parametru aplēsēm.

Apzīmēsim nejaušā lieluma (vispārējās populācijas) aprēķināto parametru kā 0 un tā novērtējumu, kas iegūts, izmantojot izlasi, kā 0.

Rezultāts 0 ir nejauša vērtība, jo jebkura izlase ir nejauša. Dažādiem paraugiem iegūtie aprēķini atšķirsies. Tāpēc 0 uzskatīsim par funkciju, kas ir atkarīga no izlases: 0 = 0(X c).

SHR Definīcija 8.2. Statistisko novērtējumu sauc turīgs ja tas, iespējams, sliecas uz aprēķināto parametru:

Šī vienlīdzība nozīmē, ka notikums 0=0 kļūst uzticams, neierobežoti palielinot izlases lielumu.

Piemērs ir kāda notikuma relatīvais biežums A, kas ir konsekvents šī notikuma varbūtības novērtējums saskaņā ar Puasona teorēmu (sk. formulas (6.1.) 1. daļu).

Definīcija 8.3. Tiek uzskatīts, ka statistiskais aprēķins ir efektīvs, ja tam ir vismazākā dispersija tiem pašiem izlases lielumiem.

Apsveriet tāmi M x matemātiskās cerības M x nejaušais mainīgais x. Kā šādu aplēsi mēs izvēlamies x. Atradīsim nejauša lieluma matemātisko cerību x.

Vispirms izteiksim svarīgu apgalvojumu: ņemot vērā, ka visi nejaušie mainīgie X, no tās pašas populācijas X, tāpēc tiem ir tāds pats sadalījums kā X, var rakstīt:

Tagad atradīsim M(X collas):


Tādējādi izlases vidējais rādītājs ir nejauša mainīgā lieluma matemātiskās cerības statistisks novērtējums. Šis aprēķins ir konsekvents, jo saskaņā ar Čebiševa teorēmas izrietošo varbūtību tas saplūst ar matemātisko cerību (6.3).

Mēs noskaidrojām, ka aplūkojamajā gadījumā mūsu izvēlētā novērtējuma (gadījuma mainīgā) matemātiskā cerība ir vienāda ar pašu novērtēto parametru. Aprēķini ar šo īpašību matemātiskajā statistikā ieņem īpašu vietu; tos sauc par objektīviem.

Definīcija 8.4. Statistisko novērtējumu © sauc par objektīvu, ja tā matemātiskā prognoze ir vienāda ar aprēķināto parametru

Ja šī prasība nav izpildīta, aprēķinu sauc par neobjektīvu.

Tādējādi izlases vidējais rādītājs ir objektīvs matemātiskās cerības novērtējums.

Analizēsim izlases dispersijas novirzes D, ja tas ir izvēlēts kā vispārējās dispersijas novērtējums D x . Lai to izdarītu, mēs pārbaudām nosacījuma (8.2) iespējamību?) :


Mēs pārveidojam katru no diviem iegūtajiem terminiem:

Šeit mēs esam izmantojuši vienlīdzību M(X.) = M(X 2), derīga tāda paša iemesla dēļ kā (8.1.).

Apskatīsim otro termiņu. Izmantojot summas kvadrātveida formulu P nosacījumi, ko saņemam


atkal ņemot vērā vienādību (8.1.) un arī to, ka X. un X ir neatkarīgi gadījuma lielumi, rakstām

un visbeidzot mēs iegūstam:

Aizstāsim iegūtos rezultātus ar (8.3)

Pēc transformācijas mēs iegūstam

Tādējādi var secināt, ka izlases dispersija ir pārvietoti vispārējās dispersijas novērtējums.

Ņemot vērā iegūto rezultātu, izvirzījām uzdevumu konstruēt vispārējās dispersijas novērtējumu, kas apmierinātu objektīvuma nosacījumu (8.2). Lai to izdarītu, apsveriet nejaušu mainīgo

Ir viegli redzēt, ka nosacījums (8.2) ir izpildīts šim daudzumam:

Ņemiet vērā, ka atšķirība starp izlases dispersiju un koriģēto izlases dispersiju kļūst nenozīmīga, ja paraugs ir liels.

Izvēloties nejaušo lielumu raksturlielumu aprēķinus, ir svarīgi zināt to precizitāti. Dažos gadījumos ir nepieciešama augsta precizitāte, un dažreiz pietiek ar aptuvenu aprēķinu. Piemēram, plānojot lidojumu ar pārsēšanos, mums ir svarīgi pēc iespējas precīzāk zināt plānoto ierašanās laiku lidojuma savienojuma vietā. Citā situācijā, piemēram, atrodoties mājās un gaidot kurjeru ar mūsu pasūtītajām precēm, mums nav svarīga viņa ierašanās laika augstā precizitāte. Abos gadījumos nejaušais lielums ir ierašanās laiks, un mūs interesējošā gadījuma lieluma raksturlielums ir vidējais ceļojuma laiks.

Vērtējumi ir divu veidu. Pirmajā gadījumā uzdevums ir iegūt konkrētu parametra skaitlisko vērtību. Citā gadījumā tiek noteikts intervāls, kurā mūs interesējošais parametrs iekrīt ar noteiktu varbūtību.

Lekcijas plāns:

    Vērtēšanas jēdziens

    Statistisko aplēšu īpašības

    Metodes punktu aplēšu atrašanai

    Intervāla parametru novērtējums

    Ticamības intervāls matemātiskajai cerībai ar zināmu normāli sadalītas populācijas dispersiju.

    Chi kvadrāta sadalījums un Stjudenta sadalījums.

    Ticamības intervāls gadījuma mainīgā, kam ir normāls sadalījums ar nezināmu dispersiju, matemātiskām prognozēm.

    Normālā sadalījuma standartnovirzes ticamības intervāls.

Bibliogrāfija:

    Vencels, E.S. Varbūtību teorija [Teksts] / E.S. Vencels. - M.: Augstskola, 2006. - 575 lpp.

    Gmurmans, V.E. Varbūtību teorija un matemātiskā statistika [Teksts] / V.E. Gmurmans. - M.: Augstskola, 2007. - 480 lpp.

    Krēmers, N. Š. Varbūtību teorija un matemātiskā statistika [Teksts] / N.Sh. Krēmers - M: UNITI, 2002. - 543 lpp.

P.1. Vērtēšanas jēdziens

Tādi sadalījumi kā binomiālie, eksponenciālie, normālie ir sadalījumu saimes, kas ir atkarīgas no viena vai vairākiem parametriem. Piemēram, eksponenciālais sadalījums ar varbūtības blīvumu ir atkarīgs no viena parametra λ, normālā sadalījuma
- no diviem parametriem m un σ. Parasti no pētāmās problēmas nosacījumiem ir skaidrs, kura sadalījumu saime tiek apspriesta. Tomēr šī sadalījuma parametru konkrētās vērtības, kas ir iekļautas mūs interesējošo sadalījuma raksturlielumu izteiksmēs, joprojām nav zināmas. Tāpēc ir jāzina vismaz aptuvenā šo daudzumu vērtība.

Ļaujiet definēt vispārējās populācijas sadalījuma likumu līdz tā sadalījumā iekļauto parametru vērtībām
, no kuriem daži var būt zināmi. Viens no matemātiskās statistikas uzdevumiem ir no novērojumu izlases atrast nezināmu parametru aplēses
no vispārējās populācijas. Nezināmu parametru novērtēšana sastāv no funkcijas konstruēšanas
no nejaušas izlases tā, lai šīs funkcijas vērtība būtu aptuveni vienāda ar aprēķināto nezināmo parametru θ . Funkcija sauca statistika parametrs θ .

Statistikas novērtējums(turpmāk tikai novērtējums) parametrs θ teorētisko sadalījumu sauc par tā aptuveno vērtību atkarībā no izvēles datiem.

Novērtējums ir nejaušs mainīgais, jo ir neatkarīgu gadījuma lielumu funkcija
; ja izveidojat atšķirīgu paraugu, tad funkcijai parasti būs atšķirīga vērtība.

Ir divu veidu aplēses - punkts un intervāls.

punktēts sauc par novērtējumu, ko nosaka viens skaitlis. Ar nelielu skaitu novērojumu šīs aplēses var izraisīt rupjas kļūdas. Lai no tiem izvairītos, tiek izmantoti intervālu aprēķini.

Intervāls sauc par aprēķinu, ko nosaka divi skaitļi - intervāla beigas, kurās aplēstā vērtība ir ietverta ar noteiktu varbūtību θ .

2. lpp. Statistisko aplēšu īpašības

Izmērs
sauca novērtējuma precizitāte. Jo mazāk
, jo labāk, jo precīzāk tiek noteikts nezināmais parametrs.

Jebkura parametra novērtēšanai tiek izvirzītas vairākas prasības, kurām tam ir jāatbilst, lai tas būtu “tuvs” parametra patiesajai vērtībai, t.i. kaut kādā ziņā ir "labdabīgs" novērtējums. Novērtējuma kvalitāti nosaka, pārbaudot, vai tai piemīt objektīvas, efektivitātes un konsekvences īpašības.

Novērtējums parametrs θ sauca objektīvs(bez sistemātiskām kļūdām), ja novērtējuma vidējā vērtība ir tāda pati kā patiesā vērtība θ :

. (1)

Ja vienādība (1) nepastāv, tad novērtējums sauca pārvietoti(ar sistemātiskām kļūdām). Šo novirzi var izraisīt mērījumu, skaitīšanas kļūdas vai izlases negadījuma raksturs. Sistemātiskas kļūdas noved pie pārvērtēšanas vai nenovērtēšanas.

Dažām matemātiskās statistikas problēmām var būt vairāki objektīvi aprēķini. Parasti priekšroka tiek dota tai, kurai ir vismazākā izkliede (dispersija).

Novērtējums sauca efektīvs ja tam ir mazākā dispersija starp visiem iespējamiem objektīviem parametra aprēķiniem θ .

Ļaujiet D() ir minimālā novirze un
ir jebkura cita objektīva novērtējuma dispersija parametrs θ . Tad tāmes efektivitāte vienāds ar

. (2)

Tas ir skaidrs
. Tuvāk
līdz 1, jo efektīvāks novērtējums . Ja
plkst
, tad tiek izsaukta tāme asimptotiski efektīva.

komentēt: Ja rezultāts nobīdīts, tad tā izkliedes mazums nenozīmē tās kļūdas mazumu. Piemēram, ņemot vērā parametra aprēķinus θ kādu numuru , mēs iegūstam novērtējumu pat ar nulles dispersiju. Tomēr šajā gadījumā kļūda (kļūda)
var būt patvaļīgi liels.

Novērtējums sauca turīgs, ja palielinās izlases lielums (
) aplēse pēc varbūtības tuvojas precīzai parametra vērtībai θ , t.i. ja par kādu

. (3)

Novērtējuma konsekvence parametrs θ nozīmē, ka ar izaugsmi n izlases lieluma novērtēšanas kvalitāte uzlabojas.

Teorēma 1. Izlases vidējais rādītājs ir objektīvs un konsekvents cerības novērtējums.

Teorēma 2. Labotā izlases dispersija ir objektīvs un konsekvents dispersijas novērtējums.

Teorēma 3. Izlases empīriskā sadalījuma funkcija ir objektīvs un konsekvents nejauša lieluma sadalījuma funkcijas novērtējums.

Lai būtu jāizpēta kopējās populācijas kvantitatīvā zīme. Pieņemsim, ka no teorētiskiem apsvērumiem bija iespējams noteikt, kuram sadalījumam ir kāda iezīme. Problēma rodas, novērtējot parametrus, kas nosaka šo sadalījumu. Piemēram, ja ir iepriekš zināms, ka pētāmā pazīme ir sadalīta vispārējā populācijā saskaņā ar normālo likumu, tad ir jānovērtē matemātiskā prognoze un standarta novirze, jo šie divi parametri pilnībā nosaka normālo sadalījumu. Ja ir pamats uzskatīt, ka objektam ir Puasona sadalījums, tad ir jānovērtē parametrs , kas nosaka šo sadalījumu. Parasti ir tikai paraugdati, kas iegūti novērojumu rezultātā: , , ... , . Izmantojot šos datus, izsakiet aprēķināto parametru. Ņemot vērā , , ... , kā neatkarīgu gadījuma lielumu vērtības , , ... , , varam teikt, ka teorētiskā sadalījuma nezināma parametra statistiskā aplēse nozīmē atrast novēroto nejaušo mainīgo funkciju, kas dod aptuveno aplēstā parametra vērtību.

Tātad, statistiskais novērtējums nezināmu teorētiskā sadalījuma parametru sauc par novēroto nejaušo mainīgo funkciju. Tiek izsaukta vispārējās populācijas nezināma parametra statistiskā novērtēšana ar vienu skaitli punktu. Tālāk ir aplūkoti šādi punktu aprēķini: neobjektīvi un objektīvi, efektīvi un konsekventi.

Lai statistikas aplēses sniegtu labus aptuvenus aplēstos parametrus, tiem jāatbilst noteiktām prasībām. Precizēsim šīs prasības. Lai ir teorētiskā sadalījuma nezināmā parametra statistiskais novērtējums. Pieņemsim, ka aprēķins ir atrasts, pamatojoties uz apjoma paraugu. Atkārtosim eksperimentu, t.i., izvilksim no kopējās kopas vēl vienu tāda paša izmēra izlasi un, izmantojot tās datus, atradīsim tāmi utt. Iegūsim skaitļus , , ... , , kas atšķirsies no viens otru. Tādējādi novērtējumu var uzskatīt par nejaušu lielumu, bet skaitļus , , ... , - par tā iespējamām vērtībām.

Ja novērtējums dod aptuvenu vērtību ar pārsniegumu, tad no izlases datiem atrastais skaitlis ( ) būs lielāka par patieso vērtību. Līdz ar to nejaušā lieluma matemātiskā cerība (vidējā vērtība) būs lielāka par , t.i. Ja dod aptuvenu vērtību ar trūkumu, tad .

Tādējādi, izmantojot statistisko aprēķinu, kura matemātiskā prognoze nav vienāda ar aprēķināto parametru, radītu sistemātiskas kļūdas. Tāpēc ir nepieciešams prasīt, lai novērtējuma matemātiskā cerība būtu vienāda ar aprēķināto parametru. Atbilstība novērš sistemātiskas kļūdas.

objektīvs sauc par statistisko novērtējumu, kura matemātiskā sagaidāmā vērtība ir vienāda ar aplēsto parametru, t.i.

Pārvietots sauc par statistisko novērtējumu, kura matemātiskā sagaidāmā vērtība nav vienāda ar aprēķināto parametru.

Tomēr ir kļūdaini pieņemt, ka objektīvs novērtējums vienmēr sniedz labu aptuveno aptuveno parametru. Patiešām, iespējamās vērtības var būt ļoti izkliedētas ap to vidējo vērtību, t.i., vērtības dispersija var būt nozīmīga. Šajā gadījumā, piemēram, no viena parauga datiem iegūtais novērtējums var izrādīties ļoti tālu no tā vidējās vērtības un līdz ar to arī no paša aplēstā parametra. Ņemot par aptuvenu vērtību, mēs pieļautu lielu kļūdu. Ja vēlaties, lai vērtības izkliede būtu neliela, lielas kļūdas iespēja tiks izslēgta. Tāpēc statistiskajam novērtējumam tiek izvirzītas efektivitātes prasības.

efektīvs tiek saukts par statistisko aprēķinu, kam (noteiktam izlases lielumam ) ir mazākā iespējamā dispersija. Apsverot liela apjoma paraugus, uz statistikas aplēsēm attiecas konsekvences prasība.

Turīgs tiek saukts par statistisko novērtējumu, kas pēc varbūtības sliecas uz aprēķināto parametru. Piemēram, ja objektīva novērtējuma dispersija pie tiecas uz nulli, tad šāds novērtētājs arī izrādās konsekvents.

Apskatīsim jautājumu par to, kuri izlases raksturlielumi vislabāk novērtē vispārējo vidējo un dispersiju attiecībā uz neobjektīvumu, efektivitāti un konsekvenci.

Ļaujiet diskrētu vispārējo populāciju pētīt attiecībā uz kvantitatīvo atribūtu. Vispārējā sekundārā sauc par vispārējās populācijas pazīmes vērtību vidējo aritmētisko. To var aprēķināt, izmantojot formulas vai , kur ir apjoma vispārējās populācijas atribūta vērtības , ir atbilstošās frekvences un .

Ļaujiet no vispārējās populācijas neatkarīgu kvantitatīvās pazīmes novērojumu rezultātā iegūt tilpuma paraugu ar pazīmes vērtībām . Parauga vidējais sauc par izlases vidējo aritmētisko. To var aprēķināt, izmantojot formulas vai , kur ir atribūta vērtības apjoma izlases kopā, ir atbilstošās frekvences un .

Ja vispārējais vidējais nav zināms un tas jānovērtē no izlases datiem, tad par vispārējā vidējā aprēķinu tiek ņemts izlases vidējais rādītājs, kas ir objektīvs un konsekvents novērtējums. No tā izriet, ka, ja izlases vidējo atrašanai izmanto vairākus pietiekami liela apjoma paraugus no vienas un tās pašas kopas, tad tie būs aptuveni vienādi viens ar otru. Šis ir īpašums parauga līdzekļu stabilitāte.

Ņemiet vērā: ja divu populāciju dispersijas ir vienādas, tad izlases vidējo tuvums vispārējiem nav atkarīgs no izlases lieluma attiecības pret vispārējās populācijas lielumu. Tas ir atkarīgs no izlases lieluma: jo lielāks izlases lielums, jo mazāk izlases vidējais atšķiras no vispārējā.

Lai raksturotu kopējās populācijas kvantitatīvā atribūta vērtību izkliedi ap tā vidējo vērtību, tiek ieviests kopsavilkuma raksturlielums - vispārējā dispersija. Vispārējā dispersija To sauc par kopējo populācijas zīmes vērtību noviržu kvadrātu vidējo aritmētisko no to vidējās vērtības, ko aprēķina pēc formulām: , vai .

Lai raksturotu parauga kvantitatīvā atribūta novēroto vērtību izkliedi ap tā vidējo vērtību, tiek ieviests kopsavilkuma raksturlielums - izlases dispersija. Izlases dispersija sauc par objekta novēroto vērtību kvadrātu noviržu vidējo aritmētisko no to vidējās vērtības, ko aprēķina pēc formulām: , vai .

Papildus dispersijai, lai raksturotu vispārējās (izlases) populācijas atribūta vērtību izkliedi ap tās vidējo vērtību, viņi izmanto kopsavilkuma raksturlielumu - standarta novirzi. Vispārējā standarta novirze ko sauc par vispārējās dispersijas kvadrātsakni: . Parauga standarta novirze sauc par izlases dispersijas kvadrātsakni:

Ļaujiet tilpuma paraugu iegūt no vispārējās populācijas neatkarīgu kvantitatīvās pazīmes novērojumu rezultātā. No izlases datiem ir jānovērtē nezināmā vispārējā novirze. Ja parauga dispersiju ņemam kā vispārējās dispersijas aprēķinu, tad šis novērtējums radīs sistemātiskas kļūdas, radot nepietiekami novērtētu vispārējās dispersijas vērtību. Tas izskaidrojams ar to, ka izlases dispersija ir neobjektīva aplēse; citiem vārdiem sakot, izlases dispersijas vidējā vērtība nav vienāda ar aplēsto vispārējo dispersiju, bet ir vienāda ar .

Izlases dispersiju ir viegli labot tā, lai tās vidējā vērtība būtu vienāda ar vispārējo dispersiju. Lai to izdarītu, pietiek reizināt ar daļu. Rezultātā iegūstam koriģēto dispersiju, ko parasti apzīmē ar . Labotā dispersija būs objektīvs vispārējās dispersijas novērtējums: .

2. Intervālu aprēķini.

Paralēli punktu novērtēšanai parametru novērtēšanas statistiskā teorija aplūko intervālu novērtēšanas jautājumus. Intervālu novērtējuma problēmu var formulēt šādi: pamatojoties uz izlases datiem, konstruēt skaitlisku intervālu, attiecībā pret kuru ar iepriekš izvēlētu varbūtību varam teikt, ka novērtētais parametrs atrodas šī intervāla iekšpusē. Intervālu novērtējums ir īpaši nepieciešams nelielam skaitam novērojumu, kad punktu novērtējums ir lielā mērā nejaušs un tāpēc nav īpaši ticams.

Ticamības intervāls parametram tiek izsaukts tāds intervāls, attiecībā uz kuru ar iepriekš izvēlētu varbūtību tuvu vienam var apgalvot, ka tas satur nezināmu parametra vērtību, t.i. . Jo mazāks ir izvēlētās varbūtības skaitlis, jo precīzāks ir nezināmā parametra novērtējums. Un otrādi, ja šis skaitlis ir liels, tad aprēķins, kas veikts, izmantojot šo intervālu, praksē ir maz noderīgs. Tā kā ticamības intervāla beigas ir atkarīgas no izlases elementiem, un vērtības var mainīties no parauga uz paraugu. Varbūtību parasti sauc par ticamības varbūtību (uzticamību). Parasti aplēses ticamība tiek noteikta iepriekš, un par vērtību tiek ņemts skaitlis, kas ir tuvu vienam. Uzticamības varbūtības izvēle nav matemātiska problēma, bet to nosaka konkrētā risināmā problēma. Visbiežāk uzticamība ir iestatīta uz ; ; .

Norādīsim bez atvasināšanas ticamības intervālu vispārīgajam vidējam ar zināmu standartnovirzes vērtību, ja gadījuma mainīgais (kvantitatīvs atribūts) ir normāli sadalīts:

kur ir iepriekš noteikts skaitlis, kas ir tuvu vienam, un funkcijas vērtības ir norādītas 2. pielikumā.

Šīs attiecības nozīme ir šāda: var droši apgalvot, ka ticamības intervāls ( ) aptver nezināmo parametru, aplēses precizitāte ir . Skaitlis tiek noteikts no vienādības , vai . Saskaņā ar tabulu (2. pielikums) tiek atrasts arguments, kas atbilst Laplasa funkcijas vērtībai, kas vienāda ar .

1. piemērs. Nejaušajam lielumam ir normāls sadalījums ar zināmu standarta novirzi. Atrodiet ticamības intervālus nezināmā vispārējā vidējā aprēķināšanai no izlases vidus, ja ir norādīts izlases lielums un novērtējuma ticamība.

Risinājums. Atradīsim. No koeficienta mēs to iegūstam. Saskaņā ar tabulu (2.pielikums) mēs atrodam. Atrodiet aplēses precizitāti . Uzticamības intervāli būs: . Piemēram, ja , tad ticamības intervālam ir šādas ticamības robežas: ; . Tādējādi nezināmā parametra vērtības, kas atbilst izlases datiem, apmierina nevienlīdzību .

Pazīmes normālā sadalījuma vispārējā vidējā ticamības intervālu ar nezināmu standartnovirzes vērtību nosaka izteiksme .

No tā izriet, ka var droši apgalvot, ka ticamības intervāls aptver nezināmo parametru.

Ir gatavas tabulas (4.pielikums), ar kurām var atrast doto un atrast varbūtību , un otrādi, dot un var atrast.

2. piemērs. Vispārējās populācijas kvantitatīvā zīme parasti ir sadalīta. Pamatojoties uz tilpuma paraugu, tika atrasts parauga vidējais lielums un koriģētā standartnovirze. Novērtējiet nezināmās populācijas vidējo vērtību, izmantojot ticamības intervālu ar ticamību.

Risinājums. Atradīsim. Izmantojot tabulu (4. pielikums) un mēs atrodam:. Noskaidrosim uzticības robežas:

Tātad ar uzticamību nezināmais parametrs ir iekļauts ticamības intervālā.

3. Statistiskās hipotēzes jēdziens. Hipotēžu pārbaudes problēmas vispārīgs izklāsts.

Statistisko hipotēžu pārbaude ir cieši saistīta ar parametru novērtēšanas teoriju. Dabaszinātnēs, tehnoloģijās un ekonomikā bieži vien, lai noskaidrotu vienu vai otru nejaušu faktu, viņi ķeras pie hipotēžu izvirzīšanas, kuras var pārbaudīt statistiski, tas ir, pamatojoties uz nejaušās izlases novērojumu rezultātiem. Zem statistiskās hipotēzes ir domātas tādas hipotēzes, kas attiecas uz nejaušā lieluma sadalījuma veidu vai atsevišķiem parametriem. Tā, piemēram, statistiskā hipotēze ir tāda, ka darba ražīguma sadalījumam strādniekiem, kuri veic to pašu darbu tādos pašos apstākļos, ir normāls sadalījuma likums. Statistiska būs arī hipotēze, ka viena veida paralēlajās mašīnās ražoto detaļu vidējie izmēri neatšķiras savā starpā.

Statistisko hipotēzi sauc vienkārši ja tas unikāli nosaka nejaušā mainīgā sadalījumu, pretējā gadījumā tiek izsaukta hipotēze komplekss. Piemēram, vienkārša hipotēze ir pieņēmums, ka gadījuma lielums ir sadalīts saskaņā ar parasto likumu ar matemātisko cerību, kas vienāda ar nulli un dispersiju vienāda ar vienu. Ja tiek pieņemts, ka nejaušam mainīgajam ir normāls sadalījums ar dispersiju, kas vienāda ar vienu, un matemātiskā sagaidāmā vērtība ir segmenta skaitlis, tad šī ir sarežģīta hipotēze. Vēl viens sarežģītas hipotēzes piemērs ir pieņēmums, ka nepārtraukts gadījuma lielums ņem vērtību no intervāla ar varbūtību, un tādā gadījumā nejaušā lieluma sadalījums var būt jebkurš no nepārtraukto sadalījumu klases.

Bieži vien lieluma sadalījums ir zināms, un ir nepieciešams pārbaudīt pieņēmumus par šī sadalījuma parametru vērtību, izmantojot novērojumu izlasi. Šādas hipotēzes sauc parametrisks.

Pārbaudāmo hipotēzi sauc nulles hipotēze un ir apzīmēts. Kopā ar hipotēzi tiek aplūkota viena no alternatīvajām (konkurējošām) hipotēzēm. Piemēram, ja tiek pārbaudīta hipotēze, ka parametrs ir vienāds ar kādu noteiktu vērtību , t.i. : , tad par alternatīvu hipotēzi var uzskatīt vienu no sekojošām hipotēzēm: : ; : ; : ; : , kur ir iestatītā vērtība, . Alternatīvas hipotēzes izvēli nosaka konkrētais problēmas formulējums.

Noteikums, saskaņā ar kuru tiek pieņemts lēmums pieņemt vai noraidīt hipotēzi, tiek saukts kritērijs. Tā kā lēmums tiek pieņemts, pamatojoties uz nejaušā mainīgā lieluma novērojumu izlasi, ir jāizvēlas atbilstoša statistika, ko šajā gadījumā sauc par testa statistiku. Pārbaudot vienkāršu parametru hipotēzi: par kritērija statistiku tiek izvēlēta tā pati statistika, kas parametru novērtējumam.

Statistisko hipotēžu pārbaude balstās uz principu, ka notikumi ar zemu varbūtību tiek uzskatīti par neiespējamiem, un notikumi ar lielu varbūtību tiek uzskatīti par noteiktiem. Šo principu var īstenot šādi. Pirms parauga analīzes tiek fiksēta neliela varbūtība, ko sauc nozīmīguma līmenis. Ļaut būt statistikas vērtību kopai un būt tādai apakškopai, ka ar nosacījumu, ka hipotēze ir patiesa, varbūtība, ka kritērija statistika ietilpst, ir vienāda ar , t.i. .

Apzīmē ar statistikas izlases vērtību, kas aprēķināta no novērojumu izlases. Kritērijs ir formulēts šādi: noraidīt hipotēzi, ja ; pieņemt hipotēzi, ja . Tiek izsaukts tests, kura pamatā ir iepriekš noteikta nozīmīguma līmeņa izmantošana nozīmīguma kritērijs. Visu kritērija statistikas vērtību kopu, par kuru tiek pieņemts lēmums noraidīt hipotēzi sauc kritiskā zona; apgabalu sauc pieņemšanas zona hipotēzes.

Nozīmīguma līmenis nosaka kritiskā reģiona lielumu. Kritiskā apgabala pozīcija uz statistikas vērtību kopas ir atkarīga no alternatīvās hipotēzes formulējuma. Piemēram, ja tiek pārbaudīta hipotēze : un alternatīvā hipotēze ir formulēta šādi: (), tad kritiskais apgabals tiek novietots statistikas sadalījuma labajā (kreisajā) “aste”, t.i., tam ir nevienlīdzības forma. : (), kur un ir statistikas vērtības, kuras tiek pieņemtas attiecīgi ar varbūtībām un ar nosacījumu, ka hipotēze ir patiesa. Šajā gadījumā kritērijs tiek saukts vienpusējs, attiecīgi, labroči un kreili. Ja alternatīvo hipotēzi formulē šādi: , tad kritiskais apgabals atrodas uz abām sadalījuma “astēm”, t.i., to nosaka nevienādību kopa un ; šajā gadījumā tiek saukts kritērijs divpusējs.

Attēlā 30 parāda kritiskā apgabala atrašanās vietu dažādām alternatīvām hipotēzēm. Šeit ir kritērija statistikas sadalījuma blīvums, ja hipotēze ir patiesa, ir hipotēzes pieņemšanas joma, .

Tādējādi parametriskās statistiskās hipotēzes pārbaudi, izmantojot nozīmīguma testu, var iedalīt šādos posmos:

1) formulēt pārbaudāmās () un alternatīvās () hipotēzes;

2) piešķir nozīmīguma līmeni; kā neatbilstoši novērojumu rezultātiem; ja , tad pieņem hipotēzi , t.i., pieņem, ka hipotēze nav pretrunā ar novērojumu rezultātiem.

Parasti, veicot 4. - 7. punktu, tiek izmantota statistika, kuras kvantiles ir tabulas: statistika ar normālu sadalījumu, Stjudenta statistika, Fišera statistika.

3. piemērs. Pēc automašīnas dzinēja pases datiem degvielas patēriņš uz 100 km nobraukums ir 10 l. Dzinēja pārbūves rezultātā paredzams degvielas patēriņa samazinājums. Lai pārbaudītu, tiek veikti testi 25 nejauši atlasīti transportlīdzekļi ar modernizētu dzinēju un izlases vidējais degvielas patēriņš uz vienu 100 km nobraukums pēc testa rezultātiem bija 9,3 l. Pieņemsim, ka degvielas patēriņa paraugs ir iegūts no normāli sadalītas populācijas ar vidējo un dispersiju. Ar nosacījumu, ka sākotnējās statistikas kritiskā reģiona hipotēze ir patiesa, t.i., vienāda ar nozīmīguma līmeni. Atrodiet pirmā un otrā veida kļūdu iespējamības kritērijam ar tik kritisku reģionu. ir normāls sadalījums ar vidējo vienādu un dispersiju, kas vienāda ar . Mēs atrodam otrā veida kļūdas iespējamību pēc formulas (11.2):

Līdz ar to saskaņā ar pieņemto kritēriju 13,6% transportlīdzekļu ar degvielas patēriņu 9 l ieslēgts 100 km nobraukums tiek klasificēti kā transportlīdzekļi ar degvielas patēriņu 10 l.

4. Teorētiskās un empīriskās frekvences. Piekrišanas kritēriji.

Empīriskās frekvences- pieredzes (novērošanas) rezultātā iegūtās frekvences. Teorētiskās frekvences aprēķina pēc formulām. Normālam sadalījumam tos var atrast šādi:

, (11.3)

ir nobīdīts O. no lapas. dispersijai, kopš ; kā nenobīdīts O. ar. s 2 parasti izmanto funkciju


Skatīt arī Neobjektīvs novērtētājs.

Nenobīdīta O. precizitātes mērīšanai ar. un parametram visbiežāk tiek ņemta dispersija Da.

O. s. ar mazāko dispersiju. vislabākais. Iepriekš minētajā piemērā vidējais aritmētiskais (1) ir labākais O. ar. Tomēr, ja nejaušie mainīgie X i atšķiras no parastā, tad O. s. (1) var nebūt labākais. Piemēram, ja novērojumu rezultāti X i vienmērīgi sadalīts intervālā ( b, c), tad labākais O. s. matemātikai. cerības a=(b+c)/2 būs puse no galējo vērtību summas

(3)

Kā raksturlielums dažādu O. s precizitātes salīdzināšanai. pielietot labākās novērtējuma un dotās objektīvās novērtējuma efektivitāti - dispersijas. Piemēram, ja novērojumu rezultāti X i ir vienmērīgi sadalīti, tad (1) un (3) novērtējumu dispersijas izsaka ar formulām

Un (4)

Tā kā novērtējums (3) ir vislabākais, tad novērtējuma (1) efektivitāte šajā gadījumā ir

Ar lielu skaitu novērojumu tie parasti prasa, lai izvēlētais O. ar. tiecoties pēc varbūtības uz parametra patieso vērtību A, i., jebkuram e > 0

tāds O. s. sauca konsekvents (konsekventa O. s, - jebkura, kura dispersija tiecas uz nulli pie; sk. arī Konsekvents novērtējums). Tā kā tendencei uz robežu šajā gadījumā ir liela nozīme, asimptotiski vislabākie ir asimptotiski efektīvie O.s., tas ir, O.s., kuriem

Piemēram, ja sadala vienādi normāli, tad O. s. (2) ir asimptotiski efektīvs aprēķins nezināmam parametram , jo gadījumā , aplēses dispersija un labākā novērtējuma dispersija ir asimptotiski līdzvērtīgas:

un turklāt,

Pamatvērtība O. lapas teorijai. un tās pieteikumos ir fakts, ka O. s. parametram a tas no apakšas ir ierobežots ar noteiktu vērtību (R. Fišers ierosināja ar šo vērtību raksturot novērojumu rezultātos informācijas apjomu par nezināmo parametru a). Piemēram, ja tie ir neatkarīgi un vienādi sadalīti ar varbūtības blīvumu p(x; A).un ja - O. s. kādai funkcijai g(a) uz parametra a, tad plašā gadījumu klasē

Tiek izsaukta funkcija b(a). nobīde, un nevienādības labās puses apgrieztā vērtība (5), ko sauc. informācijas apjoms (pēc Fišera) par funkciju g(a) , ietverts novērojumā. Jo īpaši, ja a ir objektīvs O. s. parametrs A, Tas,

un informācijas apjoms nIašajā gadījumā tas ir proporcionāls novērojumu skaitam (funkciju I(a) sauc par vienā novērojumā ietvertās informācijas apjomu).

Galvenie nosacījumi, kādos pastāv nevienādība (5) un (6), ir aplēses vienmērīgums kā funkcija no X i , un arī par šo punktu kopas parametru X, kur p( x, a)=0. Pēdējais nosacījums nav izpildīts, piemēram, vienmērīga sadalījuma gadījumā un līdz ar to O. s dispersija. (3) neapmierina nevienādību (6) [saskaņā ar (4) šī dispersija ir n -2 kārtībā, savukārt pēc nevienādības (6) tā nevar būt mazāka par n -1].

Nevienādības (5) un (6) ir spēkā arī diskrēti sadalītiem gadījuma lielumiem X i ir nepieciešama tikai informācijas I(a) definīcijā. p(x; A).aizstāt ar notikuma varbūtību (X=x).

Ja objektīva O. s dispersija. a* parametram a sakrīt ar nevienādības (6) labo pusi, tad ir labākais novērtējums. Pretējais apgalvojums, vispārīgi runājot, nav patiess: labākā O. s dispersija. var pārsniegt. Tomēr, ja , tad labākā novērtējuma dispersija ir asimptotiski ekvivalenta (6) labajā pusē, t.i., . Tādējādi, izmantojot informācijas daudzumu (pēc Fišera domām), var noteikt asimptotiku lapas nepārvietotā O. efektivitāte. a, pieņemot

Īpaši auglīga ir informatīvā pieeja O. teorijai par s. ietekmē, kad nejaušo lielumu kopējā sadalījuma blīvumu (diskrētā gadījumā - ) var attēlot kā divu funkciju h( x 1 ,x 2 ,...,x p).[y( x 1 , x 2 ,..., x n);A] , no kuriem pirmais nav atkarīgs A, un otrais ir noteikta gadījuma lieluma sadalījuma blīvums Z=y(X 1, X 2,....,X lpp), sauca pietiekama statistika vai izsmeļoša statistika.

Viena no visizplatītākajām metodēm, kā atrast punktu O. lapa - momentu metode. Saskaņā ar šo metodi teorētiskais sadalījums atkarībā no nezināmiem parametriem tiek ievietots diskrētā izlasē, ko nosaka novērojumu rezultāti X i un attēlo varbūtības sadalījumu iedomātam gadījuma mainīgajam, kas ņem vērtības ar vienādām varbūtībām, kas vienādas ar 1/n (izlases sadalījumu var uzskatīt par teorētiskā sadalījuma punktu sadalījumu). Kā O. ar. teorētiskajiem momentiem. sadalījumi ņem atbilstošos izlases sadalījuma momentus; piemēram, matemātikai. gaidīšanas ai un dispersijas s 2 momentu metode dod šādu OS: (1) un izlases dispersiju (2). Nezināmus parametrus parasti izsaka (precīzi vai aptuveni) kā vairāku teorētisko momentu funkcijas. izplatīšana. Aizstāšana šajās funkcijās teorētiska. mirkļi selektīvi, saņem nepieciešamo O. ar. Šī metode, kas praksē bieži noved pie salīdzinoši vienkāršiem aprēķiniem, parasti dod O. s. zema asimptotiskā efektivitāte (sk. iepriekš piemēru, kā novērtēt vienmērīga sadalījuma matemātisko cerību).

Cita lappuses O. atrašanas metode, ideālāka ar teorētisko. viedokļi, - maksimālās varbūtības metode, vai maksimālās varbūtības metode. Saskaņā ar šo metodi tiek apskatīta varbūtības funkcija L(a), kas ir nezināmā parametra a funkcija un tiek iegūta argumentu kopīgā sadalījuma blīvuma aizstāšanas rezultātā. x i paši nejaušie mainīgie X i; Ja Xi - ir neatkarīgi un vienmērīgi sadalīti ar varbūtības blīvumu p(x; A), Tas

(Ja X i ir diskrēti sadalīti, tad varbūtības funkcijas L definīcijā blīvums jāaizstāj ar notikumu varbūtību ). Kā O. ar. par maksimālo varbūtību nezināmam parametram a tiek uzskatīta tāda vērtība a, kurai L(a) sasniedz maksimālo vērtību (šajā gadījumā L vietā bieži tiek uzskatīta tā sauktā logaritmiskā varbūtības funkcija ; logaritma monotonitātes dēļ funkciju L(a) un l(a) maksimumu punkti sakrīt). Piemēri O. ar. maksimālās iespējamības aplēses ir mazāko kvadrātu metode.

Galvenā priekšrocība O. ar. Maksimālā iespējamība ir tāda, ka noteiktos vispārīgos apstākļos šie aprēķini ir konsekventi, asimptotiski efektīvi un aptuveni normāli sadalīti.

Uzskaitītās īpašības nozīmē, ka, ja a ir O. s. tad maksimālā iespējamība

(ja X ir neatkarīgi, tad ). Tādējādi normalizētās O. s sadalījuma funkcijai. ir robežsakarība

O. priekšrocības ar. maksimālā iespējamība attaisno skaitļošanas darbu, lai atrastu funkcijas L(vai l) maksimumu . Dažos gadījumos skaitļošanas darbs ir ievērojami samazināts šādu īpašību dēļ: pirmkārt, ja a* ir tāds O.S., kuram (6) kļūst par vienādību, tad O.S. maksimālā iespējamība ir unikāla un sakrīt ar a*; otrkārt, ja pastāv Z, tad O. s. maksimālā iespējamība ir funkcija Z.

Ļaujiet, piemēram, būt neatkarīgiem un sadalīti vienādi normāli, lai

Tāpēc

Koordinātas a = a 0 un s= s 0 funkcijas I( A, s).apmierina vienādojumu sistēmu


Tādējādi un līdz ar to arī šajā lietā O. s. (1) un (2) - maksimālās varbūtības aplēses un - labākās O. s. parametrs A, normāli sadalīts (, ), un - asimptotiski efektīva O. s. parametrs s 2 , sadalīts lielam p ir aptuveni normāls (). Abas aplēses ir pietiekami neatkarīga statistika.

Vēl viens piemērs, kurā

Šis blīvums apmierinoši apraksta vienas no koordinātām daļiņām, kuras sasniegušas plakanu ekrānu un izkļuvušas no punkta, kas atrodas ārpus ekrāna (a ir avota projekcijas koordināta uz ekrāna, pieņem, ka tā nav zināma). Par norādīto matemātikas sadalījumu. cerības nepastāv, jo atbilstošā atšķiras. Tāpēc O. meklēšana pēc lapas. jo momentu metode nav iespējama. Oficiāls pieteikums kā O. of page. vidējais aritmētiskais (1) ir bezjēdzīgs, jo šajā gadījumā tas ir sadalīts ar tādu pašu blīvumu p(x; a) kā katrs atsevišķais novērojuma rezultāts. Lai novērtētu, var izmantot faktu, ka aplūkotais sadalījums ir simetrisks attiecībā pret punktu x=a un tāpēc, A - teorētiskā mediāna izplatīšana. Nedaudz modificējot momentu metodi, kā O. s. par pieņemšanu t.s. parauga mediāna m, kas ir objektīva O. s. a, un ja p ir liels, tad m ir sadalīts aptuveni normāli ar dispersiju


Tajā pašā laikā

tāpēc un līdz ar to saskaņā ar (7) asimptomotiski. efektivitāte ir vienāda. Tādējādi, lai m būtu tikpat precīzs O. s. a, kā arī maksimālās varbūtības aplēse a, novērojumu skaits jāpalielina par 25%. Ja eksperimenta izmaksas ir augstas, tad lapas noteikšanai jāizmanto O.. a, kas šajā gadījumā tiek definēts kā vienādojumi

Kā pirmo tuvinājumu izvēlas 0 =u un pēc tam to atrisina ar secīgām tuvinājumiem pēc formulas

Skatīt arī Punktu aprēķins.

Intervālu aprēķini. Tiek izsaukts intervāla novērtējums. tāda robežsistēma, kas ģeometriski attēlojama kā parametru telpai piederošu punktu kopa. Intervāls O. ar. var uzskatīt par punktu O. ar. Šī kopa ir atkarīga no novērojumu rezultātiem un tāpēc ir nejauša; tāpēc katrs intervāls O. ar. tiek samērots ar varbūtību, kādā šis novērtējums "aptver" nezināmo parametru. punktu. Šāda varbūtība, vispārīgi runājot, ir atkarīga no nezināmiem parametriem; tāpēc kā intervāla O ticamības raksturojums. ar. pieņemt ticamību – norādītās varbūtības mazākā iespējamā vērtība. Informatīvā statistika. secinājumi ļauj iegūt tikai tos intervālus O. s., ticamības koeficients to-rykh ir tuvu vienībai.

Ja tiek novērtēts viens parametrs a, tad intervāls O. ar. parasti ir daži (b, g). (tā sauktie ), kuru beigu punkti (b un g ir novērojumu rezultātu funkcijas; ticamības koeficientu šajā gadījumā definē kā divu notikumu vienlaicīgas iestāšanās varbūtības (dzim< a} и (g >a) aprēķina pēc visām iespējamām parametra a vērtībām:


Ja šāda intervāla vidu ņem par punktu O. ar. parametram a, tad ar vismaz ω varbūtību var apgalvot, ka šis O. s. nepārsniedz pusi no intervāla garuma . Citiem vārdiem sakot, ja mēs ievērosim norādīto absolūtās kļūdas novērtēšanas noteikumu, tad kļūdains secinājums tiks iegūts vidēji mazāk nekā gadījumiem. Fiksētam ticamības koeficientam visizdevīgākie ir visīsākie ticamības intervāli, kuriem matemātiskais garuma paredzamā vērtība sasniedz mazāko vērtību.

Ja nejaušo lielumu sadalījums X i ir atkarīgs tikai no viena nezināma parametra A, tad ticamības intervāla konstruēšana parasti tiek veikta ar kāda punkta O. s palīdzību. A. Lielākajai daļai praktiski interesantu gadījumu saprātīgi izvēlēta O. s. sadalījuma funkcija. un monotoni ir atkarīgs no parametra A.Šajos apstākļos lapas O. intervāla atrašanai. seko F(x; A) aizstājējs x= a . un atrodi saknes a 1 = a 1(a, w) un a 2 \u003d a 2 (a, w) vienādojumi

(9) kur

[nepārtrauktam sadalījumam]. Punkti ar koordinātām un ierobežo ticamības intervālu ar ticamības koeficientu w. Protams, tik vienkāršā veidā konstruēts intervāls daudzos gadījumos var atšķirties no optimālā (īsākā). Tomēr, ja a ir asimptotiski efektīva O.S. a, tad pietiekami lielam novērojumu skaitam šāds intervāls O. s. praktiski nenozīmīgi atšķiras no optimālā. Jo īpaši tas attiecas uz O. s. maksimālā iespējamība, jo tā ir asimptomotiski normāli sadalīta (sk. (8)). Gadījumos, kad vienādojumi (9) ir sarežģīti, intervāls O. s. aprēķini aptuveni ar punkta O palīdzību. ar. maksimālā iespējamība un attiecība (8):

Kur X - vienādojuma sakne

Ja , tad intervāla novērtējuma patiesajam ticamības koeficientam ir tendence w. Vispārīgākā gadījumā novērojumu rezultātu sadalījums X i- atkarīgs no vairākiem parametriem a, b.... Šādos apstākļos iepriekš minētie ticamības intervālu konstruēšanas noteikumi bieži vien izrādās nepiemērojami, jo punkta O. sadalījums ar. a , parasti ir atkarīgs ne tikai no a, bet arī no citiem parametriem. Taču praktiski interesantos gadījumos O. s. a var aizstāt ar šādu funkciju no novērojumu rezultātiem X i un nezināms parametrs i, kura sadalījums nav atkarīgs (vai "gandrīz nav atkarīgs") no visiem nezināmajiem parametriem. Šādas funkcijas piemērs ir normalizētā O. s. maksimālā iespējamība; ja saucējs satur argumentus a, b... aizstāt tos ar maksimālās varbūtības aplēsēm a, b,. . . , tad limita sadalījums paliks tāds pats kā formulā (8). Tāpēc aptuvenos ticamības intervālus katram parametram atsevišķi var izveidot šādi tas pats, tāpat kā viena parametra gadījumā.

Kā minēts iepriekš, ja , ... ir neatkarīgi un vienādi normāli sadalīti gadījuma lielumi, tad s 2 ir vislabākie O. s. attiecīgi parametriem a un s 2. Sadales funkcija O. s. tiek izteikts ar formulu


un līdz ar to tas ir atkarīgs ne tikai no a, bet arī no s. Tajā pašā laikā sadala t.s. studentu attiecības


nav atkarīgs ne no a, ne no s, un

kur konstante ir izvēlēta tā, lai vienādība . Tātad ticamības intervāls

atbilst ticamības koeficientam

Novērtējuma s 2 sadalījums ir atkarīgs tikai no s 2 un O. s sadalījuma funkcijas. s 2 ir norādīts pēc formulas

kur konstante D n-1 tiek noteikta ar nosacījumu (tā sauktais -sadale ar n-1 brīvības pakāpēm).

Tā kā varbūtība palielinās monotoni, palielinoties s, lai izveidotu intervālu O. s. piemēro (9) noteikumu. Tādējādi, ja x 1 un x 2 ir vienādojumu saknes un = , tad ticamības intervāls

atbilst ticamības koeficientam w. No tā jo īpaši izriet, ka relatīvās kļūdas ticamības intervālu nosaka nevienādības

Detalizētas Studenta sadalījuma funkciju un sadalījumu tabulas ir pieejamas lielākajā daļā matemātikas rokasgrāmatu. statistika.

Līdz šim tika pieņemts, ka novērojumu rezultātu sadalījuma funkcija ir zināma vairāku parametru vērtībās. Tomēr lietojumprogrammās bieži sastopams gadījums, kad izplatīšanas funkcija nav zināma. Šajā situācijā t.s. neparametriskās statistikas metodes(t.i., metodes, kas nav atkarīgas no sākotnējā varbūtības sadalījuma). Ļaujiet, piemēram, novērtēt teorētiskās vidējās vērtības neatkarīgu gadījuma lielumu nepārtraukts sadalījums X 1 , X 2 ,..., X lpp(simetriskiem sadalījumiem tas sakrīt ar matemātisko cerību, ja tas, protams, pastāv). Lai Y 1 ir vienādi lielumi X i bet sakārtoti augošā secībā. Tad ja k- vesels skaitlis, kas apmierina nevienlīdzības n/2, Tas

Tādējādi, - intervāls O. ar. TS pēc ticamības koeficienta w=w n, k. Tas attiecas uz jebkuru nejaušu mainīgo nepārtrauktu sadalījumu X i .

Iepriekš tika atzīmēts, ka selektīvais sadalījums ir punkts O. ar. par nezināmu teorētisko izplatīšana. Turklāt izlases sadalījuma funkcija F n(x) - nenobīdīts O. s. teorētiskajai funkcijai. sadalījums F(x) . Tajā pašā laikā, kā parādīts A. N. Kolmogorovs, statistikas sadalījums

nav atkarīgs no nezināmā teorētiskā. sadalījums un tendence uz robežizplatījumu K(y) , to-roe naz. Kolmogorova sadalījums. Tādējādi, ja y - vienādojuma atrisinājums K(y)=w, tad ar varbūtību w var apgalvot, ka teorētiskās funkcijas. sadalījums F (y). ir pilnībā "pārklāts" ar joslu, kas atrodas starp funkciju grafikiem (kad atšķirība starp statistikas l n priekšlimitācijas un limita sadalījumu ir praktiski nenozīmīga). Tāds intervāls O. ar. sauca uzticības zona. Skatīt arī Intervālu novērtējums.

Statistikas aplēses kļūdu teorijā. Kļūdu teorija ir matemātiskās statistikas sadaļa, kas veltīta nezināmu lielumu skaitliskai noteikšanai no mērījumu rezultātiem. Mērījumu kļūdu nejaušības un, iespējams, pētāmās parādības nejaušības dēļ ne visi šādi rezultāti ir vienādi: atkārtotos mērījumos daži no tiem notiek biežāk, citi retāk.

Kļūdu teorijas pamats ir matemātisks. , saskaņā ar kuru pirms eksperimenta visu iespējamo mērījumu rezultātu kopums tiek uzskatīts par noteikta nejauša lieluma vērtību kopumu. Tāpēc O. iegūst nozīmīgu lomu. Kļūdu teorijas secinājumi ir statistiski. . Šādu secinājumu (kā arī O. secinājumu) nozīme un saturs.

Pieņemot, ka mērījumu rezultāts X ir nejaušs lielums, ir trīs galvenie mērījumu kļūdu veidi: sistemātiskā, nejaušā un rupjā (šādu kļūdu kvalitatīvie apraksti ir sniegti 1. Kļūdu teorija). Šajā gadījumā nezināmā daudzuma anaz mērījumu kļūda. X-a, matemātiskā. šīs atšķirības gaidīšana E( Ha)=b sauca sistemātiska kļūda (ja b \u003d 0, tad viņi saka, ka mērījumos nav sistemātisku kļūdu), un atšķirība d \u003d X- a-b sauca nejauša kļūda . Tātad, ja ir doti p-neatkarīgi a mērījumi, tad to rezultātus var uzrakstīt kā vienādības

kur ai un b ir konstantes, a d i- nejaušie mainīgie. Vispārīgāk

kur b i- nav atkarīgi no d i nejauši mainīgie, kas ir vienādi ar nulli ar varbūtību, kas ir ļoti tuvu vienībai (tādēļ jebkura cita vērtība ir maz ticama). b i sauca rupja kļūda.

Uzdevums novērtēt (un novērst) sistemātisku. kļūdas parasti pārsniedz matemātisko. statistika. Izņēmumi ir t.s. standartu metode, saskaņā ar Kromu, lai novērtētu b, tiek veikta zināmas vērtības a mērījumu sērija (šajā metodē b- paredzamā vērtība un a - zināms sistemātisks. kļūda), kā arī , ļaujot novērtēt sistemātisku. neatbilstības starp vairākām mērījumu sērijām.

Kļūdu teorijas galvenais uzdevums ir atrast O. ar. nezināmai a vērtībai un mērījumu precizitātes aplēsei. Ja sistemātiski kļūda ir novērsta (b=0) un novērojumos nav rupju kļūdu, tad saskaņā ar (10) Х i=a+d i un tāpēc šajā gadījumā c novērtēšanas problēma ir samazināta līdz optimālā O. s atrašanai vienā vai otrā nozīmē. matemātikai. identiski sadalītu nejaušo mainīgo gaidas X i . Kā parādīts iepriekšējās sadaļās, šāda veida O. s. (punkts vai intervāls) būtībā ir atkarīgs no nejaušo kļūdu sadalījuma likuma. Ja šis likums ir zināms līdz dažiem nezināmiem parametriem, tad novērtējumam, kā arī novērtējumam var pielietot, piemēram, maksimālās ticamības metodi; pretējā gadījumā tas vispirms seko pēc novērojumu rezultātiem X i atrast O. s. nezināmai gadījuma kļūdu sadalījuma funkcijai d i(šādas funkcijas "neparametriskais" intervāls O. norādīts iepriekš). Praktiski darbs bieži vien ir apmierināts ar divām O. lapām. un (sk. (1) un (2)). Ja d i sadalīti vienādi normāli, tad šie O. s. vislabākais; citos gadījumos šīs aplēses var būt neefektīvas.

Rupju kļūdu klātbūtne sarežģī parametra a novērtēšanas problēmu. Parasti novērojumu īpatsvars, kuros ir mazs, un matemātisks. sagaidīt, ka nav nulles |b i| ievērojami pārsniedz (rupjas kļūdas rodas nejauša nepareiza aprēķina rezultātā, nepareizi nolasot mērierīces rādījumus utt.). Mērījumu rezultāti, kas satur lielas kļūdas, bieži ir skaidri redzami, jo tie ievērojami atšķiras no citiem mērījumu rezultātiem. Šādos apstākļos vispiemērotākais veids, kā identificēt (un novērst) rupjas kļūdas, ir tieša mērījumu analīze, rūpīga visu eksperimentu apstākļu nemainīguma pārbaude, rezultātu fiksēšana "divās rokās" utt. Statistika. rupju kļūdu noteikšanas metodes jāizmanto tikai apšaubāmos gadījumos.

Vienkāršākais šādu metožu piemērs ir statists. viena ārēja novērojuma identificēšana, ja nu Y 1 = min X 1, vai Y p \u003d maxX i(pieņem, ka vienādībās (11) b=0 un lielumu sadalījuma likumā d i slavens). Lai noskaidrotu, vai pieņēmums par vienas rupjas kļūdas esamību ir pamatots, pārim Y 1, Y n aprēķināt locītavas intervālu O. ar. (pārliecība ), pieņemot, ka visas b i nulle. Ja šī O. s. "pārklāj" punktu ar koordinātām ( Y 1, Y n), tad aizdomas par rupjas kļūdas esamību uzskatāmas par statistiski nepamatotām; pretējā gadījumā hipotēze par rupjas kļūdas esamību ir jāatzīst par apstiprinātu (šajā gadījumā noraidīts novērojums parasti tiek noraidīts, jo statistiski nav iespējams ticami novērtēt rupjas kļūdas lielumu no viena novērojuma).

Gadījuma lieluma sadalījumu (populācijas sadalījumu) parasti raksturo vairāki skaitliski raksturlielumi:

  • normālam sadalījumam N(a, σ) ir matemātiskā prognoze a un standartnovirze σ;
  • vienmērīgam sadalījumam R(a,b) ir tā intervāla robežas, kurā tiek novērotas šī nejaušā lieluma vērtības.
Tādus skaitliskos raksturlielumus, kas parasti nav zināmi, sauc populācijas parametri . Parametru novērtējums - atbilstošais skaitliskais raksturlielums, kas aprēķināts no parauga. Iedzīvotāju parametru aplēses iedalās divās klasēs: punktu Un intervāls.

Ja rezultātu nosaka viens skaitlis, tas tiek izsaukts punktu tāme. Punktu novērtējums kā parauga funkcija ir gadījuma lielums un atšķiras atkarībā no parauga ar atkārtotiem eksperimentiem.
Punktu aplēsēm ir prasības, kas tām ir jāizpilda, lai tās būtu “labdabīgas” jebkurā nozīmē. Šis nepārvietota, efektivitāti Un bagātība.

Intervālu aprēķini tiek noteiktas ar diviem skaitļiem - tā intervāla galiem, kas aptver aprēķināto parametru. Atšķirībā no punktu aprēķiniem, kas nedod priekšstatu par to, cik tālu no tiem var atrasties aprēķinātais parametrs, intervālu aplēses ļauj noteikt aplēšu precizitāti un ticamību.

Kā matemātiskās cerības, dispersijas un standartnovirzes punktu aprēķini tiek izmantoti izlases raksturlielumi, attiecīgi parauga vidējais, parauga dispersija un izlases standartnovirze.

Neobjektīva novērtējuma īpašība.
Vēlama novērtējuma prasība ir sistemātisku kļūdu neesamība, t.i. atkārtoti izmantojot parametra θ vietā tā novērtējumu, aproksimācijas kļūdas vidējā vērtība ir nulle - tas ir objektīva novērtējuma īpašība.

Definīcija. Aprēķinu sauc par objektīvu, ja tā matemātiskā prognoze ir vienāda ar aprēķinātā parametra patieso vērtību:

Izlases aritmētiskais vidējais ir objektīvs matemātiskās cerības un izlases dispersijas novērtējums - neobjektīvs vispārējās dispersijas novērtējums D. Neobjektīvs vispārējās dispersijas novērtējums ir aplēse

Novērtējuma konsekvences īpašība.
Otrā prasība novērtējumam — tās konsekvence — nozīmē, ka aplēse uzlabojas, palielinoties izlases lielumam.

Definīcija. Novērtējums tiek saukts par konsekventu, ja tas pēc varbūtības konverģē uz aprēķināto parametru θ kā n→∞.


Varbūtības konverģence nozīmē, ka ar lielu izlases lielumu iespējamība, ka novērtējuma lielums novirzīsies no patiesās vērtības, ir maza.

Efektīvas aplēses īpašums.
Trešā prasība ļauj izvēlēties labāko novērtējumu no vairākiem viena parametra aprēķiniem.

Definīcija. Neobjektīvs novērtētājs ir efektīvs, ja tam ir vismazākā dispersija starp visiem objektīvajiem novērtētājiem.

Tas nozīmē, ka efektīvajam novērtējumam ir minimāla izkliede attiecībā pret parametra patieso vērtību. Ņemiet vērā, ka efektīva aplēse ne vienmēr pastāv, bet no divām aplēsēm parasti ir iespējams izvēlēties efektīvāko, t.i. ar mazāku dispersiju. Piemēram, normālas populācijas N(a,σ) nezināmam parametram a gan izlases aritmētisko vidējo, gan izlases mediānu var uzskatīt par objektīvu novērtējumu. Bet izlases mediānas dispersija ir aptuveni 1,6 reizes lielāka nekā vidējā aritmētiskā dispersija. Tāpēc efektīvāks novērtējums ir izlases vidējais aritmētiskais.

Piemērs Nr.1. Atrodiet objektīvu kāda nejauša lieluma mērījumu dispersijas novērtējumu, izmantojot vienu ierīci (bez sistemātiskām kļūdām), kuras mērījumu rezultāti (mm): 13,15,17.
Risinājums. Tabula rādītāju aprēķināšanai.

x|x - x av |(x - x vid.) 2
13 2 4
15 0 0
17 2 4
45 4 8

Vienkāršs vidējais aritmētiskais(neobjektīvs matemātiskās cerības novērtējums)


Izkliede- raksturo dispersijas mēru ap tā vidējo vērtību (dispersijas mērs, t.i. novirze no vidējā - neobjektīvs novērtējums).


Neobjektīvs dispersijas novērtētājs- konsekvents dispersijas novērtējums (labotā dispersija).

Piemērs Nr.2. Atrodiet objektīvu aprēķinu matemātiskajai cerībai uz noteikta nejauša lieluma mērījumiem ar vienu ierīci (bez sistemātiskām kļūdām), kuras mērījumu rezultāti (mm): 4,5,8,9,11.
Risinājums. m = (4+5+8+9+11)/5 = 7,4

Piemērs Nr.3. Atrodiet laboto dispersiju S2 izlases lielumam n=10, ja izlases dispersija ir D = 180.
Risinājums. S 2 = n*D/(n-1) = 10*180/(10-1) = 200

Saistītie raksti