Mit lehet feltárni varianciaanalízissel. Varianciaanalízis. ANOVA és Student és Fisher tesztek: melyik a jobb?

Varianciaanalízis

1. A varianciaanalízis fogalma

Varianciaanalízis egy tulajdonság variabilitásának elemzése bármely szabályozott változó tényező hatására. A külföldi szakirodalomban a varianciaanalízist gyakran ANOVA-nak nevezik, amelyet variabilitásanalízisnek (Analysis of Variance) fordítanak.

ANOVA probléma abban áll, hogy elkülönítjük egy tulajdonság általános variabilitását, és elkülönítjük az eltérő fajtát:

a) a vizsgált független változók mindegyikének hatása miatti változékonyság;

b) a vizsgált független változók kölcsönhatásából adódó változékonyság;

c) az összes többi ismeretlen változó miatti véletlenszerű változékonyság.

A vizsgált változók hatásából és kölcsönhatásukból adódó variabilitás korrelál a véletlen variabilitással. Ennek a kapcsolatnak a mutatója a Fisher-féle F-teszt.

Az F-kritérium számítási képlete tartalmazza a varianciabecsléseket, vagyis az attribútum eloszlási paramétereit, ezért az F-kritérium parametrikus kritérium.

Minél inkább egy tulajdonság változékonysága a vizsgált változóknak (tényezőknek) vagy azok kölcsönhatásának köszönhető, annál nagyobb empirikus kritériumértékek.

Nulla a varianciaanalízis hipotézise kimondja, hogy a vizsgált effektív jellemző átlagértékei minden fokozatban azonosak.

Alternatív a hipotézis kimondja, hogy a kapott jellemző átlagértékei a vizsgált tényező különböző fokozataiban eltérőek.

A varianciaanalízis lehetővé teszi egy jellemző változásának megállapítását, de nem jelzi irány ezeket a változásokat.

Kezdjük a varianciaanalízis vizsgálatát a legegyszerűbb esettel, amikor csak a műveletét vizsgáljuk egy változó (egy tényező).

2. Egyirányú varianciaanalízis független mintákra

2.1. A módszer célja

Az egytényezős varianciaanalízis módszerét olyan esetekben alkalmazzák, amikor egy effektív jellemző változásait a változó feltételek vagy egy tényező gradációi hatására vizsgálják. A módszer ezen változatában a faktor egyes fokozatainak befolyása az különböző tantárgyak mintái. A faktornak legalább három fokozatának kell lennie. (Lehet két fokozat, de ebben az esetben nem tudunk nemlineáris függőséget megállapítani, és ésszerűbbnek tűnik az egyszerűbbek alkalmazása).

Az ilyen típusú elemzés nem paraméteres változata a Kruskal-Wallis H teszt.

Hipotézisek

H 0: A faktor fokozatok (különböző feltételek) közötti különbségek nem nagyobbak, mint az egyes csoportokon belüli véletlenszerű különbségek.

H 1: A faktor fokozatok (különböző feltételek) közötti különbségek nagyobbak, mint az egyes csoportokon belüli véletlenszerű különbségek.

2.2. A független minták egyirányú varianciaanalízisének korlátai

1. Az egytényezős varianciaanalízishez a faktor legalább három fokozata és minden fokozatban legalább két alany szükséges.

2. Az eredményül kapott jellemzőnek normális eloszlásúnak kell lennie a vizsgált mintában.

Igaz, általában nincs feltüntetve, hogy a jellemző eloszlásáról a teljes vizsgált mintában, vagy annak a diszperziós komplexumot alkotó részében beszélünk.

3. Példa egy probléma megoldására független minták egyirányú varianciaanalízisének módszerével a következő példa segítségével:

Három különböző, hat tantárgyból álló csoport kapott tíz szóból álló listát. A szavakat az első csoportnak alacsony sebességgel - 1 szó / 5 másodperc, a második csoport átlagos sebességgel - 1 szó / 2 másodperc, a harmadik csoport pedig nagy sebességgel - 1 szó / másodperc. A reprodukciós teljesítmény várhatóan a szóbemutató sebességétől függ. Az eredményeket a táblázat tartalmazza. 1.

A reprodukált szavak száma Asztal 1

Tárgy sz.

alacsony sebesség

átlagsebesség

Magassebesség

teljes összeg

H 0: Különbségek a szóalkotási terjedelemben között csoportok nem hangsúlyosabbak, mint a véletlenszerű különbségek belül mindegyik csoport.

H1: A szótermelési volumen különbségei között csoportok kifejezettebbek, mint a véletlenszerű különbségek belül mindegyik csoport. táblázatban bemutatott kísérleti értékek felhasználásával. 1, akkor meghatározunk néhány értéket, amelyek szükségesek lesznek az F-kritérium kiszámításához.

Az egyirányú varianciaanalízis főbb mennyiségeinek kiszámítását a táblázat tartalmazza:

2. táblázat

3. táblázat

Műveletsorozat az egyirányú varianciaanalízisben független minták esetén

Az ebben és az azt követő táblázatokban gyakran előforduló SS megjelölés a „négyzetösszeg” rövidítése. Ezt a rövidítést leggyakrabban a fordított forrásokban használják.

SS tény a jellemzőnek a vizsgált tényező hatására bekövetkező változékonyságát jelenti;

SS általában- a tulajdonság általános változékonysága;

S C.A.-nem figyelembe vett tényezők miatti változékonyság, „véletlen” vagy „maradék” változékonyság.

KISASSZONY- „átlag négyzet”, vagy a négyzetösszeg matematikai elvárása, a megfelelő SS átlagértéke.

df - a szabadságfokok száma, amelyet a nem paraméteres kritériumok figyelembevételével görög betűvel jelöltünk v.

Következtetés: H 0 elutasítva. H 1 elfogadott. A csoportok közötti szófelidézési különbségek nagyobbak voltak, mint az egyes csoportokon belüli véletlenszerű különbségek (α=0,05). Tehát a szavak bemutatásának sebessége befolyásolja reprodukciójuk mennyiségét.

Az alábbiakban bemutatunk egy példát a probléma Excelben való megoldására:

Kiinduló adatok:

A Tools->Data Analysis->One-way ANOVA paranccsal a következő eredményeket kapjuk:

A varianciaanalízis egy effektív jellemző variabilitásának elemzése bármely szabályozott változó tényező hatására. (A külföldi szakirodalomban ANOVA – „Analisis of Variance”) néven szerepel.

Az eredményül kapott jellemzőt függő jellemzőnek is nevezik, a befolyásoló tényezőket pedig független jellemzőknek.

A módszer korlátai: független jellemzők nominális, ordinális vagy metrikus skálán mérhetők, függőek - csak metrikus skálán. A varianciaanalízis elvégzéséhez a faktorjellemzők több fokozatát azonosítják, és az összes mintaelemet ezeknek a fokozatoknak megfelelően csoportosítják.

Hipotézisek megfogalmazása varianciaanalízisben.

Nullhipotézis: „Az eredményül kapott jellemző átlagértékei a faktor minden körülményei között (vagy a faktor gradációiban) azonosak.”

Alternatív hipotézis: "Az effektív tulajdonság átlagértékei a faktor különböző feltételei között eltérőek."

A varianciaanalízis több kategóriába sorolható a következőktől függően:

a figyelembe vett független tényezők számáról;

tényezőknek kitett kimeneti változók számáról;

a megszerzés természetéről, természetéről és az összehasonlított értékminták közötti kapcsolat meglétéről.

Ha van egy tényező, amelynek hatását vizsgáljuk, a varianciaanalízist egytényezős elemzésnek nevezzük, és két típusra osztható:

- Nem rokon (azaz eltérő) minták elemzése . Például a válaszadók egyik csoportja csendes körülmények között oldja meg a problémát, a második - egy zajos szobában. (Ebben az esetben egyébként a nullhipotézis így hangzana: „az ilyen típusú problémák megoldásának átlagos ideje egyforma lesz csendes és zajos helyiségben”, vagyis nem függ a zajtól tényező.)

- Kapcsolt mintaelemzés , azaz két mérést végeztek ugyanazon a válaszadói csoporton, eltérő körülmények között. Ugyanez a példa: az első alkalommal csendben oldották meg a problémát, a második alkalommal - hasonló probléma - zajos interferencia körülményei között. (A gyakorlatban az ilyen kísérletekhez óvatosan kell hozzáállni, mert szóba jöhet az el nem számolt „tanulási képesség” tényező, amelynek hatását a kutató a körülmények változásának, nevezetesen a zajnak tulajdonítja.)

Ha két vagy több tényező egyidejű hatását vizsgáljuk, akkor azzal foglalkozunk többváltozós varianciaanalízis, amely mintatípus szerint is felosztható.

Ha több változót is befolyásolnak a tényezők, akkor beszélünk többváltozós elemzés . A többváltozós varianciaanalízist csak akkor érdemes elvégezni az egyváltozós elemzéssel szemben, ha a függő változók nem függetlenek egymástól és korrelálnak egymással.

Általánosságban elmondható, hogy a varianciaanalízis feladata egy tulajdonság általános variabilitásának három konkrét változatának azonosítása:

    a vizsgált független változók (tényezők) mindegyikének hatása által okozott változékonyság.

    variabilitás a vizsgált független változók kölcsönhatása miatt.

    véletlenszerű variabilitás minden figyelembe nem vett körülmény miatt.

A vizsgált változók hatása és kölcsönhatása által okozott variabilitás értékeléséhez a megfelelő variabilitási mutató és a véletlen variabilitás arányát számítjuk ki. Ennek a kapcsolatnak a mutatója a Fisher F teszt.

Minél nagyobb egy jellemző variabilitása a befolyásoló tényezők hatásából vagy azok kölcsönhatásából, annál magasabbak a kritérium tapasztalati értékei .

A kritérium kiszámításának képletében szórásbecsléseket tartalmaz, ezért ez a módszer a paraméteresek kategóriájába tartozik.

A független minták egyirányú varianciaanalízisének nem-paraméteres analógja a Kruskal-Wallace teszt. Hasonlít a Mann-Whitney teszthez két független minta esetében, azzal a különbséggel, hogy mindegyikhez összegzi a rangokat. csoportok.

Ezenkívül a medián kritérium használható a varianciaanalízisben. Használata során minden csoportra meghatározzák az összes csoportra számított mediánt meghaladó és a mediánnál kisebb megfigyelések számát, amely után kétdimenziós kontingenciatáblázatot készítenek.

A Friedman-teszt a páros t-próba nem-paraméteres általánosítása ismételt mérésű minták esetében, amikor az összehasonlítandó változók száma kettőnél több.

A korrelációs elemzéssel ellentétben a varianciaanalízis során abból a feltételezésből indul ki a kutató, hogy egyes változók befolyásolóként működnek (úgynevezett faktorok vagy független változók), míg másokat (eredményjellemzőket vagy függő változókat) ezek a tényezők befolyásolnak. Bár ez a feltevés a matematikai számítási eljárások alapjául szolgál, mégis óvatosságot igényel az ok-okozati következtetések levonásakor.

Például, ha felállítunk egy hipotézist egy tisztviselői munka sikerének a H faktortól való függőségére vonatkozóan (Cattell szerint társadalmi bátorság), akkor ennek az ellenkezője sem kizárt: a válaszadó társadalmi bátorsága úgy keletkezhet (növekszik) munkája sikerének eredménye – ez egyrészt. Másrészt tisztában kell lennünk azzal, hogy pontosan hogyan is mérték a „sikert”? Ha nem objektív jellemzőkre (a ma divatos „eladási mennyiségek” stb.), hanem a kollégák szakértői értékelésére épül, akkor fennáll annak a lehetősége, hogy a „sikert” viselkedési vagy személyes jellemzők (akarati, kommunikációs, az agresszivitás külső megnyilvánulásai stb.).

A szóban forgó varianciaanalízis sémája a következőktől függően különbözik: a) annak a jellemzőnek a jellege, amellyel a sokaságot csoportokra (mintákra) osztják, b) azon jellemzők számát, amelyek alapján a sokaságot csoportokra (mintákra) osztják; c) a mintavétel módjáról.

Funkcióértékek. amely a populációt csoportokra bontja, képviselheti az általános populációt vagy egy ahhoz közeli populációt. Ebben az esetben a varianciaanalízis végrehajtásának sémája megfelel a fent tárgyaltnak. Ha a különböző csoportokat alkotó jellemző értékei egy mintát képviselnek az általános sokaságból, akkor a null- és alternatív hipotézisek megfogalmazása megváltozik. A nullhipotézis az, hogy a csoportok között különbségek vannak, vagyis a csoportátlagok némi eltérést mutatnak. Egy alternatív hipotézis az, hogy nincs fluktuáció. Nyilvánvaló, hogy a hipotézisek ilyen megfogalmazásával nincs ok az eltérések összehasonlításának eredményeinek pontosítására.

Amikor a csoportosítási jellemzők száma például 2-re nő, először a nulla és ennek megfelelően az alternatív hipotézisek száma nő. Ebben az esetben az első nullhipotézis az első csoportosítási jellemző csoportjainak átlagai közötti különbségek hiányáról, a második nullhipotézis a második csoportosítási jellemző csoportjainak átlagai közötti különbségek hiányáról, végül a harmadik nullhipotézis a tényezők (csoportosítási jellemzők) kölcsönhatási hatásának hiányáról beszél.

Az interakciós hatás alatt a kapott jellemző értékének olyan változását értjük, amely nem magyarázható két tényező összhatásával. A három felterjesztett hipotézispár teszteléséhez ki kell számítani a Fisher F-teszt három tényleges értékét, amely viszont feltételezi a teljes variációtérfogat dekompozíciójának következő változatát

Az F-kritérium megszerzéséhez szükséges szórásokat ismert módon kapjuk meg, ha elosztjuk a variációs térfogatokat a szabadsági fokok számával.

Mint tudják, a minták lehetnek függőek és függetlenek. Ha a minták függőek, akkor a teljes variáció mennyiségében meg kell különböztetni az ún.
. Ha nincs elkülönítve, akkor ez a variáció jelentősen növelheti a csoporton belüli variációt (
), ami torzíthatja a varianciaanalízis eredményeit.

Ismétlő kérdések

17-1. Mi a specifikációja a varianciaanalízis eredményeinek?

17-2. Milyen esetben használják a Tukey-féle Q tesztet a specifikációhoz?

17-3. Mi a különbség az első, második és így tovább rendelések között?

17-4. Hogyan lehet megtalálni a Tukey-féle Q teszt tényleges értékét?

17-5. Milyen hipotéziseket állítanak fel az egyes különbségekkel kapcsolatban?

17-6. Mitől függ a Tukey-féle Q teszt táblázatértéke?

17-7. Mi lenne a nullhipotézis, ha a csoportosítási jellemző szintjei reprezentálják a mintát?

17-8 Hogyan számítják ki a teljes variáció mértékét az adatok két jellemző szerinti csoportosítása során?

17-9. Milyen esetben azonosítható az ismétlés általi eltérés (
) ?

Összegzés

A varianciaanalízis eredményeinek konkretizálásának megfontolt mechanizmusa lehetővé teszi, hogy kész formát adjunk. Vegye figyelembe a korlátozásokat a Tukey-féle Q-teszt használatakor. Az anyag felvázolta a varianciaanalízis modellek osztályozásának alapelveit is. Hangsúlyozni kell, hogy ezek csak elvek. Az egyes modellek jellemzőinek részletes tanulmányozása külön, mélyreható tanulmányt igényel.

Tesztfeladatok az előadáshoz

Milyen statisztikai jellemzőket feltételez az ANOVA?

    Két eltéréssel kapcsolatban

    Egy átlaghoz viszonyítva

    Több átlaghoz képest

    Egy eltéréshez viszonyítva

Mi az alternatív hipotézis tartalma a varianciaanalízisben?

    Az összehasonlított eltérések nem egyenlőek egymással

    Az összes összehasonlított átlag nem egyenlő egymással

    Legalább két általános eszköz nem egyenlő egymással

    A csoportok közötti variancia nagyobb, mint a csoporton belüli variancia

Milyen szignifikanciaszinteket használnak leggyakrabban a varianciaanalízis során?

Ha a csoporton belüli variáció nagyobb, mint a csoportok közötti variáció, akkor folytassuk a varianciaanalízist, vagy azonnal fogadjuk el a H0-t vagy az NA-t?

1. Folytassuk a szükséges eltérések meghatározásával?

2. Egyet kell értenünk H0-val

3. Egyet kell értened NA-val

Ha a csoporton belüli variancia megegyezik a csoportok közötti variancia értékével, mit tegyen a varianciaanalízist végző személy?

    Egyetértünk azzal a nullhipotézissel, hogy az általános átlagok egyenlőek

    Egyetért azzal az alternatív hipotézissel, hogy van legalább egy pár olyan eszköz, amely nem egyenlő egymással

Milyen variancia legyen mindig a számlálóban Fisher-féle F-próba kiszámításakor?

    Csak csoporton belül

    Mindenesetre csoportközi

    Csoportközi, ha nagyobb, mint csoporton belüli

Mi legyen a Fisher-féle F-teszt tényleges értéke?

    Mindig kevesebb, mint 1

    Mindig több mint 1

    egyenlő vagy nagyobb, mint 1

Mitől függ a Fisher-féle F-teszt táblázati értéke?

1. Az elfogadott szignifikancia szintről

2. A teljes variáció szabadságfokainak számáról

3. A csoportok közötti variáció szabadságfokainak számáról

4. A csoporton belüli variáció szabadságfokainak számáról

5. A Fisher-féle F-próba tényleges értékéből?

Ha minden csoportban egyenlő szórással növeljük a megfigyelések számát, akkor nő az elfogadás valószínűsége......

1.Null hipotézis

2. Alternatív hipotézis

3. Nem befolyásolja sem a null, sem az alternatív hipotézis elfogadását

Mi értelme pontosítani a varianciaanalízis eredményeit?

    Ellenőrizze, hogy a varianciaszámításokat megfelelően végezték-e el

    Határozza meg, hogy az általános átlagok közül melyik vált egyenlőnek egymással!

    Határozza meg, hogy az általános átlagok közül melyek nem egyenlőek egymással!

Igaz-e az állítás: „A varianciaanalízis eredményeinek megadásakor minden általános átlag egyenlőnek bizonyult egymással?”

    Lehet igaz vagy hamis

    Ez nem helyes, ennek oka lehet a számítások hibája

Lehetséges-e a varianciaanalízis megadásakor arra a következtetésre jutni, hogy nem minden általános átlag egyenlő egymással?

1. Nagyon is lehetséges

2. Kivételes esetekben lehetséges

3. Elvileg lehetetlen.

4. Csak akkor lehetséges, ha a számítások során hibák történtek

Ha a nullhipotézist elfogadtuk a Fisher-féle F-teszt szerint, szükséges-e varianciaanalízis?

1.Kötelező

2.Nem kötelező

3. A varianciaanalízist végző személy belátása szerint

Milyen esetben használják a Tukey-tesztet a varianciaanalízis eredményeinek meghatározására?

1. Ha a megfigyelések száma csoportokban (mintákban) azonos

2. Ha a megfigyelések száma csoportokban (mintákban) eltérő

3. Ha vannak egyenlő és nem egyenlő számú minták,

lustaság

Mit jelent az NSR a Tukey-kritériumon alapuló varianciaanalízis eredményeinek megadásakor?

1. Az átlagos hiba és a kritérium tényleges értékének szorzata

2. Az átlagos hiba szorzata a kritérium táblázatos értékével

3. A mintaátlagok közötti különbségek aránya

átlagos hiba

4. A mintaátlagok közötti különbség

Ha a mintapopulációt 2 jellemző szerint csoportokra osztjuk, akkor legalább hány forrásra kell felosztani a jellemző teljes variációját?

Ha a mintákból (csoportokból) származó megfigyelések függőek, hány forrásra kell felosztani a teljes variációt (egy csoportosítási jellemző)?

Mi a csoportok közötti eltérés forrása (oka)?

    Szerencsejáték

    A szerencsejáték és a tényező együttes hatása

    Tényező(k) hatása

    Az ANOVA után kiderül

Mi a csoporton belüli eltérések forrása (oka)?

1. Szerencsejáték

2. A szerencsejáték és a tényező együttes fellépése

3. A tényező(k) működése

4. Varianciaanalízis elvégzése után derül ki

Milyen módszert alkalmazunk a forrásadatok konvertálására, ha a jellemző értékeket részesedésekben fejezzük ki?

    Logaritmus

    Gyökér kivonás

    Phi átalakulás

8. előadás Korreláció

annotáció

A jellemzők közötti kapcsolat vizsgálatának legfontosabb módszere a korrelációs módszer. Ez az előadás feltárja ennek a módszernek a tartalmát, megközelítéseit ennek a kapcsolatnak az analitikus kifejezésére. Különös figyelmet fordítanak az olyan specifikus mutatókra, mint a kommunikáció szorosságának mutatói

Kulcsszavak

Korreláció. Legkisebb négyzet alakú módszer. Regressziós együttható. Determinációs és korrelációs együtthatók.

Lefedett kérdések

    Funkcionális és korrelációs kapcsolat

    A korrelációs kommunikációs egyenlet felépítésének szakaszai. Egyenletegyütthatók értelmezése

    A kapcsolat szorosságának mutatói

    A kiválasztott kapcsolódási mutatók értékelése

1. moduláris egység A korreláció lényege. Korrelációs kommunikációs egyenlet felépítésének szakaszai, egyenletegyütthatók értelmezése.

Az 1. moduláris egység tanulásának célja és célkitűzései a korrelációs kapcsolat jellemzőinek megértésében áll. a kommunikációs egyenlet felépítésére szolgáló algoritmus elsajátítása, az egyenlet együtthatóinak tartalmának megértése.

      A korreláció lényege

A természeti és társadalmi jelenségekben kétféle összefüggés létezik - funkcionális kapcsolatok és korrelációs kapcsolatok. Funkcionális kapcsolat esetén minden argumentumérték szigorúan meghatározott (egy vagy több) függvényértéknek felel meg. A funkcionális összefüggésre példa a kerület és a sugár közötti összefüggés, amelyet az egyenlet fejez ki.
. Minden sugárérték r a kerület egyetlen értékének felel meg L . Korrelációs összefüggésben egy faktorjellemző minden értéke az eredő jellemző több nem teljesen meghatározott értékének felel meg. Példák a korrelációs összefüggésekre: egy személy súlya (eredményes tulajdonság) és magassága (faktoriális tulajdonság), a kijuttatott műtrágya mennyisége és a termelékenység, valamint a kínált áruk ára és mennyisége közötti kapcsolat. A korreláció kialakulásának forrása az a tény, hogy a való életben általában egy effektív tulajdonság értéke sok tényezőtől függ, beleértve azokat is, amelyek véletlenszerűen változnak. Például egy személy azonos súlya kortól, nemtől, táplálkozástól, foglalkozástól és sok más tényezőtől függ. Ugyanakkor nyilvánvaló, hogy általában véve a növekedés a döntő tényező. E körülményekre tekintettel a korrelációs kapcsolatot olyan hiányos kapcsolatként kell meghatározni, amely csak átlagosan nagy számú megfigyelés esetén állapítható meg és értékelhető.

1.2 A korrelációs kommunikációs egyenlet felépítésének szakaszai.

A funkcionális kapcsolathoz hasonlóan a korrelációs kapcsolatot is kapcsolati egyenlet fejezi ki. Felépítéséhez egymás után végig kell mennie a következő lépéseken (szakaszokon).

Először is meg kell értenie az ok-okozati összefüggéseket, meg kell találnia a jelek alárendeltségét, vagyis melyik az ok (faktoriális jel), és melyik az okozat (eredményjelek). A jellemzők közötti ok-okozati összefüggéseket az alany elmélete állapítja meg, ahol a korrelációs módszert alkalmazzák. Például az „emberi anatómia” tudománya lehetővé teszi, hogy megmondjuk, mi a forrása a súly és a magasság közötti kapcsolatnak, melyik jel a tényező, melyik az eredmény, a „közgazdaságtan” tudománya feltárja a testsúly és a magasság közötti összefüggést. Az ár és a kínálat közötti kapcsolat megállapítja, hogy mi és melyik szakaszban az ok és mi az okozat. Ilyen előzetes elméleti indoklás nélkül a további eredmények értelmezése nehézkes, esetenként abszurd következtetésekhez vezethet.

Az ok-okozati összefüggések meglétének megállapítása után ezeket a kapcsolatokat formalizálni kell, azaz kommunikációs egyenletekkel kell kifejezni, és először ki kell választani az egyenlet típusát. Az egyenlet típusának kiválasztásához számos technika ajánlható. A korrelációs módszert alkalmazó tantárgy elméletéhez lehet fordulni, mondjuk az „agrokémia” tudománya már választ kapott arra a kérdésre, hogy melyik egyenlettel kell kifejezni az összefüggést: termés - műtrágyák. Ha nincs ilyen válasz, akkor egy egyenlet kiválasztásához néhány empirikus adatot kell használni, és ennek megfelelően kell azokat feldolgozni. Rögtön le kell szögezni, hogy az empirikus adatok alapján választott egyenlettípust egyértelműen meg kell érteni, hogy ezzel az egyenlettípussal leírható a felhasznált adatok kapcsolata. Ezen adatok feldolgozásának fő módja a grafikonok készítése, ahol a faktorkarakterisztika értékei az abszcissza tengelyen, az eredő karakterisztika lehetséges értékei pedig az ordináta tengelyen vannak ábrázolva. Mivel definíció szerint egy faktorattribútum ugyanazon értéke az eredő attribútum sok bizonytalan értékének felel meg, a fenti műveletek eredményeként egy bizonyos pontkészletet kapunk, amelyet korrelációs mezőnek nevezünk. A korrelációs mező általános megjelenése számos esetben lehetővé teszi az egyenlet lehetséges alakjáról feltételezést A számítástechnika modern fejlődésével az egyenletválasztás egyik fő módszere a különböző egyenlettípusok felsorolása, és a legjobbat választjuk, mint amelyik a legmagasabb determinációs együtthatót adja, a beszédet az alábbiakban tárgyaljuk. Mielőtt rátérnénk a számításokra, ellenőrizni kell, hogy az egyenlet összeállításához felhasznált empirikus adatok mennyire tesznek eleget bizonyos követelményeknek. A követelmények a tényezők jellemzőire és az adatok összességére vonatkoznak. A faktorjellemzőknek, ha több van belőlük, függetlennek kell lenniük egymástól. Ami a teljességet illeti, először is homogénnek kell lennie

(a homogenitás fogalmáról korábban volt szó), másodszor pedig elég nagy. Minden tényezőjellemzőnek legalább 8-10 megfigyeléssel kell rendelkeznie.

Az egyenlet kiválasztása után a következő lépés az egyenlet együtthatóinak kiszámítása. Az egyenletegyütthatók kiszámítása leggyakrabban a legkisebb négyzetek módszerével történik. Korrelációs szempontból a legkisebb négyzetek módszere abból áll, hogy megkapjuk az egyenlet együtthatóit úgy, hogy
=min, vagyis úgy, hogy az eredményül kapott jellemző tényleges értékeinek eltéréseinek négyzetes összege ( ) a ( ) egyenlettel számítottakból ) volt a minimális érték. Ezt a követelményt egy jól ismert, úgynevezett normálegyenletrendszer felépítésével és megoldásával valósítjuk meg. Ha a közötti korreláció egyenleteként yÉs x az egyenes egyenletét választjuk
, ahol a normálegyenletrendszer, mint ismeretes, a következő lesz:

Ennek a rendszernek a megoldása a aÉs b , megkapjuk az együtthatók szükséges értékeit. Az együtthatók számításának helyességét az egyenlőség ellenőrzi

Mire használják a varianciaanalízist? A varianciaanalízis célja bármely minőségi vagy mennyiségi tényező szignifikáns befolyásának megléte vagy hiánya a vizsgált eredő jellemző változásaira gyakorolt ​​hatás vizsgálata. Ehhez gradációs osztályokra (vagyis csoportokra) bontják azt a faktort, amelyről úgy gondolják, hogy van vagy nincs szignifikáns hatása, és az eszközök közötti szignifikancia vizsgálatával megállapítják, hogy a faktor hatása azonos-e. faktor fokozatainak megfelelő adatsorokban. Példák: vizsgálják a vállalkozás nyereségének függését a felhasznált nyersanyagok típusától (ekkor a fokozatossági osztályok a nyersanyagfajták), az egy termelési egységre jutó termelési költség függését a vállalkozás részlegének méretétől (majd a fokozatos osztályok az osztály méretének jellemzői: nagy, közepes, kicsi).

A fokozatos osztályok (csoportok) minimális száma kettő. Az érettségi osztályok lehetnek minőségi vagy mennyiségi jellegűek.

Miért nevezik a varianciaanalízist varianciaanalízisnek? A varianciaanalízis két variancia közötti kapcsolatot vizsgálja. A diszperzió, mint tudjuk, az adatok átlagérték körüli szórásának jellemzője. Az első a faktor hatásával magyarázható diszperzió, amely a faktor (csoportok) fokozatai közötti értékek szórását jellemzi az összes adat átlaga körül. A második a megmagyarázhatatlan variancia, amely az adatok gradációkon (csoportokon) belüli szóródását jellemzi maguknak a csoportoknak az átlagértékei körül. Az első varianciát csoportok közöttinek, a másodikat csoporton belülinek nevezhetjük. Ezen eltérések arányát tényleges Fisher-hányadosnak nevezzük, és a Fisher-hányados kritikus értékével hasonlítják össze. Ha a tényleges Fisher-arány nagyobb, mint a kritikus, akkor a fokozatossági osztályok átlagai eltérnek egymástól, és a vizsgált tényező jelentősen befolyásolja az adatok változását. Ha ez kisebb, akkor az átlagos fokozatossági osztályok nem térnek el egymástól, és a tényezőnek nincs jelentős befolyása.

Hogyan fogalmazzák meg, fogadják el és utasítják el a hipotéziseket az ANOVA-ban? A varianciaanalízis során egy vagy több tényező összhatásának fajlagos súlyát határozzuk meg. Egy tényező befolyásának jelentőségét hipotézisek tesztelésével határozzuk meg:

  • H0 : μ 1 = μ 2 = ... = μ a, Ahol a- fokozatos osztályok száma - minden fokozati osztálynak azonos az átlagértéke,
  • H1 : Nem mind μ én egyenlő - nem minden fokozati osztálynak azonos az átlagértéke.

Ha egy faktor befolyása nem szignifikáns, akkor ennek a faktornak a fokozatossági osztályai közötti különbség sem szignifikáns és a varianciaanalízis során a nullhipotézis H0 nincs elutasítva. Ha a faktor befolyása szignifikáns, akkor a nullhipotézis H0 elutasítva: nem minden fokozati osztálynak azonos az átlagértéke, vagyis a fokozatos osztályok közötti lehetséges eltérések között egy vagy több szignifikáns.

A varianciaanalízis néhány további fogalma. A varianciaanalízis statisztikai komplexuma empirikus adatok táblázata. Ha a fokozatok minden osztályában ugyanannyi lehetőség van, akkor a statisztikai komplexumot homogénnek (homogénnek), ha az opciók száma eltérő - heterogénnek (heterogénnek) nevezzük.

A vizsgált faktorok számától függően megkülönböztetünk egy-, két- és többtényezős varianciaanalízist.

Egytényezős varianciaanalízis: a módszer lényege, képletek, példák

A módszer lényege, képlet

azon a tényen alapul, hogy egy statisztikai komplexum eltéréseinek négyzetes összege komponensekre osztható:

SS = SS a+ SS e,

SS

SSa a az eltérések négyzetes összege,

SSe- a négyzetes eltérések megmagyarázhatatlan összege vagy a hibanégyzetes eltérések összege.

Ha át nén jelölje meg az egyes fokozati osztályokban (csoportokban) a lehetőségek számát és a a faktor(csoportok) gradációinak teljes száma, majd a megfigyelések összesített száma és a következő képletek kaphatók:

a négyzetes eltérések teljes száma: ,

faktor befolyásával magyarázható a az eltérések négyzetes összege: ,

az eltérések négyzetének megmagyarázhatatlan összege vagy a hibanégyzetes eltérések összege: ,

- a megfigyelések általános átlaga,

(csoport).

Kívül,

ahol a faktor (csoport) gradáció varianciája.

A statisztikai komplexum adatainak egyirányú varianciaanalíziséhez meg kell találnia a tényleges Fisher-hányadot - a faktor (csoportközi) és a megmagyarázhatatlan variancia (csoporton belüli) hatásával magyarázott variancia arányát:

és hasonlítsa össze a Fisher-kritikus értékkel.

Az eltérések kiszámítása a következőképpen történik:

Magyarázott eltérés,

Megmagyarázhatatlan eltérés

va = a − 1 - a megmagyarázott variancia szabadságfokainak száma,

ve = na - a megmagyarázhatatlan eltérés szabadságfokainak száma,

v = n

A Fisher-hányados kritikus értéke a szignifikanciaszint és a szabadságfok bizonyos értékeivel statisztikai táblázatokban található, vagy az MS Excel F.OBR függvényével számítható ki (az alábbi ábra nagyításához kattintson rá a bal egérgomb).


A funkció a következő adatok megadását igényli:

Valószínűség – szignifikancia szintje α ,

Degrees_freedom1 – a magyarázott variancia szabadságfokainak száma va,

Degrees_freedom2 - a megmagyarázhatatlan variancia szabadsági fokainak száma ve.

Ha a Fisher-hányados tényleges értéke nagyobb, mint a kritikus érték (), akkor a nullhipotézist a szignifikancia szinten elvetjük. α . Ez azt jelenti, hogy a faktor szignifikánsan befolyásolja az adatok változását, és az adat valószínűséggel függ a tényezőtől P = 1 − α .

Ha a Fisher-hányados tényleges értéke kisebb, mint a kritikus érték (), akkor a nullhipotézist nem lehet elvetni szignifikancia szinten. α . Ez azt jelenti, hogy a tényező valószínűséggel nem befolyásolja jelentősen az adatokat P = 1 − α .

Egyirányú ANOVA: Példák

1. példa Ki kell deríteni, hogy a felhasznált alapanyagok típusa befolyásolja-e a vállalkozás nyereségét. A faktor hat fokozatos osztályában (csoportjában) (1. típus, 2. típus stb.) 1000 egységnyi termék millió rubelben kifejezett nyereségére vonatkozó adatokat gyűjtenek 4 év alatt.

Nyersanyag típusa2014 2015 2016 2017
17,21 7,55 7,29 7,6
27,89 8,27 7,39 8,18
37,25 7,01 7,37 7,53
47,75 7,41 7,27 7,42
57,7 8,28 8,55 8,6
67,56 8,05 8,07 7,84
Átlagos
Diszperzió
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

a= 6 és minden osztályban (csoportban) ni=4 megfigyelések. A megfigyelések teljes száma n = 24 .

A szabadságfokok száma:

va = a − 1 = 6 − 1 = 5 ,

ve = na = 24 − 6 = 18 ,

v = n − 1 = 24 − 1 = 23 .

Számítsuk ki az eltéréseket:

.

.

Mivel a tényleges Fischer-arány nagyobb, mint a kritikus:

szignifikancia szinttel α = 0,05 arra a következtetésre jutunk, hogy a vállalkozás nyeresége a termelésben felhasznált alapanyagok típusától függően jelentősen eltér.

Vagy ami ugyanaz, elvetjük a fő hipotézist az átlagok egyenlőségéről minden faktorgradációs osztályban (csoportban).

Az imént vizsgált példában minden faktorgradációs osztálynak ugyanannyi opciója volt. De amint azt a bevezető részben említettük, a lehetőségek száma változhat. És ez semmiképpen sem bonyolítja a varianciaanalízis eljárását. Ez a következő példa.

2. példa Ki kell deríteni, hogy a termelési egységre jutó termelési költség függ-e a vállalati részleg méretétől. A faktor (egységméret) három fokozati osztályra (csoportra) oszlik: kicsi, közepes, nagy. Az ezeknek a csoportoknak megfelelő adatokat egy azonos típusú termék egy adott időszakra vonatkozó előállítási költségére vonatkozóan összegzik.

kicsiátlagosnagy
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
Átlagos58,6 54,0 51,0
Diszperzió128,25 65,00 107,60

Tényező fokozatos osztályok (csoportok) száma a= 3, megfigyelések száma osztályokban (csoportokban) n1 = 4 , n2 = 7 , n3 = 6 . A megfigyelések teljes száma n = 17 .

A szabadságfokok száma:

va = a − 1 = 2 ,

ve = na = 17 − 3 = 14 ,

v = n − 1 = 16 .

Számítsuk ki az eltérések négyzetes összegét:

Számítsuk ki az eltéréseket:

,

.

Számítsuk ki a tényleges Fisher-arányt:

.

A Fisher-hányados kritikus értéke:

Mivel a Fisher-mutató tényleges értéke kisebb, mint a kritikus: , arra a következtetésre jutottunk, hogy a vállalati részleg mérete nincs jelentős hatással a termelési költségekre.

Illetve, ami ugyanaz, 95%-os valószínűséggel elfogadjuk azt a fő hipotézist, hogy egy egységnyi termék előállításának átlagos költsége a vállalkozás kis-, közepes és nagy részlegeiben nem tér el jelentősen.

Egyirányú ANOVA MS Excelben

Az egyirányú varianciaanalízis az MS Excel eljárással végezhető el Egyirányú ANOVA. A felhasznált nyersanyagok típusa és a vállalkozás nyeresége közötti kapcsolatra vonatkozó adatok elemzésére használjuk az 1. példából.

Szolgáltatás/Adatelemzésés válasszon elemző eszközt Egyirányú ANOVA.

Az ablakban Beviteli intervallum jelölje meg az adatterületet (esetünkben ez $A$2:$E$7). Jelöljük a faktor csoportosítását - oszlopok vagy sorok (esetünkben sorok) szerint. Ha az első oszlop a faktorosztályok neveit tartalmazza, jelölje be a négyzetet Címkék az első oszlopban. Az ablakban Alpha jelezze a jelentőség szintjét α = 0,05 .

A második táblázat - Varianciaanalízis - a csoportok közötti és a csoporton belüli faktor értékekre és az összegekre vonatkozó adatokat tartalmazza. Ez az eltérések négyzetes összege (SS), a szabadsági fokok száma (df), a diszperzió (MS). Az utolsó három oszlop tartalmazza a Fisher-mutató (F), a p-szint (P-érték) és a Fisher-arány kritikus értékét (F-kritikus) tényleges értékét.

KISASSZONY F P-érték F crit
0,58585 6,891119 0,000936 2,77285
0,085017

Mivel a Fisher-hányados tényleges értéke (6,89) nagyobb, mint a kritikus (2,77), 95%-os valószínűséggel elvetjük az átlagos termelékenység egyenlőségére vonatkozó nullhipotézist minden típusú alapanyag felhasználása esetén, azaz arra a következtetésre jutottak, hogy a felhasznált nyersanyagok típusa hatással van a profitorientált vállalkozásokra.

Kéttényezős varianciaanalízis ismétlés nélkül: a módszer lényege, képletek, példa

Kéttényezős varianciaanalízissel ellenőrizzük az eredményül kapott karakterisztika lehetséges függését két tényezőtől: AÉs B. Akkor a- faktor fokozatok száma AÉs b- faktor fokozatok száma B. A statisztikai komplexumban a maradékok négyzetének összege három komponensre oszlik:

SS = SS a+ SS b+ SS e,

- az eltérések négyzetes összege,

- magyarázza a faktor befolyása A az eltérések négyzetes összege,

- magyarázza a faktor befolyása B az eltérések négyzetes összege,

- a megfigyelések általános átlaga,

A megfigyelések átlaga az egyes faktorok fokozataiban A ,

B .

A ,

A szórás a faktor befolyásával magyarázható B ,

va = a − 1 A ,

vb = b − 1 - a diszperziós szabadsági fokok száma a faktor hatásával magyarázva B ,

ve = ( a − 1)(b − 1)

v = ab− 1 - a szabadságfokok teljes száma.

Ha a tényezők nem függenek egymástól, akkor a faktorok jelentőségének meghatározásához két nullhipotézist és a megfelelő alternatív hipotézist állítunk fel:

faktorhoz A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Nem mind μ iA egyenlő;

faktorhoz B :

H0 : μ 1B = μ 2B = ... = μ aB,

H1 : Nem mind μ iB egyenlőek.

A

Egy tényező befolyásának meghatározása B, össze kell hasonlítania a tényleges Fischer-attitűdöt a kritikus Fischer-attitűddel.

α P = 1 − α .

α P = 1 − α .

Kétirányú ANOVA ismétlés nélkül: példa

3. példa Az információ a 100 kilométerenkénti átlagos üzemanyag-fogyasztásra vonatkozik literben, a motor méretétől és az üzemanyag típusától függően.

Meg kell vizsgálni, hogy az üzemanyag-fogyasztás függ-e a motor méretétől és az üzemanyag típusától.

Megoldás. Tényezőnek A fokozatos osztályok száma a= 3, a faktorra B fokozatos osztályok száma b = 3 .

Kiszámoljuk az eltérések négyzetes összegét:

,

,

,

.

Megfelelő eltérések:

,

,

.

A . Mivel a tényleges Fisher-arány kisebb, mint a kritikus, ezért 95%-os valószínűséggel elfogadjuk azt a hipotézist, hogy a motorméret nem befolyásolja az üzemanyag-fogyasztást. Ha azonban a szignifikanciaszintet választjuk α = 0,1, akkor a Fisher-arány tényleges értéke, majd 95%-os valószínűséggel elfogadhatjuk, hogy a motortérfogat befolyásolja az üzemanyag-fogyasztást.

Fisher tényleges aránya a faktorhoz B , a Fisher-hányados kritikus értéke: . Mivel a tényleges Fisher-arány nagyobb, mint a Fisher-arány kritikus értéke, ezért 95%-os valószínűséggel elfogadjuk, hogy az üzemanyag típusa befolyásolja a fogyasztását.

Kétirányú ANOVA ismétlések nélkül MS Excelben

Kéttényezős varianciaanalízis ismétlés nélkül elvégezhető az MS Excel eljárással. Az üzemanyag típusa és fogyasztása közötti kapcsolatra vonatkozó adatok elemzésére használjuk a 3. példából.

Az MS Excel menüben hajtsa végre a parancsot Szolgáltatás/Adatelemzésés válasszon elemző eszközt Kétirányú ANOVA ismétlés nélkül.

Az adatokat ugyanúgy töltjük ki, mint az egyirányú varianciaanalízis esetén.


Az eljárás eredményeként két táblázat jelenik meg. Az első táblázat a Totals. A faktorgradáció minden osztályára vonatkozó adatokat tartalmaz: megfigyelések száma, összérték, átlagérték és variancia.

A második táblázat - Varianciaanalízis - az eltérések forrásaira vonatkozó adatokat tartalmazza: sorok közötti szóródás, oszlopok közötti szóródás, hibaszórás, teljes szórás, eltérések négyzetösszege (SS), szabadsági fok (df), szóródás (MS). Az utolsó három oszlop tartalmazza a Fisher-mutató (F), a p-szint (P-érték) és a Fisher-arány kritikus értékét (F-kritikus) tényleges értékét.

KISASSZONY F P-érték F crit
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

Tényező A(motor lökettérfogat) sorokba van csoportosítva. Mivel a tényleges 5,28-as Fisher-arány kisebb, mint a kritikus 6,94-es, 95%-os valószínűséggel elfogadjuk, hogy az üzemanyag-fogyasztás nem függ a motor méretétől.

Tényező B(üzemanyag típusa) oszlopokba van csoportosítva. A tényleges 13,56-os Fisher-arány nagyobb, mint a 6,94-es kritikus arány, így 95%-os valószínűséggel elfogadjuk, hogy az üzemanyag-fogyasztás a típustól függ.

Kétfaktoros varianciaanalízis ismétlésekkel: a módszer lényege, képletek, példa

Az ismétlésekkel végzett kéttényezős varianciaanalízist nem csak az eredményül kapott karakterisztika két tényezőtől való lehetséges függésének ellenőrzésére használjuk: AÉs B, hanem a tényezők lehetséges kölcsönhatása is AÉs B. Akkor a- faktor fokozatok száma AÉs b- faktor fokozatok száma B, r- ismétlések száma. A statisztikai komplexumban a maradékok négyzetének összege négy komponensre oszlik:

SS = SS a+ SS b+ SS ab + SS e,

- az eltérések négyzetes összege,

- magyarázza a faktor befolyása A az eltérések négyzetes összege,

- magyarázza a faktor befolyása B az eltérések négyzetes összege,

- a tényezők kölcsönhatásának hatására magyarázható AÉs B az eltérések négyzetes összege,

- a négyzetes eltérések megmagyarázhatatlan összege vagy a hibanégyzetes eltérések összege,

- a megfigyelések általános átlaga,

- a megfigyelések átlaga az egyes faktorok fokozataiban A ,

- a megfigyelések átlagos száma az egyes faktorok fokozataiban B ,

A megfigyelések átlagos száma a faktor fokozatok egyes kombinációiban AÉs B ,

n = abr- a megfigyelések teljes száma.

Az eltérések kiszámítása a következőképpen történik:

A szórás a faktor befolyásával magyarázható A ,

A szórás a faktor befolyásával magyarázható B ,

- a tényezők kölcsönhatásával magyarázható variancia AÉs B ,

- megmagyarázhatatlan eltérés vagy hiba eltérés,

va = a − 1 - a diszperziós szabadsági fokok száma a faktor hatásával magyarázva A ,

vb = b − 1 - a diszperziós szabadsági fokok száma a faktor hatásával magyarázva B ,

vab = ( a − 1)(b − 1) - a tényezők kölcsönhatásával magyarázható variancia szabadságfokainak száma AÉs B ,

ve = ab(r − 1) - a megmagyarázhatatlan variancia vagy hibavariancia szabadságfokainak száma,

v = abr− 1 - a szabadságfokok teljes száma.

Ha a tényezők nem függenek egymástól, akkor a faktorok jelentőségének meghatározásához három nullhipotézist és a megfelelő alternatív hipotézist állítunk fel:

faktorhoz A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Nem mind μ iA egyenlő;

faktorhoz B :

A tényezők kölcsönhatásának hatásának meghatározása AÉs B, össze kell hasonlítania a tényleges Fischer-attitűdöt a kritikus Fischer-attitűddel.

Ha a tényleges Fisher-hányados nagyobb, mint a kritikus Fisher-arány, akkor a nullhipotézist el kell utasítani a szignifikancia szinten. α . Ez azt jelenti, hogy a faktor jelentősen befolyásolja az adatokat: az adat valószínűséggel függ a tényezőtől P = 1 − α .

Ha a tényleges Fisher-hányados kisebb, mint a kritikus Fisher-arány, akkor a nullhipotézist el kell fogadni a szignifikancia szinten. α . Ez azt jelenti, hogy a tényező valószínűséggel nem befolyásolja jelentősen az adatokat P = 1 − α .

Kétirányú ANOVA ismétlésekkel: példa

tényezők kölcsönhatásáról AÉs B: Fisher tényleges aránya kisebb a kritikusnál, ezért a reklámkampány és az adott üzlet interakciója nem jelentős.

Kétirányú ANOVA ismétlésekkel MS Excelben

A replikátumokkal végzett kétirányú varianciaanalízis az MS Excel eljárással végezhető el. A 4. példából származó adatok elemzésére használjuk a bolti bevételek, valamint az adott üzletválasztás és a reklámkampány közötti összefüggést.

Az MS Excel menüben hajtsa végre a parancsot Szolgáltatás/Adatelemzésés válasszon elemző eszközt Kétirányú ANOVA ismétlésekkel.

Az adatokat ugyanúgy töltjük ki, mint az ismétlés nélküli kéttényezős varianciaanalízisnél, azzal a kiegészítéssel, hogy a mintaablak sorszámánál meg kell adni az ismétlések számát.

Az eljárás eredményeként két táblázat jelenik meg. Az első táblázat három részből áll: az első kettő a két reklámkampánynak felel meg, a harmadik mindkét reklámkampány adatait tartalmazza. A táblázat oszlopai a második faktor összes gradációs osztályáról tartalmaznak információkat - tároló: megfigyelések száma, összérték, átlagérték és szóródás.

A második táblázat az eltérések négyzetösszegére (SS), a szabadsági fokok számára (df), a diszperzióra (MS), a Fisher-hányados tényleges értékére (F), a p-szintre (P-érték) ill. a Fisher-hányados kritikus értéke (F-kritérium) különböző ingadozási forrásokra: két tényező, amelyeket sorokban (minta) és oszlopokban adunk meg, a tényezők kölcsönhatása, a hiba (belül) és a teljes mutatók (összesen).

KISASSZONY F P-érték F crit
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

Tényezőnek B A tényleges Fisher-arány nagyobb, mint a kritikus arány, ezért 95%-os valószínűséggel jelentősen eltérnek az üzletek bevételei.

A tényezők kölcsönhatására AÉs B Fisher tényleges aránya a kritikusnál kisebb, ezért 95%-os valószínűséggel a reklámkampány és az adott üzlet kölcsönhatása nem jelentős.

Minden a "matematikai statisztika" témában

Ez a cikk a varianciaanalízist tárgyalja. Alkalmazásának jellemző vonásait elemzi, a varianciaanalízis módszereit, valamint a varianciaanalízis alkalmazásának feltételeit biztosítja. A módszer alkalmazásának szükségességét azonosították és indokolták. Az elvégzett kutatások alapján megadjuk a klasszikus varianciaanalízis állomásait.

  • Az autók javítás utáni minőségellenőrzésének biztosításának kérdéséről az autóipari szervizvállalkozásokban, figyelembe véve a tanúsítási rendszer követelményeit
  • Az információs technológiák logisztikában való megvalósításának problémái az orosz szervezetek példáján
  • Hullámgenerátor üzem hatékonyságának javítása
  • „Föld-Hold rendszer” oktatási és módszertani kézikönyv a Moodle távoktatási rendszerben

A varianciaanalízis fő célja az átlagok közötti különbségek jelentőségének vizsgálata. Ha egyszerűen két minta átlagait hasonlítja össze, a varianciaanalízis ugyanazt az eredményt adja, mint a közönséges elemzés. t- független minták tesztje (ez akkor történik, ha objektumok vagy megfigyelések két független csoportját hasonlítjuk össze) vagy t-teszt függő mintákra (ez az, ha két változót hasonlítunk össze ugyanazon objektum- vagy megfigyeléshalmazon).

A varianciaanalízis bizonyos tényezők miatt ezt a nevet viseli. Furcsának tűnhet, hogy az átlagok összehasonlítására szolgáló eljárást varianciaanalízisnek nevezik. Valójában ez azért van így, mert amikor két (vagy több) csoport átlaga közötti különbség statisztikai szignifikanciáját vizsgáljuk, valójában a minta varianciáit hasonlítjuk össze (vagyis elemezzük). A varianciaanalízis alapvető koncepcióját Fisher javasolta 1920-ban. Talán a természetesebb kifejezés a négyzetösszeg elemzése vagy a variációanalízis lenne, de a hagyományok miatt a varianciaanalízis kifejezést használják.

A varianciaanalízis a matematikai statisztika egy olyan módszere, amely a kísérleti adatokban való függőségek keresését célozza az átlagértékek eltéréseinek jelentőségének vizsgálatával. A t-teszttől eltérően lehetővé teszi három vagy több csoport átlagértékeinek összehasonlítását. R. Fischer dolgozta ki kísérleti vizsgálatok eredményeinek elemzésére. A szakirodalomban az ANOVA elnevezés is megtalálható. ANvarianciaanalízis).

A piackutatás során gyakran felmerül az eredmények összehasonlíthatóságának kérdése. Például az ország különböző régióiban egy termék fogyasztásával kapcsolatos felmérések során le kell vonni a következtetéseket, hogy a felmérés adatai mennyiben térnek el, vagy nem térnek el egymástól. Nincs értelme az egyes mutatókat összehasonlítani, ezért az összehasonlítást és az azt követő értékelési eljárást néhány átlagolt érték és az átlagolt értékeléstől való eltérések felhasználásával hajtják végre. A tulajdonság variációit tanulmányozzuk. A diszperziót a variáció mértékének tekinthetjük. A σ 2 diszperzió a változás mértéke, egy karakterisztika négyzetes eltéréseinek átlagaként definiálva.

A gyakorlatban gyakran felmerülnek általánosabb jellegű problémák – több mintapopuláció átlagai közötti különbségek szignifikánsságának ellenőrzése. Például fel kell mérni a különféle nyersanyagok hatását a gyártott termékek minőségére, meg kell oldani a műtrágya mennyiségének a mezőgazdasági hozamokra gyakorolt ​​hatását. Termékek.

Néha több populáció homogenitásának megállapítására is alkalmazzák a varianciaanalízist (ezek a sokaságok szórása feltételezés szerint megegyezik; ha a varianciaanalízis azt mutatja, hogy a matematikai elvárások megegyeznek, akkor ebben az értelemben a sokaságok homogének). A homogén populációk összevonhatók egybe, és ezáltal teljesebb információhoz juthatunk róla, és ezáltal megbízhatóbb következtetésekhez.

Variancia-módszerek elemzése

  1. Fisher-módszer – F-teszt; A módszert egyirányú varianciaanalízisben alkalmazzák, ahol az összes megfigyelt érték teljes varianciáját az egyes csoportokon belüli és a csoportok közötti varianciákra bontják.
  2. Az "általános lineáris modell" módszer. A többváltozós elemzésben használt korrelációs vagy regressziós elemzésen alapul.

Az egytényezős diszperziós modell alakja: x ij = μ + F j + ε ij ,
ahol x ij a vizsgált változó értéke, amelyet a faktor i-edik szintjén kaptunk (i=1,2,...,t) a j-edik sorszámmal (j=1,2,.. .,n); F i – a faktor i-edik szintjének befolyása által okozott hatás; ε ij – véletlenszerű komponens, vagy szabályozhatatlan tényezők hatása által okozott zavar, pl. variáció egy adott szinten belül.

A varianciaanalízis legegyszerűbb esete az egyváltozós egyirányú analízis két vagy több független csoportra, amikor az összes csoportot egy jellemző szerint kombináljuk. Az elemzés során az átlagok egyenlőségének nullhipotézisét teszteljük. Két csoport elemzésekor a varianciaanalízis megegyezik a kétmintás analízissel t- Hallgatói teszt független mintákhoz, és az érték F-statisztika egyenlő a megfelelő négyzetével t-statisztika.

Az eltérések egyenlőségének megerősítésére általában a Lievene-kritériumot használják ( Levene tesztje). Ha a varianciaegyenlőség hipotézisét elvetjük, a fő elemzés nem alkalmazható. Ha a szórások egyenlőek, akkor a csoportközi és a csoporton belüli variabilitás arányának becslésére használjuk F- Fisher-kritérium F-a statisztika meghaladja a kritikus értéket, ekkor a nullhipotézist elvetjük, és következtetést vonunk le az átlagok egyenlőtlenségére. Két csoport átlagának elemzésekor az eredmények közvetlenül a Fisher-teszt alkalmazása után értelmezhetők.

Sok tényező. A világ összetett és sokdimenziós természetű. Rendkívül ritkák az olyan helyzetek, amikor egy bizonyos jelenséget egy változó teljesen leír. Például, ha nagy paradicsom termesztését próbáljuk megtanulni, figyelembe kell venni a növény genetikai szerkezetével, talajtípusával, fényével, hőmérsékletével stb. kapcsolatos tényezőket. Így egy tipikus kísérlet elvégzésekor számos tényezővel kell számolni. A fő ok, amiért az ANOVA használata előnyösebb, mint két minta ismételt összehasonlítása különböző faktorszinteken sorozatok használatával t- kritérium, hogy a varianciaanalízis lényegesen több hatékony kis minták esetén pedig informatívabb. Némi erőfeszítést kell tennie, hogy elsajátítsa a STATISTICA-ban alkalmazott ANOVA technikát, és megtapasztalja annak előnyeit konkrét tanulmányokban.

A kéttényezős varianciamodell a következőképpen alakul:

x ijk =μ+F i +G j +I ij +ε ijk ,

ahol x ijk a megfigyelési érték a k számú ij cellában; μ - általános átlag; F i - az A faktor i-edik szintjének hatása által okozott hatás; G j - a B faktor j-edik szintjének hatása által okozott hatás; I ij - két tényező kölcsönhatása által okozott hatás, pl. eltérés a megfigyelési átlagtól az ij cellában a modell első három tagjának összegétől; Az ε ijk egy olyan zavar, amelyet egy változó egyetlen cellán belüli változása okoz. Feltételezzük, hogy ε ijk normális eloszlási törvénye N(0; c 2), és minden F *, G *, I i *, I * j matematikai elvárás egyenlő nullával.

A varianciaanalízis használatának feltételei vannak:

  1. A vizsgálat célja egy (legfeljebb 3) tényező eredményre gyakorolt ​​hatásának erősségének meghatározása, vagy különböző tényezők (nem és életkor, fizikai aktivitás és táplálkozás stb.) együttes hatásának erősségének meghatározása.
  2. A vizsgált tényezőknek függetleneknek (nem kapcsolódnak egymáshoz) kell lenniük. Például lehetetlen tanulmányozni a munkatapasztalat és az életkor, a gyermekek magassága és súlya stb. együttes hatását. a lakosság morbiditásáról.
  3. A csoportok kiválasztása a vizsgálathoz véletlenszerűen történik (véletlenszerű kiválasztás). A diszperziós komplexum megszervezését a véletlenszerűség elvének megvalósításával az opciók kiválasztásában randomizációnak nevezik (angolul - random), azaz véletlenszerűnek. véletlenszerűen választották ki.
  4. Mind mennyiségi, mind minőségi (attribútum) jellemzők használhatók.

Az egytényezős varianciaanalízis elvégzésekor javasolt (a használat szükséges feltétele):

  1. Az elemzett csoportok eloszlásának normalitása vagy a mintacsoportok megfeleltetése a normál eloszlású általános sokaságokhoz.
  2. A megfigyelések csoportonkénti eloszlásának függetlensége (nem rokonsága).
  3. A megfigyelések gyakoriságának (ismétlésének) elérhetősége.

Az eloszlás normalitását a Gauss-görbe (De Mavoor) határozza meg, amely az y=f(x) függvénnyel írható le, mivel ez az egyik eloszlási törvény, amely a véletlenszerű, valószínűségi jelenségek leírásának közelítésére szolgál. a természetben. Az orvosbiológiai kutatások témája a valószínűségi jelenségek, a normális eloszlás igen gyakran előfordul az ilyen kutatásokban.

A klasszikus varianciaanalízis a következő szakaszokban történik:

  1. Diszperziós komplexum építése.
  2. Átlagos négyzetes eltérések számítása.
  3. Varianciaszámítás.
  4. Tényező- és reziduális eltérések összehasonlítása.
  5. Az eredmények értékelése a Fisher-Snedecor eloszlás elméleti értékei alapján
  6. A varianciaanalízis modern alkalmazásai a közgazdaságtan, a biológia és a technológia problémáinak széles körét fedik le, és általában a statisztikai elmélet szerint értelmezik, amely a bizonyos változó körülmények között végzett közvetlen mérések eredményei közötti szisztematikus különbségeket azonosítja.
  7. A varianciaanalízis automatizálásának köszönhetően a kutató különféle statisztikai vizsgálatokat végezhet számítógép segítségével, miközben kevesebb időt és energiát fordít az adatszámításokra. Jelenleg sok olyan szoftvercsomag létezik, amely megvalósítja a diszperzióelemző berendezést. A leggyakoribb szoftvertermékek: MS Excel, Statistica; Stadia; SPSS.

A legtöbb statisztikai módszert a modern statisztikai szoftvertermékekben alkalmazzák. Az algoritmikus programozási nyelvek fejlődésével lehetővé vált további blokkok létrehozása a statisztikai adatok feldolgozásához.

A varianciaanalízis hatékony modern statisztikai módszer a pszichológia, a biológia, az orvostudomány és más tudományok kísérleti adatainak feldolgozására és elemzésére. Nagyon szorosan kapcsolódik a kísérleti kutatások tervezésének és lefolytatásának sajátos módszertanához.

A varianciaanalízist a tudományos kutatás minden területén alkalmazzák, ahol különböző tényezőknek a vizsgált változóra gyakorolt ​​hatását kell elemezni.

Bibliográfia

  1. Ableeva, A. M. Értékelési eszközök alapjának kialakítása a Szövetségi Állami Oktatási Szabvány feltételei között [Szöveg] / A. M. Ableeva, G. A. Salimova // A társadalomtudományi, humanitárius, természettudományi és műszaki tudományok oktatásának aktuális problémái a felsőoktatás korszerűsítésének összefüggésében oktatás: anyagok nemzetközi tudományos és módszertani konferencia, 2014. április 4-5. / Baskír Állami Agráregyetem, Információs Technológiai és Menedzsment Kar. - Ufa, 2014. - 11-14.
  2. Ganieva, A.M. A foglalkoztatás és a munkanélküliség statisztikai elemzése [Szöveg] / A.M. Ganieva, T.N. Lubova // A gazdasági-statisztikai kutatás és az információs technológiák aktuális kérdései: cikkgyűjtemény. tudományos Art.: a „Statisztikák és Információs Rendszerek a Közgazdaságtudományban” / Baskír Állami Agrártudományi Egyetem létrehozásának 40. évfordulója alkalmából. - Ufa, 2011. - 315-316.
  3. Ismagilov, R. R. Kreatív csoport - a tudományos kutatás megszervezésének hatékony formája a felsőoktatásban [Szöveg] / R. R. Ismagilov, M. Kh. Urazlin, D. R. Islamgulov // A régió tudományos, műszaki és tudományos-oktatási komplexumai: problémák és fejlődési kilátások: tudományos-gyakorlati konferencia anyagai / Fehéroroszországi Tudományos Akadémia, UGATU. - Ufa, 1999. - 105-106.
  4. Iszlamgulov, D.R. Kompetenciaalapú oktatási megközelítés: az oktatás minőségének felmérése [Szöveg] / D.R. Iszlamgulov, T.N. Lubova, I.R. Islamgulova // Modern tudományos közlemény. – 2015. – T. 7. – No. 1. – P. 62-69.
  5. Islamgulov, D. R. A hallgatók kutatómunkája a mezőgazdasági egyetemek szakemberképzésének legfontosabb eleme [Szöveg] / D. R. Islamgulov // A hallgatók gyakorlati képzésének problémái az egyetemen a jelenlegi szakaszban és megoldásuk módjai: gyűjtés. anyagtudományi módszer. Konf., 2007. április 24. / Baskír Állami Agráregyetem. - Ufa, 2007. - 20-22.
  6. Lubova, T.N. A szövetségi állam oktatási szabványa végrehajtásának alapja a kompetencia alapú megközelítés [Szöveg] / T.N. Lubova, D.R. Iszlamgulov, I.R. Islamgulova // BODEST RESEARCH - 2016: Anyagok a XII Nemzetközi Tudományos és Gyakorlati Konferenciához, 2016. február 15-22. - Szófia: Byal GRAD-BG OOD, 2016. - 4. kötet Pedagógiai tudományok. – 80-85.
  7. Lubova, T.N. Új oktatási szabványok: megvalósítási jellemzők [Szöveg] / T.N. Lubova, D.R. Islamgulov // Modern tudományos közlemény. – 2015. – T. 7. – 1. sz. – P. 79-84.
  8. Lubova, T.N. A tanulók önálló munkájának szervezése [Szöveg] / T.N. Lubova, D.R. Islamgulov // Felsőoktatási oktatási programok megvalósítása a Szövetségi Állami Felsőoktatási Oktatási Standard keretében: az Összoroszországi Tudományos és Módszertani Konferencia anyagai az Országos Orvosi Tanács környezetgazdálkodási és vízügyi látogató ülése keretében a Szövetségi Oktatási Intézmény használata a felsőoktatási rendszerben. / Baskír Állami Agráregyetem. - Ufa, 2016. - 214-219.
  9. Lubova, T.N. A szövetségi állam oktatási szabványa végrehajtásának alapja a kompetencia alapú megközelítés [Szöveg] / T.N. Lubova, D.R. Iszlamgulov, I.R. Islamgulova // Modern tudományos közlemény. – 2015. – T. 7. – 1. sz. – P. 85-93.
  10. Saubanova, L.M. Demográfiai terhelési szint [Szöveg] / L.M. Saubanova, T.N. Lubova // A gazdasági-statisztikai kutatás és az információs technológiák aktuális kérdései: cikkgyűjtemény. tudományos Art.: a „Statisztikák és Információs Rendszerek a Közgazdaságtudományban” / Baskír Állami Agrártudományi Egyetem létrehozásának 40. évfordulója alkalmából. - Ufa, 2011. - P. 321-322.
  11. Fakhrullina, A.R. Az oroszországi infláció statisztikai elemzése [Szöveg] / A.R. Fakhrullina, T.N. Lubova // A gazdasági-statisztikai kutatás és az információs technológiák aktuális kérdései: cikkgyűjtemény. tudományos Art.: a „Statisztikák és Információs Rendszerek a Közgazdaságtudományban” / Baskír Állami Agrártudományi Egyetem létrehozásának 40. évfordulója alkalmából. - Ufa, 2011. - 323-324.
  12. Farkhutdinova, A.T. Munkaerőpiac a Baskír Köztársaságban 2012-ben [Elektronikus forrás] / A.T. Farkhutdinova, T.N. Lubova // Tudományos hallgatói fórum. V. Nemzetközi Diákelektronikai Tudományos Konferencia anyagai: elektronikus tudományos konferencia (elektronikus gyűjtemény). Orosz Természettudományi Akadémia. 2013.
Cikkek a témában