statisztika szól jön modellek megmagyarázni, hogy mi folyik a világon. De mennyire vagyunk jók ebben? A számok sok mindenre jók, nem? Honnan tudjuk, hogy a helyes történetet mesélik-e el?
adja meg a tesztstatisztikák híres világát.
a tesztstatisztika célja annak meghatározása, hogy a modell mennyire illeszkedik az adatokhoz. Gondolj rá egy kicsit úgy, mint a ruhákra. Amikor a boltban tartózkodik, a manöken elmondja, hogyan kell kinéznie a ruháknak (az elméleti modell). Amikor hazaér, kipróbálja őket, és megnézi, hogyan néznek ki valójában (az adatalapú modell). A teszt-statisztika megmondja, ha a különbség közöttük (mert én biztosan nem néz ki, mint a manöken.) jelentős.
egy másik bejegyzésben a korrelációs és kísérleti kutatás természetéről beszéltem. A lineáris regresszió, a többszörös regresszió és a logisztikai regresszió olyan lineáris modellek, amelyek korrelálják az egyidejűleg előforduló változókat. A kísérleti modellek azonban ok-okozati modellekkel foglalkoznak, vagy legalábbis olyan modellekkel, amelyek jelentős különbséget mutatnak az esetek között.
a Tesztstatisztikák kiszámítják, hogy van-e szignifikáns különbség a csoportok között. Leggyakrabban a tesztstatisztikákat használják annak megállapítására, hogy az Ön által létrehozott modell eltér-e a lakosság ideális modelljétől. Például, a ruhák jelentősen különböznek-e a manökenen, mint rajtad? Vessünk egy pillantást a két leggyakoribb tesztstatisztikára: t-teszt és F-teszt.
a t-teszt egy tesztstatisztika, amely két különböző csoport átlagát hasonlítja össze. Van egy csomó olyan eset, amikor érdemes összehasonlítani a csoport teljesítményét, például a teszteredményeket, a klinikai vizsgálatokat, vagy akár azt, hogy mennyire boldogok a különböző típusú emberek különböző helyeken. Természetesen a különböző típusú csoportok és beállítások Különböző típusú teszteket igényelnek. A szükséges t-teszt típusa a meglévő minta típusától függ.
ha a két csoport azonos méretű, és egyfajta előtte-utána kísérletet végez, akkor függő vagy páros Minta T-tesztet fog végezni. Ha a két csoport különböző méretű, vagy két különálló eseményeszközt hasonlít össze, akkor független T-tesztet végez.
függő vagy párosított T-teszt minta
meglehetősen introvertált ember vagyok. Annyira befelé forduló vagyok, hogy rendkívüli szorongásom van olyan társadalmi helyzetekben, amelyek indokolják a Chloe nevű terápiás kutyát. És nagyon imádnivaló.
sok embernek van terápiás kutyája a szorongás enyhítésére. Tegyük fel, hogy az emberek szorongását a terápiás kutyáik nélkül és a terápiás kutyáikkal 1 (alacsony) és 5 (magas) skálán mérjük, hogy meghatározzuk, hogy a terápiás kutyák jelentősen csökkentik-e a szorongást az olyan emberek számára, mint én. A kényelem érdekében a következő adatokat kapja
első pillantásra úgy tűnik, hogy egyértelmű különbség van az emberek szorongási szintje között a terápiás kutyákkal és anélkül. Arra a következtetésre akarsz ugrani, hogy a modellünk (különbséget tesznek) különbözik a nullhipotézistől (nem). De várj, azt szeretnénk, hogy néhány statisztikai adatok vissza, hogy az állítás fel. Tehát elvégez egy t-tesztet.
a T-teszt a statisztikai elemzés egyik formája, amely összehasonlítja a mért átlagot a populáció átlagával vagy a kiindulási átlaggal a szórás szempontjából. Mivel ugyanazzal az embercsoporttal van dolgunk egy előtte-utána típusú helyzetben, függő t-tesztet szeretne végezni. A without forgatókönyvre úgy gondolhat, mint a with forgatókönyv alapvonalára.
a hagyományos T-teszt egyenlet így néz ki
a nullhipotézis szerint a két minta átlaga között nem lehet különbség. Tehát ez azt jelenti, hogy 6-1-0 = 0
de mit csinálsz ezzel a számmal? Nos, akkor olvassa el a misztikus chart t táblázat. A táblázat tetején található a hiba valószínűsége, amelyet hajlandó elfogadni. Más szavakkal, mi az a lehetőség, hogy tévedsz? Az asztal oldalán vannak a szabadság fokai. Ebben az esetben 46 szabadságfokod van, mert két csoportod van, egyenként 24 résztvevővel.
a T táblázat kimondja, hogy a 46 szabadságfok és a 0,05% – os hiba kritikus értéke 2,013. A számított t-értéke meghaladja ezt, ami azt jelzi, hogy eszközei jelentősen eltérnek egymástól. Teljesen véletlenszerű alapján, fiktív adatok, a szorongásos emberek alacsonyabb átlaga a terápiás kutyáikkal elég eltérő ahhoz, hogy értelmes legyen, más néven statisztikailag szignifikáns.
azt hiszem, Chloe jó nekem, lol.
független Minta t-teszt
a független mintatesztek esete kissé eltér. Ez a tesztstílus a legjobban megfelel a kísérleti terveknek, vagy azoknak a terveknek, amelyek összehasonlítják a csoportokat a résztvevők különböző csoportjaival. Ennek előnye, hogy a csoportoknak nem kell azonos méretűnek lenniük. Nézzünk meg egy másik statisztikai példát.
tegyük fel egy pillanatra, hogy (valamilyen őrült okból) szeretné tudni, hogy az emberek jobban aggódnak-e a statisztikai osztályban, mint egy másik, mondjuk angolul. Tehát talál néhány önkéntes önkéntest, és mérje meg a pulzusukat minden osztályban. Fontos megjegyezni, hogy egyik osztályban sem lesznek ugyanazok a résztvevők. Az adatok egy kicsit így néz ki
van különbség, de vajon elég a különbség? Amikor kiszámítja a t-értéket, és úgy találja, hogy 1,92, hasonlítsa össze ezt a t-táblázattal a 40-es jelnél, vegye figyelembe, hogy a kritikus érték alatt van. Ez azt jelenti, hogy bár van különbség, ez nem jelentős különbség.
Huh, azt hiszem, a statisztika nem túl stresszes.
a t-teszt szerepe annak meghatározása, hogy két csoport különbözik-e egymástól. Ne feledje, hogy a függő t-teszteket leginkább azoknál a csoportoknál lehet használni, amelyek ugyanazokkal a résztvevőkkel rendelkeznek, míg a független t-tesztek különböző csoportokra vonatkoznak.
F-teszt statisztika
de John, mi van, ha valami mást akarok tesztelni? Mint egy modell?
ez egy fantasztikus kérdés!
Néha szeretnénk összehasonlítani egy kiszámított modellt egy átlaggal. Tegyük fel például, hogy kiszámított egy lineáris regressziós modellt. Ne feledje, hogy az átlag egy olyan modell is, amely felhasználható az adatok magyarázatára.
az F-teszt egy olyan módszer, amellyel összehasonlítjuk a kiszámított modellt az adatok általános átlagával. A T-teszthez hasonlóan, ha magasabb, mint egy kritikus érték, akkor a modell jobban magyarázza az adatokat, mint az átlag.
mielőtt belemennénk az F-teszt apróságába, beszélnünk kell a négyzetek összegéről. Vessünk egy pillantást néhány olyan adatra, amely már rendelkezik a legjobban illeszkedő sorral.
az F-teszt összehasonlítja az úgynevezett négyzetek átlagos összegét a modell maradványaira, valamint az adatok általános átlagát. Fél tény, a maradványok a tényleges vagy megfigyelt adatpont és a megjósolt adatpont közötti különbség.
az (a) gráf esetében az adatpontok maradékait és a teljes minta átlagát vizsgáljuk. A (c) gráf esetében az adatpontok maradékait és az adatokból kiszámított modellt nézzük. De a (b) grafikonon a modell maradékait és a teljes minta átlagát nézzük.
a négyzetek összege annak mértéke, hogy a maradványok hogyan viszonyulnak a modellhez vagy az átlaghoz, attól függően, hogy melyikkel dolgozunk. Három dologról van szó.
a maradványok négyzeteinek összege (SSR) az adatpontok és a tényleges regressziós vonalak közötti maradványok négyzetének összege, például a (c) gráf. A negatív értékek kompenzálására négyzet alakúak. Az SSR kiszámítása
a teljes (SST) négyzetének összege az adatpontok és a minta átlaga közötti maradványok négyzetének összege, például az (a) gráf. A negatív értékek kompenzálására négyzet alakúak. Az SST kiszámítása
fontos megjegyezni, hogy bár az egyenletek első pillantásra ugyanúgy nézhetnek ki, fontos különbség van. Az SSR egyenlet magában foglalja a megjósolt értéket, tehát a második Y-n van egy kis sárgarépa (ejtsd: Y-hat). Az SST egyenlet magában foglalja a minta átlagát, tehát a másodiknak van egy kis sávja rajta (ejtsd: Y-sáv). Ne felejtsd el ezt a nagyon fontos különbséget.
a kettő közötti különbség (SSR – SST) megmondja magának a modellnek a négyzeteinek teljes összegét, például a (b) gráfot. Ezt követjük annak érdekében, hogy végre elkezdjük kiszámítani a tényleges F értéket.
ezek a négyzetértékek összege érzékelteti, hogy a modell mennyire különbözik a megfigyelt értékektől, ami hasznos annak meghatározásában, hogy a modell valóban jó-e az előrejelzéshez. Az F-teszt folyamatának következő lépése a maradványok és a modell négyzetének átlagának kiszámítása.
a modell vagy az MSM négyzetének átlagának kiszámításához ismernie kell a modell szabadságfokát. Hálásan, ez elég egyértelmű. A modell szabadságfoka a változók száma a modellben! Ezután kövesse a képletet MSM = SSM kb dfmodel
a maradványok négyzetének átlagának kiszámításához, vagy MSR, ismernie kell a minta méretének szabadságfokát. A mintaméretben a szabadság foka mindig N – 1. Ezután egyszerűen kövesse az MSR = SSR képletet dfresiduals
Ok, eddig nagyon sok matematikát tettél. Büszke vagyok rád, mert tudom, hogy ez nem szuper szórakoztató. De nagyon fontos tudni, honnan származnak ezek az értékek, mert segít megérteni, hogyan működnek. Mert most valójában látni fogjuk, hogyan számítják ki az F-statisztikát!
ez a számítás megadja a modell előrejelzésének az adatok rendszeres átlagához viszonyított arányát. Ezután összehasonlítja ezt az arányt egy F-eloszlási táblával, mint a t-statisztikát. Ha a számított érték meghaladja a táblázatban szereplő kritikus értéket, akkor a modell jelentősen eltér az adatok átlagától, ezért jobban meg tudja magyarázni az adatok mintáit.
a Tesztstatisztikák létfontosságúak annak meghatározásához, hogy egy modell jól magyarázza-e az adatok mintáit. A legegyszerűbb tesztstatisztika a t-teszt, amely meghatározza, hogy két eszköz jelentősen különbözik-e egymástól. Bonyolultabb modellek esetén az F-statisztika meghatározza, hogy egy egész modell statisztikailag eltér-e az átlagtól. Mindkét eset elengedhetetlen ahhoz, hogy egy jó modellt elmondjunk egy rossztól. Boldog statisztika!