Statistics on kyse mallien keksimisestä selittämään, mitä maailmassa tapahtuu. Mutta kuinka hyviä olemme siinä? Numerot kelpaavat vain tiettyyn rajaan. Mistä tiedämme, kertovatko he oikean tarinan?
astu koetilastojen kuuluisaan maailmaan.
testitilaston tavoitteena on selvittää, kuinka hyvin malli sopii aineistoon. Ajattele sitä vähän vaatteena. Kun olet kaupassa, mallinukke kertoo, miltä vaatteiden on tarkoitus näyttää (teoreettinen malli). Kun pääsee kotiin, niitä testataan ja katsotaan, miltä ne oikeasti näyttävät (datapohjainen malli). Testi-tilasto kertoo, jos ero niiden välillä (koska en todellakaan näytä mannekiini.) on merkittävä.
toisessa viestissä keskustelin korrelatiivisen ja kokeellisen tutkimuksen luonteesta. Lineaarinen regressio, moniregressio ja logistinen regressio ovat kaikentyyppisiä lineaarisia malleja, jotka korreloivat samanaikaisesti esiintyviä muuttujia. Kokeellisissa malleissa on kuitenkin kyse syy-seurausmalleista tai ainakin malleista, joissa todetaan merkittävä ero tapausten välillä.
Testitilastoissa lasketaan, onko ryhmien välillä merkittävää eroa. Useimmiten testitilastoilla katsotaan, poikkeaako keksimäsi malli populaation ihannemallista. Näyttävätkö vaatteet esimerkiksi mallinukella merkittävästi erilaisilta kuin sinulla? Katsotaanpa kahta yleisintä testitilastotyyppiä: t-test ja F-test.
t-testi on testitilasto, jossa verrataan kahden eri Ryhmän keskiarvoja. On joukko tapauksia, joissa haluat ehkä vertailla ryhmän suorituskykyä, kuten testitulokset, kliiniset kokeet, tai jopa kuinka onnellinen erilaisia ihmisiä on eri paikoissa. Erilaiset ryhmät ja asetelmat vaativat tietysti erilaisia testejä. T-testin tyyppi, jota saatat tarvita, riippuu näytteen tyypistä.
jos kaksi ryhmää ovat samankokoisia ja suoritat eräänlaisen ennen ja jälkeen-kokeen, suoritat niin sanotun riippuvaisen tai parillisen T-testin. Jos kaksi ryhmää ovat erikokoisia tai vertaat kahta erillistä tapahtumakeinoa, suoritat riippumattoman otoksen T-testin.
riippuvainen tai parillinen otos t-testi
olen melko sisäänpäin kääntynyt ihminen. Olen niin introvertti, että tunnen äärimmäistä ahdistusta sosiaalisissa tilanteissa, jotka oikeuttavat terapiakoiran nimeltä Chloe. Ja hän on aika suloinen.
nykyään monilla on terapiakoiria ahdistuksen lievittämiseksi. Oletetaan, että mittaat ihmisten ahdistusta ilman terapiakoiria ja heidän terapiakoiriensa kanssa asteikolla 1 (Matala) – 5 (Korkea) selvittääksesi, tekevätkö terapiakoirat merkittävästi vähemmän ahdistusta kaltaisilleni ihmisille. Yksinkertaisuuden vuoksi saat seuraavat tiedot
ensi silmäyksellä näyttää siltä, että on olemassa selvä ero ihmisten ahdistuksen taso kanssa ja ilman terapiakoiria. Haluat tehdä sen johtopäätöksen, että mallimme (niillä on merkitystä) on erilainen kuin nollahypoteesi (niillä ei ole). Mutta odota, haluat tilastotietoja väitteen tueksi. Joten teet t-testin.
t-testi on tilastollisen analyysin muoto, jossa mitattua keskiarvoa verrataan perusjoukon keskiarvoon tai perusjoukon keskiarvoon keskihajonnan perusteella. Koska olemme tekemisissä saman ihmisryhmän kanssa ennen ja jälkeen-tilanteessa, haluat tehdä riippuvaisen t-testin. Voit ajatella ilman skenaario perustasona kanssa skenaario.
perinteinen t-testin yhtälö näyttää
nollahypoteesin mukaan kahden otosvälin välillä ei pitäisi olla eroa. Eli μ1-μ2 = 0 antaa meille
mutta mitä teet tällä numerolla? No, voit tarkistaa mystinen kaavio t taulukon. Taulukon yläreunassa on virheen todennäköisyys, jonka olet valmis hyväksymään. Toisin sanoen, mikä on mahdollisuus, että olet väärässä? Pöydän vieressä ovat vapausasteet. Tässä tapauksessa sinulla on 46 vapausastetta, koska sinulla on kaksi ryhmää, joissa kummassakin on 24 osallistujaa.
t-taulukon mukaan kriittinen arvo 46 vapausasteelle ja 0,05 prosentin virheelle on 2,013. Laskettu t-arvosi on sen yläpuolella, mikä osoittaa, että keinosi ovat merkittävästi erilaiset. Perustuu minun täysin satunnainen, kuvitteellisia tietoja, alempi keskiarvo ahdistuneisuus ihmiset osoittavat niiden terapia koirat on tarpeeksi erilainen olla mielekäs, muuten tunnetaan tilastollisesti merkitsevä.
luulen, että Chloe on hyvä minulle, lol.
riippumaton otos t-testi
riippumattomien näytetestien tapaus on hieman erilainen. Tämä tyyli testi sopii parhaiten kokeellisia malleja, tai ne mallit, jotka vertaavat ryhmiä eri joukko osallistujia. Etuna on, että ryhmien ei tarvitse olla samankokoisia. Katsotaanpa toinen tilastollinen esimerkki.
teeskennellään hetki, että te (jostain hullusta syystä) haluatte tietää, ovatko ihmiset ahdistuneempia tilastotieteen tunnilla kuin toisella, vaikkapa englannin tunnilla. Etsi siis halukkaita vapaaehtoisia ja mittaa heidän sykkeensä jokaiselta tunnilta. On tärkeää huomata, että kummallakaan luokalla ei ole samoja osallistujia. Tietosi näyttävät tältä.
eroa on,mutta riittääkö se? Kun lasket t-arvon ja huomaat sen olevan 1,92, vertaa tätä t-taulukkoon 40 merkillä, huomaa, että se on kriittisen arvon alapuolella. Tämä tarkoittaa, että vaikka ero on olemassa, se ei ole merkittävä ero.
Huh, tilastot eivät taida sittenkään stressata liikaa.
t-testin tehtävänä on selvittää, ovatko kaksi ryhmää keskenään erilaisia. Muista vain, että riippuvaisia t-testejä käytetään parhaiten ryhmille, joilla on samat osallistujat, kun taas riippumattomat t-testit ovat ryhmille, joilla on eri.
F-testin tilastollinen
mutta John, mitä jos haluan testata jotain muuta? Kuten malli?
huikea kysymys!
joskus haluamme verrata laskemaamme mallia keskiarvoon. Sanotaan esimerkiksi, että olet laskenut lineaarisen regressiomallin. Muista, että keskiarvo on myös malli, jota voidaan käyttää tietojen selittämiseen.
F-testi on tapa, jolla vertaamme laskemaamme mallia aineiston kokonaiskeskiarvoon. Kuten t-testi, jos se on suurempi kuin kriittinen arvo niin malli on parempi selittää tiedot kuin keskiarvo on.
ennen kuin päästään F-testin pikkuriikkisyyteen, on puhuttava neliöiden summasta. Katsotaanpa katsomaan esimerkki joitakin tietoja, jotka jo on linja parhaiten sovi sitä.
F-testissä verrataan niin sanottua neliöiden keskiarvoa mallin jäännöksille ja aineiston kokonaiskeskiarvolle. Osapuoli tosiasia, jäännökset ovat ero todellisen, tai havaittu, datapiste ja ennustettu datapiste.
kuvaajan (a) tapauksessa tarkastellaan datapisteiden jäännöksiä ja kokonaisotoksen keskiarvoa. Kuvaajan (c) tapauksessa tarkastellaan datapisteiden jäännöksiä ja aineistosta laskettua mallia. Mutta kaaviossa (b) tarkastellaan mallin jäännöksiä ja kokonaisotoksen keskiarvoa.
neliöiden summa on mitta siitä, miten jäännökset vertautuvat malliin tai keskiarvoon riippuen siitä, kumman kanssa työskentelemme. On kolme, joista olemme huolissamme.
jäännösten neliöiden summa (SSR) on datapisteiden ja varsinaisten regressiolinjojen välisten jäännösten neliöiden summa, kuten graafi (c). Ne on potenssiin kompensoimaan negatiivisia arvoja. SSR lasketaan
kokonaissumman neliöiden summa (SST) on datapisteiden ja otoksen keskiarvon välisten neliöiden summa, kuten kuvaaja (a). Ne on potenssiin kompensoimaan negatiivisia arvoja. SST lasketaan
on tärkeää huomata, että vaikka yhtälöt voivat näyttää samalta ensi silmäyksellä,on olemassa tärkeä ero. SSR-yhtälössä on mukana ennustettu arvo, joten toisella Y: llä on pieni porkkana sen päällä (lausutaan Y-hattu). SST-yhtälö sisältää otoksen keskiarvon, joten toisella Y: llä on sen yläpuolella pieni palkki (lausutaan Y-bar). Älä unohda tätä tärkeää eroa.
näiden kahden (SSR – SST) välinen erotus kertoo itse mallin neliöiden kokonaissumman, kuten graafi (b). Tätä me tavoittelemme, jotta voimme vihdoin alkaa laskea todellista F-arvoa.
nämä neliöarvojen summat antavat meille käsityksen siitä, kuinka paljon malli eroaa havaituista arvoista, mikä on kätevä määritettäessä, onko malli todella hyvä ennustettavaksi. F-testiprosessin seuraava vaihe on laskea neliöiden keskiarvo jäännöksille ja mallille.
mallin neliöiden keskiarvon eli MSM: n laskemiseksi täytyy tietää mallin vapausasteet. Onneksi se on melko yksinkertaista. Mallin vapausasteet ovat mallin muuttujien lukumäärä! Tämän jälkeen seuraa kaavaa MSM = SSM ÷ dfmodel
laskeaksesi residuaalien eli MSR: n neliöiden keskiarvon, sinun täytyy tietää otoskoon vapausasteet. Otoskoon vapausasteet ovat aina N-1. Sitten yksinkertaisesti seuraa kaavaa MSR = SSR ÷ dfresiduals
Ok, olet tehnyt paljon matematiikkaa tähän mennessä. Olen ylpeä sinusta, koska tiedän, ettei se ole superhauskaa. Mutta on erittäin tärkeää tietää, mistä nämä arvot tulevat, koska se auttaa ymmärtämään, miten ne toimivat. Nyt nimittäin nähdään, miten F-tilasto oikeasti lasketaan!
tällä laskutoimituksella saadaan mallin ennusteen suhde tietojen säännölliseen keskiarvoon. Sitten vertaat tätä suhdetta F-jakaumataulukkoon kuten T-statistiikkaa. Jos laskettu arvo ylittää taulukon kriittisen arvon, malli eroaa merkittävästi aineiston keskiarvosta ja selittää siten paremmin aineiston kuviot.
Testitilastot ovat elintärkeitä sen määrittämiseksi, onko malli hyvä selittämään aineistojen kuvioita. Yksinkertaisin testitilasto on t-testi, joka määrittää, ovatko kaksi keinoa merkittävästi erilaisia. Monimutkaisemmissa malleissa F-statistiikka määrittää, poikkeaako koko malli tilastollisesti keskiarvosta. Molemmat tapaukset ovat välttämättömiä hyvän mallin erottamiseksi huonosta. Iloisia tilastoja!