Statistika je o přichází s modely vysvětlit, co se děje ve světě. Ale jak jsme v tom dobří? Myslím, čísla jsou dobrá jen pro tolik věcí, že jo? Jak víme, jestli vyprávějí správný příběh?
zadejte slavný svět statistik testů.
cílem testovací statistiky je zjistit, jak dobře model odpovídá datům. Ber to trochu jako oblečení. Když jste v obchodě, manekýn vám řekne, jak má vypadat oblečení (teoretický model). Když se vrátíte domů, vyzkoušíte je a uvidíte, jak skutečně vypadají (model založený na datech). Testovací statistika vám řekne, zda je rozdíl mezi nimi (protože rozhodně nevypadám jako manekýn.) je významný.
v jiném příspěvku, diskutoval jsem o povaze korelačního a experimentálního výzkumu. Lineární regrese, vícenásobná regrese a logistická regrese jsou všechny typy lineárních modelů, které korelují proměnné, které se vyskytují současně. Experimentální modely se však zabývají modely příčin a následků nebo alespoň modely, které uvádějí významný rozdíl mezi případy.
statistiky testů vypočítají, zda existuje významný rozdíl mezi skupinami. Nejčastěji se používají statistiky testů, aby se zjistilo, zda se model, se kterým přicházíte, liší od ideálního modelu populace. Například oblečení vypadá na manekýně výrazně jinak než na vás? Podívejme se na dva nejběžnější typy statistik testů: t-test A F-test.
t-test je testovací statistika, která porovnává prostředky dvou různých skupin. Existuje spousta případů, kdy budete chtít porovnat výkon skupiny, jako jsou výsledky testů, klinické studie nebo dokonce, jak šťastní jsou různé typy lidí na různých místech. Různé typy skupin a nastavení samozřejmě vyžadují různé typy testů. Typ t-testu, který budete potřebovat, závisí na typu vzorku, který máte.
pokud jsou vaše dvě skupiny stejné velikosti a provádíte jakýsi experiment před a po, pak provedete to, co se nazývá závislý nebo spárovaný vzorek t-test. Pokud jsou tyto dvě skupiny různé velikosti nebo porovnáváte dva samostatné prostředky události, pak provedete nezávislý vzorek t-test.
závislý nebo spárovaný vzorek t-Test
jsem poměrně introvertní osoba. Jsem tak introvertní, že mám extrémní úzkost v sociálních situacích, které vyžadují terapeutického psa jménem Chloe. A je docela rozkošná.
mnoho lidí má terapeutické psy, aby zmírnilo úzkost. Řekněme, že budete měřit úzkost lidí bez jejich terapie psů a jejich terapie psů na stupnici od 1 (nízké) do 5 (vysoká) zjistit, zda terapie psů výrazně nižší úzkost pro lidi, jako jsem já. Kvůli pohodlí, můžete získat následující údaje
Na první pohled se zdá, že existuje jasný rozdíl mezi lidmi je úroveň úzkosti a bez jejich terapie psů. Chcete přejít k závěru, že náš model (dělají rozdíl) se liší od nulové hypotézy(nemají). Ale počkejte, chcete mít nějaké statistické údaje, které by podpořily toto tvrzení. Takže provedete t-test.
t-test je forma statistické analýzy, která porovnává naměřené tím k populační průměr, nebo základní říct, že z hlediska směrodatné odchylky. Protože máme co do činění se stejnou skupinou lidí v situaci před a po, chcete provést závislý t-test. Můžete si představit scénář bez scénáře jako základ pro scénář s.
tradiční t-testu rovnice vypadá
nulovou hypotézu státy měly by tam být žádný rozdíl mezi dvou výběrových průměrů. To znamená μ1-μ2 = 0, což nám dává
ale co děláte s tímto číslem? Studna, budete konzultovat mystický graf tabulky t. V horní části tabulky je pravděpodobnost chyby, kterou jste ochotni přijmout. Jinými slovy, jaká je možnost, že se mýlíte? Po straně stolu jsou stupně volnosti. V tomto případě máte 46 stupňů volnosti, protože máte dvě skupiny s 24 účastníky.
tabulka t uvádí, že kritická hodnota pro 46 stupňů volnosti a 0,05% chyba je 2,013. Vaše vypočtená hodnota t je vyšší, což znamená, že vaše prostředky jsou výrazně odlišné. Na základě mého zcela náhodná, fiktivní údaje, dolní průměr úzkost lidí show s jejich terapie psů se liší dost na to, být smysluplné, jinak známý jako statisticky významné.
myslím, že Chloe je pro mě dobrá, lol.
nezávislý vzorek t-Test
případ pro nezávislé testy vzorků je trochu jiný. Tento styl testu se nejlépe hodí pro experimentální návrhy, nebo ty návrhy, které porovnávají skupiny s různými sadami účastníků. Výhodou je, že skupiny nemusí být stejné velikosti. Podívejme se na další statistický příklad.
na okamžik předstírejme, že (z nějakého šíleného důvodu) chcete vědět, zda jsou lidé ve statistické třídě úzkostlivější než v jiné, řekněme anglické, třídě. Takže najdete nějaké ochotné dobrovolníky a změříte jejich srdeční frekvence během každé třídy. Je důležité si uvědomit, že ani jedna třída nebude mít stejné účastníky. Vaše data vypadají trochu takto
existuje rozdíl, ale je to dost rozdíl? Při výpočtu hodnoty t a je 1.92, porovnejte si to s t-stůl na 40 značka všimnete, že je pod kritickou hodnotu. To znamená, že i když existuje rozdíl, není to významný rozdíl.
No, myslím, že statistiky nejsou příliš stresující.
úlohou t-testu je určit, zda se dvě skupiny od sebe liší. Nezapomeňte, že závislé t-testy se nejlépe používají pro skupiny, které mají stejné účastníky, zatímco nezávislé t-testy jsou pro skupiny s různými.
Statistika F-testu
ale Johne, co když chci vyzkoušet něco jiného? Jako modelka?
to je fantastická otázka!
někdy chceme porovnat model, který jsme vypočítali, s průměrem. Řekněme například, že jste vypočítali lineární regresní model. Nezapomeňte, že průměr je také model,který lze použít k vysvětlení dat.
F-Test je způsob, jakým porovnáme model, který jsme vypočítali, s celkovým průměrem dat. Podobně jako u t-testu, pokud je vyšší než kritická hodnota, pak model lépe vysvětluje data než průměr.
než se dostaneme do drsného testu F, musíme mluvit o součtu čtverců. Podívejme se na příklad některých dat, která již mají řadu nejlepších.
F-test porovnává, co je tzv. průměrný součet čtverců pro rezidua modelu a a celkový průměr údajů. Skutečnost strany, zbytky jsou rozdíl mezi skutečným nebo pozorovaným datovým bodem a předpokládaným datovým bodem.
v případě grafu (a) se díváte na zbytky datových bodů a celkový průměr vzorku. V případě grafu (c) se díváte na zbytky datových bodů a model, který jste vypočítali z dat. Ale v grafu (b) se díváte na zbytky modelu a celkový průměr vzorku.
součet čtverců je měřítkem toho, jak se zbytky porovnávají s modelem nebo průměrem, v závislosti na tom, se kterým z nich pracujeme. Jsou tři, o které se zajímáme.
součet čtverců reziduí (SSR) je součet čtverců reziduí mezi datové body a skutečné regresní přímky, jako graf (c). Jsou čtvercové, aby kompenzovaly záporné hodnoty. SSR se vypočítá
součet čtverců celkových (SST) je součet čtverců reziduí mezi datové body a tím vzorku, jako graf (a). Jsou čtvercové, aby kompenzovaly záporné hodnoty. SST se vypočítá
je důležité poznamenat, že zatímco rovnice může vypadat na první pohled stejné, tam je důležitý rozdíl. Rovnice SSR zahrnuje předpokládanou hodnotu, takže druhé Y má nad sebou malou mrkev (vyslovuje se Y-hat). Rovnice SST zahrnuje průměr vzorku, takže druhé Y má nad sebou malý pruh (vyslovuje se Y-bar). Nezapomeňte na tento velmi důležitý rozdíl.
rozdíl mezi těmito dvěma (SSR – SST) vám řekne celkový součet čtverců pro samotný model, jako je graf (b). To je to, po čem jdeme, abychom konečně začali vypočítat skutečnou hodnotu F.
Tyto součet čtverců hodnot nám dávají pocit, jak moc se model liší od pozorovaných hodnot, což přijde vhod při určování, zda model je opravdu dobrý pro predikci. Dalším krokem v procesu F-testu je výpočet průměru čtverců pro zbytky a pro model.
Chcete-li vypočítat průměr čtverců modelu nebo MSM, musíte znát stupně volnosti modelu. Díkybohu, je to docela jednoduché. Stupně volnosti modelu je počet proměnných v modelu! Poté postupujte podle vzorce MSM = SSM ÷ dfmodel
Chcete-li vypočítat průměr čtverců zbytků nebo MSR, musíte znát stupně volnosti ve velikosti vzorku. Stupně volnosti ve velikosti vzorku jsou vždy N-1. Pak jednoduše postupujte podle vzorce MSR = SSR ÷ dfresiduals
Ok, jste udělali spoustu matematiky tak daleko. Jsem na tebe hrdý, protože vím, že to není super zábava. Je však velmi důležité vědět, odkud tyto hodnoty pocházejí, protože to pomáhá pochopit, jak fungují. Protože teď vlastně uvidíme, jak se vlastně vypočítá F-statistika!
tento výpočet vám dává poměr predikce modelu k pravidelnému průměru dat. Pak porovnáte tento poměr s F-distribuční tabulkou, jako byste měli t-statistiku. Pokud vypočtená hodnota překročí kritickou hodnotu v tabulce, pak se model výrazně liší od průměru dat, a proto lépe vysvětluje vzorce v datech.
statistiky testů jsou zásadní pro určení, zda je model dobrý při vysvětlování vzorců v datech. Nejjednodušší statistikou testu je t-test, který určuje, zda se dva prostředky výrazně liší. U složitějších modelů určuje F-statistika, zda se celý model statisticky liší od průměru. Oba případy jsou nezbytné pro vyprávění dobrého modelu od špatného. Šťastné statistiky!