T-TestとF-Test:テスト統計の基礎

Statisticsは、世界で何が起こっているのかを説明するためのモデルを考え出すことです。 しかし、我々はそれでどのように良いですか? つまり、数字は非常に多くのものにのみ適していますよね? 彼らが正しい話をしているかどうかをどのようにして知るのですか?

テスト統計の有名な世界に入ります。

テスト統計量の目標は、モデルがデータにどれだけ適合するかを決定することです。 少し服のようにそれを考えてみてください。 あなたが店にいるとき、マネキンは服がどのように見えるかを教えてくれます(理論的なモデル)。 あなたが家に帰るとき、あなたはそれらをテストし、それらが実際にどのように見えるかを見ます(データベースのモデル)。 テスト統計は、それらの違いが(私は間違いなくマネキンのように見えないので)かどうかを示します。)が重要である。

別の投稿では、相関的および実験的研究の性質について議論しました。 線形回帰、重回帰、およびロジスティック回帰は、同時に発生する変数を相関させるすべてのタイプの線形モデルです。 しかし、実験モデルは、因果モデル、または少なくともケース間の有意な差を述べるモデルに関係しています。

テスト統計は、グループ間に有意差があるかどうかを計算します。 ほとんどの場合、テスト統計は、あなたが思い付くモデルが母集団の理想的なモデルとは異なるかどうかを確認するために使用されます。 例えば、衣服はあなたでするよりマネキンでかなり異なって見るか。 テスト統計の2つの最も一般的なタイプを見てみましょう:t検定とF検定。

t検定は、2つの異なるグループの平均を比較する検定統計量です。 テストの点数、臨床試験、さらにはさまざまな種類の人々がさまざまな場所にいることを幸せにしているなど、グループのパフォーマンスを比較したいと もちろん、さまざまなタイプのグループとセットアップでは、さまざまなタイプのテストが必要です。 必要なt検定のタイプは、使用しているサンプルのタイプによって異なります。

あなたの2つのグループが同じサイズで、ある種の前後の実験をしている場合、従属または対になったサンプルt検定と呼ばれるものを行います。 2つのグループのサイズが異なる場合、または2つの別々のイベント平均を比較している場合は、独立した標本t検定を実行します。

従属または対になったサンプルt検定

私はかなり内向的な人です。 私はクロエの名前でセラピー犬を保証する社会的状況で極端な不安を持っているように内向的です。 そして、彼女はかなり愛らしいです。

今、多くの人が不安を和らげるためにセラピー犬を持っています。 セラピー犬なしで、セラピー犬と一緒に1(低)から5(高)のスケールで人々の不安を測定して、セラピー犬が私のような人々の不安を有意に低下させるかどうかを判断 便宜上、次のデータを取得します

一見すると、治療犬の有無にかかわらず、人々の不安のレベルには明確な違いがあるようです。 あなたは私たちのモデル(彼らは違いを生む)が帰無仮説とは異なるという結論に飛びつきたいと思います(そうではありません)。 しかし、待って、あなたはその主張を裏付けるためにいくつかの統計データを持っていたいと思います。 したがって、t検定を実行します。

t検定は、測定された平均を母集団平均またはベースライン平均と標準偏差で比較する統計分析の一形態です。 私たちは前後の種類の状況で同じグループの人々を扱っているので、従属t検定を実施したいと考えています。 Withoutシナリオはwithシナリオのベースラインと考えることができます。

従来のt検定式は次のようになります

帰無仮説は、2つの標本平均の間に差があってはならないと述べています。 したがって、σ1–σ2=0は私たちに与えます

しかし、あなたはこの番号で何をしますか? さて、あなたはtテーブルの神秘的なチャートを参照してください。 テーブルの上部に沿って、あなたが受け入れて喜んでいるエラーの確率です。 言い換えれば、あなたが間違っている可能性は何ですか? テーブルの側面に沿って自由度があります。 この場合、それぞれ24人の参加者を持つ2つのグループがあるため、46の自由度があります。

t表には、46自由度と0.05%の誤差の臨界値は2.013であると記載されています。 計算されたt値はそれを上回っており、平均値が大幅に異なることを示しています。 私の完全にランダムな架空のデータに基づいて、人々が彼らの治療犬と一緒に示す不安の低い平均は、それ以外の場合は統計的に有意であると知られ

私はクロエが私のために良いと思います、笑。

独立標本t検定

独立標本検定の場合は少し異なります。 このスタイルのテストは、実験計画、または参加者の異なるセットを持つグループを比較する計画に最も適しています。 利点は、グループが同じサイズである必要がないことです。 別の統計的な例を確認してみましょう。

統計クラスの方が他のクラスよりも気になる人がいるかどうかを知りたいと(狂った理由で)ちょっとふりをしてみましょう。 だから、いくつかの喜んでボランティアを見つけ、各クラスの間に彼らの心拍数を測定します。 どちらのクラスにも同じ参加者がいないことに注意することが重要です。 あなたのデータは少し次のようになります

違いはありますが、それは違いで十分ですか? T値を計算して1.92であることが判明した場合、これを40マークのtテーブルと比較して、臨界値を下回っていることに注意してください。 これは、違いはありますが、それは有意差ではないことを意味します。

え、やっぱり統計はストレスじゃないんでしょうね。

t検定の役割は、2つのグループが互いに異なるかどうかを判断することです。 従属t検定は同じ参加者を持つグループに最もよく使用され、独立t検定は異なる参加者を持つグループに最もよく使用されることに注意してくださ

F検定統計

しかし、ジョン、私は何か他のものをテストしたい場合はどうなりますか? モデルのように?

それは素晴らしい質問です!

計算したモデルを平均と比較したい場合があります。 たとえば、線形回帰モデルを計算したとします。 平均は、データを説明するために使用できるモデルでもあることに注意してください。

F検定は、計算したモデルをデータの全体平均と比較する方法です。 T検定と同様に、それが臨界値よりも高い場合、モデルは平均よりもデータを説明するのに優れています。

F検定の核心に入る前に、二乗和について話す必要があります。 すでにその上に最適なラインを持っているいくつかのデータの例を見てみましょう。

F検定は、モデルの残差とデータの全体平均の平均二乗和と呼ばれるものを比較します。 パーティの事実、残差は、実際の、または観測されたデータ点と予測データ点との間の差です。

グラフ(a)の場合、データ点の残差と全体のサンプル平均を見ています。 グラフ(c)の場合、データポイントの残差とデータから計算したモデルを見ています。 しかし、グラフ(b)では、モデルの残差と全体的なサンプル平均を見ています。

二乗和は、残差がモデルまたは平均とどのように比較されるかの尺度であり、どちらを使用しているかに応じています。 私たちが懸念している三つがあります。

残差の平方和(SSR)は、グラフ(c)のように、データポイントと実際の回帰線との間の残差の平方和です。 これらは、負の値を補償するために二乗されます。 SSRは次式で計算されます

合計の二乗和(SST)は、グラフ(a)のように、データポイントとサンプルの平均との間の残差の二乗和です。 これらは、負の値を補償するために二乗されます。 SSTは次のように計算されます。

一見すると方程式は同じように見えるかもしれませんが、重要な区別があることに注意することが重要です。 SSR方程式には予測値が含まれているため、2番目のYはその上に少しニンジンがあります(y-hatと発音されます)。 SST方程式にはサンプル平均が含まれているため、2番目のYはその上に少しバーがあります(yバーと発音されます)。 この非常に重要な区別を忘れないでください。

2つの差(SSR–SST)は、グラフ(b)のように、モデル自体の全体的な平方和を示します。 これは、最終的に実際のF値の計算を開始するために、私たちが求めているものです。

これらの平方和の値は、モデルが観測値からどれだけ変化するかの感覚を与え、モデルが本当に予測に適しているかどうかを判断するのに便利です。 F検定プロセスの次のステップは、残差とモデルの二乗平均を計算することです。

モデルの二乗平均、つまりMSMを計算するには、モデルの自由度を知る必要があります。 ありがたいことに、それはかなり簡単です。 モデルの自由度は、モデル内の変数の数です! 次に、式MSM=SSM÷dfmodel

に従って、残差の二乗平均、またはMSRを計算するには、サンプルサイズの自由度を知る必要があります。 サンプルサイズの自由度は常にN–1です。 その後、単に式に従ってくださいMSR=SSR÷dfresiduals

Ok、あなたはこれまでのところ数学の全体の多くを行っています。 私はそれが超楽しいではないことを知っているので、私はあなたを誇りに思っています。 しかし、これらの値がどのように機能するかを理解するのに役立つため、これらの値がどこから来たのかを知ることは非常に重要です。 今、私たちは実際にF統計が実際にどのように計算されるかを見ていくからです!

この計算により、データの正規平均に対するモデルの予測の比率が得られます。 次に、t統計量と同じように、この比率をF分布表と比較します。 計算された値が表の臨界値を超える場合、モデルはデータの平均値と大きく異なるため、データのパターンを説明するのに適しています。

テスト統計は、モデルがデータのパターンを説明するのに適しているかどうかを判断するために不可欠です。 最も単純な検定統計量は、2つの平均が有意に異なるかどうかを判断するt検定です。 より複雑なモデルの場合、F統計量は、モデル全体が平均値と統計的に異なるかどうかを判断します。 どちらの場合も、良いモデルを悪いモデルから伝えるために不可欠です。 幸せな統計!

You might also like

コメントを残す

メールアドレスが公開されることはありません。