office Hana Blogs

office Hana / Quality consulting

Familiar Statistics (11) / 熟悉的统计学 (11) / 身近な統計 (11)

日本語は最後にあります。

Listed in English, Chinese, and Japanese in that order.

Please note that this is an automatic translation.

英文、中文和日文,依次排列。

请注意,这是一个自动翻译,任何错误的翻译都应予以确认。

 

 

Familiar Statistics (11)

Broadcast University's eleventh series on "Everyday Statistics" sheds light on the concept of statistical hypothesis testing. Let's delve into the topic.

From Sample to Population:

Statistical inference allows us to make educated guesses about a population based on sample data. This process can be broken down into two key categories:

  1. Estimation: Using sample data to estimate population parameters such as mean or proportion. Concepts like sample error (S.E.) and confidence intervals are essential in this realm.
  2. Testing: Based on sample data, we judge hypotheses about population means or proportions. A critical term to remember here is the significance level (risk rate).

The Essence of Hypothesis Testing:

Hypothesis testing is a set of rules that help us determine the validity of an uncertain hypothesis about a population based on data. Two primary hypotheses exist:

  1. Null Hypothesis (H0): The default hypothesis, which is generally set with the expectation of being refuted.
  2. Alternative Hypothesis (H1): Adopted when the null hypothesis is rejected.

If sample data probabilistically contradicts the null hypothesis, it is rejected, leading to the acceptance of the alternative hypothesis.

The Two Errors:

  1. Type I Error: Represented as α, this error occurs when the null hypothesis is true, but we mistakenly reject it. Often called the "hasty error."
  2. Type II Error: Denoted by β, it happens when the null hypothesis is false, but we fail to reject it. Known as the "oblivious error."

It's vital to note that it's impossible to minimize both α and β simultaneously. Typically, α is controlled in advance, with common standards being 5% or 1%.

Testing Procedures:

  1. Set the null hypothesis H0 and alternative hypothesis H1.
  2. Determine the test method (test statistic T).
  3. Check the probability distribution of test statistic T under H0.
  4. Set the significance level α.
  5. Confirm the rejection region for T according to α.
  6. Collect sample data.
  7. Calculate the specific value 't' for the test statistic T using the data.
  8. Compare 't' value with the rejection region (or calculate the p-value and compare it with α).

Note: p-value is the cumulative probability in the direction of the alternative hypothesis starting from the 't' value on the T distribution.

Various Tests:

  1. One-Sample Test for Normal Population Mean: Use z-test when standard deviation is known and t-test when it's unknown.
  2. One-Sample Test for Population Proportion: Use the binomial theorem for small samples and z-test for large samples.
  3. Testing the Difference of Means for Two Normal Populations: Use z-test when standard deviations are known and t-test when they're unknown.

In conclusion, statistical hypothesis testing is a foundational concept in understanding how to make valid inferences about populations based on sample data. Whether you're diving into research or just curious, grasping these principles can empower you to make more informed decisions.

 

熟悉的统计学 (11)

广播大学第十一期 "日常统计 "系列节目揭示了统计假设检验的概念。让我们深入探讨这一主题。

从样本到总体:

统计推断允许我们根据样本数据对总体进行有根据的推测。这一过程可分为两大类:

  1. 估计: 使用样本数据估计平均值或比例等总体参数。样本误差 (S.E.) 和置信区间等概念在这一领域至关重要。
  2. 检验: 根据样本数据,我们判断有关总体均值或比例的假设。这里需要记住的一个关键术语是显著性水平(风险率)。

假设检验的本质:

假设检验是一套规则,帮助我们根据数据来确定有关人群的不确定假设的有效性。主要存在两种假设:

  1. 零假设(H0): 默认假设,通常是以被反驳为预期而设定的。
  2. 备择假设 (H1): 在否定零假设时采用。

如果样本数据在概率上与零假设相矛盾,则拒绝接受零假设,从而接受备择假设。

两种错误:

  1. 第一类错误: 用 α 表示,当零假设为真,但我们错误地拒绝了它时,就会出现这种错误。通常称为 "草率错误"。
  2. 第二类错误: 用 β 表示,它发生在零假设为假,但我们未能拒绝它的情况下。被称为 "遗忘误差"。

需要注意的是,不可能同时最小化 α 和 β。通常情况下,α 是事先控制好的,常见的标准是 5%或 1%。

测试程序:

  1. 设定零假设 H0 和备择假设 H1。
  2. 确定检验方法(检验统计量 T)。
  3. 检验 H0 条件下检验统计量 T 的概率分布。
  4. 设定显著性水平 α。
  5. 根据 α 确认 T 的拒绝区域。
  6. 收集样本数据。
  7. 利用数据计算检验统计量 T 的特定值 "t"。
  8. 将 "t "值与拒斥区域进行比较(或计算 p 值并与 α 进行比较)。

注:p 值是从 T 分布上的 "t "值开始,向替代假设方向的累积概率。

各种测试

  1. 正态分布均值的单样本检验: 已知标准差时使用 z 检验,未知标准差时使用 t 检验。
  2. 种群比例的单样本检验: 小样本使用二项式定理,大样本使用 z 检验。
  3. 检验两个正常种群的均值差: 已知标准差时使用 z 检验,未知标准差时使用 t 检验。

总之,统计假设检验是了解如何根据样本数据对群体做出有效推断的基础概念。无论您是在潜心研究还是只是好奇,掌握这些原则都能让您做出更明智的决定。

 

身近な統計 (11)

皆さん、統計というと難しいイメージを持っていませんか?放送大学の「身近な統計(11)」を基に、統計的仮説検定の考え方をわかりやすく解説します。

標本から母集団への推測:

標本データを使用して母集団についての推測を行う手法として、推定と検定の2つが存在します。

  • 推定: 母集団の平均や比率を標本から推定します。この際に、標本誤差や信頼区間が大切です。
  • 検定: 母集団の平均や比率に関する仮説の真偽を判断します。ここで重要なのが有意水準です。

仮説検定の基礎:

  1. 帰無仮説(H0): 一般的な前提として設定され、通常は否定されることを期待します。
  2. 対立仮説(H1): 帰無仮説が棄却された場合に採用される仮説です。

2つの過誤:

  • 第一の過誤: 帰無仮説が真であるにも関わらず、誤って棄却する場合。あわて者の誤りとも呼ばれます。
  • 第二の過誤: 帰無仮説が偽でありながら、棄却しない場合。ぼんやり者の誤りとも言えます。

これらの過誤は同時に小さくすることができず、αは通常5%や1%として設定されます。

検定のステップ:

  1. 帰無仮説と対立仮説の設定
  2. 検定方法の決定
  3. 帰無仮説下の検定統計量の確率分布の確認
  4. 有意水準の設定
  5. αに基づく棄却域の確認
  6. データの採取
  7. データからの具体的な値の計算
  8. 計算された値と棄却域の比較

様々な検定方法:

  • 正規母集団の母平均の検定: 標準偏差が既知の場合はz検定、未知の場合はt検定を用います。
  • 母集団比率の検定: 小標本の場合は2項定理、大標本ではz検定が用いられます。
  • 2つの正規母集団の母平均の差の検定: 標準偏差が既知ならz検定、未知ならt検定を使用します。

統計的仮説検定は、日常の疑問を科学的に解明するための強力なツールです。放送大学の「身近な統計」を通じて、統計の魅力を感じてみませんか?

 

 

office Hana An / 小庵

office Hana - office Hana