office Hana Blogs

office Hana / Quality consulting

Familiar Statistics (9) / 熟悉的统计学 (9) / 身近な統計 (9)

日本語は最後にあります。

Listed in English, Chinese, and Japanese in that order.

Please note that this is an automatic translation.

英文、中文和日文,依次排列。

请注意,这是一个自动翻译,任何错误的翻译都应予以确认。

 

 

Familiar Statistics (9)

In the ninth edition of "Everyday Statistics" series provided by the Open University of Japan, we delve into the world of sampling surveys.

Sampling surveys are essential in managing an entire population based on a part of it. They are widely used in a variety of settings, including government statistics, opinion polls by TV stations and newspapers, viewership surveys, and market research.

Terms to Understand:

Population: The entirety of individuals that become the subject of a survey.

Sample: A subset of the population where the actual survey is conducted.

Census Survey: A survey that covers the whole population. It eliminates sampling errors but requires more effort, time, and cost, and has a higher potential for non-sampling errors.

Sample Survey: A survey that targets a subset of the population. It saves time, cost, and effort but comes with sampling errors which are controllable. For instance, television viewership rates are surveyed from 900 out of 13.85 million households.

The Concept of Statistical Inference:

The process of statistical inference involves taking a sample from the population, collecting data, identifying sample characteristics, and then estimating population characteristics.

How to Draw a Sample:

  1. Judgment Sampling: Here, representative individuals are selected based on the subjective judgment of the researcher.

  2. Random Sampling: Selection of individuals is done purely on probability or by chance.

Random Numbers are a sequence of numbers independently generated under a specific probability distribution. A Random Number Table is a table of numbers from 0-9, where each number appears with an equal probability and is independent of others.

Different types of random sampling methods include:

  • Simple Random Sampling: This requires many random numbers and becomes problematic when the target range is large or when dealing with sampling errors.

  • Systematic Random Sampling: Only the first selection uses a random number, after which selections are made at regular intervals.

  • Stratified Random Sampling: The population is divided into strata or layers. Within each layer, the population is homogeneous, while between the layers it is heterogeneous. Simple random sampling is then performed within each layer.

  • Multistage Random Sampling: The population is divided into clusters, from which clusters are selected. From the selected clusters, simple random sampling is performed.

Case Study: NHK Broadcasting Culture Research Institute

The Institute uses stratified random sampling to measure both household and individual viewership rates. For individual viewership, they survey individuals, male and female, aged seven and above, from 3,600 people (300 points x 12 people) using a two-stage stratified random sampling method. Data collection is performed in 5-minute intervals over a specific week, and the results are utilized for program planning for the following year.

By understanding sampling surveys, we become better consumers of information in a world where statistics is all around us.

 

熟悉的统计学 (9)

在日本放送大学提供的“日常统计”系列的第九期中,我们深入探讨了样本调查的世界。

样本调查是管理全体(母体)的重要工具,它通过研究其中的一部分(样本)。样本调查在各种环境中都有广泛的应用,包括政府统计调查、电视台和报社的民意调查、收视率调查、市场调查等。

需要理解的术语:

母体:成为调查对象的所有个体的集合。

样本:母体的一部分,实际进行调查的个体集合。

全数调查:覆盖全部母体的调查。这种调查方式可以消除样本误差,但需要投入更多的努力、时间和成本,并且可能导致非样本误差增大。

样本调查:针对母体的一部分进行的调查。这样可以节省时间、成本和努力,但会产生样本误差,这是可以控制的。例如,电视收视率调查是在1385万户中选择900户进行。

统计推断的概念:

统计推断的过程包括从母体中取样,收集数据,确定样本的特性值,然后推测母体的特性值。

如何抽取样本:

  1. 有意抽样:根据研究者的主观判断选择代表性的个体。

  2. 随机抽样:个体的选择完全基于概率或偶然性。

随机数是在特定概率分布下独立生成的数字序列。随机数表是一个从0-9的数字表,其中每个数字出现的概率相等,且彼此独立。

随机抽样方法有几种:

  • 简单随机抽样:这需要大量的随机数,当目标范围大或面临样本误差时,这可能会出问题。

  • 系统随机抽样:只有第一个选择使用随机数,然后按照固定间隔进行选择。

  • 分层随机抽样:将母体分为几个层次。在每一层内部,母体是均质的,而在各层之间则是异质的。然后在每一层内进行简单随机抽样。

  • 多阶段随机抽样:将母体分为几个簇,从中选取簇。然后从选取的簇中进行简单随机抽样。

案例研究:NHK广播文化研究所

该研究所使用分层随机抽样来测量家庭和个人的收视率。对于个人收视率,他们调查了男女各半,年龄在七岁以上的3600人(300个地点×12人),使用了两阶段的分层随机抽样方法。数据收集以5分钟为间隔,在特定的一周内进行,结果将用于次年度的节目规划。

通过理解样本调查,我们可以在一个充满统计数据的世界中成为更好的信息消费者。

 

身近な統計 (9)

放送大学の「身近な統計」シリーズの第9回では、標本調査の実際について解説します。標本調査は、全体(母集団)を部分(標本)から理解するための手法です。日常生活でよく見かける政府の統計調査、テレビ局や新聞社の世論調査、視聴率調査、市場調査など、多くの調査はこの標本調査に基づいて行われています。

標本調査の基礎

調査を行う際、まず理解しなければならないのが「母集団」です。これは調査の対象となるすべての個体の集合を指します。そしてその母集団から一部を抜き出し、それを「標本」として調査します。調査方法は大きく分けて全数調査と標本調査の2つになります。

全数調査は、母集団全体を対象に調査を行うため、標本誤差はありません。しかし、全数調査には手間・時間・コストがかかるため、大規模な母集団に対する調査では難しさがあります。それに対して標本調査は、手間・時間・コストを大幅に節約できます。ただし、標本から母集団を推測するため、標本誤差が発生します。

例えば、テレビの視聴率調査では、1385万世帯の中から900世帯を抽出して調査を行います。

統計的推測と標本抽出法

標本調査を行う際に重要なのが、「統計的推測」です。これは母集団から標本を抽出し、データを取得して標本の特性値を導き出し、それを基に母集団の特性値を推測するプロセスのことを言います。

そのためには適切な「標本抽出法」が必要です。主に「有意抽出法」と「無作為抽出法」の2つがあります。有意抽出法は、調査者が主観的に代表的な個体を選び出す方法です。一方、無作為抽出法は、確率的な偶然性に基づいて個体を選び出す方法です。

無作為抽出法では、特定の確率分布のもとで互いに独立に生成された「乱数」を使用します。そのための「乱数表」も存在します。無作為抽出法にはさらに「単純無作為抽出」「系統無作為抽出」「層別無作為抽出」「多段無作為抽出」の4つの方法があります。

NHK放送文化研究所の標本調査の例

NHK放送文化研究所では、上記の概念を活用して視聴率の調査を行っています。具体的には、7歳以上の男女3600人(300地点×12人)からなる標本を用いて、層別無作為2段抽出による視聴率調査を行っています。得られたデータは、次年度の番組編成に活用されます。

標本調査の理解は、データが溢れる現代社会で、情報を適切に解釈するための基礎となります。これを機に、身近な統計について改めて考えてみてはいかがでしょうか。

 

 

office Hana An / 小庵

office Hana - office Hana