office Hana Blogs

office Hana / Quality consulting

Familiar Statistics (3) / 熟悉的统计学 (3) / 身近な統計 (3)

日本語は最後にあります。
Listed in English, Chinese, and Japanese in that order.
Please note that this is an automatic translation.
英文、中文和日文,依次排列。
请注意,这是一个自动翻译,任何错误的翻译都应予以确认。

 

 

Familiar Statistics (3)

As I continued my educational journey with the Open University of Japan, I delved into understanding frequency distribution tables and histograms - vital tools for summarizing quantitative data. It’s fascinating how we can aggregate data to unearth patterns or distributions, thereby revealing the likelihood of certain values.

Grades and frequency distribution tables, for instance, use intervals (or classes) for quantitative data. These include class values, frequencies, cumulative frequencies, relative frequencies, and cumulative relative frequencies. It's essential to not only create these but also be able to analyze them effectively.

Moving onto graphical summaries, histograms stand out among the common statistical graphs that include box plots and scatter plots. Coupling histograms with cumulative relative frequencies helps pinpoint the median - the value splitting data in half. However, it's crucial to keep the class range neither too large nor too small for accuracy.

Interpreting histograms is an art. For instance, a unimodal, symmetrical shape represents homogeneous data variability. Multimodal indicates mixed populations. Asymmetry shows skewed data. Outliers require thorough investigation to identify their cause.

This knowledge is vital in health initiatives, aiding efforts to extend healthy life expectancy, considering the financial challenges of health insurance. Using electronic receipts, we can shift from a high-risk approach (post-illness measures) to a population approach (pre-illness measures).

Finally, creating histograms becomes easy with Excel's pivot tables, making statistics more accessible to everyone.

Unimodal, symmetrical shape

 

Multimodal

 

Asymmetry

 

Outliers

 

 

熟悉的统计学 (3)

我最近在日本开放大学听了一场讲座,主题是频率分布表与柱状图,这两者是统计学中的重要工具,用于总结定量数据的变化。

我们可以通过聚合数据,挖掘出数据中隐藏的模式或分布,从而了解某个值发生的可能性。例如,等级与频率分布表,我们使用区间(也称为类别)来分类定量数据。这些包括类别值、频率、累积频率、相对频率和累积相对频率。我们既需要创建这些信息,也需要有效地分析它们。

接下来,我们将研究图形摘要,其中柱状图在常见的统计图形(包括箱形图和散点图)中备受青睐。结合累积相对频率和柱状图,可以帮助我们找到中位数——将数据分成两半的数值。值得注意的是,类别的范围既不能太大也不能太小,以保持精确度。

阅读柱状图是一门艺术。例如,单峰、对称的形状代表同质群体中数据的变异性。多峰则表示混合了不同的群体。不对称形状表明数据向右偏斜或向左偏斜。对于离群值,我们需要进行深入研究,找出其出现的原因。

这些知识在健康倡议中具有重要作用,鉴于健康保险的财政困难及其对企业的影响,我们需要采取措施延长健康的预期寿命。例如,我们可以使用电子收据,将高风险方法(疾病发生后采取的措施)转变为人口方法(疾病发生前采取的措施)。

最后,我们要提到的是Excel。通过使用数据透视表,我们可以轻松创建柱状图,使统计学对每个人都更加容易理解。总的来说,掌握这些工具和技术可以让我们更好地理解和使用数据,从而做出更明智的决策。

单模态,对称的形状

 

多模态

 

不对称性

 

离群值

 

 

身近な統計 (3)

最近、放送大学の講義を視聴しました。その主題は「度数分布表とヒストグラム」で、量的データのバラツキを分析する統計学の手法について学びました。

まず、データを集計することで、値がどれほど起こりやすいかのパターン、つまり分布を探ることが可能です。量的データに対しては、「階級」を設定し、階級値、度数、累積度数、相対度数、累積相対度数を計算します。これらのデータを作成するだけでなく、正しく読み解くことが重要なのです。

次に、統計データの視覚化として、箱ひげ図、散布図、そしてヒストグラムといった統計三大グラフについて学びました。特にヒストグラムは、累積相対度数と組み合わせることでデータの中央値(データを半分に分ける値)を探ることが可能です。ただし、階級幅は大きすぎても小さすぎてもならない、という注意点があります。

さらにヒストグラムの形状によって、データの特性を理解することも可能です。単峰性で左右対称な形は、同質な集団のデータのばらつきを示しています。一方、多峰性は、異質な集団の混在の可能性を示唆します。非対称な形状は、データが右か左に偏っていることを表します。そして、外れ値の存在は、その原因を探るきっかけとなります。

このような統計の知識は、健康寿命を延ばすという課題に対する取り組みにも応用可能です。例えば、電子レセプトのデータを分析することで、ハイリスクアプローチ(病気になってからの対応)からポピュレーションアプローチ(病気になる前からのアプローチ)へと移行することが可能です。

そして最後に、Excelのピボットテーブルを用いれば、誰でも簡単にヒストグラムを作成することができます。これらの知識を駆使して、身の回りのデータを分析し、より賢い選択をする手助けにしましょう。

単峰性で左右対称な形

 

多峰性

 

非対称

外れ値

 

 

office Hana An / 小庵

office Hana - office Hana