17.5 使用合適的量度方法 比較不同組別數據的離差 (Comparing the Dispersions of Different Sets of Data Using Appropriate Measures)

要 比較不同組別數據的離差 ,其實都係用返前面學過嗰兩大類別量度數據離差嘅方法:

  • 分佈域、四分位數間距、框線圖
  • 標準差

至於咩先係合適嘅量度方法就真係好難講。

  • 有時要睇你嘅需要、有時要睇你會用幾多時間去計個“離差”。

不過點都好,我哋都先要了解兩種方法嘅“特點”:

  • “分佈域、四分位數間距、框線圖”嘅優點/優勝之處:
    • 分佈域可以話我哋知最極端數據嘅差距。
    • 再加上四分位數間距,我哋太約都可以知邊數據嘅分佈情況。
    • 用埋框線圖就更加清楚同容易睇。
    • 以上幾點係標準差做唔到嘅!
    • 另外計算“分佈域、四分位數間距”嘅方法比較簡單。
  • 標準差嘅優點/優勝之處:
    • 標準差唔會好似“分佈域、四分位數間距”咁只係某幾個數據嘅值嚟量度整組數據嘅離差。相反,所有嘅數據都會影響到標準差嘅值,所以標準差可以話係一個較公平嘅量度方法。
      • 例如分佈域只考慮最大值同最細值嘅數據,所以只要就算其它數據有幾集中,而只有一、兩個較極端嘅數據,咁分佈域就會好大。
    • 標準差嘅計算比較複習及花時間(當然喺實際做統計時會有電腦程式幫我哋去計)。

比較過兩種方法之後,基本上我哋可以見到:

  • “分佈域、四分位數間距、框線圖”係一個比較快同簡單嘅方法。
  • “標準差”係一個比較公平及仔細嘅方法。

標準分和正態分佈的應用