數據 (data)有兩種: numerical和 categorical。Numerical是有數量單位的, 而 categorical就沒有。舉例,「血型」和「性別」是 categorical、「分數」和「高度」是 numerical。

假設你有一大堆收集回來的血型問卷, 怎樣將它們數碼化呢? 可以用 Excel的 countif()函數。如果不懂, 可以參考這裡。這個例子都幾好, 因為它同時解釋了 sumif()函數。

對付 numerical data的方法, 就是將收集回來的例如:學生分數, 然後將數據分組, 做一個  Histogram圖。其中就要用到 Excel的 frequency()函數, 但記住這個函數要用array方法輸入(即是按Ctl-Shift-Enter), 因為這函數傳回的是一個array。唔知我講乜? 唔緊要, 看看這個例子。在這個例子中, 也提供另外更好的方法, 例如 index()內藏 frequency(), 又或者直接利用sumproduct()。

做統計, 除了畫一畫 Histogram 看看, 還要計一計 average()平均數、median()中位數、mode()眾數、varp()變異數及stdevp()標準差等。看一看這些例子吧! varp()的p代表population, 所以計算sample, 就用var()。同樣地, stdev()也是用在計算sample的。

來看看一個例子:(男女兩組的平均薪資)

statistics-01

雖然兩組的平均值都一樣, 但有一個數字可以用來表現兩組的分別, 這就是「離散度」。其實離散度就是標準差。標準差的計法是:(以女生的薪資為例)
statistics-02

結果是, 男生薪資的標準差是1.4, 女生是3.5。所以女生的離散度比較大。

但如果比較甲乙兩隻股票的波動, 就不能直接用標準差來比較。例如甲公司平均股價是120元(標準差40元), 乙公司平均股價60元(標準差30元), 兩者的股價, 在性質上是不同的。只看標準差40>30, 以為甲公司的股價波動大。所以應以變異係數來比較。變異系數 = STDEVP() / AVERAGE()。甲的變異系數40/120=0.33, 乙的變異系數30/60=0.5, 正確判斷乙公司的波動比較大。

我看見網上曾有人問, 為什麼IVE用grading而不用一般大專院校GPA, 去評分? 其實好簡單, GPA分數是你和其他考生的較量(或與平均分相差幾多?), 而grading是測試你是否達標, 其他考生的分數不影你的分數。所以, 如果你某科得75分, 你最後的GPA應是(75-average())/stdevp()分, 或是利用excel的standardize()函數, 可直接計出。

迴歸分析其中一用處, 就是測試兩者的相關程度, 能否構成正比或反比。例如想知道投放的廣告費是否對營業額的增長有幫助, 可以抽樣相關的投放廣告費對應相關的營業額, 然後在座標圖畫上有關的點, 很快就表逹出。如果用數字表逹, 就是相關係數了。計算法是將兩組數輸入Excel的Correl()函數, 求出的結果會介於0與1之間, 大過0.5表示相關度高。再舉一例, 氣温對冰淇淋的銷路關係:

statistics-03

計算相關係數(r), 要利用兩者的共同變異數, 除以各自的標準差。

statistics-05

計算兩者的共變異數, 先要將每項抽樣值的離均差交乘積加起來(如下), 再除以抽樣的數目。即 123 / 5 = 24.6 (其實可以由Excel的cover()函數計出共變異數)。氣溫的標準差為 4.2, 冰淇淋的標準差為 6.2。所以冰淇淋銷量與氣溫的相關係數 = 24.6 / (4.2 * 6.2) = 0.94 (相關程度甚高)。

statistics-04


以上是比較兩者的關係, 如果影響營業額的因素不只一個, 例如:

 statistics-06

營業額是由1.廣告費和2.專櫃小姐人數所影響。0.68和 0.64是它們各自對營業額的貢獻度係數。0.68>0.64表示廣告費的貢獻度比較多。這裡有兩個變數X1和X2, 所以可謂「複迴歸分析」, 用Excel計算, 可參考這裡

再說統計作業, 有時不能取得所有數據(可能總數母體很大), 只能夠抽樣(部份數據)。但準確度就受損。由抽樣(平均數、標準差)計出的母體的平均數, 要作如下修正。

statistics-07

要注意的, 樣本數n 最好在100以上, 否則結果的區間會很大, 精確度會大為降低。如果精確度超過20%, 調查結果就不足採信了。<完>

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 stephen shum 的頭像
    stephen shum

    Stephen Shum

    stephen shum 發表在 痞客邦 留言(0) 人氣()