close

到底是英國人特別喜歡作奇怪的研究,還是台灣的媒體特別喜愛"誤"用英國的研究結果來大作文章。姑且不論其研究的可靠性,光目下標的新聞標題就夠醒目,讓你不尤自主地點進連結。

 

以統計的關點來看,不論其研究命題的方式,其大多犯了一個統計上常見的錯誤。

迴歸分析(Regression analysis)是統計上的一大利器,但如果你不了解其中的函義前就直接套用,相信你也可以導出像英國研究這樣的大膽假設,無心求證的結果。

常見有七大濫用的情況:

  1. 使用迴歸分析來分析非線性關係的問題。 (就像是硬要在分佈極遠的3個點之間劃上一條線,而就希望該線能代表3個點)
  2. 數據間具相關系並不等於具有因果關係。(某一時期美國自閉症人數上升,中國的GDP也上升。這並不意味其間有真接的因果關係)
  3. 顛倒的因果。(A 與B具相關性,並無法推論出是A導致B,還是B導致A。常見的英式作法就是看那種推論較為聳動就選那一個)
  4. 遺漏變數偏誤。(生活壓力大的人大多是"年輕人",做愛次數本來就比年長者多。故其分析遺漏了"年紀"的這個變數)
  5. 高度相關的解釋變數(多重共線性)。(只有走路3次就可以......? 但常走路的人不代表就不從事其它運動。一個統計模型中放入太多高度相關的變數,會使分析的焦點模糊)
  6. 超出資料範圍的推測。(用身高來推算智力? 那你很能得到身高=負25公分這樣的可笑結果)
  7. 資料地雷(太多變數)
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 MR. MINING 的頭像
    MR. MINING

    蛋塔賣你 (Data Mining)

    MR. MINING 發表在 痞客邦 留言(0) 人氣()