跳到主要內容區

淺談探索性研究的統計方法


淺談探索性研究的統計方法

公共衛生學科 蔡培癸副教授

科學研究主要分成驗證性研究及探索性研究兩大類,驗證性研究主要以實驗性質為主,透過研究設計建立同質性高的樣本,以驗證介入變項是否形成結果的差異。而探索性研究主要以研究標的相關因素建立為主,例如透過問卷調查、病歷或資料庫,就研究標的蒐集異質性高的樣本,運用適當的統計分析工具,探索與研究標的差異有關聯的可能因素,做為後續研究假說的實證基礎或介入措施的參考依據。

探索性研究運用統計分析建立關聯性,經常使用多變項迴歸分析(multivariate regression analysis),意即探究每一個獨立變項Xi的數據差異,是否與相對應研究標的變項Y的數據變化有關,且達到統計檢定顯著性。然而研究標的變項Y的屬性不同,使用的統計工具也會不同。常見探索性醫學研究標的變項Y之屬性可分成三大類型:一是量性資料(quantitative data),二是類別資料(categorical data),三是存活時間(survival time)資料。茲以肺癌病人照護相關的研究標的,說明上述三類資料適用的統計分析工具:

. 量性資料適用的複迴歸分析(Multiple Regression)

以肺癌病人生活品質相關因素探討為例,生活品質量測可以透過具有信效度的問卷建立量化的數值(研究標的變項Y),研究者意欲探索相關因素的數據,可能透過問卷調查或病歷資料蒐集而得,將其設為統計分析模型中的X。複迴歸分析的結果, XY的關係透過係數(b)呈現,若統計檢定達顯著性,則可解釋為每一個單位X的變動,連帶可觀察到b單位Y的變動。

. 類別資料適用的羅吉斯迴歸分析(Logistic Regression )

以罹患肺癌的危險因素探討為例,罹患肺癌的病人Y變項數值為1,沒有罹患肺癌的病人Y變項數值為0;研究者從這兩組病人蒐集到的資料中,探索那些變項與罹患肺癌有較高的關聯。羅吉斯迴歸分析結果,XY的關係慣常以勝算比(odds ratio)呈現,若統計檢定達顯著性,則可解釋為具備X特性的病人,相對於沒有X特性的病人,罹患肺癌與否的比值。

.存活時間資料適用的Cox迴歸分析 ( Cox Regression)

以肺癌病人接受治療後存活率的相關因素探討為例,接受治療後的存活期間為Y變項;研究者欲探索的因素為XCox迴歸分析結果,XY的關係慣常以風險比(hazard ratio)呈現,若統計檢定達顯著性,則可解釋為具備X特性的病人,相對於沒有X特性的病人,死亡的風險比值。

總結而言,在這篇文章裡,我們簡單地介紹幾個醫學常用的探索性研究所使用的統計方法。好的研究除了須使用正確的統計方法並分析出那些因素與研究標的具關連性及其關聯程度,以做為驗證性研究的基礎,或介入方案與資源配置的參考依據。而品質不佳的研究因使用了錯誤的統計方法,故可能誤導研究結論,進而對疾病因素與治療提供錯誤訊息。

瀏覽數: