1. 程式人生 > 其它 >醫學統計學習 | 第一章 基本概念和SPSS特點

醫學統計學習 | 第一章 基本概念和SPSS特點

引用內容是我的碎碎念
封校了很無聊,想起來可以有時間繼續寫統計內容了。2022年了學校的醫學統計仍然是用SPSS,R語言哭暈在廁所。
以下為看這本書的時候做的一些筆記,這本書編排合理,有SPSS說明,好評

參考書籍:1.Peat, J. K. & Barton, B. Medical statistics: a guide to SPSS, data analysis, and critical appraisal. (John Wiley & Sons Inc, 2014).

SPSS是選單式統計分析軟體,操作邏輯靠滑鼠點選就能完成,不需要程式設計基礎。其中DATA一欄負責分割資料、去重等等,TRANSFORM一欄負責對變數的轉換、分組等,ANALYZE一欄負責各種統計分析。

資料錄入介面為表格式,和EXCEL相同,在錄入資料前需要在變數編輯介面設定好變數型別、取值精度等等。對每一個變數可以設定標籤,這一點倒是和STATA相似,避免忘掉當初為什麼這樣起名。

變數的型別分為三種:

  1. Nominal Variable 名義變數,分類變數的一種,例如性別
  2. Ordinal Variable 定序變數,分類變數的一種,例如壓力程度,由輕到重漸進編號
  3. Scale Variable 連續變數,即不能分類的,形式為數值的測量量,例如BMI

資料匯入:常常用EXCEL進行資料錄入,然後File →Open →Data匯入資料進入SPSS,SPSS儲存檔案的字尾為sav;

但實際上最好最好不要用EXCEL做這件事,因為EXCEL有資料更正的功能,特別是當你輸入基因名的時候他會自動糾正,給你的分析帶來不可預知的災難性後果。這就是生物資訊分析使用程式語言的原因。

分析模型中的變數名稱問題 數學裡常常把X軸上的稱為自變數,Y軸上的稱為因變數;但是目前把他們一組叫做解釋變數 Explanatory Variable,一組叫做結果變數 Outcome Variable 比較好,更符合敘述邏輯。

假設檢驗和P值 假設檢驗分為三個步驟:建立假設-計算-得出檢驗結論。第一個步驟中建立零假設\(H_0\),含義為要比較的幾組資料之間的某個統計量,比如均值,如果均值相等,就推斷沒有差異。計算由統計軟體完成,不用自己費心。P值代表零假設成立的概率,P值小於0.05則拒絕零假設,說明組間有差異。至於這個數字為啥是0.05,這是人為規定的,P的界限可大可小,也可以是0.1或0.01.

也正因為P值是個概率,才會有I類和II類錯誤的出現。I類錯誤為假陽性,臨床中可表現為檢驗單上陽性但實際上病人沒有臨床表現,也就是零假設被錯誤地拒絕了;II類為假陰性,可以理解成核酸漏檢了一個陽性… 詳細說明可見這個解釋

P值最先是由Fisher他老人家制定的,大佬發話於是就一直延續這個傳統了
另據八卦,Fisher和Neyman經常就因果推斷的問題進行學術爭論(吵架)

關於自由度df 自由度代表有多少個變數可以自由變動,自由意味著樣本的獨立性。當有約束條件時(比如樣本服從整體的情況下,樣本均值確定了),自由度減少。
自由度計算公式:自由度=樣本個數-樣本資料受約束條件的個數,即df=n-k(df自由度,n樣本個數,k約束條件個數)
具體請看:這個解釋

關於正態性檢驗 除了可以用上課講的Explore一欄在Plot選項卡內勾選檢驗正態性,還可以在非引數檢驗中進行單樣本的正態檢驗,選單選擇順序為Non-parametric tests; One sample; Kolmogorov–Smirnov (即KS檢驗)

統計方法選擇 本書的1.6 Choosing the correct statistical test 對於如何選擇合適的統計檢驗方法做了詳盡的表格,考試的時候揹著這個表格就不會選錯了。

由於不少期刊要求同時上傳原始資料檔案,所以正式分析資料時要記錄好儲存時間和檔案、原始資料相應位置。最好有單獨的LOG檔案記錄每次的操作,避免丟失進度。

我覺得SPSS最煩人的是每次操作完成後都要跳出OUTPUT框,還很大一個。你安安靜靜待在後臺不好嗎……

缺失值的處理 Transform −→Replace Missing Values 缺失值的填補有很多種辦法,最常見的是填上其他資料的均值,但這個方法其實不是很靠譜,因為這就強化了統計結論的可靠度了。

結果的儲存 不需要直接用微信或其他截圖,在OUTPUT介面右擊結果,選擇儲存為圖片即可。此外OUTPUT介面有按鈕可以追溯先前的歷史操作,也就是說,這個視窗每次點最小化而不是關掉,就能儲存一次分析的所有結果。

但依舊,每次操作後都要彈窗……

就醬,有問題請在評論區留言,最近會勤快更新的。