大家好,我是公號作者數據小兵,統計學/數據分析非專業教育博主。歡迎大家一起學習和使用統計學方法。限制性立方樣條(RCS)是一種靈活且直觀的曲線擬合方法,可將連續變量與結局間的復雜非線性關系轉化為平滑曲線,并用統計學方法檢驗其非線性趨勢,幫助研究者發現數據中隱藏的'拐點’或'閾值效應’。plotRCS包是R語言中專門為限制性立方樣條(RCS)模型設計的可視化包,支持一鍵繪制平滑曲線、置信區間及非線性檢驗結果,讓復雜關系的呈現更直觀高效。exposure:需要分析的非線性變量(如年齡、血壓等連續變量)。knots:節點位置,默認按分位數設置(如0.05, 0.35, 0.65, 0.95),用戶可自定義。ref.value:參考值位置,默認為第1個節點("k1"),也可指定為具體數值(如ref.value = 50)。pvalue:自動計算并顯示整體效應(Overall)和非線性效應(Nonlinear)的P值。因變量:salary;自變量:eduy;協變量:gender和salbegin。
library(plotRCS) rcsplot(data = employee, outcome = "salary", exposure = "eduy", covariates = c("salbegin","gender")) 基于限制性立方樣條(RCS)回歸模型的教育年限(eduy)與工資(salary)關聯性分析,圖中展示了教育年限(eduy)與工資(salary)的回歸系數(β),模型已調整起始工資(salbegin)和性別(gender)的影響。數據通過線性回歸模型擬合,模型使用4個節點(位于教育年限的5th、35th、65th、95th百分位數),并以第5百分位數(5th)作為參考值。實線表示回歸系數(β),陰影區域表示95%置信區間(CI)。rcs曲線上,p for nonlinear=0.001小于0.05,說明eduy和salary存在顯著非線性關系。
- 4-5節點:中等復雜度,推薦大多數研究(如醫學、社會科學)。
- >5節點:僅限超大樣本量(如>10,000),否則可能過擬合。
- 默認分位數法:均勻分布(如5th, 35th, 65th, 95th),避免邊緣數據稀疏。
- 等距法:變量范圍均勻分段(如10, 20, 30...),適用于均勻分布的數據。
節點少(如3個)的好處包括模型穩定,不易過擬合,計算效率高,但可能忽略真實非線性特征(如漏檢拐點)。比如說若真實關系為“U形”,3節點可能擬合為近似直線。節點過多的好處包括極致靈活,可捕捉微小波動,但可能出現過擬合風險,曲線跟隨噪聲波動,降低泛化性。這個可以基于閾值效應分析。比如本例基于閾值效應分析,我們最終確認的拐點是14.21。我們可以把這個拐點畫在rcs曲線圖上。 總體而言,當eduy低于14.21時,eduy和salary為正向關聯[β (95%CI): 376.58 (94.64 - 658.52)];當eduy高于14.208時,eduy和salary為正向關聯[β (95%CI): 2729.47 (1364.26 - 4094.68)]。如果遇到自己一個人無法解決的問題,歡迎微信聯系小兵進行小額付費咨詢,我的微信:qq2405064443如果是想通過視頻學習SPSS數據分析,那么直接購買加入下方視頻課程即可。??立即學習,助你科研效率翻倍!
|