線性回歸的因變量Y必須為連續變量,但當我們研究的因變量為分類變量時,因為不再是隨機變量,不符合正態分布,因此不能采用線性回歸,此時應該使用Logistic回歸。 SPSS有話說 概述 Logistic回歸分析也用于研究變量之間的影響關系,即X對Y的影響情況,此處涉及的Y是分類數據。結合Y的具體情況,Logistic回歸分析可以分為三種,分別是二元Logistic回歸、多元無序Logistic回歸和多元有序Logistic回歸。Logistic回歸分析的分類情況如下圖: 如果因變量Y僅有兩個類別,分別是有無之類的分類數據,則屬于二元Logistic回歸分析。如果因變量Y有兩個以上的類別,并且類別之間沒有高低、順序關系,比如血型“A型、B型、AB型和O型”,則可以使用多元無序Logistic回歸分析。如果因變量Y的類別有兩個以上的類別,并且類別之間有高低、順序關系,如傷痛級別“輕度、中度、重度”,則可以使用多元有序Logistic回歸分析 問卷研究中,二元Logistic回歸使用頻率最高,該方法簡單易懂,多元無序Logistic回歸和多元有序Logistic回歸則相對復雜。本次僅對二元Logistic回歸進行說明。 特別提示 在進行二元Logistic回歸(包括其他Logistic回歸)分析前,建議先通過單因素分析(t檢驗、卡方檢驗等)考察所有自變量與因變量之間的關系,篩掉一些可能無意義的變量,再進行多因素分析,這樣可以保證結果更加可靠。同時為了防止一些有意義的自變量被單因素分析剔除,單因素分析時將檢驗水準設為P<0.01,只要小于0.01,就認為有意義,然后進行多因素分析。 操作步驟 問題:性別、學歷、獨生子女對去新疆就業意愿的影響? 性別:1=男,2=女; 學歷:1=研究生,2=本科生; 獨生子女:1=是,2=否; 就業意愿:1=愿意,0=不愿意。 (一)單擊“分析” “回歸” “二元logistic” (二)選入相應的因變量和自變量,如圖所示。 (三)單擊“分類”,將各分類變量選入“分類協變量”框中,將參考類別選中“第一個”,單擊“更改”。 注:在參考類別的右側選擇First(表示選擇變量COPD中,賦值最小的,即“0”作為參照。如果選擇Last則表示以賦值最大的作為參照)。 (四)單擊“選項”,勾選“Hosmer-Lemeshow擬合度”和“exp”(OR值),繼續。 結果解釋 ①該結果顯示各變量的編碼情況。 ②模型系數的Omnibus檢驗表明該模型總體有意義,R平方值越接近1,回歸模型擬合越好。 ③“Hosmer-Lemeshow”檢驗,sig=0.443>0.05,即模型擬合優度較高。 ④該結果顯示,學歷(P<0.01,OR=1.684)、獨生子女(P=<0.01,OR=0.599)納入模型中有統計學意義,性別(P>0.05)無統計學意義;常量,即截距,在模型中無實際意義。根據上述的結果,研究生的就業意愿是本科生的1.684倍,非獨生子女的就業意愿是獨生子女的1.669倍(1/0.599)。 特別提示 OR值的含義為:相對于賦值較低的研究對象,賦值較高的研究對象發生某種情況風險的多少倍。例如,男生吸煙發生的可能性是女生的1.292倍。對于連續型變量,如:年齡,即年齡每增加1歲,患鼻咽癌的風險增加OR倍。 |
|
來自: 洪梅6jraxg3utr > 《統計》