什么是結(jié)構(gòu)方程模型? 結(jié)構(gòu)方程模型(Structural Equation Modeling,SEM)是在1970年代由Joreskog綜合因素分析、回歸分析與路徑分析而逐步形成的一門統(tǒng)計方法,是一種建立、估計和檢驗因果關(guān)系模型的方法。 模型中既包含有可觀測的顯在變量,也可能包含無法直接觀測的潛在變量。SEM可以替代多元回歸、路徑分析、因子分析、協(xié)方差分析等方法,清晰分析單項指標對總體的作用和單項指標間的相互關(guān)系。與傳統(tǒng)分析方法相比,結(jié)構(gòu)方程模型在了解變量之間的共變關(guān)系的同時,能夠解釋模型中變量盡可能多的變異。 一般用SEM來解釋變量的變異或者變量之間的共變(variation and covariation);用驗證性因子分析探究潛變量和顯變量之間的關(guān)系;用潛增長曲線模型(LGM)估計縱向數(shù)據(jù)的初始、變化、結(jié)構(gòu)斜率和方差;用路徑分析探究變量之間的因果。 ![]() ![]() 潛變量latent variable /unmeasurement variables /factors / concepts /constructs/dimensions) 同義詞:因素、構(gòu)念、構(gòu)面等。 潛變量是無法直接測量或觀察到的變量,需借由一組觀察變量(題目)間接地測量或觀察來作推論,測量的方法可以來自調(diào)查或各種測驗等。 如英文能力為潛變量,可以利用測驗其聽、說、讀、寫能力,來推測其英文能力如何;再比如內(nèi)外向性格也是潛在的心理構(gòu)面,可利用內(nèi)外向量表來評估一個人性格是傾向外向或內(nèi)向(形成型指標)。 潛變量一般以圓形或橢圓形代表。 觀察變量(observed variables/ measured variables/ manifest variables/ indicators generally considered endogenous) 同義詞:測量指標、操作變量、測量變量等。 觀察變量是可直接測量的變量,是一組變量的集合,用來定義或推論潛變量。 例如人的年齡、性別等變量。有時也會采用問卷來衡量,問卷的每個題目也都是一個觀察變量。 觀察變量一般以正方形或長方形代表。 外生變量(exogenous variables/external variables/ independent variables/ predictor variables/affect other variables in the model) 同義詞:自變量、預測變量、獨立變量等。 外生變量指的是在模型中不受到其他變量影響的變量,也就是在圖形中箭頭朝外的變量。 外生變量可以是觀察變量也可能是潛變量,依照變量的形態(tài)而定。 外生變量通常會有箭頭向外指向其他的變量。 內(nèi)生變量(endogenous variables/internal variables/dependent variables/criterion effects of other variables/ can be represented as causes of other endogenous variables) 同義詞:因變量、依變量、應(yīng)變數(shù)、果變量、準則變量等。 內(nèi)生變量指的是模型中收到其他變量所影響的變量,也就是圖形被箭頭所刺到的變量均稱之為內(nèi)生變量。 內(nèi)生變量可以是觀察變量也可以是潛變量,依照變量的形態(tài)決定。 簡單說箭頭往外刺就是外生變量,被箭頭刺到就是內(nèi)生變量。 模型(model)是變量之間關(guān)系的統(tǒng)計陳述,有時也稱之為路徑圖(pathdia gram),就是模型以圖示方式的具體展現(xiàn),也可稱之為研究架構(gòu)圖。 每個潛變量之間的關(guān)系應(yīng)有理論上的支持或?qū)崉?wù)上的證明,最后形成研究架構(gòu)圖。 SEM就是在檢驗這個模型是否與樣本數(shù)據(jù)一致,如果結(jié)論是p值為不顯著(p>0.05),則表示研究模型與樣本數(shù)據(jù)一致,表示模型擬合良好。 模型設(shè)定說明(model specification)是由一組參數(shù)或一個模型的陳述所形成的。 (1)模型設(shè)定與估計的重要原則是研究者經(jīng)過一系列文獻回顧之后,會提出感興趣的模型,并且企圖去了解模型中關(guān)系存在的事實。但在SEM實際分析中,即使假設(shè)的模型已經(jīng)過嚴謹?shù)耐普摚匀粫媾R一些程度不一的不符合最初理想的結(jié)果。 (2)研究者要盡可能地定義出最佳結(jié)果,找出與樣本數(shù)據(jù)擬合良好的特定模型并產(chǎn)生有意義且可以解讀的結(jié)果。 (3)考慮所有可能的模型,包括競爭模型及等價模型(equivalence model),找出特定的模型盡可能通過協(xié)方差矩陣重復樣本數(shù)據(jù),產(chǎn)生擬合度高并具有意義且可以解讀的結(jié)果。 參數(shù)分成固定參數(shù)及自由參數(shù)。 (1)固定參數(shù)(fixparameters)。模型中沒有被估計的值,通常設(shè)為0或1。固定的參數(shù)值通常根據(jù)模型設(shè)定的要求而定,其中一個重要的要求是建立模型中每一個潛變量的尺度,這也包含誤差項(errors)。為解決模型中潛變量尺度設(shè)定的問題,一般以以下兩種方式進行: ①將潛變量的標準差設(shè)定為1,稱為標準化設(shè)定。因為SEM分析中把平均數(shù)假設(shè)為0,所以在正態(tài)分布下,平均數(shù)為0,標準差數(shù)為1即為標準正態(tài)——NORM(0,1)。 ②固定潛變量所估計的多個指標中的一個指標,將其因素負荷量設(shè)為1,稱為非標準化設(shè)定。 (2)自由參數(shù)(freeparameters)。模型中所估計的參數(shù)均為自由參數(shù),通常包括因素負荷量、非標準化(標準化)路徑系數(shù)、方差、協(xié)方差/相關(guān)系數(shù),有些模型會估計平均數(shù)、截距等,這些都屬于自由參數(shù)。 雙相關(guān)(covary)是指協(xié)方差或相關(guān),觀察變量或潛變量之間如果沒有因果關(guān)系的存在,只是有關(guān)聯(lián)(association)而已,稱為相關(guān)或共變。 因素負荷量(factor scores/measurement weights)是一條直線直接從潛變量指向特定的觀察變量,代表因素與測量變量之間的關(guān)系,這條關(guān)系解釋為因素負荷量,該因素負荷量的平方稱為變量估計的共同性(commonality),其實就是潛變量對特定觀察變量的解釋能力,稱為多元相關(guān)平方(square multiple correlations,SMC),也是該測量變量(題目)的信度。 測量誤差(measurement errors)也稱之為殘差,代表的是特定的觀察變量無法被相關(guān)的因素所解釋的獨特的方差。如圖的e1~e3就屬于殘差。要衡量測量誤差,每一個測量誤差的方差需要被估計(非標準化),標準化殘差為1一SMC或(1-factor loading2)。 單向因果關(guān)系(causality)又稱為遞歸路徑(一路傳遞出去的路徑)(recursive),即所有的結(jié)構(gòu)模型路徑都是單方向指向下一個變量,不會有兩個變量相互(reciprocal)影響,也不會有反饋(feedback)路徑的存在。因此,又稱為變量與變量之間的直接效應(yīng)。 間接效應(yīng)(indirect effect)又稱為路徑分析(path analysis),如x對y為直接效應(yīng),x對z為間接效應(yīng),y為中介變量。圖形中x、y、z根據(jù)變量類型用方框或橢圓表示均可。 互為因果關(guān)系(reciprocal,two-way causation)是非遞歸(non-recursive)路徑的一種,也稱循環(huán)互動路徑。如圖,x與y互為直接效應(yīng),x與y具有反饋循環(huán)效應(yīng)。 循環(huán)因果關(guān)系是非遞歸路徑的一種,如圖,x影響y、y影響z,z又回過頭來影響x,以上均為直接效應(yīng),x、y、z:為間接反饋循環(huán)效應(yīng)。循環(huán)因果關(guān)系和中介效應(yīng)很像,不同的是中介是同一時間所搜集的數(shù)據(jù),而循環(huán)因果關(guān)系是不同時間所搜集的數(shù)據(jù)。 干擾(disturbance)一樣是不可解釋的變異(殘差),是內(nèi)生變量無法被自變量解釋的變異,標準化的干擾(殘差)也等于1-SMC。 多元相關(guān)平方為可解釋方差或R2,是內(nèi)生(潛在)變量被外生(預測)變量所解釋的百分比。 SEM以協(xié)方差矩陣作為分析的基礎(chǔ),因此有必要對分析中會出現(xiàn)的幾個矩陣要加以介紹,分別為樣本協(xié)方差矩陣(sample covariances,S matrix)、隱含(期望)協(xié)方差矩陣(implied covariances,Σ(θ))、殘差協(xié)方差矩陣(residual covariance,S-Σ(θ))及標準化殘差協(xié)方差矩陣(standardize residual covariance,[S-Σ(θ)]/s.e.)。 擬合度(配適度)指標(fit indices)表示當研究者設(shè)定一個包含固定參數(shù)及自由參數(shù)的模型后,與樣本數(shù)據(jù)協(xié)方差矩陣一致性的程度。如常用的擬合度指標為Chi-square、CFI、NNFI以及RMSEA等。 偏度(skew)表示變量數(shù)據(jù)分布左右不對稱的程度。如果偏度過于嚴重,表示數(shù)據(jù)中有極端值(outliers),應(yīng)將極端值予以刪除。 峰度(kurtosis)表示變量的分布上下高低的程度。一般統(tǒng)計學上將正態(tài)峰定義為平均數(shù)為0,方差為1,圖形呈現(xiàn)鐘形對稱分布,峰度為3。只要峰度高于3稱之為高狹峰,峰度低于3則為低闊峰。在統(tǒng)計意義上,通常將峰度減3,此時正態(tài)分布的峰度為0,峰度值為正即為高狹峰,代表樣本值較為集中;峰度值為負則為低闊峰,代表樣本值較為分散。 多元正態(tài)是當每一個觀察變量都是正態(tài)分布的情況下,與其他的觀察變量結(jié)合后仍維持正態(tài)分布的現(xiàn)象。當x軸為某指定變量的值,y軸為計算該變量每個值的權(quán)重,z軸是任何其他變量的值。在結(jié)構(gòu)方程模型的分析中,多元正態(tài)是經(jīng)常性的假設(shè)條件。 一般SEM模型包含了測量模型與結(jié)構(gòu)模型兩部分。測量模型評估的是潛變量與測量指標之間的關(guān)系,又稱為驗證式因素分析(CFA)模型,而結(jié)構(gòu)模型描述的是潛變量與潛變量之間的關(guān)系,不包含潛變量的測量指標。 驗證式因素分析(confirmatory factor analysis,CFA)模型指的是所有的觀察變量直接與潛變量聯(lián)結(jié),并讓因素負荷量自由估計,箭頭需由潛變量指向觀察變量(反映型指標)。模型正定的條件為潛變量方差(方差)設(shè)為1或在某一觀察變量因素負荷量設(shè)為1,每個構(gòu)面至少要三個觀察變量,除非模型有兩個潛變量。 違犯估計(offending estimate)指的是參數(shù)估計中出現(xiàn)不合理的估計值,如標準化系數(shù)接近1(>0.95)或超過1、殘差值為負值或不顯著。因為殘差值為平方值,所以不可能為負數(shù)。而不顯著即代表殘差不存在,不符合實務(wù)上的認知。 Hair等人(2009)提出發(fā)生違犯估計的原因通常是樣本數(shù)不夠大,如只有100多個樣本或沒有符合每個構(gòu)面3個觀察變量的原則。只要樣本數(shù)超過300個,再加上每個構(gòu)面有3個觀察變量就不太可能產(chǎn)生違犯估計。 迭代(iteration)為數(shù)學上的一種演算法,對一組問題求解,從初始估計出發(fā),先預估初始解,再尋找一系列近似解來解決問題的過程。這個過程使得后一個解比前一個解更接近實際值,直到與實際值差異可忽略不計為止,這一過程所使用的方法統(tǒng)稱為迭代法。收斂(convergence)則是一連串的迭代結(jié)果,最后與實際值相接近,數(shù)學上通常以0.001為標準。 以實際的例子說明迭代法在生活上的應(yīng)用,例如電視綜藝節(jié)目中有一個猜數(shù)字的游戲節(jié)目,主持人先設(shè)定一個數(shù)字,由現(xiàn)場5位嘉賓猜數(shù)字,猜中就會獲得獎勵。第一位嘉賓假設(shè)猜66,主持人會提示正確的數(shù)字在0-66之間,于是第二位嘉賓可能猜36,主持人再次提示正確的數(shù)字在36-66之間。如此重復這個過程,嘉賓所猜的數(shù)字會越來越接近中獎號碼,直到中獎號碼猜中為止。這個猜測的過程稱之為迭代,最后猜測的正確結(jié)果稱之為收斂。 ![]() ![]() SEM是一種大樣本的分析技術(shù),樣本數(shù)不應(yīng)該太小,如此才能取得穩(wěn)定的參數(shù)估計及標準誤,因為協(xié)方差矩陣大小的差異對樣本數(shù)非常敏感。至于樣本數(shù)多少才夠?有許多學者提出不同的看法。
綜合上述的看法,大于200以上的樣本,才可以稱得上是一個中型的樣本,若要追求穩(wěn)定的SEM結(jié)果,樣本數(shù)最少在200以上。 也可從觀察變量(題目)的數(shù)量來確定樣本數(shù)量,每一個觀察變量至少要有5個樣本,最好每個觀察變量在10-20個樣本。 ![]() ![]() SEM的分析主要依賴計算機軟件的協(xié)助。目前全球比較常用的SEM分析工具大致有以下八種,即Amos、CALIS、EQS、LISREL、Mplus、Mx、RAMONA以及SEPATH。 下面簡單介紹的Mplus、Amos。
Mplus的優(yōu)勢在于允許一起分析橫截面和時間序列數(shù)據(jù),單層和多層數(shù)據(jù),來自不同母樣本的數(shù)據(jù),以及可見或不可見的異質(zhì)數(shù)據(jù)。可分析的變量是連續(xù)變量(continuous)、缺失變量(consored)、二分類變量(binary)、順序變量(ordered categorical/ordinal)、名義變量(unordered categorical/ nominal)、計數(shù)變量(counts)或這些變量類型的組合。Mplus也有特別的功能處理缺失值、復雜的調(diào)查數(shù)據(jù)和多層次的數(shù)據(jù)。此外,Mplus有強大的功能用于蒙特卡羅模擬研究。 官網(wǎng)網(wǎng)址:http:///
Amos(Analysis of Moment Structures)由Arbuckle(1995-2012年)開發(fā),目前是IBM SPSS公司旗下的產(chǎn)品,該軟件可以獨立進行運作,無須依賴SPSS的工作環(huán)境。Amos可直接讀取SPSS的數(shù)據(jù)文件,不同版本的SPSS數(shù)據(jù)文件皆可讀取,并且可將整個數(shù)據(jù)文件應(yīng)用于分析過程中,無須作任何文件切割。Amos以畫圖為主,軟件會自動將圖形轉(zhuǎn)為程序代碼并進行演算。此外,Amos也可以用BASIC語法輸入,但此步驟太過麻煩,很少有研究者使用這一功能。Amos軟件的特色是內(nèi)置Bootstrap(自助法)的估計方法,可以估計所有參數(shù)的標準誤及置信區(qū)間,對于缺失值的插補也提供了ML插補及多重插補法。 官網(wǎng)網(wǎng)址:http:/// 本文來自:記向日書公號 參考文獻|《與結(jié)構(gòu)方程模型共舞:曙光初現(xiàn)》張偉豪;徐茂洲;蘇榮海 尤其是拿SPSS做科研學術(shù)數(shù)據(jù)分析,論文寫作數(shù)據(jù)分析,我的這個課程太適合你了。可以一邊看視頻,一般討論溝通解決難題,雙管齊下,收獲更多。 |
|
來自: 漢無為 > 《統(tǒng)計分析》