顧客滿意度模型估計的(de)PLS與LISREL

2005/1/2 10:15:03

                                                                     作者:羅春财
  顧客滿意度模型是一(yī)個多方程的(de)因果關系系統——結構方程模型(SEM,Structural Equation Model),有(yǒu)多個因變量,是一(yī)個原因和(hé)結果關系的(de)網,模型必須要按照這些關系進行(xíng)估計。模型中包括質量感知、顧客滿意度、顧客忠誠度和(hé)企業形象等隐變量,這些隐變量隻能通過多個具體測量變量來間接衡量。模型中允許自(zì)變量和(hé)因變量含有(yǒu)測量誤差,還必須要計算出來隐變量的(de)表現得分(例如(rú)通過多個測量變量的(de)加權指數)。
  以ACSI模型為(wèi)例,它就是一(yī)個結構方程模型,包括結構方程(隐變量之間關系的(de)方程)和(hé)測量方程(隐變量和(hé)測量變量之間關系的(de)方程) 。要對結構方程模型進行(xíng)參數估計,目前最經常使用的(de)兩種方法是PLS(Partial Least Square)方法和(hé)LISREL(LInear Structural RELationships)方法。這兩種方法既有(yǒu)相同之處,也有(yǒu)許多不同之處。本文主要讨論兩種方法的(de)算法,以及他們(men)之間的(de)聯系與區别,并根據實證案例,提出我國(guó)在構建顧客滿意度模型過程中使用的(de)方法。
  一(yī)、PLS和(hé)LISREL方法
  PLS(Wald,1982)是将主成分分析與多元回歸結合起來的(de)叠代估計,是一(yī)種因果建模的(de)方法。瑞典、美國(guó)和(hé)歐盟模型都使用這種方法進行(xíng)估計。在ACSI模型估計中 ,該方法對不同隐變量的(de)測量變量子(zǐ)集抽取主成分,放在回歸模型系統中使用,然後調整主成分權數,以最大化模型的(de)預測能力。PLS方法的(de)具體步驟如(rú)下所示。
  步驟1:用叠代方法估計權重和(hé)隐變量得分。從④開始,重複①—④直至收斂。


  步驟2:估計路徑系數和(hé)載荷系數。
  步驟3:估計位置參數。
  PLS方法是“偏”LS,因為(wèi)估計的(de)每一(yī)步都在給定其他參數條件下,對某個參數子(zǐ)集的(de)殘差方差進行(xíng)最小化。雖然在收斂的(de)極限,所有(yǒu)殘差方差聯合的(de)進行(xíng)最小化,但PLS方法仍然是“偏”LS,因為(wèi)沒有(yǒu)對總體殘差方差或其他總體最優标準嚴格的(de)進行(xíng)最小化。
  LISREL(Joreskog,1970)方法通過拟合模型估計協方差 與樣本協方差(S)來估計模型參數,也稱為(wèi)協方差建模方法。具體來說,就是使用極大似然(Maximum Likelihood,ML)、非加權最小二乘(Unweighted Least Squares,ULS)、廣義最小二乘(Generalized LeastSquares,GLS)或其他方法 ,構造一(yī)個模型估計協方差與樣本協方差的(de)拟合函數,然後通過叠代方法,得到使拟合函數值最優的(de)參數估計。例如(rú),采用ML方法的(de)拟合函數的(de)形式為(wèi):
  LISREL中的(de)步驟與PLS相反:先估計參數,然後如(rú)果需要,再考慮所有(yǒu)結構信息,對所有(yǒu)觀測變量作回歸,“估計”隐變量。LISREL 軟件可(kě)以進行(xíng)模型的(de)識别,對所有(yǒu)估計參數的(de)标準誤進行(xíng)檢驗,并對模型拟合程度進行(xíng)檢驗。
  為(wèi)了得到最優估計,ML方法的(de)計算量很大。最麻煩的(de)是信息矩陣(也稱為(wèi)Hessian矩陣,即似然函數對模型中任意兩個參數的(de)二階偏微分矩陣)。如(rú)果模型可(kě)識别,Hessian矩陣必須是正定的(de)。
  二、兩種方法的(de)聯系與區别
  上面簡要介紹的(de)PLS和(hé)LISREL方法,既有(yǒu)相似之處,也有(yǒu)不同。它們(men)的(de)第一(yī)個相似點是都采用箭頭示意圖作為(wèi)模型的(de)圖形表示。第二個相似點是在每個區組(block),都假設測量變量與隐變量和(hé)誤差項為(wèi)線性關系,即y=Λyη+ε x=Λxξ+δ (6)
  第三個相似點是路徑關系(PLS中稱為(wèi)內(nèi)部關系)的(de)表達形式一(yī)樣,η=Βη+Гξ+ζ 或 (I-Β)η=Гξ+ζ。 (7)
  第四個相似點是對每個內(nèi)生變量區組,都給出顯變量y的(de)因果-預測關系,即用隐變量路徑關系中的(de)解釋變量來表示y,y=Λy(Βη+Гξ)+ε+Λyζ (8)
  PLS和(hé)LISREL也有(yǒu)許多不同之處。它們(men)的(de)區别類似主成分分析與因子(zǐ)分析的(de)區别。PLS是從主成分分析發展而來的(de),LISREL是從因子(zǐ)分析發展而來的(de)。
  第一(yī),分布假設不同。PLS為(wèi)了處理(lǐ)缺乏理(lǐ)論知識的(de)複雜問題,采取“軟”方法,避免LISREL模型嚴格的(de)“硬”假設。這樣,不論模型大小,PLS方法都可(kě)以得到“瞬時估計(instant estimation)”,并得到漸進正确的(de)估計,即PLS方法沒有(yǒu)分布要求,而LISREL方法假設顯變量的(de)聯合分布為(wèi)多元正态。
  第二,目标不同。PLS方法的(de)目标是根據區組結構(6)、內(nèi)部關系(7)和(hé)因果預測關系(8)進行(xíng)預測,而LISREL方法研究的(de)目标是矩陣Σ的(de)結構。
  第三,準确性取向不同。PLS估計在樣本量很大和(hé)每個隐變量的(de)顯變量很多時,是一(yī)緻(consistency)和(hé)基本一(yī)緻(consistency at large)的(de),但LISREL估計在大樣本時是最優的(de)(置信區間漸近最小)。最優性包括一(yī)緻性,但一(yī)緻性不包括最優性。因此,PLS和(hé)LISREL對同一(yī)參數的(de)估計都在一(yī)緻性的(de)範圍內(nèi)。兩種估計的(de)差别不可(kě)能、也不應該很大。
  第四,假設檢驗不同。PLS方法采用Stone(1974)和(hé)Geisser(1974)的(de)交互驗證(cross-validation)方法檢驗,考察因果預測關系(8)。LISREL方法一(yī)般使用似然比檢驗,考察觀測矩陣S和(hé)理(lǐ)論矩陣Σ的(de)拟合程度。
  第五,估計順序不同。PLS方法通過逼近,先将每個區組的(de)隐變量的(de)估計得分表示為(wèi)測量變量的(de)加權合計, ,然後通過一(yī)系列權重關系的(de)叠代,得到權重的(de)估計。LISREL方法先估計載荷Λy和(hé)Λx,在這個過程中消去(qù)隐變量,然後通過對測量變量的(de)多元OLS回歸,估計隐變量的(de)樣本值(因子(zǐ)得分)。
  第六,對方程中變量間的(de)關系理(lǐ)解不同。PLS方法将系統部分(6)和(hé)(7)定義為(wèi)給定解釋變量值時的(de)條件期望,作為(wèi)變量間的(de)因果預測關系。因此,對于(6),PLS方法假設,
  E(y/η)=Λyη E(x/ξ)=Λxξ (9)
  對于(7),PLS方法假設,
  E(η/η,ξ)=Bη+Гξ (10)
  而LISREL方法将結構關系(6)和(hé)(7)定義為(wèi)具有(yǒu)誤差的(de)确定性“方程”,即變量間是具有(yǒu)誤差的(de)确定性關系。
  第七,模型的(de)識别不同。PLS方法中,雖然隐變量的(de)估計是逼近得到的(de),但由于估計是顯式的(de)(explicit),因此PLS方法中沒有(yǒu)識别問題。LISREL方法中,矩陣Σ的(de)結構是由區組結構(6)決定的(de),(6)又受到路徑關系(7)的(de)限制,LISREL方法有(yǒu)可(kě)能不能識别模型。因此,LISREL估計的(de)第一(yī)個階段就是考察模型的(de)可(kě)識别性。如(rú)果不能識别,模型中必須包括一(yī)些參數假設(reparameterization assumption)。
  最後,PLS方法中,還可(kě)以選擇三種加權關系,取決于更關注(6)、(7)還是(8)的(de)操作性。權重關系模式A和(hé)模式B分别使用簡單OLS回歸和(hé)多元OLS回歸,模式C是二者的(de)結合。在PLS模型的(de)圖形中,顯變量與其隐變量之間的(de)箭頭指向表明了選擇的(de)估計模式。
  三、PLS和(hé)LISREL的(de)适用條件
  人們(men)在兩種方法的(de)選擇上一(yī)直存在分歧,由以上比較可(kě)見,PLS适用于以下情況:
  1.研究者更加關注通過測量變量對隐變量的(de)預測,勝于關注滿意度模型的(de)參數估計值大小,因為(wèi)PLS的(de)估計量是有(yǒu)偏的(de),但可(kě)以根據測量變量得到隐變量的(de)最優預測 。
  2.适用于數據有(yǒu)偏分布的(de)情況,因為(wèi)PLS使用非參數推斷方法(例如(rú)Jackknife),不需要對數據進行(xíng)嚴格假定;而LISREL假設觀測是獨立的(de),且服從多元正态分布。
  3.适用于關注隐變量得分的(de)情況,因為(wèi)PLS在參數估計過程中就計算隐變量得分,可(kě)以得到确定的(de)計算結果。而LISREL在進行(xíng)參數估計之後,再采用某個目标函數計算隐變量得分,計算結果因目标函數選擇不同而不同。
  4.适用于小樣本滿意度研究 ,因為(wèi)PLS是一(yī)種有(yǒu)限信息估計方法,所需要的(de)樣本量比完全信息估計方法LISREL小得多。
  5. 适用于較大、較複雜的(de)結構方程模型,因為(wèi)PLS收斂速度非常快,計算效率比LISREL更高(gāo) 。但對于不太複雜的(de)顧客滿意度模型,計算時間的(de)優勢不明顯。
  LISREL适用的(de)情況不同:
  1.研究者更加關注滿意度模型的(de)參數估計值大小,即測量變量對隐變量的(de)影響和(hé)測量變量的(de)效度,而不是純粹的(de)預測應用;而且,隻有(yǒu)當模型的(de)參數估計無偏時,才能驗證測量變量的(de)效度,因此PLS不能對此進行(xíng)驗證,因為(wèi)PLS估計的(de)隐變量路徑系數有(yǒu)低(dī)估,不能揭示隐變量之間的(de)關系(Dijkstra, 1983);PLS的(de)隐變量載荷的(de)參數估計易于趨同,且有(yǒu)高(gāo)估偏差。
  2.适用于不同的(de)樣本間參數估計比較的(de)情況,因為(wèi)LISREL可(kě)以提供 檢驗,而PLS得到的(de)權重、載荷和(hé)隐變量得分在不同樣本間的(de)可(kě)比較性是一(yī)個值得懷疑的(de)問題。
  同時,随着LISREL的(de)發展和(hé)完善,也可(kě)以利用PLS的(de)思想來彌補自(zì)身的(de)缺陷:
  3.盡管LISREL中ML估計的(de)有(yǒu)效性、标準誤差和(hé)檢驗統計量的(de)正确性需要數據正态和(hé)獨立的(de)假設,但隻要滿足某些條件,這些特性并不會受到非正态的(de)影響(Satorra,1990)。此外,LISREL也可(kě)以像PLS一(yī)樣使用非參數重抽樣方法(例如(rú)bootstrap)進行(xíng)統計推斷。
  4.LISREL中的(de)ML估計,即使分布假設不成立也非常穩健,可(kě)以得到總體參數的(de)一(yī)緻估計。然後基于這些參數,采用幾種目标函數計算隐變量得分。這些目标函數不同于PLS目标函數,但這并不能說明得分是不确定的(de)。而PLS通過最大化測量變量的(de)可(kě)靠性估計和(hé)隐變量回歸的(de)R2來計算隐變量得分,導緻PLS參數估計有(yǒu)偏 ,使隐變量得分的(de)價值大打折扣。
  實際上,兩種方法各有(yǒu)千秋,分别适用于不同的(de)情況。從根本上說,由于算法的(de)不同,PLS對測量變量協方差矩陣的(de)對角元素的(de)拟合較好,适用于對數據點的(de)分析,預測的(de)準确程度較高(gāo);LISREL對測量變量協方差矩陣的(de)非對角元素的(de)拟合較好,适用于對協方差結構的(de)分析,參數估計更加準确。兩種方法的(de)選擇取決于研究的(de)目的(de)。當研究目的(de)是理(lǐ)論檢驗且先驗理(lǐ)論知識充足時,更宜采用LISREL;當研究目的(de)是因果預測應用,且理(lǐ)論知識非常缺乏時,則PLS更加适合。因此,從實用的(de)角度可(kě)以說,ML和(hé)PLS方法是互補的(de),而不是互斥的(de)。
  四、我國(guó)構建顧客滿意度模型時估計方法的(de)選擇
  對于我國(guó)顧客滿意度模型估計方法的(de)選擇,主要應該在我國(guó)不同行(xíng)業的(de)不同公司進行(xíng)試算,也可(kě)以采取模拟數據進行(xíng)研究,參照國(guó)外的(de)研究結果,對我國(guó)的(de)實證結論進行(xíng)PLS和(hé)LISREL的(de)比較。
  作者對某服務行(xíng)業公司的(de)滿意度數據進行(xíng)測算 ,兩種方法得到的(de)結果進行(xíng)比較,結論與前文類似。PLS估計的(de)隐變量路徑系數有(yǒu)低(dī)估,PLS的(de)隐變量載荷的(de)參數估計易于趨同,且有(yǒu)高(gāo)估偏差,結果如(rú)下表所示 :


  作者介紹:河南君友商(shāng)務咨詢有(yǒu)限公司行(xíng)業研究部經理(lǐ)