顧客滿意度模型估計的(de)PLS與LISREL--君友視(shì)角--河南君友數字科(kē)技有(yǒu)限公司

作者：羅春财
　　顧客滿意度模型是一(yī)個多方程的(de)因果關系系統——結構方程模型（SEM，Structural Equation Model），有(yǒu)多個因變量，是一(yī)個原因和(hé)結果關系的(de)網，模型必須要按照這些關系進行(xíng)估計。模型中包括質量感知、顧客滿意度、顧客忠誠度和(hé)企業形象等隐變量，這些隐變量隻能通過多個具體測量變量來間接衡量。模型中允許自(zì)變量和(hé)因變量含有(yǒu)測量誤差，還必須要計算出來隐變量的(de)表現得分（例如(rú)通過多個測量變量的(de)加權指數）。
　　以ACSI模型為(wèi)例，它就是一(yī)個結構方程模型，包括結構方程（隐變量之間關系的(de)方程）和(hé)測量方程（隐變量和(hé)測量變量之間關系的(de)方程）。要對結構方程模型進行(xíng)參數估計，目前最經常使用的(de)兩種方法是PLS（Partial Least Square）方法和(hé)LISREL（LInear Structural RELationships）方法。這兩種方法既有(yǒu)相同之處，也有(yǒu)許多不同之處。本文主要讨論兩種方法的(de)算法，以及他們(men)之間的(de)聯系與區别，并根據實證案例，提出我國(guó)在構建顧客滿意度模型過程中使用的(de)方法。
　　一(yī)、PLS和(hé)LISREL方法
　　PLS（Wald，1982）是将主成分分析與多元回歸結合起來的(de)叠代估計，是一(yī)種因果建模的(de)方法。瑞典、美國(guó)和(hé)歐盟模型都使用這種方法進行(xíng)估計。在ACSI模型估計中，該方法對不同隐變量的(de)測量變量子(zǐ)集抽取主成分，放在回歸模型系統中使用，然後調整主成分權數，以最大化模型的(de)預測能力。PLS方法的(de)具體步驟如(rú)下所示。
　　步驟1：用叠代方法估計權重和(hé)隐變量得分。從④開始，重複①—④直至收斂。

　　步驟2：估計路徑系數和(hé)載荷系數。
　　步驟3：估計位置參數。
　　PLS方法是“偏”LS，因為(wèi)估計的(de)每一(yī)步都在給定其他參數條件下，對某個參數子(zǐ)集的(de)殘差方差進行(xíng)最小化。雖然在收斂的(de)極限，所有(yǒu)殘差方差聯合的(de)進行(xíng)最小化，但PLS方法仍然是“偏”LS，因為(wèi)沒有(yǒu)對總體殘差方差或其他總體最優标準嚴格的(de)進行(xíng)最小化。
　　LISREL（Joreskog，1970）方法通過拟合模型估計協方差與樣本協方差（S）來估計模型參數，也稱為(wèi)協方差建模方法。具體來說，就是使用極大似然（Maximum Likelihood，ML）、非加權最小二乘（Unweighted Least Squares，ULS）、廣義最小二乘（Generalized LeastSquares，GLS）或其他方法，構造一(yī)個模型估計協方差與樣本協方差的(de)拟合函數，然後通過叠代方法，得到使拟合函數值最優的(de)參數估計。例如(rú)，采用ML方法的(de)拟合函數的(de)形式為(wèi)：
　　LISREL中的(de)步驟與PLS相反：先估計參數，然後如(rú)果需要，再考慮所有(yǒu)結構信息，對所有(yǒu)觀測變量作回歸，“估計”隐變量。LISREL 軟件可(kě)以進行(xíng)模型的(de)識别，對所有(yǒu)估計參數的(de)标準誤進行(xíng)檢驗，并對模型拟合程度進行(xíng)檢驗。
　　為(wèi)了得到最優估計，ML方法的(de)計算量很大。最麻煩的(de)是信息矩陣（也稱為(wèi)Hessian矩陣，即似然函數對模型中任意兩個參數的(de)二階偏微分矩陣）。如(rú)果模型可(kě)識别，Hessian矩陣必須是正定的(de)。
　　二、兩種方法的(de)聯系與區别
　　上面簡要介紹的(de)PLS和(hé)LISREL方法，既有(yǒu)相似之處，也有(yǒu)不同。它們(men)的(de)第一(yī)個相似點是都采用箭頭示意圖作為(wèi)模型的(de)圖形表示。第二個相似點是在每個區組（block），都假設測量變量與隐變量和(hé)誤差項為(wèi)線性關系，即y=Λyη+ε x=Λxξ+δ （6）
　　第三個相似點是路徑關系（PLS中稱為(wèi)內(nèi)部關系）的(de)表達形式一(yī)樣，η＝Βη+Гξ+ζ 或（I-Β）η＝Гξ+ζ。（7）
　　第四個相似點是對每個內(nèi)生變量區組，都給出顯變量y的(de)因果－預測關系，即用隐變量路徑關系中的(de)解釋變量來表示y，y=Λy（Βη+Гξ）＋ε＋Λyζ （8）
　　PLS和(hé)LISREL也有(yǒu)許多不同之處。它們(men)的(de)區别類似主成分分析與因子(zǐ)分析的(de)區别。PLS是從主成分分析發展而來的(de)，LISREL是從因子(zǐ)分析發展而來的(de)。
　　第一(yī)，分布假設不同。PLS為(wèi)了處理(lǐ)缺乏理(lǐ)論知識的(de)複雜問題，采取“軟”方法，避免LISREL模型嚴格的(de)“硬”假設。這樣，不論模型大小，PLS方法都可(kě)以得到“瞬時估計（instant estimation）”，并得到漸進正确的(de)估計，即PLS方法沒有(yǒu)分布要求，而LISREL方法假設顯變量的(de)聯合分布為(wèi)多元正态。
　　第二，目标不同。PLS方法的(de)目标是根據區組結構（6）、內(nèi)部關系（7）和(hé)因果預測關系（8）進行(xíng)預測，而LISREL方法研究的(de)目标是矩陣Σ的(de)結構。
　　第三，準确性取向不同。PLS估計在樣本量很大和(hé)每個隐變量的(de)顯變量很多時，是一(yī)緻（consistency）和(hé)基本一(yī)緻（consistency at large）的(de)，但LISREL估計在大樣本時是最優的(de)（置信區間漸近最小）。最優性包括一(yī)緻性，但一(yī)緻性不包括最優性。因此，PLS和(hé)LISREL對同一(yī)參數的(de)估計都在一(yī)緻性的(de)範圍內(nèi)。兩種估計的(de)差别不可(kě)能、也不應該很大。
　　第四，假設檢驗不同。PLS方法采用Stone（1974）和(hé)Geisser（1974）的(de)交互驗證（cross-validation）方法檢驗，考察因果預測關系（8）。LISREL方法一(yī)般使用似然比檢驗，考察觀測矩陣S和(hé)理(lǐ)論矩陣Σ的(de)拟合程度。
　　第五，估計順序不同。PLS方法通過逼近，先将每個區組的(de)隐變量的(de)估計得分表示為(wèi)測量變量的(de)加權合計，，然後通過一(yī)系列權重關系的(de)叠代，得到權重的(de)估計。LISREL方法先估計載荷Λy和(hé)Λx，在這個過程中消去(qù)隐變量，然後通過對測量變量的(de)多元OLS回歸，估計隐變量的(de)樣本值（因子(zǐ)得分）。
　　第六，對方程中變量間的(de)關系理(lǐ)解不同。PLS方法将系統部分（6）和(hé)（7）定義為(wèi)給定解釋變量值時的(de)條件期望，作為(wèi)變量間的(de)因果預測關系。因此，對于（6），PLS方法假設，
　　E（y/η）=Λyη E（x/ξ）=Λxξ （9）
　　對于（7），PLS方法假設，
　　E（η/η，ξ）＝Bη+Гξ （10）
　　而LISREL方法将結構關系（6）和(hé)（7）定義為(wèi)具有(yǒu)誤差的(de)确定性“方程”，即變量間是具有(yǒu)誤差的(de)确定性關系。
　　第七，模型的(de)識别不同。PLS方法中，雖然隐變量的(de)估計是逼近得到的(de)，但由于估計是顯式的(de)（explicit），因此PLS方法中沒有(yǒu)識别問題。LISREL方法中，矩陣Σ的(de)結構是由區組結構（6）決定的(de)，（6）又受到路徑關系（7）的(de)限制，LISREL方法有(yǒu)可(kě)能不能識别模型。因此，LISREL估計的(de)第一(yī)個階段就是考察模型的(de)可(kě)識别性。如(rú)果不能識别，模型中必須包括一(yī)些參數假設（reparameterization assumption）。
　　最後，PLS方法中，還可(kě)以選擇三種加權關系，取決于更關注（6）、（7）還是（8）的(de)操作性。權重關系模式A和(hé)模式B分别使用簡單OLS回歸和(hé)多元OLS回歸，模式C是二者的(de)結合。在PLS模型的(de)圖形中，顯變量與其隐變量之間的(de)箭頭指向表明了選擇的(de)估計模式。
　　三、PLS和(hé)LISREL的(de)适用條件
　　人們(men)在兩種方法的(de)選擇上一(yī)直存在分歧，由以上比較可(kě)見，PLS适用于以下情況：
　　1．研究者更加關注通過測量變量對隐變量的(de)預測，勝于關注滿意度模型的(de)參數估計值大小，因為(wèi)PLS的(de)估計量是有(yǒu)偏的(de)，但可(kě)以根據測量變量得到隐變量的(de)最優預測。
　　2．适用于數據有(yǒu)偏分布的(de)情況，因為(wèi)PLS使用非參數推斷方法（例如(rú)Jackknife），不需要對數據進行(xíng)嚴格假定；而LISREL假設觀測是獨立的(de)，且服從多元正态分布。
　　3．适用于關注隐變量得分的(de)情況，因為(wèi)PLS在參數估計過程中就計算隐變量得分，可(kě)以得到确定的(de)計算結果。而LISREL在進行(xíng)參數估計之後，再采用某個目标函數計算隐變量得分，計算結果因目标函數選擇不同而不同。
　　4．适用于小樣本滿意度研究，因為(wèi)PLS是一(yī)種有(yǒu)限信息估計方法，所需要的(de)樣本量比完全信息估計方法LISREL小得多。
　　5．适用于較大、較複雜的(de)結構方程模型，因為(wèi)PLS收斂速度非常快，計算效率比LISREL更高(gāo) 。但對于不太複雜的(de)顧客滿意度模型，計算時間的(de)優勢不明顯。
　　LISREL适用的(de)情況不同：
　　1．研究者更加關注滿意度模型的(de)參數估計值大小，即測量變量對隐變量的(de)影響和(hé)測量變量的(de)效度，而不是純粹的(de)預測應用；而且，隻有(yǒu)當模型的(de)參數估計無偏時，才能驗證測量變量的(de)效度，因此PLS不能對此進行(xíng)驗證，因為(wèi)PLS估計的(de)隐變量路徑系數有(yǒu)低(dī)估，不能揭示隐變量之間的(de)關系（Dijkstra, 1983）；PLS的(de)隐變量載荷的(de)參數估計易于趨同，且有(yǒu)高(gāo)估偏差。
　　2．适用于不同的(de)樣本間參數估計比較的(de)情況，因為(wèi)LISREL可(kě)以提供檢驗，而PLS得到的(de)權重、載荷和(hé)隐變量得分在不同樣本間的(de)可(kě)比較性是一(yī)個值得懷疑的(de)問題。
　　同時，随着LISREL的(de)發展和(hé)完善，也可(kě)以利用PLS的(de)思想來彌補自(zì)身的(de)缺陷：
　　3．盡管LISREL中ML估計的(de)有(yǒu)效性、标準誤差和(hé)檢驗統計量的(de)正确性需要數據正态和(hé)獨立的(de)假設，但隻要滿足某些條件，這些特性并不會受到非正态的(de)影響（Satorra,1990）。此外，LISREL也可(kě)以像PLS一(yī)樣使用非參數重抽樣方法（例如(rú)bootstrap）進行(xíng)統計推斷。
　　4．LISREL中的(de)ML估計，即使分布假設不成立也非常穩健，可(kě)以得到總體參數的(de)一(yī)緻估計。然後基于這些參數，采用幾種目标函數計算隐變量得分。這些目标函數不同于PLS目标函數，但這并不能說明得分是不确定的(de)。而PLS通過最大化測量變量的(de)可(kě)靠性估計和(hé)隐變量回歸的(de)R2來計算隐變量得分，導緻PLS參數估計有(yǒu)偏，使隐變量得分的(de)價值大打折扣。
　　實際上，兩種方法各有(yǒu)千秋，分别适用于不同的(de)情況。從根本上說，由于算法的(de)不同，PLS對測量變量協方差矩陣的(de)對角元素的(de)拟合較好，适用于對數據點的(de)分析，預測的(de)準确程度較高(gāo)；LISREL對測量變量協方差矩陣的(de)非對角元素的(de)拟合較好，适用于對協方差結構的(de)分析，參數估計更加準确。兩種方法的(de)選擇取決于研究的(de)目的(de)。當研究目的(de)是理(lǐ)論檢驗且先驗理(lǐ)論知識充足時，更宜采用LISREL；當研究目的(de)是因果預測應用，且理(lǐ)論知識非常缺乏時，則PLS更加适合。因此，從實用的(de)角度可(kě)以說，ML和(hé)PLS方法是互補的(de)，而不是互斥的(de)。
　　四、我國(guó)構建顧客滿意度模型時估計方法的(de)選擇
　　對于我國(guó)顧客滿意度模型估計方法的(de)選擇，主要應該在我國(guó)不同行(xíng)業的(de)不同公司進行(xíng)試算，也可(kě)以采取模拟數據進行(xíng)研究，參照國(guó)外的(de)研究結果，對我國(guó)的(de)實證結論進行(xíng)PLS和(hé)LISREL的(de)比較。
　　作者對某服務行(xíng)業公司的(de)滿意度數據進行(xíng)測算，兩種方法得到的(de)結果進行(xíng)比較，結論與前文類似。PLS估計的(de)隐變量路徑系數有(yǒu)低(dī)估，PLS的(de)隐變量載荷的(de)參數估計易于趨同，且有(yǒu)高(gāo)估偏差，結果如(rú)下表所示：

　　作者介紹：河南君友商(shāng)務咨詢有(yǒu)限公司行(xíng)業研究部經理(lǐ)