结构方程模型构建方法比较

发布 2021-05-30 12:59:28 阅读 7267

统计与决策200年9月(理论版)

知识丛林。摘要:线性结构关系和偏最小二乘路径分。

析是构建结构方程模型主要的两类技术。本文在阐述线性结构关系和偏最小二乘算法的基础上,比较分析了它们的差异,给出了各自的适用条件,指出了偏最小二乘路径分析技术的特点及其在社会科学领域逐渐受到重视的原因。

关键词:因果模型;线性结构关系;偏最小二乘路径分析;差异;适用条件中图分类号:o2

文献标识码:a

文章编号。结构方程模型构建方法比较。张。军。

山东大学管理学院,济南250

结构方程模型简称sem是由瑞典统计学家于20世纪70年代初期提出来的一种通用线性统计建模技术。近年来,这一统计建模及分析方法获得了巨大的发展,不仅拥有专属期刊《结构方程模型研究和应用结构方程的**更是难计其数。它已经成为心理学、经济学、金融学、管理学、社会学等社会科学领域中一种十分重要的数据分析技巧。

在国内,结构方程模型研究方法则刚刚兴起,相当多的人文社科类实证研究**中都已经采用了这一建模方法。

目前,主要有两大类估计技术来构建结构方程模型。一种是基于极大似然估计(ml的协方差结构分析方法,该方法被称为“硬模型以线性结构关系(li

方法为代表;另一种则是基。

于偏最小二乘法(pl的分析方法,被称为“软模型”(s

以路径分析方法为代。

表。国内社会科学研究**多数采用lis方法对sem参数进行估计。实际上,相对于lis方法,pl方法在求解结构方程模型中具有诸多优点,国外越来越多的营销、管理等领域的学者在研究中使用了这一工具。

本文讨论了这两种方法的算法、它们之间的区别及各自适用条件。

lis和pls方法。

.1l方法。

isr方法也称为协方差建模方法,它建立在协方差。

结构的基础上,从变量之间的协方差结构入手,通过拟合模型估计协方差∑(θ与样本协方差(s)来估计模型参数。li使用极大似然。

非加权最小二乘。

广义最小二乘或其他方法,构造一个模型估计。

协方差与样本协方差的拟合函数,然后通过迭代方法,得到。

使拟合函数值最优的参数估计。例如,采用ml方法的拟合函数的形式为:

其中,p是内生测量变量的个数,q是外生测量变量的个数。

为了得到最优估计,ml方法的计算量很大。如果模型可识别,he矩阵(信息矩阵,即似然函数对模型中任意两个参数的二阶偏微分矩阵)必须是正定的。

isr软件可以对sem模型进行识别,对所有估计参。

数的标准误差进行检验,并对模型拟合程度进行检验。基于协方差为主的结构方程分析软件很多。li是其中一个较早问世且流行至今的软件,其他主要软件有amo

及cal等。1.

ls方法。ls方法是伍德(s.和阿巴诺等人在198年首次提出的。它是将主成分分析与多元回归结合起。

来的迭代估计,是一种因果建模的方法。pl方法对不同潜变量的观测变量抽取主成分、建立回归模型,然后通过调整主成分权数的方法来进行参数估计。其基本思路首先对不同隐变量的测量变量子集抽取主成分估计潜变量得分,然后使用普通最小二乘估计载荷系数和路径系数。

在形式上,pl路径模型与lis完全模型一样,可以表示为:

式中,x为外生观测变量,ξ为外生潜变量,λx为外生观测变量与外生潜变量之间的关系,是外生观测变量在外生潜变量上的因子载荷矩阵,δ

为外生变量的误差项向量;y为内137

统计与决策200年9月(理论版)

生观测变量,η为内生潜变量,λy为内生观测变量与内生潜变量之间的关系,是内生观测变量在内生潜变量上的因子载荷矩阵,ε为内生变量的误差项向量;β和г都是路径系数,表示内生潜变量之间的关系,г则表示外生潜变量对于内。

生潜变量值的影响,ζ

为结构方程的误差项。为了论述的方便,潜变量记为ηi,观察变量记为xin路径估计的具体步骤如下:

步骤1:用迭代方法估计权重和潜变量得分。(1对潜变量进行标准化变化后,它的外部估计yi。

潜变量的估计为:

in为外部权重。(2对潜变量进行标准化变化后,它的内部估计zi。

ij为内部权重。

3)内部权重vij

内部权重指在pls路径模型中有箭头联系的两个潜变量之间的关系。内部权重的确定方法有三个:因子加权法、重心法和路径加权法。

此处选择因子加权法,此时内部权重vij等于yi和yj的相关系数。即。

和ηj有直接关系0η

和ηj无直接关$系。

4)外部权重win

开始时权重可以任意赋值,然后进行以上1-4步的迭代计算,直至收敛为止。

步骤2:估计路径系数和载荷系数。步骤3:估计位置参数。

在20世纪80年代,基于偏最小二乘法的主成分分析软件已经出现(如。

989但这些软件在性能上存在缺陷,使用起来不方便,这。

影响了pls路径分析方法在社会科学领域内的应用。近年来,实现pls路径分析的软件日益增多(如。

等),新一代软件在。

性能和用户界面上都有很大提高。

两种方法的差异。

ls和lis方法,既有相似之处,也有不同。它们的。

第一个相似点是都采用箭头示意图作为模型的图形表示。第二个相似点是在每个区组(bl都假设测量变量与潜变量和误差项为线性关系,即。

第三个相似点是路径关系(pl中称为内部关系)的表。

达形式一样,=β或。

第四个相似点是对每个内生变量区组,都给出显变量y的因果—**关系,即用潜变量路径关系中的解释变量来表。示y。

ls和lis也有许多不同之处。由于pls是从主成。

分分析发展而来的,li是从因子分析发展而来的,它们的区别类似主成分分析与因子分析的区别。

1)分布假设不同。pl方法没有分布要求,而lis方法假设显变量的联合分布为多元正态。pl为了处理缺乏理论知识的复杂问题,采取“

软”方法,避免lis模型严格的“硬”假设。这样,不论模型大小,pl方法都可以得到“瞬时估计并得到渐进正确的估计。

2)目标不同。pl方法的目标是根据区组结构(6)内部关系(7)和因果**关系(8)进行**,而lis方法研究的目标是矩阵σ的结构。

3)假设检验不同。pl方法采用和的交叉验证方法检验,考察因果预。

测关系方法一般使用似然比检验,考察观测矩阵s和理论矩阵σ的拟合程度。

4)估计顺序不同。pl方法通过逼近,先将每个区组的潜变量的估计得分表示为测量变量的加权合计,然后通过一系列权重关系的迭代,得到权重的估计。li方法先估计载荷λy和λx,在这个过程中消去潜变量,然后通过对测量变量的多元ols回归,估计潜变量的样本值(因子得分)。

5)方程中变量间的关系不同。pl方法将系统部分(6)和(7)定义为给定解释变量值时的条件期望,作为变量间的因果**关系。因此,对于(6)方法假设。

9)对于(7)方法假设。

而lis方法将结构关系(6)和(7)定义为具有误差的。

确定性“方程”

即变量间是具有误差的确定性关系。(6模型的识别不同。pl方法中,虽然潜变量的估计是逼近得到的,但由于估计是显式的因此pls方法中没有识别问题。

li方法中,矩阵σ的结构是由区组结构(6)决定的,(6又受到路径关系(7)的限制,li方法有可能不能识别模型。因此,li估计的第一个阶段就是考察模型的可识别性。如果不能识别,模型中必须加入一些参数假设。

pls和lis的适用条件3.1

ls的适用条件。

由以上比较可见,pl适用于以下情况:

1)研究者更加关注通过测量变量对潜变量的**,胜于关注结构模型的参数估计值大小,因为pls的估计量是有偏的,但可以根据测量变量得到潜变量的最优**。

2)适用于数据有偏分布的情况,因为pls使用非参数推断方法,不需要对数据进行严格假定;而lis假设观测是独立的,且服从多元正态分布。

3)适用于关注潜变量得分的情况,因为pls在参数估计过程中就计算潜变量得分,可以得到确定的计算结果。而lis在进行参数估计之后,再采用某个目标函数计算潜变量得分,计算结果因目标函数选择不同而不同。

4)适用于小样本研究,因为pls是一种有限信息估计方法,所需要的样本量比完全信息估计方法lis小得多。根据美国休斯顿大学迟教授的研究,pl的样本量至少为模型中具有最多结构路径指向的潜变量的路径数的十倍。更弱一些的限制要用至少五倍的样本量。

5)适用于较大、较复杂的结构方程模型,因为pls收敛速度非常快,计算效率比lis更高。但对于不太复杂的模型,计算时间的优势不明显。

.2l的适用条件。

isr适用以下情况:

1)研究者更加关注结构模型的参数估计值大小,即测量变量对潜变量的影响和测量变量的效度,而不是纯粹的**应用;而且,只有当模型的参数估计无偏时,才能验证测量变量的效度,因此pls不能对此进行验证,因为pls估计的潜变量路径系数有低估,不能揭示潜变量之间的关系的潜变量载荷的参数估计易于趋同,且有高估偏差。

2)适用于不同的样本间参数估计比较的情况,因为lis可以提供x2检验,而pls得到的权重、载荷和潜变量得分在不同样本间的可比较性是一个值得怀疑的问题。

3)尽管lis中ml估计的有效性、标准误差和检验统计量的正确性需要数据正态和独立的假设,但只要满足某些条件,这些特性并不会受到非正态的影响此外,li也可以像pls一样使用非参数重抽样方法(例如进行统计推断。

4)l中的ml估计,即使分布假设不成立也非常稳健,可以得到总体参数的一致估计。然后基于这些参数,采用几种目标函数计算潜变量得分。这些目标函数不同于pls目标函数,但这并不能说明得分是不确定的。

而pls通过最大化测量变量的可靠性估计和潜变量回归的r2来计算潜变量得分,导致pls参数估计有偏,使潜变量得分的价值大打折扣。

结束语。综上所述,li和pls方法各有千秋,分别适用于不同的情况。从根本上说,由于算法的不同,pl对测量变量协方差矩阵的对角元素的拟合较好,适用于对数据点的分析,**的准确程度较高;li对测量变量协方差矩阵的非对角元素的拟合较好,适用于对协方差结构的分析,参数估计更加准确。

两种方法的选择取决于研究的目的。当研究目的是理论检验且先验理论知识充足时,更宜采用lis当研究目的是因果**应用,且理论知识非常缺乏时,则pls更加适合。

值得注意的是,在营销、管理等社会科学领域,近年来国外学术界越来越多地使用了pls方法。这虽然与新一代分析软件的出现有关系,也反映出国外学者更加重视对概念测量类型的区分。概念测量有两种形式:

一是反应(结果)式的,二是构造(原因)式的。反应式结构变量是指该结构变量量表的问项即可测变量)都是其结果表现;而构造式是指该结构变量量表的问项都是该变量的原因。在现有的文献中,尤其存在着把构造式结构变量当作反应式结构变量的错误。

贾维斯等分析了119个包含多个可测变量的潜变量,其中存在336个(28本应是构造式结构变量,而被错误地看作反应式结构变量。相反,只有17个(1%本应是反应式结构变量而被错误地看作构造式结构变量。概念测量类型的错误会导致模型路径系数被显著地放大或缩小,有的甚至被放大了500相对于lis方法,pl方法更适合被用于估计含有构造式结构变量的模型。

2]王惠文.偏最小二乘回归方法及其应用[m]北京:国防工业出版社,19

责任编辑/李友平)

统计与决策200年9月(理论版)

结构方程模型建模方法的比较

用模它个中测个个潜变题子计标时代经贸 年 月中旬刊总第 期。项是的量生为与与上构关系图。结构方程模型建模方法的比较。徐本山白宝光。内蒙古工业大学,内蒙古。摘。呼和浩特 要 本文简单的介绍了结构方程模型的一些知识,并简单阐述了结构方程模型的两种建模方法 法 法,通过两种方法的介绍,简单的。阐述了两种方...

框架填充墙结构刚度计算模型比较

综合论述婕建材 年。杨春侠。侯晓辉。长沙理工大学建筑工程学院,湖南长沙 摘。要对于填充墙在框架结构中所起的刚度作用的认识是一个从无到有的过程。现今大部分建筑的设计。都考虑到了填充墙刚度的影响。本文介绍了现今常用的刚度计算模型,并对其各自所具有的优缺点进行归纳总结,同时也指明了它们各自必须在一定的范围...

结构设计模型比较与优化

厂 厂 董。结构设计模型比较与优化。谢立中。中国市政工程中南设计研究总院,福建福州 摘。要 在市政工程水池构筑物设计中,合理的结构模型不仅能节省工程量 节约投资,而且能降低施工难度 加快施。工进程。在不影响工艺运行前提下,我们进行结构设计时应尽量采取多种方案,进行比较与优化,综合考虑平面布置 投资造...