量表测量等价性及其在护理研究中的应用

*发表于：2015-5-20 10:34:00* 5330 来自：甘肃 · 发表于：2015-5-20 10:34:00

量表测量等价性及其在护理研究中的应用

2015-05-20 10:34 来源于：网络

对国外量表的引进使用呈增加的趋势。对量表进行翻译及跨文化调试、性能评价是引进量表的必要步骤[14]。将在某语言或文化情境中发展起来的量表应用于另一语言或文化情境中时，需在两种版本等价的基础上进行。等价的内容包括概念等价、语义等价、内容等价、技术等价、测量等价及功能等价[4-6]大多数等价原则在量表的翻译及跨文化调适的不同阶段均有所体现。而测量等价性作为量表的一种特征，在护理领域的量表相关研究中未得到足够的关注和重视。测量等价性(Measurement Equivalence/Invariance，ME／I)[7](也称测量不变性)，是指当观测变量和潜在特质之间的关系在相比较的各个组之间等同时，就称该量表具备测量等价性。

测量等价性在量表研制及应用推广阶段是必须进行考量的一个特征。在编制和引进量表过程中，时常要考虑量表条目是否在不同组问(如性别和年龄)有着相同的意义和功能：在跨文化研究中，也要考虑不同文化群体对同一概念是否存在相同的理解．在某种文化背景下提出的概念能否推广到其他文化背景中去。此外，概念之间的关系强度(结构系数，不同因子或潜变量间的关系)在不同群体、不同时间是否等价也是现代测量学中量表等价考量的重要方面。对量表进行测量等价性检验是进行组间比较的前提条件．是跨文化比较的前提，也是潜变量模型框架内的基本要求。是传统的信效度分析不能取代的[6,8,10,13]。本研究将对测量等价性的检验过程及其在国内外护理研究领域的具体应用予以阐释．以完善跨文化量表的有效检验及应用推广．促进护理跨文化研究的发展。

1测量等价性的检验

1．1 测量等价性的检验方法

目前，检验测量等价性的方法主要分为两大类[5,8]：结构方程模型框架内的多组验证性因素分析(Multi—group Confirmatorv Factor Analvsis，MCFA)[14]和项目反应理论框架内的项目功能差异分析(DifferentialItem Functioning，DIF)。其中结构方程模型框架下的MCFA是目前该研究领域使用最多、最流行的方法。从验证性因素分析的角度，以跨文化研究为例，其测量对等性是一个多样本比较的问题，即探讨不同文化样本之间在不同水平上的相关参数矩阵是否可以认为相等。如不能拒绝虚无假设，就可以认为样本之间在某个层次上具有跨文化的测量对等性。

1．2测量等价性的检验步骤

已有的研究中存在多种测量等价性的检验流程+最常用的测量等价分析步骤可以称为六步法[8，11，14]具体如下。

(1)形态等价(Configural Invariance)：检验潜变量的构成形态或模式是否相同，也称为因子模式等同．即指不同样本群体之间是否可以认为有相似的因子结构，以潜变量生活质量为例，即检查不同样本间的生活质量量表是否具有相同或相似的因子结构。

(2)单位等价(Metric Invariance)或弱等价(WeakInvariance)：检验测量指标与因子之间的关系，即因子负荷在各组中是否等价。如果成寺，则说明来自不同总体的、潜在特质得分相等的个体，在相应观测变量上的得分也相等。也就是说在满足了单位等价的基础上，不同样本间的量表的观测分值的比较是有意义的。

(3)尺度等价(Scalar invariance)或强等价(StrongInvariance)：检测观测变量的截距是否具有不变性，截距差异可被解释为群体间确实存在程度上的差异。例如在临床上测量的不同群体患者症状严重程度差异，是否进行强等价检验很大程度上取决于研究背景。

(4)因子方差等价(Factor Variance Invariance)：检验潜变量的方差是否跨组等价，潜变量的方差反映了潜变量的离散程度，方差跨组等价则表明不同组间的潜变量真分数的离散程度一致，具有相同跨度的量纲。

(5)因子协方差等价(Factor Cova“ance Invari—ance)：检验因子协方差是否跨组等价，协方差反映了潜变量之间的关系程度，满足此前提说明潜在结构之问的关系在不同群组中可以重现。即量表内部不同因子结构之间的关系在不同样本间等价。通常会把因子方差等价和因子协方差等价合并检验称作因子方差．协方差等价。

(6)潜均值等价(Latent Mean Invariance)：检验潜变量的均值是否跨组等价。潜在均值是考虑潜变量的均值是否跨组等价。潜在均值是考虑误差后的真值，均值上的差异可看作针对潜变量的理论建构本身的真实差异。

以上6个参数水平的检验彼此嵌套，前一步模型嵌套于随后的模型，并不是所有的研究都能完成以上六大步骤。形态等价性是检验其他等价性的前提条件，通常作为检验的基线模型，进一步等价性检验都是在形态等价的基础上通过限制相应参数而生成的嵌套模型，只有前一水平的等价性得到确立，才能进行继续更高一级的等价性检验，如比较单位等价(弱等价)和尺度等价(强等价)是进行潜均值比较的前提．如果某项研究不能满足单位等价，则不能进行尺度等价的检验．不能不满足尺度等价检验，则不能进行潜均值等价检验。

测量等价性包括测量等价(measurement equiv_alence)和结构等价(stnlctural equivalence)两个部分剐oI。一般将单位等价(弱等价)、尺度等价(强等价)合称为测量等价，而因子方差一协方差等价和潜均值等价为结构等价。以多维度量表为例，测量等价探讨的是观测变量与测量指标之间的关系在不同组问的差异比较是否具有统计学意义，结构等价探讨的是同一量表内部因子之间的结构在不同组间的差异比较是否具有统计学意义，如果不能拒绝假设，则说明量表具有测量等价或结构等价。通常应在满足了测量等价的基础上才能进一步进行结构等价的检验。

1．3测量等价性检验结果的解释

测量等价性的检验结果判断。需要提供一套判别的准则，在结构方程模型背景下讨论的测量等价性检验，主要考察模型的拟合指数是否达到了既定的标准，根据不同的检验步骤，可涉及模型整体拟合指数(至少要报告一个绝对拟合指数，一个相对拟合指数和一个简约调整指数)、模型差异拟合指数及不同的参照指标选择三方面[8,14]。结构方程模型软件MDlus报告的模型整体拟合指数包括模型卡方值(Chi—square，矿)、相对拟合指数一比较拟合指数(Comparative fit index，CFI)、相对拟合指数一Tucker—Lewis指数(Tucker—lewis index，TU)、绝对拟合指数一标准化残差均方根(Standardized Root Mean SquareResidual，SRMR)、近似误差均方根(R00t Mean SquareEⅡor of Approximation，RMSEA)及RMSEA的90％置信区间、Akaike信息准则(Alaike Information Crite—rion，AIC)和贝叶斯信息准则(Bavesian InfomationCriterion，BIC)以及精确拟合的P值。模型差异拟合指数主要有两个：①x2值差异：在某一模型检验水平上，如果施加限制后模型与基线模型x2值变化统计显著(P≤0．05)，则拒绝相应的组间参数等价的假设。②CFI值：以施加限制后模型与基线模型的CFI差值△CFI≤0．01作为标准．如果△CFI<0．01．则表明检验参数在两样本的比较模型中具有等价性。具体评判指标标准可参阅相关书籍[8,14]。

2测量等价性在护理研究的应用测量等价有着重要的理论意义和应用价值。在该概念提出以后，得到了众多研究者的认可，并且在管理学[15]、心理学[16]等多个研究领域得到应用。在护理学相关领域也开展了此类研究，国内研究较少，中文文献中只有郝元涛等[5]对世界卫生组织生存质量测定量表(WHOQOL．100)的测量等价性的研究，国外护理学相关领域则存在较多研究。根据测量等价性的概念，测量等价性的不同情景包括了不同群体、不同场合和不同测量时问点[8]。不同群体和不同场合的等价也称作多组等价性，不同时问点的等价也称作纵向等价。以下将从不同组别、不同文化及不同时间3个角度对国外文献中测量等价性的应用及研究进行分析。

2．1 不同组别之间的测量等价性比较

2．1．1不同性别、年龄组问的测量等价性比较有关不同性别、年龄组间测量等价研究一直是研究者关注的重点。Petersen等[17]测量了2403名儿童和888名父母关于儿童的生活质量．采用多组验证性因子分析(Multigroup Con“rmatory Factor Ana．1vsis，MCFA)检验瑞典语版儿童生活质量普适性量表(Pediatric Quality of Life Inventory Generic CoreScales，PedsQLIM 4．0)的儿童报告和父母报告版在不同性别组间的测量是否等价，对儿童自我报告和父母报告生活质量量表分别进行等价检验，在满足了形态等价，建立基线模型的基础上进行因子负荷是否等价(单位等价)的检验，在满足单位等价的假设基础上进行截距是否(强等价)检验。检验结果显示，父母报告的生活质量量表只满足跨性别的形态等价．儿童报告的生活质量量表跨性别因子水平测量等价．该研究结果说明儿童普适性生活量表的不同性别间的因子结构相同，满足单位等价和强等价的假设．该结果可为不同性别间儿童生活质量在不同因子水平及观测指标水平的差异比较提供依据。但该研究未进行结构等价的检验，不同性别间对于潜变量生活质量水平差异比较的真实性有待检验。同样，中国学者m1运用中文版儿童报告的Peds—QLTM4．0测评479名8～12岁儿童的研究中也显示同样的结果。有研究者∞1采用单维度生活满意度量表(Satis—faction with Life Scale．SWLS)对4984名挪威人进行调查，检验该量表不同性别和不同年龄段组别问的因子结构、因子载荷及残差方差是否等价。结果证实，该量表可用于不同性别间生活满意度得分的比较，可反映两组间生活满意度的真实差异．而能否用于不同年龄段的差异比较则需要进一步探讨。

2．1．2不同职业、疾病及测量方式组问测量等价性的比较也有研究者对不同职业、不同疾病、不同测量方式的组问测量是否等价进行研究。Etchegarav等㈣采用安全态度问卷(Safety Attitudes Questionnaire)对72名ICU护士和医生来调查其工作满意度．采用多组验证性因子分析检验该量表在不同人群中的测量等价性，结果显示，医生和护十之间的评价模型单位等价，说明该量表可用于医生和护士在观测指标水平的比较。Cook等_211对2479例脊髓损伤、肌营养不良、小儿麻痹症候群和多发性硬化症4类患者采用6例患者报告结局量表(Patient—Reponed Outcomes Mea_surement Infonnation Svstem，PROMIS)进行测评，检验量表中各个条目跨疾病和条目功能差异(DIF)。除疲乏简表外，其他简表跨疾病条目功能差异有统计学意义。即除疲乏简表外，其他简表可有效应用于不同疾病间的患者报告的症状和功能差异比较。有研究者。22通过测量79例患者慢性特发性荨麻疹症状．研究了电子版和纸质版患者每日日记(UnicariaPatient Dailv Diarv，UPDD)两种测量方式是否具有测量等价性，也有研究者眩纠在癌症患者中研究了欧洲版五维健康量表(EuroQol Group’s 5一domain ques—tionnaire，EQ一5D)语音交互版和纸质版之间的测量是否具有等价性。2项研究结果均显示，两种测量方式的测评结果等价。不同测量方式结果等价意味着研究者及临床工作人员可根据实际情况选择合适测评方式，不同方式测量的结果可进行比较，且比较结果能反应其真实差异。

2．1．3不同种族、地域组间测量等价性的比较对于不同种族、地域的组间测量是否等价，也有研究者进行了相关研究。有研究者例对1897例患者的满意度进行调查，对少数人种和白色人种的组别差异进行研究(形态等价、单位等价、尺度等价和因子方差等价水平)，结果不能证明不同种族间测量等价。Reitz等㈤采用工作嵌入量表(Job EmbeddednessInstrument)测量城市地区和农村地区注册护士的职业负荷，结果显示，40条目的原始量表两组间不等价．而32条目的结果存在单位等价。采用32条目的工作嵌入量表测量城市和农村的护士，其在观测指标水平的比较可真实反映两组的差异。该研究结果能够为城市和农村地区的注册护士人数不均衡查找真实原因。

2．2不同语言版本的量表跨文化测量等价性的比较量表不同语言版本的等价性是国际合作研究中不同地区和国家的结果具有可比性的前提条件。美国研究者∞通过调查607例6～18岁的哮喘儿童生活质量．采用多组验证性因子分析检验中文版和西班牙语版的哮喘儿童生活质量量表(Paediatric AsthmaQuality of Life Questionnaire，PAQLQ)测量等价性，结果显示，两个版本之间具有强等价(因子载荷、截距和残差等价)．即两个语言版本测量结果具有可比性，比较结果可真实反映哮喘儿童生活质量在观测水平的真实差异。Van Loev等27一采用精简健康烧伤量表(Burn Specific Health Scale．Brief，BSHSB)调查23l例瑞士和275例荷兰及比利时烧伤患者健康状况．结果显示，瑞士语版本和荷兰语版本2个版本之间具有结构等价。Beckstead等[13]：采用女性角色紧张问卷(Women’s Role Strain Inventory，WRSI)、女性角色压力量表测评我国台湾省和美国女性的职业、学生、妻子及母亲角色，采用结构方程模型检验该量表的跨文化效度(cross—cultural validitv)，研究结果显示．除少数条目测量结果测量不等价外．量表总体具有良好的测量等价性，结果提示该量表可用于我国台湾省和美国女性角色差异的真实比较，但对于不等价条目结果比较的真实性则需要进一步分析。除了上述研究采用多组验证性因子分析检验测量等价性之外，也有研究者采用项目反应理论模型来评估量表条目的等价性。如有研究者瑚评估英文版和荷兰语版健康评估量表(Healtll Assessment Ques—tionnaire II，HAQ．II)各个条目在美国(18747例)和荷兰(1022例)类风湿关节炎人群的测量是否等价。

结果显示．有2个条目显示跨文化差异，其他条目均显示具有良好的跨文化一致性，提示2个语言版本测量的健康评估结果可直接进行有效比较。Suhonen等[29]采用Rasch模型分析4种语言版本(芬兰语、希腊语、瑞士语和英语)的个人照护量表(Individualized CareScale)条目的跨文化等价性，通过对四国的1093例住院整形及创伤患者进行测量，检验反应条目的适宜性、灵敏度及功能。此外，新加坡研究者闰。1。还运用多元线性回归的方法控制年龄、性别等混杂变量后来研究中文版和英文版两种版本量表之间的测量是否具有等价性。检验的量表包括健康相关生活质量量表、癌症治疗功能评价普适性量表(FunctionalAssessment of Cancer Therapv．General，FACT—G)、乳腺癌特异性量表(Functional Assessment of CancerThe—raDv—Breast，FACT—G)和欧洲癌症治疗组织癌症患者生活质量核心量表(European Organization forthe Research and Treatment of Cancer Core Quali—tv of Life Questionnaire，EORTC QLQ—C30)，结果显示．除少数维度具有测量差异，大部分维度具有测量等价性．研究者采用不同的统计方法对量表的测量等价性在不同水平上进行分析，对量表测量结果差异比较的真实性和有效性提供了可靠依据。

2．3纵向测量等价的比较在做不同时间、不同阶段的纵向分析时，只有满足不同时间点测量等价后才能采用测量结果进行跨时间效应的分析。研究者Motl等。32采用多发性硬化症行走量表(Multiple Sclerosis Walking Scale一12，MSWS—12)分别在6个月及12个月对260例复发缓解型多发性硬化患者进行调查，来检验量表跨时问一致性，结果显示，该量表的单维度因子模型、因子载荷及条目截距在6个月和12个月两个时间段的比较等价。结果说明，该量表在用于测量6个月和12个月的患者行走状况时的因子结构、因子载荷及截距的差异无统计学意义，可用于测量复发缓解型多发性硬化患者不同时间行走状况的跨时间效应的测量及差异比较。Petersen等。17-对1897例患者的满意度中除了人种和性别外，也进行跨时间的等价性检验。结果显示，该量表具有不同时间测量等价。Barbosa．Leiker[33]检验压力感知量表(Perceived Stress Scale一10一itemversion)的跨时间和年龄的等价性。国内护理学领域未见报道，但心理学领域研究者瑚噪用创伤后应激症状清单一平民版(Posttraumatic Stress Disorder Sv．mptoms Checkljst-Civilian Version)在对汶川地震后的、适合国内护理研究开展的量表翻译及跨文化调试指南，从而规范国内护理研究量表引进及调试的标准化，提高量表相关研究的质量。通常一个其他语言版本的量表经过翻译过程、文化调试及信效度检验即可确立该量表是否适合某种文化背景的人的症状或生活质量等潜变量的测量，有关测量等价性的检验则需要同步或进一步阐述。此外．随着心理测量学及统计学的发展，对潜变量测量工具的研制及测量误差的分析都采用了更为先进的理论及方法，如项目反应理论、潜变量模型、多层线性模型等，传统的信效度检验已经不能迎合新的发展对量表检验及推广应用的严格要求。因此，护理研究者除了在现有的研究中关注如何选择合适测评工具、如何编制和引进合适量表的同时，关注相关领域的研究进展及前沿，对本领域的发展将会起到巨大的推动作用。

3．3对量表进行测量等价性检验是量表跨文化有效应用的重要步骤在采用量表评估潜变量并进行比较的实际研究中，若量表测量的结果存在显著差异，可能由两种情况造成：一种是实际的情况就是组问差异确实显著；也有可能是组间本来是没有差异，因为量表不具备测量等价性．不同的组对它的理解并不一致而导致了差异存在，即测量结果没有可比性。量表满足了测量等价性。才使得组间的比较有意义。在护理跨文化研究中，来自不同文化背景下的个体在认知、态度、信念和价值观等方面存在很多差异，不同文化背景的人对健康观念、生活质量及应对方式等认知及理解多方面存在诸多差异惭j。跨文化研究通常需要在不同的义化之间比较目标潜变量的差异，基于完全不对等概念进行跨文化比较是没有意义的。但即使保证了测量的潜变量(如：疲乏)在不同文化间的概念对等性后，在不确定测量单位是否一致时，也不能将测得的分数直接进行比较。采用统计方法检验跨文化研究量表在跨文化研究中的测量等价性，能够更准确地描述不同文化背景的人群目标潜变量的真实水平及差异。在国际化交流合作日益增多的今天，测量等价性在跨文化研究中的重要性应得到护理研究者关注和重视。

3．4对量表进行测量等价性检验的步骤应该根据研究实际来确立．研究结论需谨慎测量等价性对量表在不同组间(性别、年龄、人群、时间段)的差异比较提供依据同时，也对量表本身及测验的过程干扰因素控制提出了很高的要求。尽管在以验证性因子分析为例的测量等价性检验中提出了较为常用的六大步骤，但在测量等价性检验文献中．并不是所有的研究都能完成所有步骤。有关部分测量等价性(Panial Measurement Invari—ance)受到较多关注[8]，该提法基于跨组等价限制可能只适合部分参数而不是所有参数，可将不能保证等价的参数自由估计，从而获得较好的拟合，然而在哪个水平上放松限制，研究者观点不一。因此，对于量表测量等价性的检验方法及检验水平的确立、研究结论都需要结合研究的实际情况来进行。国际交流的日益频繁和国际合作研究的广泛开展，推动着跨文化护理研究的发展，量表成为跨文化研究中重要的组成部分。对量表进行测量等价性检验得到了众多研究者的重视，但国内护理研究领域还未得到足够关注。只有量表具有测量等价性，不同组别间的比较才有意义，不同文化、不同语言量表结果才具有可比性。关注测量等价的重要性并将其运用到在跨文化量表的调试及评价中，不仅可提高研究的严谨性，也为不同文化、不同地域间测量结果的比较提供依据，从而促进护理领域跨文化合作研究的发展。

1432089521109016.png

1432089529455964.png

1432089539622497.png

		自动登录	找回密码
密码			立即注册

量表测量等价性及其在护理研究中的应用

发表回复

浏览过的版块

作者推荐

量表测量等价性及其在护理研究中的应用

相关推荐

发表回复

浏览过的版块

作者推荐