读而思
当不知道两个因素之间的关系或两个因素之间关系在认识上比较模糊而需要对这两个因素之间的关系进行调查和确认时,可以通过散布图来确认二者之间的关系。实际上是一种实验的方法。
1什么是散布图(WHAT)
散布图(Scatter diagram)就是把互相有关联的对应数据,在方格纸上以纵轴表示结果,横轴表示原因,然后以点表示出分布形态,根据分布形态来判断对应数据之间的相互关系。其功能与鱼骨图类似,主要是了解原因与结果关系是否有相关,相关的程度如何。也有人称之为"散点图"或"相关图"。
鱼骨图可以看作是定性查找原因的工具;散布图可以看作是定量查找原因的工具。鱼骨图一般可以大致了解哪些要因会影响最后的结果,散布图也是以这种因果关系的方式来表示其关联性,并将因果关系所对应变化的数据分别点绘在X、Y轴坐标的象限上,以观察其中的相关性是否存在。
2散布图的用途(WHY)
(一)能大概掌握原因与结果之间是否有相关及相关的程度如何。例如患者满意度与候诊时间的关系。
(二)能检视离岛现象是否存在,以确定产生结果的关键因素。
(三)原因与结果相关性高时,两者可互为替代变量。对于参数特性的掌握,可从原因或结果中对一个较易观测的变量予以监测,从而可根据所观察的变量的变化来推断另一个变量的变化情况。
3散布图的实施步骤(HOW)
(一)确定要调查的两个变量,收集相关的数据,至少30组以上,并整理后写人数据表中。数据太少时无法明确判断相互间的关系,所以至少应在30组以上。
(二)找出两个变量的最大值与最小值。
(三)画出纵轴与横轴刻度,计算组距。收集的数据都是相对应数据,一般以横轴代表原因,纵轴代表结果。特别要注意一点,横轴和纵轴的长度要差不多一样长,不可以相差太多,否则在图形上将无法判断它们的相关性。组距的计算应以数据中的最大值减去最小值,原因与结果两个数据都必须计算出来,将组距除以轴长即得知每一个刻度的数值。
(四)将各组对应数据标示在坐标上。各组对应数据标示在方格纸上,但如果同一交会处产生两组数据重复时可画上两重圆记号,如3组数据相同时画上三重圆记号。
(五)记录必要事项。当各组数据都标示在坐标上之后,把收集数据目的、数据数量、项目名称、绘制者、日期等都记载清楚,并且将图形所得心得记入图形旁边空白处。
(六)分析散布图的相关性与相关程度。
4散布图的分析
散布图的分析一般来说有6种形态:
(一)正相关:当x增加,y 也增加,也就表示原因与结果有相对的正相关。例如患者满意评分和患者诊疗时间一般属于正相关关系。
(二)弱正相关:散布图点的分布较广但是有向右上的倾向,这个时候x增加,一般y也会增加,但非相对性,也就是说x除了受y的因素影响之外,可能还有其它因素影响着X,有必要对其它要因进行再调查,这种形态叫做似乎有正相关也称为弱正相关。例如医院人均业务收入和医院职工人均月收入一般属于弱正相关关系。
(三)负相关:当X增加,y反而减少,而且形态呈现一直线发展的现象。例如患者满意评分和单病种费用一般属于负相关关系。
(四)弱负相关:当X增加,Y减少的幅度不是很明显,这时的X除了受y的影响之外,尚有其它因素影响着X,这种情况叫做非显着性负相关或弱负。例如员工人均年收入和员工流失率一般属于弱负相关关系。
(五)无相关:如果散布图点的分布杂乱,没有任何倾向时,称为无相关,也就是说X与Y之间看不出有任何关系,这时候应再一次先将数据层别化之后再分析。
(六)曲线相关:假设X增大、Y也随之增大,但是X增大到某一值之后, Y反而开始减少,反之X减小,Y也减小,当X减至某一值后,Y开始增加,因此产生散布图点的分布有曲线倾向的形态,称为曲线相关。例如患者满意评分与医院环境就诊温度一般属于曲线相关关系。
5散布图的注意事项
(一)是否有异常点:有异常点时,不可任意删除该异常点,除非异常原因已确实掌握。
(二)是否需要层别:数据的获得常常因为操作人员、方法、材料、设备或时间等的不同,而使数据的相关性受到扭曲。
(三)要学会鉴别是否为假相关。
(四)收集到的数据太少时,容易发生误判。
|