多维标度法
出自 MBA智库百科(https://wiki.mbalib.com/)
多维标度法(multidimensional scaling,MDS)
目录 |
多维标度法是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。
在市场营销调研中,多维标度法的用途十分广泛。被用于确定空间的级数(变量、指标),以反映消费者对不同品牌的认知,并且在由这些维构筑的空间中,标明某关注品牌和消费者心目中理想品牌的位置。
多维标度法的概述[1]
多维标度法是一类多元统计分析方法的总称,包含各种各样的模型和手段,其目的是通过各种途径把高维的研究对象转化成低维情形进行研究,具体地说,多维标度法是以多绍研究对象之间某种亲近关系为依据(如距离、相似系数,亲疏程度的分类情况等),合理地将研究对象(样品或变量)在低维空间中给出标度或位置,以便全面而又直观地再现原始各研究对象之间的关系,同时在此基础上也可按对象点之间距离的远近实现对样品的分类,多维标度法能弥补聚类分析的不足之处,因为聚类分析将相似的样品归类,最后得到一个反映样品亲疏关系的谱系图。聚类分析比较简便易行,但是,聚类分析的缺点是将一些高维的样品强行纳入一个一维的谱系分类中,常常使原始样品之间的关系简单化,甚至有时失真。而多维标度法是将几个高维研究对象,在近似的意义下,从高维约简到一个较低维的空间内,并且寻求一个最佳的空间维数和空间位置如2维或3维)而仍保持各研究对象数据的原始关系。
多维标度法的产生与发展[1]
多维标度法的产生与发展,和它在心理学各个分支中的应用是分不开的,40年代是它的萌芽和准备时期,50年代是计量的多维标度法的发展时期,1952年Torgerson首先给出J计量的多维标度法的数学模型,为以后的发展奠定了基础,60年代是非计量的多维标度法的发展时期,70年代以后上面提出的各种方法趋于成熟,出现了许多近似计算法,并且提出了许多新的方法和模型,从应用角度来说,在50年代多维标度法仅应用于心理学,60年代又应用于销售和消费领域中,从70年代以来,多维标度法的应用范围迅速扩大,已应用于交通、社会学、生态学及地质学等领域。
多维标度法的基本思想是:用r维空间(r待定)中的点分别表示各样品,使得各样品间距离的次序能完全反映原始输入的相似次序(两样品间的距离越短,则越相似)。通常,要通过两步来完成。首先构造一个f维坐标空间,并用该空间中的点分别表示各样品,此时点间的距离未必和原始输入次序相同,通常把这一步称为构造初步图形结构。其次是逐步修改初步图形结构,以得到一个新图形结构,使得在新结构中,各样品的点间距离次序和原始输入次序尽量一致。
多维标度法的特点是将消费者对品牌的感觉或偏好以点的形式反映在多维空间上,而对不同品牌的感觉或偏好的差异程度是通过点与点问的距离体现的,我们称这种品牌或项目的空间定位点因为空间团。空间的轴代表形成感觉或偏好的各种因素或变量。
多维标度法按数据的尺度水平不同,可分为计量的和非计量的两种;所谓计量数据,就是按间隔尺度或比例尺度测定的数据,也叫做定量数据;所谓非计量数据,就是按名义尺度或顺序尺度确定的数据,也叫做定性数据;因此多维标度法也分为计量的多维标度法和非计量的多维标度法。
多维标度过程分为非度量型多维标度过接和度量型多维标度过程。非度量多维标度过程输入的数据是颇疗:型的,度量型多维标度过程输入的数据是定距以上型的,但两:者输出的结果都是区间以上型的。影响多维标度过程选择的另一因素,涉及分析过程是在单一个体水平进行还是在集合水平进行。空间图的解释能力、转折标准、统计方法及相关的知识常可帮助我们确定空间的维数。拟合度和紧缩值均可用来度量空间团对数据的拟合程度。
多维标度法的实施步骤[2]
同具它的多元统计分析方法一样,对所研究的问题做出准确的界定、仍然是我们进行多维标度分析的首要好处,由于其中将应用各种类型的数据,我们就必须决定一种获得救据的适宜方式。并选择用于数据分析的具体过程。另外,还要确定空间的维数。通常,维数多,包含的信息量就大,而维数少,更为方便数据分析。因此,需要确定既能包含大部分重要信息,又方便数据分析的较为适当的维败。在确定了空间的维数以后,需要准确命名那些构筑空间的坐标轴,并对整个空间结构做出解释,最后一步的工作是砰估所用方法的可靠性和有效性。
一、界定问题
课题的界定与通过多维标度法希望达到的日的和选定的品牌密切相关。为此。必须首先天以明确。围绕需要解决的问题,我们才能分析与之相关的因素指标(或变量),如果是研究消费者对某产品各个知名品牌的感觉或伯好,就要选择能够描述这一特征的一系列变量指标。另外,在一个构筑好的多维空间中,一般需要同时研究至少8个品牌,这样才能得到一个较好的空间图。但是,一旦超过25个品牌,就会导致调查对象的疲倦,从而影陶调研结果。品牌及相关指标或变量的选择,往往基于调研问题、相关理论,以及研究人员的判断力等。
二、获取数据
从调查对象那里得到的数据可能与感觉或偏好相关,感觉数据有直接数据和推断数据之分,直接数据源于相似性判断,而推断数据则源于对相关属性的评估。
在收集直接的感觉数据时,要求调查对象判别不同品牌相似与否。我们可采用李塞图七点标尺或其它度量进行配对品牌评估,这些数据被称为相似性判别数据。
也可以采用其它方法,比如要求调查对象将所有的品牌配对按相似性强弱由大到小排序。再比如,要求调查对象对所有品牌与固定对照品牌(基础品牌)进行相似性排序,每个品牌可轮流做为基础品牌。
收集的就是一些直接的感觉数据;收集推断数据则源于调查对象对相关屑性的评估,我们应用语义差异标尺或李亮图七点标尺度量属性后对品烽进行评估。
由于消费者对心目中理想品牌的感觉往往涉及一系列品牌属性或变量。因此,调查对象需要对这些属性做出评估。如果我们能够获得属性评估值,就可依据亲疏性度量值(如欧氏距离)对每对品牌的近似程度做出推断。
比较这两种数据收集方法,第一种方法的优点是调研人员不必确定一系列属性,调查对象用他们自己的标淮做品牌或项目的相似性判断,故结果较为真实和客观。其缺点是评估过程有时会导致调查对象下意识地忽视某种指标对品牌评估的影响,比如,被评估的若干汽车品牌都在同一价格水平上,则价格就不会成为一种重要的因素;这种方法的另一局限性还表现在很难命名空间固上的坐标铀(维)。第二种方法是以品牌属性为基础的推断性方法,这种方法具备两个优点。其一,由于我们是依据态度或其它相关指标的评估值将调查对象分类,所以较容易区分有相同感觉的调查对象3其二,我们能够较方便地命名坐标轴。其缺点是调研人员必须找出所有的属性,这是一项很复杂、很艰难的工作。而空间图恰恰就是依靠这些不同的屑性构筑的。在市场调研中,第一种方法通常比第二种方法更常用,我们建议读者在实践中交互使用这两种方法。比如,可以首先采用较直接的相似性判断获得空间图,然后进行属性评估,以帮助我们解释感觉图中的坐标轴。同样图,然后进行属性评估,以帮助我们解释感觉图中的坐标轴。同样的过程也可以用于伯好数据的分析。
三、选择多维标度过程
在具体选择多维标度过程时,要考察感觉或伯好信息的性质,而且输人数据的性质是一个决定性因素。多维标度过程分为非度量型多维标度过程和度量型多维标度过程。非度量多维标度过程输入的数据最顺序型的,但是,其输出的结果却是区闻以上型的。
与之相对照,度量型多维标度过程输入的数据是定距以上型的,且输出的数据也是定距以上型的,因此,它的输入和输出数据间相关性较强。经验证明,这两种方法的结果基本相似:
影响多维标度过程选择的另一因素,涉及分折过程是在单一个体水平进行还是在集合水平进行。在单一个。体水平进行分历时,需要对每个调查对象分别做数据分析、结果造成每个调研Xif象都拥有各自的空间团。从长远的角度看,这种:方法还是有用的。然而,营销策略的制定需要对细分市场或集合进行分析。在集合水平进行分析时,需要假设每个个体用相同的交间轴(指标)评价品牌,当然,权重可以不同。
四、确定维数
多维标度法的目的,是以空间图的方式用最少的维数去最挂地拟合输出数据。这里,拟合度被定义为相关系数的平方。然两,空间图的拟合度随着维数的增加而提高。因此,必须找出拆中的办法。一个多维标度的拟合度通常用紧缩值衡量,紧缩值是。—种拟合劣质度量。紧缩值高,说明拟合性差。
以下是常用维数确定方法:
(1)前期知识,调研理论或以往的调研经验和结论将有助于确定维数;
(2)空间图的解释能力,一般来说,要想解释三维以上的空间图是很困难的;
(3)转拆标准,考察紧缩值对维数曲折线图,如下图所示,当合适的维数出现时、往往伴随有一个转折或很急的转弯,而超过这点时,增加维数通常不会提高拟合度。观察紧缩值图发现,在三维处出现折点,形成了凹状图案,故应选择的维数是3。
在选择维数时还应考虑易操作性。一般来说,二维平面图较之多维空间图简单得多。最后,那些擅长统计学方法的专业人员、也可采用统计方法确定维数。
五、命名坐标轴并解释空间图
对坐标轴的命名主要依赖调研人员的经验和主观判断,下面的方法将有助于您的工作。
*尽管得到了直接的相似性判断值,如果可能,还应对提供的品牌屑性进行评估。应用统计中的回归方法,这些屑性向量可被嵌入空间图中(如下图所示),然后,我们可以综合考察那些最接近坐标轴的属性,以实现对坐标轴的命名或标注。
*在获得了直接相似性或编好数据后,我们还可以进一步询问调查对象在进行相似性评估时依赖的主观评估标推,这些标淮也应在命名坐标袖时予以参考。
*如果可能,可以向调查对象展示空间图,然后,请他们来命名空间图上的坐标铀。最后,如果我们了解品牌的自然属性,如充电电池充电后的最长使用时间答,这也可作为解幂空间图坐标轴
六、评估有效性和可靠性
同其它多元分析方法一样,对采用多维标度法获得的结果也要进行可靠性和有效性评估。一般采用以下方法进行评估。
首先,可计算拟合优度R2,即相关系数的平方。R2值越大,说明多维标度过程对数据的拟合程度越好。一般地,当R2大于或等于0.6时,被认为是可接受的。
另外,紧缩值也能反映多维标度法的拟合优度。R2是拟合良好程度的度量,而紧缩值是拟合劣质程度的度量,两个度量的角度完全相反,但目的相同。紧缩值随多维标度过程以及被分析资料的不同而变化。
紧缩值(%):20 | 15 | 5 | 2.5 | 0 |
拟合效果:差 | 一般 | 好 | 优 | 完美 |
如果在集合水平上进行分析,原始数据应分成两组或两组以上。我们对每一组分别应用多维标度法,然后,对各组结果进行比较。
看到品牌J与其他品牌有较大差距。为此,我们剔除品牌J,对其余的品牌重新进行多维标度分轿,观察分析结果与原结果是否呈现明显的差异。下图是剔除品牌J后的空间图。我们为现有些品牌的位置发生了变化,特别是品脾E和A。然而,总的变动并不大,说明本例应用的多维标度过程还是比较稳定的。