显著性检验

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

显著性检验（Significance Testing）

什么是显著性检验

　　显著性检验就是事先对总体（随机变量）的参数或总体分布形式做出一个假设，然后利用样本信息来判断这个假设（原假设）是否合理，即判断总体的真实情况与原假设是否显著地有差异。或者说，显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异，还是由我们所做的假设与总体真实情况之间不一致所引起的。

　　显著性检验是针对我们对总体所做的假设做检验，其原理就是“小概率事件实际不可能性原理”来接受或否定假设。

　　抽样实验会产生抽样误差，对实验资料进行比较分析时，不能仅凭两个结果（平均数或率）的不同就作出结论，而是要进行统计学分析，鉴别出两者差异是抽样误差引起的，还是由特定的实验处理引起的。

[编辑]

显著性检验的含义

　　显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异，以及这种差异是否显著的方法。

　　常把一个要检验的假设记作 $H 0$ ,称为原假设（或零假设） (null hypothesis) ，与 $H 0$ 对立的假设记作 $H 1$ ，称为备择假设(alternative hypothesis) 。

　　⑴ 在原假设为真时，决定放弃原假设，称为第一类错误，其出现的概率通常记作α；

　　 ⑵ 在原假设不真时，决定接受原假设，称为第二类错误，其出现的概率通常记作β。

　　通常只限定犯第一类错误的最大概率α，不考虑犯第二类错误的概率β。这样的假设检验又称为显著性检验，概率α称为显著性水平。

　　最常用的α值为0.01、0.05、0.10等。一般情况下，根据研究的问题，如果放弃真错误损失大，为减少这类错误，α取值小些，反之，α取值大些。

[编辑]

显著性检验的原理

无效假设

　　显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率（P）水平的选择。所谓“无效假设”，就是当比较实验处理组与对照组的结果时，假设两组结果间差异不显著，即实验处理对结果没有影响或无效。经统计学分析后，如发现两组间差异系抽样引起的，则“无效假设”成立，可认为这种差异为不显著（即实验处理无效）。若两组间差异不是由抽样引起的，则“无效假设”不成立，可认为这种差异是显著的（即实验处理有效）。

“无效假设”成立的机率水平

　　检验“无效假设”成立的机率水平一般定为5%（常写为p≤0.05），其含义是将同一实验重复100次，两者结果间的差异有5次以上是由抽样误差造成的，则“无效假设”成立，可认为两组间的差异为不显著，常记为p>0.05。若两者结果间的差异5次以下是由抽样误差造成的，则“无效假设”不成立，可认为两组间的差异为显著，常记为p≤0.05。如果p≤0.01，则认为两组间的差异为非常显著。

[编辑]

显著性检验的相关概念

[编辑]

原假设和备择假设

　　1、原假设：对总体所作的论断或推测，指观察到的差异只反映机会变异。记作 $H 0$ 。

　　2、备择假设：是指观察到的差异是真实的。记作 $H 1$ 。

　　3、原假设和备择假设合在一起，应涵盖我们所研究的总体特征的所有可能性。

[编辑]

双尾检验和单尾检验

　　采用双尾检验还是采用单尾检验（以及左单尾还是右单尾），取决于备择假设的形式。

　　表1：拒绝域的单、双尾与备择假设之间的对应关系

拒绝域位置	原假设	备择假设
双尾	$H 0 :θ = θ 0$	$H_1:\theta\ne\theta_0$
左单尾	$H_0:\theta\ge\theta_0$ (不可能有 $θ > θ 0$ 时， $H 0 :θ = θ 0$ )	$H 1 :θ < θ 0$
右单尾	$H_0:\theta\le\theta_0$ (不可能有 $θ < θ 0$ 时， $H 0 :θ = θ 0$ )	$H 1 :θ > θ 0$

[编辑]

显著性检验的作用

　　　　分析工作者常常用标准方法与自己所用的分析方法进行对照试验，然后用统计学方法检验两种结果是否存在显著性差异。若存在显著性差异而又肯定测定过程中没有错误，可以认定自己所用的方法有不完善之处，即存在较大的系统误差。

　　因此分析结果的差异需进行统计检验或显著性检验。

[编辑]

显著性检验的基本思想

　　显著性检验的基本思想可以用小概率原理来解释。

　　1、小概率原理：小概率事件在一次试验中是几乎不可能发生的，假若在一次试验中事件事实上发生了。那只能认为事件不是来自我们假设的总体，也就是认为我们对总体所做的假设不正确。

　　2、观察到的显著水平：由样本资料计算出来的检验统计量观察值所截取的尾部面积为。这个概率越小，反对原假设，认为观察到的差异表明真实的差异存在的证据便越强，观察到的差异便越加理由充分地表明真实差异存在。

　　3、检验所用的显著水平：针对具体问题的具体特点，事先规定这个检验标准。

　　4、在检验的操作中，把观察到的显著性水平与作为检验标准的显著水平标准比较，小于这个标准时，得到了拒绝原假设的证据，认为样本数据表明了真实差异存在。大于这个标准时，拒绝原假设的证据不足，认为样本数据不足以表明真实差异存在。

　　5、检验的操作可以用稍许简便一点的作法：根据所提出的显著水平查表得到相应的值，称作临界值，直接用检验统计量的观察值与临界值作比较，观察值落在临界值所划定的尾部内，便拒绝原假设；观察值落在临界值所划定的尾部之外，则认为拒绝原假设的证据不足。

[编辑]

显著性检验的两类错误

　　1、显著性检验中的第一类错误及其概率

　　显著性检验中的第一类错误是指，原假设 $H 0 :θ = θ 0$ 事实上正确，可是检验统计量的观察值却落入拒绝域，因而否定了本来正确的假设。这是弃真的错误。

　　发生第一类错误的概率（记作）也就是当原假设 $H 0 :θ = θ 0$ 正确时检验统计量的观察值落入拒绝域的概率。显然，在双尾检验时是两个尾部的拒绝域面积之和；在单尾检验时是单尾拒绝域的面积。

　　2、显著性检验中的第二类错误及其概率

　　显著性检验中的第二类错误是指，原假设 $H 0 :θ = θ 0$ 不正确，而备择假设 $H 1 :θ < θ 0$ 或 $H 1 :θ > θ 0$ 是正确的，可是检验统计量的观察值却落入了接受域，因而没有否定本来不正确的原假设。这是取伪的错误。

　　发生第二类错误的概率（记作）是指，把来自 $\theta=\theta_1(\theta_1\ne\theta_0)$ 的总体的样本值代入检验统计量所得结果落入接受域的概率。

　　3、 $α$ 和 $β$ 的关系

　　当样本容量一定时， $α$ 越小， $β$ 就越大；反之， $α$ 越大， $β$ 就越小。

[编辑]

显著性检验的P值^[1]

　　若用计算机统计软件进行假设检验, 我们会见到P—值。将算得检验统计量样本值查表得的概率是就是P值（在那里我们称之为观察到的显著水平）。

　　P值是怎么来的

　　从某总体中抽样所得的样本，其参数会与总体参数有所不同，这可能是由于两种原因：

　　⑴、这一样本是由该总体抽出，其差别是由抽样误差所致；

　　⑵、这一样本不是从该总体抽出，所以有所不同。

　　如何判断是那种原因呢？统计学中用显著性检验赖判断。其步骤是：

　　⑴、建立检验假设（又称无效假设，符号为 $H 0$ ）：如要比较A药和B药的疗效是否相等，则假设两组样本来自同一总体，即A药的总体疗效和B药相等，差别仅由抽样误差引起的碰巧出现的。

　　⑵、选择适当的统计方法计算H0成立的可能性即概率有多大，概率用P值表示。

　　⑶、根据选定的显著性水平（0.05或0.01），决定接受还是拒绝H0。

　　如果P＞0.05，不能否定“差别由抽样误差引起”，则接受H0；如果P＜0.05或P ＜0.01，可以认为差别不由抽样误差引起，可以拒绝H0，则可以接受另一种可能性的假设（又称备选假设，符号为H1），即两样本来自不同的总体，所以两药疗效有差别。

　　统计学上规定的P值意义见下表

P值	碰巧的概率	对无效假设	统计意义
P＞0.05	碰巧出现的可能性大于5%	不能否定无效假设	两组差别无显著意义
P＜0.05	碰巧出现的可能性小于5%	可以否定无效假设	两组差别有显著意义
P ＜0.01	碰巧出现的可能性小于1%	可以否定无效假设	两者差别有非常显著意义

　　理解P值，下述几点必须注意：

　　⑴P的意义不表示两组差别的大小，P反映两组差别有无统计学意义，并不表示差别大小。因此，与对照组相比，C药取得P＜0.05，D药取得P ＜0.01并不表示D的药效比C强。

　　⑵ P＞0.05时，差异无显著意义，根据统计学原理可知，不能否认无效假设，但并不认为无效假设肯定成立。在药效统计分析中，更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。

　　⑶统计学主要用上述三种P值表示，也可以计算出确切的P值，有人用P ＜0.001，无此必要。

　　⑷显著性检验只是统计结论。判断差别还要根据专业知识。

[编辑]

显著性检验的结果

　　关于显著性检验的结果：

　　(一)显著性检验回答什么问题

　　我们所观察到的差异（是纯属于机会变异，还是反映了真实的差异？

　　1、如果显著性检验得到差异显著的结论这时并不能评价差异的大小和重要性。

　　2、显著性检验只能告诉我们差异是否在事实上存在，而不能回答差异产生的原因。

　　3、显著性检验不能检查我们对实验所作的设计是否有缺陷

　　(二)显著性检验回答问题的方式

　　在表述显著性检验结论的时候，应与检验的逻辑推理相符。

　　当检验统计量的观察值落在拒绝域时，我们应该说，样本资料显著地（或高度显著地）表明，差异是存在的。

　　(三)对观察到的显著水平数值的评价

[编辑]

显著性检验中的总体和样本

　　1、显著性检验的对象是无限总体。

　　2、大样本可能会使检验统计量过分敏感。

　　3、从有限总体中抽取样本用于显著性检验时，必须作概率抽样。

[编辑]

显著性检验的步骤

　　显著性检验的一般步骤或格式，如下：

　　1、提出假设

　　　 $H 0$ ：______

　　 $H 1$ ：______

　　同时，与备择假设相应，指出所作检验为双尾检验还是左单尾或右单尾检验。

　　2、构造检验统计量，收集样本数据，计算检验统计量的样本观察值。

　　3、根据所提出的显著水平，确定临界值和拒绝域。

　　4、作出检验决策。

　　把检验统计量的样本观察值和临界值比较，或者把观察到的显著水平与显著水平标准比较；最后按检验规则作出检验决策。当样本值落入拒绝域时，表述成:“拒绝原假设”，“显著表明真实的差异存在”；当样本值落入接受域时，表述成：“没有充足的理由拒绝原假设”，“没有充足的理由表明真实的差异存在”。另外，在表述结论之后应当注明所用的显著水平。

[编辑]

总体均值为某定值的显著性检验

　　总体均值的显著性检验可有双尾、左单尾、右单尾三种不同的情况。下面就总体分布的不同情况，总体方差是否已知的不同情况以及样本大小的不同情况分别介绍检验统计量和检验规则。

　　一、总体为正态分布，总体方差已知，样本不论大小

　　对于假设： $H 0 :μ = μ 0$ ，在 $H 0$ 成立的前提下，有检验统计量

　　 $Z=\frac{\bar{x}-\mu_0}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1)$

　　如果规定显著性水平为，在双尾，左单尾，右单尾三种不同情形下，拒绝域分别为：① $(-\infty,-z_{a/2}]$ 和 $[z_{a/2},\infty)$ ；② $(-\infty,-z_a]$ ；③ $[z_a,\infty)$ 。

　　二、总体分布未知，总体方差已知，大样本

　　对于假设 $H 0 :μ = μ 0$ ，在 $H 0$ 成立的前提下，如果样本足够大（n≥30），近似地有检验统计量

　　 $Z=\frac{\bar{x}-\mu_0}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1)$

如果规定显著性水平为a，在双尾，左单尾，右单尾三种不同情形下，拒绝域分别为① $(-\infty,-z_{a/2}]$ 和 $[z_{a/2},\infty)$ ；② $(-\infty,-z_a]$ ；③ $[z_a,\infty)$ 。

　　三、总体为正态分布，总体方差未知，小样本

　　对于假设 $H 0 :μ = μ 0$ ，在 $H 0$ 成立的前提下，有检验统计量

　　 $t=\frac{\bar{x}-\mu_0}{\sqrt{\frac{s^2}{n}}}\sim t(n-1)$

　　如果规定显著性水平为a，在双尾，左单尾，右单尾三种不同情形下，拒绝域分别为：① $(-\infty,-t_{a/2}(n-1)]$ 和 $t_{a/2}(n-1),\infty$ ；② $(-\infty,-t_a(n-1)]$ ；③ $[t_a(n-1),\infty)$ 。

　　四、总体分布未知，总体方差未知，大样本

　　对于假设 $H 0 :μ = μ 0$ ，在 $H 0$ 成立的前提下，如果总体偏斜适度，且样本足够大，近似地有检验统计量

　　 $Z=\frac{\bar{x}-\mu_0}{\sqrt{\frac{s^2}{n}}}\sim N(0,1)$

　　如果规定显著性水平为a，在双尾，左单尾，右单尾三种不同情形下，拒绝域分别为：① $(-\infty,-z_{a/2}]$ 和 $[z_{a/2},\infty)$ ； ② $(-\infty,-z_{a}]$ ；③ $[z_a,\infty),$

[编辑]

总体比例为某定值的显著性检验

　　总体比例指的是随机试验中某种指定事件出现的概率。随机试验中某种指定事件出现叫做“成功”，把一次试验中成功的概率记作 $π$ 。

　　对于假设 $H 0 :π = π 0$ ,在 $H 0$ 成立的前提下，如果 $0.1\le\pi_0\le 0.9$ ，并且样本容量足够大，大到足以满足 $\sqrt{n\pi_0(1-\pi_0)}\ge 3$ 时，近似地有检验统计量

　　 $z=\frac{p-\pi_0}{\sqrt\frac{\pi_0(1-\pi_0)}{n}}\sim N (0,1)$

　　其中p是样本比例。

　　如果规定显著性水平为a，在双尾，左单尾，右单尾三种不同情形下，拒绝域分别为： ① $(-\infty,-z_{a/2}]$ 和 $[z_{a/2},\infty)$ ；② $(-\infty,-z_a]$ ；③ $[z_a,\infty)$ 。

[编辑]

显著性检验应注意的问题

　　进行显著性检验还应注意以下几个问题：

　　1、要有合理的试验设计和准确的试验操作，避免系统误差、降低试验误差，提高试验的准确性和精确性。

　　2、选用的显著性检验方法要符合其应用条件。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同，所选用的显著性检验方法也不同，因而在选用检验方法时，应认真考虑其应用条件和适用范围。

　　3、选用合理的统计假设。进行显著性检验时，无效假设和备择假设的选用，决定了采用两尾检验或是一尾检验。　　　　4、正确理解显著性检验结论的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大，也不能认为在实际应用上一定就有重要或很重要的价值。“显著”或“极显著”是指表面差异为试验误差可能性小于0.05或0.01，已达到了可以认为存在真实差异的显著水平。有些试验结果虽然表面差异大，但由于试验误差大，也许还不能得出“差异显著”的结论，而有些试验的结果虽然表面差异小，但由于试验误差小，反而可能推断为“差异显著”。

　　显著水平的高低只表示下结论的可靠程度的高低，即在0.01水平下否定无效假设的可靠程度为99％，而在0.05水平下否定无效假设的可靠程度为95%。

　　“差异不显著”是指表面差异为试验误差可能性大于统计上公认的概率水平0.05，不能理解为没有差异。下“差异不显著”的结论时，客观上存在两种可能：一是无本质差异，二是有本质差异，但被试验误差所掩盖，表现不出差异的显著性来。如果减小试验误差或增大样本容量，则可能表现出差异显著性。显著性检验只是用来确定无效假设能否被否定，而不能证明无效假设是正确的。

　　5、统计分析结论的应用，还要与经济效益等结合起来综合考虑。

[编辑]

常用显著性检验

　　1.t检验

　　适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种，三者的计算公式不能混淆。

　　2.t'检验

　　应用条件与t检验大致相同，但t′检验用于两组间方差不齐时，t′检验的计算公式实际上是方差不齐时t检验的校正公式。

　　3.U检验

　　应用条件与t检验基本一致，只是当大样本时用U检验，而小样本时则用t检验，t检验可以代替U检验。

　　4.方差分析

　　用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较，方差分析首先是比较各组间总的差异，如总差异有显著性，再进行组间的两两比较，组间比较用q检验或LST检验等。

　　5.X2检验

　　是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况：四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。

　　6.零反应检验

　　用于计数资料。是当实验组或对照组中出现概率为0或100％时，X2检验的一种特殊形式。属于直接概率计算法。

　　7.符号检验、秩和检验和Ridit检验

　　三者均属非参数统计方法，共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。

　　8.Hotelling检验

　　用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。

[编辑]

显著性检验的应用^[2]

　　在市场调研中，由于人力、物力、时间等问题，一般都用抽样调查的方法抽取一定数量的具有代表性的群体，得出样本数据来进行市场研究，并对市场总体特征进行统计推断，在这里面就会存在两个问题，一是样本的特征数量能否反映总体特征？二是，两种不同的样本的数量标志参数是否存在差异？只有解决这两个问题，才能正确的推断市场总体特征，也才能找出市场中不同特征群体的需求差异，这就需要统计学中的显著性检验来解决，由于显著性检验的功能在数据分析中的重大作用，显著性检验在市场调研中得到了广泛的应用；但若不恰当的使用便会导致市场调研信息反应的歪曲或挖掘不充分；以下是我根据以往应用显著性检验的经验而总结的一些关于如何恰当的应用统计检验的体会，仅供参考、讨论。

　　要恰当的运用检验方法，我们需要做到以下几点：

　　首先，了解各检验方法的适用范围及其特点。

　　这也是正确使用检验方法的基本前提，只有了解各检验方法的基本思想及特点，才能正确选取适当的检验方法。

　　许多统计检验方法的应用对总体有特殊的要求，如t检验要求总体符合正态分布，F检验要求误差呈正态分布且各组方差整齐，等等。这些常用来估计或检验总体参数的方法，统称为参数统计。许多调查或实验所得的科研数据，其总体分布未知或无法确定，这时做统计分析常常不是针对总体参数，而是针对总体的某些一般性假设（如总体分布），这类方法称非参数统计，相应的，统计检验总体分为参数检验和非参数检验。在选择参数与非参数检验时，首要考虑是数据的分布情况，能确定分布类型的，则可适当选用参数检验，参数检验主要包括包含的方法有：单样本T检验、两独立样本T检验、两配对样本T检验；非参数由于不限制分布，统计方法简便，适用性强，但检验效率较低，应用时应适当加以考虑，非参数检验主要涉及五个方面，即单样本、两独立样本、两配对样本、多独立样本、多配对样本的非参数检验。

　　不同的检验方法，比较的统计量是不同的。T检验等检验方法都是比较的均值；卡方检验、K-S检验等比较频数；曼－惠特尼U检验等是对秩进行比较；符号检验法比较的是前后变化差值的符号、而符号秩检验法则是对差值及符号一同比较的检验。

　　其次，认清研究目的。

　　研究目的是市场调研中一切实务的根本出发点，做数据分析时同样首要考虑的是研究目的，研究目的也是数据分析的方向，但此时研究目的需要细化，具体到要通过哪些数据、得到什么信息、何种结果的问题，如希望通过对消费者购买哪些品牌的数据来得出市场占有率的信息。

　　再次，分析数据特点。

　　明确某些数据的研究目的后，需要认清数据自身特点。第一，弄清楚要分析的数据属于什么类型，是连续型，还是非连续型？对于连续型数值，均值具有实际意义，对于非连续性的数值，均值并不具备实际意义，而是频数，百分比才有意义，所以，数据属于连续型时，适用比较均值的显著性检验，若是非连续型的级数类，则适用比较频数、比例的检验方法；其实，数据也是可以跟据不同情况，灵活处理的，如对于满意度的衡量，我们可以根据不同的需求看为连续型分值，也可以看为几个等级的级数；第二，我们还需要了解样本数据的分布特点，弄清楚样本数据是否服从某一分布，对于分布明确的，可以采用参数检验，而不清楚分布情况的则可以采用非参数检验法；第三，判断要检验差异的两组样本的关系，属于独立样本，还是属于配对样本。独立样本即指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本，样本之间相互独立；而配对样本可以是同一个体在前后两种状态下某种属性的两种状态，也可以是对某事物两个不同侧面或方面的描述，两样本不是相互独立，而是有相关性的。

　　最后，灵活运用检验方法。

　　检验方法虽然有各自特点和适用范围，但是可以对数据做稍微的处理、变化，或是换个角度分析，便可运用不同的检验方法；且各方法有适用范围，当然也有它的局限性，有时需要多种检验方法配合使用，相互补充，才能充分的挖掘信息，比如,独立样本T检验法判断AB产品对于抗过敏的功效评价在均值上是否有差异，而卡方检验可判断他们在各评价水平上的分布有无差异，假如判断出他们功效水平无差异之后，我们还想知道他们到底是同样的好还是同样的差，这时可以再使用单样本 T 检验对以与均值评价水平相近的满意度水平进行差异性检验来进行定位。此外，我们还需要合理解释检验结果。

　　不仅要正确识别检验结果，还需要结合原始数据及实际意义，并针对研究目的来分析说明。

[编辑]

显著性检验的实例分析

[编辑]

案例一：大豆籽粒品种检验分析

　　例如，目前我国大豆育种工作者认为，大豆籽粒蛋白质含量高于45%(记为 $μ 0$ )的品种为高蛋白品种。某种子公司对一大豆新品种随机抽取5个样品进行测定，得平均蛋白质含量为 $\bar{x}=46.5%$ ， $\bar{x}-\mu_0=1.5%$ 。我们能否根据 $\bar{x}-\mu_0=1.5%$ 就认定该大豆新品种就是高蛋白品种？结论是，不一定。

　　因为通过5个样品测定的蛋白质含量计算的样本平均数 $\bar{x}$ 仅是该大豆品种蛋白质含量总体平均数 $μ$ 的一个估计值。由于存在抽样误差，任何一个样品测定值 $x i$ ，都可以表示为

　　 $x i = μ + ε i$ 　　(i=1，2，…，n)　　　　（1）

　　其中， $μ$ 为总体平均数， $ε i$ 为抽样误差。

　　样本平均数 $\bar{x}$ 为

　　 $\bar{x}=\frac{1}{n}\sum_{i=1}^nx_i=\frac{1}{n}\sum_{i=1}^n(\mu+\epsilon_i)=\mu+\frac{1}{n}\sum\epsilon_i=\mu+\bar{\epsilon}$ 　　　　(2)

　　（1）式表明，样本平均数 $\bar{x}$ 包含了总体平均数 $μ$ 与抽样误差 $\bar{\epsilon}$ 二部分。于是，

　　 $\bar{x}-\mu_0=(\mu-\mu_0)+\bar{\epsilon}$ (3)

　　(2)式表明， $\bar{x}-\mu_0$ 是由两部分组成：一部分是两总体平均数的真实差异 $(μ - μ 0)$ ；另一部分是抽样误差 $\bar{\epsilon}$ 。 $\bar{x}-\mu_0$ 并不能代表新品种蛋白质含量总体平均数 $μ$ 与标准含量 $μ 0$ 之间的真实差异，我们称 $\bar{x}-\mu_0$ 为表面差异。虽然真实差异 $(μ - μ 0)$ 未知，但表面差异 $\bar{x}-\mu_0$ 是可以计算的，借助数理统计方法可以对试验误差作出估计。所以，可将表面差异 $\bar{x}-\mu_0$ 与试验误差相比较间接推断真实差异 $μ - μ 0$ 是否存在，这就是差异显著性检验的基本思想。显著性检验的目的在于判明，表面差异 $\bar{x}-\mu_0$ 主要是由真实差异 $μ - μ 0$ 造成的，还是由抽样误差 $\bar{\epsilon}$ 造成的，从而得到可靠的结论。

[编辑]

案例二：信用评级对企业债券市场定价影响力的判断^[3]

　　一、模型设计

　　选取2008年、2009年和2010年发行的企业债券为研究样本，根据以下原则进行分组：(1)期限结构相同的两组企业债券(A1、A2)在同一月度内发行，且该两组企业债券的债项评级和主体评级均相同，命名为样本组A，得到有效样本67个；(2)期限结构相同的两组企业债券(B1、B2)在同一月度内发行，且其中一组企业债券(B2)的债项评级和主体评级均优于另一组(B1)，命名为样本组B，得到有效样本76个；(3)期限结构完全相同的两组企业债券(C1、C2)在同一月度内发行，且该两组企业债券的债项评级相同，主体评级不同，命名为样本组C，得到有效样本58个；(4)期限结构完全相同的两组企业债券(D1、D2)在同一月内发行，且该两组企业债券的主体评级相同，债项评级不同，命名为样本组D，得到有效样本49个。

　　计量经济理论中，用来比较两组数据是否存在显著性差异的方法是t检验。本文采用配对设计两样本均数差异显著性检验的方法来验证A1与A2、B1与B2、C1与C2、D1与D2是否存在显著性差异。所采用的研究样本之所以选取期限结构完全相同而且是在同一个月内发行的两组债券作为配对样本，原因在于只有期限结构完全相同的债券其发行利差的比较才有意义，在同一个月内发行也大大减少了市场上资金供求关系对债券发行利差造成的影响，因此，本文将企业债券在同一月度内发行视为在同一时期发行。

　　二、实证分析

　　采用excel 2007对样本数据进行分析，显著性水平取0．05。根据显著性检验的计量经济理论，运用t检验法检验两组数据是否存在显著性差异时，对样本数据要求方差齐性，即各组资料的总体方差相等。因此，在对各组样本数据进行t检验之前，先要对各组样本数据进行方差齐性检验，一般采用F检验来完成。

　　(一)F检验

　　首先对样本数据组A1与A2、Bl与B2、C1与C2、D1与D2用excel 2007进行方差齐性检验(F检验)，计量结果如表1至表4所示。

表1 A1、A2的方差齐性检验(F检验)

项目＼分类	A1	A2
平均	3．380997	3．450907
方差	0．890546	0．88167
观测值	67	67
df	66	66
F	1．010068
P(F<=f)单尾	0．483833
F单尾临界	1．503607

表2 B1、B2的方差齐性检验(F检验)

项目＼分类	B1	B2
平均	3．693077	2．834852
方差	1．275205	0．963889
观测值	76	76
df	75	75
F	1．322979
P(F<=f)单尾	0．113918
F单尾临界	1．465625

表3 C1、C2的方差齐性检验(F检验)

项目＼分类	变量1	变量2
平均	3．292207	3．347521
方差	1．129063	1．159825
观测值	58	58
df	57	57
F	0．973477
P(F<=f)单尾	0．459764
F单尾临界	0．644431

表4 D1、D2的方差齐性检验(F检验)

项目＼分类	变量1	变量2
平均	3．190006	3．392693
方差	0．931489	0．885317
观测值	49	49
df	48	48
F	1．052153
P(F<=f)单尾	0．430467
F单尾临界	1．61537

　　考察表1至表4中F检验的计量结果，由于各表中P值分别等于0．483 833(表1)、0．113 918(表2)、0．459 764(表3)、0．430 467(表4)，均大于0．05，所以，样本数据组A1与A2、BI与B2、C1与C2、D1与D2各两组数据的方差是齐性的，即各两组数据的方差不存在显著性差异，可以进行t检验。

　　(二)t检验

　　本节对样本数据组A1与A2、B1与B2、C1与C2、D1与D2用excel 2007进行配对双样本的均值分析(t检验)，计量结果如表5至表8所示。

表5 A1、A2均值分析(t检验)

项目＼分类	A1	A2
平均	3．380997	3．450907
方差	0．890546	0．88167
观测值	67	67
泊松相关系数	0．703808
假设平均差	0
df	66
t Stat	-0．78982
P(T<=t)单尾	O．21623
t单尾临界	1．668271
P(T<=t)双尾	0．432459
t双尾临界	1．996564

表6 B1、B2均值分析(t检验)

项目＼分类	B1	B2
平均	3．693077	2．834852
方差	1．275205	0．963889
观测值	76	76
泊松相关系数	0．795185
假设平均差	0
df	75
t Star	10．84559
P(T<=t)单尾	2．53E-17
t单尾临界	1．665425
P(T<=t)双尾	5．06E-17
t双尾临界	1．992102

表7 C1、C2均值分析(t检验)

项目＼分类	C1	C2
平均	3．292207	3．34752l
方差	1．129063	1．159825
观测值	58	58
泊松相关系数	0．637837
假设平均差	0
df	57
t Stat	1.046265
P(T<=t)单尾	0．322688
t单尾临界	1．672029
P(T<=t)双尾	0．645376
t双尾临界	2．002465

表8 D1、D2均值分析(t检验)

项目＼分类	D1	D2
平均	3．190006	3．392693
方差	0．931489	0．885317
观测值	49	49
泊松相关系数	0．588482
假设平均差	0
df	48
t Stat	-1．6405
P(T<=t)单尾	0．05372
t单尾临界	1．677224
P(T<=t)双尾	0．10744
t双尾临界	2．010635

　　考察表5至表8中t检验的计量结果，表5、表7、表8中P(单尾)分别等于0．216 23(表5)、0．322 688(表7)、0．053 72(表8)，P(双尾)分别等于0．432 459(表5)、0．645 376(表7)、0．107 44(表8)均大于0．05，所以，样本数据组A1与A2、C1与C2、Dl与D2各两组数据在统计学上没有显著性差异，即各两组数据的均值在统计意义上是相等的。

　　考察表6中t检验的计量结果，P(单尾)等于2．53E-17(表6)，P(双尾)等于5．06E-17(表6)，均小于0．05，所以样本数据组B1与B2这两组数据在统计学上具有显著性差异，即各两组数据的均值在统计意义上是不相等的。

　　三、结果解析

　　实证结果表明：(1)A1与A2不存在显著性差异，即在同一时期发行的、期限结构完全相同的两组企业债券，如果该两组企业债券的债项评级和主体评级均相同，那么其发行利差不存在显著性差异。(2)B1与B2存在显著性差异，即在同一时期发行的、期限结构完全相同的两组企业债券，如果其中一组企业债券(B2)的债项评级和主体评级优于另一组(B1)，则其发行利差存在显著性差异。(3)C1与C2不存在显著性差异，即在同一时期发行的、期限结构完全相同的两组企业债券，如果该两组企业债券的债项评级相同，主体评级不同，那么其发行利差不存在显著性差异。(4)Dl与D2不存在显著性差异，即在同一时期发行的、期限结构完全相同的两组企业债券，如果该两组企业债券的主体评级相同，债项评级不同，则其发行利差不存在显著性差异。

　　上述四项实证结果可进一步表述为：在其他条件相同时，只要信用评级相同(债项评级和／或主体评级相同)，企业债券的发行利差(即发行成本)在统计学上不具有显著性差异。在其他条件相同时，只要信用评级不同(债项评级和主体评级均不同)，企业债券的发行利差(即发行成本)在统计学上也显著不同。

　　据此，可以得出结论：(1)信用评级信息已经成为我国企业债券市场投资者制定投资决策的主要依据，市场投资者对信用评级信息有很强的依赖性。(2)信用评级信息在资本市场上对我国企业债券的市场定价具有显著的影响力。(3)我国企业债券的市场定价是有效率的。

[编辑]

$r α$ 　　α k	0.10　　0.05　　0.02　　0.01　　0.001	α　　 $r α$ k
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100	0.9877 0.9000 0.8054 0.7293 0.6694 0.6215 0.5822 0.5494 0.5214 0.4973 0.4762 0.4575 0.4409 0.4259 0.4124 0.4000 0.3887 0.3783 0.3687 0.3598 0.3233 0.2960 0.2746 0.2573 0.2428 0.2306 0.2108 0.1954 0.1829 0.1726 0.1638	0.9969 0.9500 0.8783 0.8114 0.7545 0.7067 0.6664 0.6319 0.6021 0.5760 0.5529 0.5324 0.5139 0.4973 0.4821 0.4683 0.4555 0.4438 0.4329 0.4227 0.3809 0.3494 0.3246 0.3044 0.2875 0.2732 0.2500 0.2319 0.2172 0.2050 0.1946	0.9995 0.9800 0.9343 0.8822 0.8329 0.7887 0.7498 0.7155 0.6851 0.6581 0.6339 0.6120 0.5923 0.5742 0.5577 0.5425 0.5285 0.5155 0.5034 0.4921 0.4451 0.4093 0.3810 0.3578 0.3384 0.3218 0.2948 0.2737 0.2565 0.2422 0.2301	0.9999 0.9900 0.9587 0.9172 0.8745 0.8343 0.7977 0.7646 0.7348 0.7079 0.6835 0.6614 0.6411 0.6226 0.6055 0.5897 0.5751 0.5614 0.5487 0.5368 0.4869 0.4487 0.4182 0.3932 0.3721 0.3541 0.3248 0.3017 0.2830 0.2673 0.2540	0.9999 0.9990 0.9912 0.9741 0.9507 0.9249 0.8982 0.8721 0.8471 0.8233 0.8010 0.7800 0.7603 0.7420 0.7246 0.7084 0.6932 0.6787 0.6652 0.6524 0.5974 0.5541 0.5189 0.4896 0.4648 0.4433 0.4078 0.3799 0.3568 0.3375 0.3211	1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100

本条目由以下用户参与贡献

Zfj3000,Angle Roh,Yixi,chinabing,泡芙小姐,连晓雾,林巧玲,Mis铭,Mike Zhang.

页面分类: 质量检验 | 统计方法

评论(共22条)

提示:评论内容为网友针对条目"显著性检验"展开的讨论，与本站观点立场无关。

219.151.40.* 在 2011年1月14日 11:30 发表

good job

回复评论

1.197.116.* 在 2011年2月19日 20:43 发表

很好，加上SPSS的应用更好

回复评论

222.89.114.* 在 2011年3月10日 17:46 发表

很全面

回复评论

113.108.133.* 在 2011年3月30日 09:29 发表

帮助很大，受教了，谢谢～

回复评论

58.254.93.* 在 2011年4月28日 08:08 发表

那什么a b c 是什么意思都没说呀！？

回复评论

咖啡馆 (Talk | 贡献) 在 2011年4月28日 09:13 发表

58.254.93.* 在 2011年4月28日 08:08 发表

那什么a b c 是什么意思都没说呀！？

请问楼上指的a b c在哪呀？

回复评论

118.168.12.* 在 2011年5月11日 18:01 发表

"4、在检验的操作中，把观察到的显著性水平与作为检验标准的显著水平标准比较，小于这个标准时，得到了拒绝原假设的证据，认为样本数据表明了真实差异存在。大于这个标准时，拒绝原假设的证据不足，认为样本数据不足以表明真实差异存在。 "

没看懂

回复评论

113.140.45.* 在 2011年5月20日 13:43 发表

专业

回复评论

117.36.52.* 在 2011年9月22日 22:00 发表

相当给力，真是深入浅出，看完后受益匪浅，一塌糊涂的统计学顿时清晰了很多谢谢

回复评论

123.124.151.* 在 2011年10月9日 16:51 发表

ding

回复评论

59.37.162.* 在 2011年10月19日 17:07 发表

好！！

回复评论

58.215.212.* 在 2012年5月18日 10:29 发表

好

回复评论

张丽娜 (Talk | 贡献) 在 2012年11月6日 19:46 发表

很好

回复评论

163.152.116.* 在 2012年11月27日 21:02 发表

非常感谢，建议po到维基上让更多的华人了解！

回复评论

117.136.35.* 在 2013年3月27日 16:07 发表

对我们很有用

回复评论

124.42.78.* 在 2013年4月14日 21:06 发表

看你要求的准确度，这是个主观选择，虽然一般都选择5%。

回复评论

124.112.2.* 在 2013年4月30日 09:14 发表

实力太少了，亲

回复评论

202.108.196.* 在 2013年6月5日 14:01 发表

遇到一个问题，双边检验H0下统计量值为0.48，服从标准正态分布，p应该是2*（1-N(0.48)）=0.63，非常大，表示无法拒绝原假设，但不代表能够接受原假设吧？PS,无法拒绝H0就意味着原假设为真么，不一定吧？

回复评论

218.6.135.* 在 2013年12月17日 20:17 发表

首先请恕我无知，我想请问一下那个显著性标记是怎么标上去的，有没什么规定，怎么有些文献是标的ab,有的是abcd,甚至有的是abcdef。。。原谅我没有学过统计学。。

回复评论

158.135.191.* 在 2014年9月23日 05:51 发表

给力！比摆渡百科全，很不错。

回复评论

39.89.37.* 在 2015年9月29日 00:42 发表

第一次假设h0 认为是高蛋白第二次假设h0 不认为是高蛋白请问怎么区别啊

回复评论

121.33.49.* 在 2015年10月30日 08:50 发表

发生第二类错误的概率（记作）是指，把来自\theta=\theta_1(\theta_1\ne\theta_0)的总体的样本值代入检验统计量所得结果落入接受域的概率。

第二类错误概率的定义和计算一直是晕晕乎乎没搞懂，麻烦详细解释一下，多谢

回复评论

发表评论请文明上网，理性发言并遵守有关规定。

查看

工具箱▼

显著性检验

出自 MBA智库百科(https://wiki.mbalib.com/)

目录

什么是显著性检验

显著性检验的含义

显著性检验的原理

显著性检验的相关概念

原假设和备择假设

双尾检验和单尾检验

显著性检验的作用

显著性检验的基本思想

显著性检验的两类错误

显著性检验的P值^[1]

显著性检验的结果

显著性检验中的总体和样本

显著性检验的步骤

总体均值为某定值的显著性检验

总体比例为某定值的显著性检验

显著性检验应注意的问题

常用显著性检验

显著性检验的应用^[2]

显著性检验的实例分析

案例一：大豆籽粒品种检验分析

案例二：信用评级对企业债券市场定价影响力的判断^[3]

相关系数显著性检验表

相关条目

温馨提示

本条目相关课程

本条目由以下用户参与贡献

评论(共22条)

导航

意见反馈

查看

工具箱▼

显著性检验

出自 MBA智库百科(https://wiki.mbalib.com/)

目录

什么是显著性检验

显著性检验的含义

显著性检验的原理

显著性检验的相关概念

原假设和备择假设

双尾检验和单尾检验

显著性检验的作用

显著性检验的基本思想

显著性检验的两类错误

显著性检验的P值[1]

显著性检验的结果

显著性检验中的总体和样本

显著性检验的步骤

总体均值为某定值的显著性检验

总体比例为某定值的显著性检验

显著性检验应注意的问题

常用显著性检验

显著性检验的应用[2]

显著性检验的实例分析

案例一：大豆籽粒品种检验分析

案例二：信用评级对企业债券市场定价影响力的判断[3]

相关系数显著性检验表

相关条目

温馨提示

本条目相关文档

本条目相关课程

本条目由以下用户参与贡献

评论(共22条)

导航

意见反馈

显著性检验的P值^[1]

显著性检验的应用^[2]

案例二：信用评级对企业债券市场定价影响力的判断^[3]