社会及行为科学研究法(3?资料分析)
上QQ阅读APP看书,第一时间看更新

四 假设检定

先前提到,回归分析是社会科学研究者用来探索事物间因果关系常用的分析工具,而回归系数正代表研究者对于某种因果关系的假设。然而在现实上,往往母体资料不可得的,因此假设是否被经验资料所验证,不单是要估计出回归系数的数值,还需要透过假设检定对“因果关系假设是否通过验证”作出判断。特别强调的是,部分社会科学家反对回归分析可以用来研究“因果关系”的说法,主张回归分析仅能发现事物间的“相关性”,而相关性并不能等同于因果关系。关于社会科学家对于因果关系的看法,请参见延伸阅读3。

本节将使用一个假设的例子来进行假设检定的讨论:一位在大学政治系教授统计学的教授,根据其历年的教学经验,认为学生的修课数目与智商成绩是两个最有效预测学生统计成绩的因素,其所对应的假设是:

1.当学生修课数目愈多,其平均每周花在研读统计学的时间就会变少,因此统计成绩会较低。

2.统计学的学习需要对数字的敏感性较高,许多人即便花了很多时间,学习的成效仍然相当有限,反而是智商成绩高的人不需要花很多时间就有很好的学习结果,因此统计成绩与智商成绩呈正比。

假定这位教授现在想利用回归分析来检证他的假设是否得到经验资料的支持,因此他针对全台湾政治系修习统计的学生进行抽样,再应用最小平方法或最大概似法进行参数推估,而得出对应于修课数目和智商成绩分别为负向和正向数值的回归系数结果,此时这位教授就可以宣称其假设被验证了吗?

答案是否定的,因为还没有经过假设检定之前,回归分析的结果即便系数方向正确,也无法知道这样的结果究竟充分反映母体的状况,还是被抽样的风险左右,而假设检定在概念上来说,就是一套评估抽样风险对于回归分析影响的统计工具。一旦我们有这样的资讯,便可以对于研究假设是否通过经验检证进行判断。

让我们重新思考这位教授所面临的问题本质,比方说如果他确实拥有母体资料(全台湾政治系学生的应统成绩、修课数、智商分数),那么只要将这些资料带进去回归模型中推算出母体中的回归参数β即可。需要说明的是,这里的回归参数β是母体参数值,具有唯一性,而非针对样本资料所推估出的回归系数值^,会随样本的不同而产生变化,而这正是要对参数估计值进行假设检定的原因。

因此,只要分析的样本不是母体样本,参数估计就会受到抽样的影响,无法利用其结果直接进行因果关系假设的推论。但在绝大多数的社会科学领域中,母体样本取得不易,鲜少能直接对母体进行分析,因此多半经由随机抽样来取得一个具有代表性的样本,将其看做母体的同形缩小版(microcosm),使得我们从此样本所推估出的参数,能够十分接近母体参数值。但要注意的是,随机抽样对于取得一个有推论效力、代表性足够的样本之先决要件,是建立在大数法则的基础下,也就是样本数要够大,才能借由各种随机误差的相互抵消,使得样本性质能够接近母体性质。

既然我们的推论都来自于样本,而且是某一次随机抽样的特定样本,那么当然就有抽样造成推论风险的问题。比方说,假使将母体资料带入回归模型,得到β=2,代表依变项和自变项有正向关系,但是由于我们仅抽了100人的样本来进行参数推估,所以得出,此时我们若依这个结果而宣称依变项和自变项有负向关系,则推论就会是错的。此处问题的关键不在“最小平方法”或“最大概似法”,而是在抽样的环节上,因为不管β,都是用相同的推估方法,但分析的样本却有母体样本和抽样样本之别。显而易见的,当回归分析所使用的资料不同,自然参数估计也可能得出不同结果,这就是抽样风险的意义。

相同的问题出现在从相同母体抽出不同样本而得出不同回归参数推估值上。倘若同样针对教授的假设,甲、乙、丙三人分别针对母体进行抽样而各自得到一随机样本,三人都采用相同的估计法推估回归系数,但皆得到不同结果,某甲得出,某乙得出,某丙得出,假设三人的抽样过程都符合正当程序的要求,即三人的推论所依据的样本都一样有效,此时在裁决何种推论较为接近母体参数值上就发生了困难。

严格地说,在母体资料不可得的前提下,我们永远无法百分之百确定甲、乙、丙三人的参数推估结果谁比较正确,事实上只要分析对象是抽样样本,就会有抽样风险,所以三人都承受了相同的推论风险,所推估出数字并没有谁比较正确的问题,因此三人的答案可能都是错的,而抽再多的样本,并无法解决那一个参数推估结果较佳的问题,必须借助对回归参数进行“假设检定”的方式,来评估会如何变动,以及如何对的假设进行裁断。

(一)假设检定步骤一:确定假设检定的目标

不论母体中回归参数值是正向或负向,如果自变项和依变项间有共变关系存在,则β≠0,如果没有共变关系,则β=0。因此究竟在母体样本中回归参数值是否为0就是我们假设检定的目标。

(二)假设检定的第二步:决定何者为假设检定的虚无假设

虚无假设是从英文的null hypothesis直译过来,意味着我们想推翻的假设,但是为了使我们推翻此假设的理由够充分,能够说服大多数的人,所以我们应该展现的证据是:如果虚无假设为真的话(对于未知事实的真假宣称),那会出现我们所看到的证据(无法改变的客观证据)是微乎其微,意味着,不是虚无假设的宣称有误,就是证据有误,否则不会出现一个机率上微乎其微的现象,而既然经验资料所产生的证据无法否定,那么我们就只有否定虚无假设的宣称,这时整个逻辑推论的说服力才够强。

由于科学研究强调严谨的特性,因此假设检定是要用最严苛的标准来验证科学的发现,因此“判定母体中XY具有共变关系”这样的决策,除非真的有很强的证据支持,否则不轻易下如此的判断。所以不论任何研究,主观上我们宁愿先下一个先入为主的假设,也就是将“在母体中XY不具有共变关系”设为我们的虚无假设,然后进行实际验证。在虚无假设为真的前提下,如果我们得到一个很离谱的经验发现,代表此先入为主的看法根本不可能导出这个发生几率是微乎其微的证据,所以虚无假设有误。反过来想,如果证据不够离谱,我们会觉得先入为主的看法还是相当有可能会导出这个证据的发生,因此我们想要推翻虚无假设的说服力就不够强。

不过即便经验证据再离谱,发生的机会微乎其微,毕竟还是有可能发生,因此假设当虚无假设为真而出现离谱证据的几率为p时,代表我们若否定虚无假设的宣称,还是有可能犯了决策错误,因为有p的几率是虚无假设为真而离谱证据也真的发生,此时应该想到的,是我们到底能够容许多少的决策错误风险。留心这里所谓的决策错误是错误地否定虚无假设,也就是“母体中XY不具有共变关系,但研究者却判定有”,即所谓的“第一型错误”。换句话说,如果我们认为α是最大限度可以容许犯第一型错误的几率,比方说α=0.05,那么如果p小于α,代表我们犯第一型错误的几率还在可以容许的范围内。所以既然虚无假设在现实证据之下显得高度不可能为真,而我们否定虚无假设所产生决策错误的风险又在可容许的范围内,自然我们可以放心的否定虚无假设,而宣称“否定虚无假设的决定是已经排除了抽样风险之后的判断”,因此α被称为“显著水准”。

至于容许犯第一型错误的几率α应该设为多大,长久以来,统计学者约定成俗通常将α设为0.05(5%),而较为严格的标准常见有0.01(1%)或0.001(0.1%),这些不同设定的容许值,就称为“α显著水准”,在统计书写上,通常习惯在回归系数值旁边分别以一个(∗)、两个(∗∗)和三个星号(∗∗∗)来表示。

(三)假设检定的第三步:根据经验证据来进行假设检定的决策

基于上面的讨论,虚无假设为“第一型错误”所对应的事实假设,即“假设母体中自变项和依变项不具有共变关系”(H0:β=0),而对立假设为“假设母体中XY具有共变关系”(H1:β≠0),我们必须要找出在“先入为主(虚无假设)”为真的状况下,会怎么受到抽样影响而变化的规则。值得注意的是,虚无假设是我们想象的,并没有涉及经验资料,但是我们用以作为推论的参数推估值,是一个会变动的参数推估值,其数值全部是基于我们抽样所得的特定样本。

接下来,不管是使用最小平方法或最大概似法,我们要找出所推估出数值变动的法则,即回归参数的共变异矩阵V)。由于其数学推导较为繁复,而且最小平方法和最大概似法两者推导出的结果有些微差异,因此下面仅列出最小平方法所推估出的结果,如式(2-15)所示。有关进一步的说明,请参考延伸阅读4中中央极限定理的介绍。

根据“中央极限定理”,可以知道回归参数推估值是会依循着常态分配,其变动的法则如图2-1所示。

图2-1 回归系数估β的抽样分配

如图2-1,在母体中依变项和自变项不具有共变关系前提下,研究者随机抽样出一样本而推算出的回归系数值为,那么的数值会依循着常态分配而变动,虚无假设,此区间称为“接受域”。

或称为β的抽样分配。倘若研究者对于“第一型误差”的容许值设定为0.05,而推估值同时存在过大或过小的可能,导致研究者认为经验证据显然与虚无假设相悖,则在正负方向实际的容许值则为0.025,此即称为“双尾检定”。凡是落在β抽样分配正负极端方向前2.5%的区间,代表在虚无假设为真前提下此经验证据出现的几率几乎微乎其微,因而必须做出拒绝虚无假设为真的判断,则此区间称为“拒绝域”,如果是落在中间95%的区间,由于“第一型错误”的几率超过我们的容许限度,因此只能接受

实际进行假设检定时,β抽样分配被称为t分配,当抽样的样本数趋近无限大时,β抽样分配的趋近于标准常态分配,而统计量t的计算,在意义上等同于算出是位于距离0几个标准误的坐标点上,如式(2-16)所示:

此处标准误SE()为V)的开根号值。

由于t分配的机率计算并非封闭形式(closed form),因此p值的计算不易,一般应用上都以查表的方式,先制作好t值与p值的换算表,然后计算出p值来进行假设检定。

值得注意的是,当我们接受虚无假设时,不代表我们真的认为母体中XY一定不具有共变关系,而是在经验证据不够充分的状况下,我们宁愿采取较为保守的立场,不去采认母体中XY具有共变关系的结论。

至于回归模型的解释力,先前提到,简单线性回归分析是一种对于依变项变异数的正交分割,即总变异等于回归变异加上误差变异。其中回归变异就是模型的解释变异,也就是模型预测值之间所产生的变异量,误差变异为回归分析中误差值之间所产生的变异量,总变异则为依变项数值之间所产生的变异量,以数学式来表示:

回归模型的解释力为“回归变异”占“总变异”的百分比,称为R2,其公式为:

通常解释力的大小跟自变项的个数有某种程度的关系,因为回归模型所纳入自变项愈多,模型的解释力会愈大,因此考虑到自变项的个数,可采“调整后的解释力”(AdjR2),其公式为:

也就是分别将总变异和误差变异除以其自由度,算出调整后的误差变异占总变异的百分比,然后用1减去得出AdjR2