
2.3 正交试验设计
当实验中需考察不同条件对过程的影响情况时,实验方案的设计就非常重要了。实验方案设计可以考虑析因设计。析因设计也称为全因子实验设计,就是由实验中所涉及的全部实验因素的各水平全面组合形成不同的实验条件,每个实验条件下进行两次或两次以上的独立重复实验。析因设计的最大优点是所获得的信息量很多,可以准确地估计各实验因素的主效应的大小,还可估计因素之间各级交互作用效应的大小;其最大缺点是所需要的实验次数最多,因此耗费的人力、物力和时间也较多,当所考察的实验因素和水平较多时,研究者很难承受。
当析因设计要求的实验次数太多时,一个非常自然的想法就是从析因设计的水平组合中,选择一部分有代表性的水平组合进行试验,以减少试验次数。因此就出现了分式析因设计(fractional factorial designs),但是对于初期进行探索实验的实际工作者来说,选择适当的分式析因设计还是比较困难的。
正交试验设计(orthogonal experimental design)是进行多因素多水平实验研究的又一种设计方法。它是根据正交性,从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备“均匀分散、齐整可比”的特点。正交试验设计是分式析因设计的主要方法,是一种高效率、快速、经济的实验设计方法。日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每一组合的重复数。若按L9(33)正交表安排实验,只需作9次;按L18(37)正交表安排实验,需进行18次实验,显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。
2.3.1 正交表
正交表是一整套规则的设计表格,用Ln(tc)表示。L为正交表的代号,n为试验的次数,t为水平数,c为列数,也就是可能安排因素的最多个数。例如L9(34)(见表2-3),它表示需做9次实验,最多可观察4个因素,每个因素均为3水平。一个正交表中也可以各列的水平数不相等,即混合型正交表,如L8(4×24)(见表2-4),此表的5列中,有1列为4水平,4列为2水平。根据正交表的数据结构可以看出,正交表是一个n行c列的表,其中第j列由数码1,2,…,Sj组成,这些数码均各出现N/S次,例如表2-3中,第二列的数码个数为3,S=3,即由1、2、3组成,各数码均出现N/3=9/3=3次。
表2-3 L9(34)正交表

表2-4 L8(4×24)正交表

正交表具有以下两项性质。
①每一列中,不同的数字出现的次数相等。例如在两水平正交表中,任何一列都有数码“1”与“2”,且任何一列中它们出现的次数是相等的;如在三水平正交表中,任何一列都有“1”、“2”、“3”,且在任一列的出现次数均相等。
②任意两列中数字的排列方式齐全而且均衡。例如在两水平正交表中,任何两列(同一横行内)有序数对共有4种,(1,1)、(1,2)、(2,1)、(2,2),每种数对出现次数相等。在三水平情况下,任何两列(同一横行内)有序数对共有9种,(1,1)、(1,2)、(1,3)、(2,1)、(2,2)、(2,3)、(3,1)、(3,2)、(3,3),且每对出现次数也均相等。
以上两点充分地体现了正交表的两大优越性,即“均匀分散、齐整可比”。通俗地说,每个因素的每个水平与另一个因素各水平各碰一次,这就是正交性。
2.3.2 交互作用表
每一张正交表后都附有相应的交互作用表,它是专门用来安排交互作用试验的。如表2-5为L8(27)正交表,表2-6就是L8(27)表的交互作用表。
表2-5 L8(27)正交表

安排交互作用的试验时,是将两个因素的交互作用当作一个新的因素,占用一列,为交互作用列,从表2-6中可查出L8(27)正交表中的任何两列的交互作用列。表中带( )的为主因素的列号,它与另一主因素的交互列为第一个列号从左向右,第二个列号顺次由下向上,二者相交的号为二者的交互作用列。例如将A因素排为第(1)列,B因素排为第(2)列,两数字相交为3,则第3列为A×B交互作用列。又如可以看到第4列与第6列的交互作用列是第2列,等等。
表2-6 L8(27)表的交互作用表

2.3.3 正交试验的表头设计
表头设计是正交设计的关键,它承担着将各因素及交互作用合理安排到正交表的各列中的重要任务,因此一个表头设计就是一个设计方案。
表头设计的主要步骤如下。
(1)确定列数
根据试验目的,选择处理因素与不可忽略的交互作用,明确其共有多少个数,如果对研究中的某些问题尚不太了解,列可多一些,但一般不宜过多。当每个试验号无重复,只有1个试验数据时,可设2个或多个空白列,作为计算误差项之用。
(2)确定各因素的水平数
根据研究目的,一般二水平(有、无)可作因素筛选用,也适用于试验次数少、分批进行的研究。三水平可观察变化趋势,选择最佳搭配。多水平以能一次满足试验要求为宜。
(3)选定正交表
根据确定的列数(c)与水平数(t)选择相应的正交表。例如观察5个因素8个一级交互作用,留两个空白列,且每个因素取2水平,则适宜选L16(215)表。由于同水平的正交表有多个,如L8(27)、L12(211)、L16(215),因此一般只要表中列数比计划需要观察的因素个数稍多一点即可,这样省工省时。
(4)表头安排
应优先考虑交互作用不可忽略的处理因素,按照不可混杂的原则,将它们及交互作用首先在表头安排妥当,而后再将剩余各因素任意安排在各列上。例如某项目考察4个因素A、B、C、D及A×B交互作用,各因素均为2水平,现选取L8(27)表,由于A、B两因素需要观察其交互作用,故将二者优先安排在第1、第2列,根据交互作用表查得A×B应排在第3列,于是C排在第4列,由于A×C交互在第5列,B×C交互作用在第6列,虽然未考查A×C与B×C,为避免混杂之嫌,D就排在第7列。设计结果见表2-7。
表2-7 L8(27)表头设计

(5)组织方案实施
根据选定正交表中各因素占有列的水平数列,构成实施方案表,按实验号依次进行,共做n次实验,每次实验按表中横行的各水平组合进行。例如L9(34)表,若安排四个因素,第一次实验A、B、C、D四因素均取1水平;第二次实验A因素1水平,B、C、D取2水平;……第九次实验A、B因素取3水平,C因素取2水平,D因素取1水平。实验结果数据记录在该行的末尾。因此整个设计过程可用一句话归纳为:“因素顺序上列,水平对号入座,实验横着去做。”
2.3.4 二水平正交试验设计与方差分析
下面以一个实例简单介绍有交互作用的正交试验设计及方差分析。
某研究室研究影响某试剂回收率的三个因素,包括温度、反应时间、原料配比,每个因素都为二水平,各因素及其水平见表2-8。选用L8(27)正交表进行实验,实验结果见表2-9。
表2-8 因素与水平

表2-9 某试剂回收率的正交试验L8(27)表结果

首先计算Ij与IIj,Ij为第j列第1水平各试验结果取值之和,IIj为第j列第2水平各试验结果取值之和。然后进行方差分析。过程为:
总离差平方和
各列离差平方和
本例各列离差平方和见表2-9最底部一行。各空列SSj之和即误差平方和SSe=∑SS空列=0.5+4.5+4.5=9.5。
自由度v为各列水平数减1,交互作用项的自由度为相交因素自由度的乘积。分析结果见表2-10。
表2-10 L8(27)三种因素对某溶剂回收率影响的正交试验方差分析表

从表2-10看出,在α=0.05水准上,只有C因素与A×B交互作用有统计学意义,其余各因素均无统计学意义。A因素影响最小,考虑到交互作用A×B的影响较大,且它们的二水平为优。在C2的情况下,有B1A2和B2A1两种组合状况下的回收率最高。考虑到B因素影响较A因素影响大些,而B中选B1为好,故选A2B1。这样最后决定最佳配方为A2B1C2,即温度80℃,反应时间2.5h,原料配比1.2:1为最佳配方。
如果使用计算机进行统计分析,则在数据处理时只需要输入试验因素和实验结果的内容,交互作用列的内容不用输入,然后按照表头定义要分析的模型进行方差分析。