第2章 优化设计的理论基础
2.1 优化设计问题的几何意义
2.1.1 目标函数的等值面(线)
目标函数的值是评价设计方案优劣的指标。n维变量的目标函数,其函数图像只能在n+1维空间中描述出来。当给定一个设计方案,即给定一组x1,x2,…,xn的值时,目标函数f(X)=f(x1,x2,…,xn)必相应有一确定的函数值;但若给定一个f(X)值,却有无限多组x1,x2,…,xn值与之对应,也就是当f(X)=a时,X=(x1,x2,…,xn)T在设计空间中对应有一个点集。通常这个点集是一个曲面(二维是曲线,大于三维称为曲面),称之为目标函数的等值面。当给定一系列的a值,取a=a1,a2,…时,相应地有f(X)=a1,a2,…,这样可以得到一组超曲面族——等值面族。显然,等值面具有下述特性,即在一个特定的等值面上,尽管设计方案很多,但每一个设计方案的目标函数值却是相等的。
现以二维无约束最优化设计问题为例阐明其几何意义。如图2-1所示,二维目标函数值f(X)=f(x1,x2)在以x1、x2和f(X)为坐标的三维坐标系空间内是一个曲面。在二维设计平面x1Ox2中,每一个点X=(x1,x2)都有一个相应的目标函数值f(X)=f(x1,x2),它在图中反映为沿f(X)轴方向的高度。若将f(X)=f(x1,x2)面上具有相同高度的点投影到设计平面x1Ox2上,则得f(X)=f(x1,x2)=a的点集,称为目标函数的等值线(等值线是等值面在二维设计空间中的特定形态)。当给定一系列不同的a值时,可以得到一组平面曲线:f(X)=f(x1,x2)=a1,f(X)=f(x1,x2)=a2,…,这组曲线构成目标函数的等值线族。由图可以清楚地看到,等值线的分布情况反映了目标函数值的变化情况,等值线越向里,目标函数值越小,对于一个有中心的曲线族来说,目标函数的无约束极小点就是等值线族的一个共同中心X*。故从几何意义上说,求目标函数无约束极小点也就是求其等值线族的共同中心。
以上二维设计空间等值线的讨论,可以推广到分析多组问题。但需注意,对于三维问题在设计空间中是等值面,高于三维的问题在设计空间中则是等值超曲面。
2.1.2 约束最优解和无约束最优解
n维目标函数f(X)=f(x1,x2,…,xn),若在无约束条件下极小化,即在整个n维设计空间寻找X*=(x1*,x2*,…,xn*)T,使满足minf(X)=f(X*),X∈Rn,其最优点X*、最优值f(X*)构成无约束最优解;若在约束条件限制下极小化,即在可行域中寻找X*=(x1*,x2*,…,xn*)T,使满足minf(X)=f(X*),X∈Rn,其最优点X*、最优值f(X*)构成约束最优解,无论在数学模型还是几何意义上,两者均是不同的概念。
现用一个二维非线性最优化问题,从几何意义上来说明约束最优解和无约束最优解。
设已知目标函数f(X)=x21+x22-4x1+4,受约束于g1(X)=x1-x2+2≥0,g2(X)=x1≥0,g3(X)=x2≥0,g4(X)=-x21+x2-1≥0,求其最优解X*和f(X*)。图2-1a表示其目标函数和约束函数的立体图,图2-1b表示其平面图。当目标函数f(X)=0.25、1、4、6.25时,相应在x1Ox2设计平面内得一系列平面曲线(同心圆)——等值线,它表示了目标函数值的变化情况,越向里边的代表目标函数值越小。显然其无约束最优解为目标函数等值线同心圆中心X*(1)=(x1*(1),x2*(1))T=(2,0)T,f(X*(1))=0。而其约束最优解则需在由约束线g1(X)=0,g2(X)=0,g3(X)=0,g4(X)=0组成的可行域(阴影线里侧)内寻找使目标函数值为最小的点,由图可见,约束线g4(X)=0与某等值线的一个切点X*(2)即为所求,X*(2)=(x1*(2),x2*(2))T=(0.58,1.34)T,f(X*(2))=3.8为其约束最优解。
图2-1 二维函数的约束最优解和无约束最优解
以上二维问题关于约束最优解和无约束最优解几何意义的讨论,同样可以推广到多维问题。n个设计变量(x1,x2,…,xn)组成设计空间。在这个空间中的每个点代表一个设计方案。此时n个变量有确定的值。当给定目标函数某一值时,就在n维设计空间内构成一个目标函数的等值超曲面,给定目标函数一系列数值时就得一系列目标函数的等值超曲面。这些等值超曲面反映了目标函数的变化情况。无约束最优点为这些等值超曲面的共同中心。对于约束最优化问题,每一个约束条件在n维设计空间中是一个约束超曲面,全部约束超曲面在设计空间中构成可行域。在其上寻找目标函数值最小的点即为约束最优点。这一点可以是目标函数等值超曲面与某个约束超曲面的一个切点,也可以是目标函数值较小的某些约束超曲面的交点(如图2-2所示的X*点)。
图2-2 n维问题的约束最优点和无约束最优点
2.1.3 局部最优解和全域最优解
对无约束最优化问题,当目标函数不是单峰函数时,有多个极值点X*(1),X*(2),…,如图2-3所示。此时,X*(1)和f(X*(1))、X*(2)和f(X*(2))均称为局部最优解。如其中X*(1)的目标函数值f(X*(1))是全区域中所有局部最优解中的最小者,则称X*(1)和f(X*(1))为全域最优解。
对于约束最优化问题,情况更为复杂,它不仅与目标函数的性质有关,还与约束条件及其函数性质有关。如图2-4所示,将目标函数f(X)的等值线绘于图上,由两个不等式约束g1(X)≥0、g2(X)≥0构成两个可行域D1和D2。X*(1)、X*(2)、X*(3)分别是可行域内在某一邻域目标函数值最小的点,都是局部极小点,亦即X*(1)、f(X*(1)),X*(2)、f(X*(2)),X*(3)、f(X*(3))均称为局部最优解。由于f(X*(1))<f(X*(2))<f(X*(3)),可知X*(3)为全域极小点,亦即X*(3)和f(X*(3))为全域最优解。
优化设计总是期望得到全域最优解,但目前的优化方法只能求出局部最优解,并采取对各局部最优解的函数值加以比较,取其中最小的一个作为全域最优解。
图2-3 无约束优化的全域和局部最优解
图2-4 约束优化的全域和局部最优解