1.前言 数值求解海洋与大气方程组可以看做是初边值问题。即给定初始条件和边界条件,方程封闭,即可求解。因此,如果想要得到精准的结果,需要保证满足两点,其一是控制方程能很好的描述海洋大气的物理运动机制,其二是需要初边值条件精确。从前面讲过的有限差分方程离散的形式可以看到,如果初始条件和实际情况有误差,这个误差会随着时间迭代一步步的积累下去。这样是我们看天气预报,能发现短期预报通常都很准,而长时间预报经常不准。不仅仅是初始条件的误差,整个模式系统不能收敛的误差都会随着时间迭代逐渐累积下去,使得结果变得渐渐无法接受。( h9 Q* O3 L4 Y" b. }2 l5 D( `! M
资料同化技术,可以一定程度上解决这一问题。资料同化,就是利用观测资料来修正模式结果,使得模式结果不偏离观测的结果。比如,针对上述问题,如果时间迭代每进行一定步数,就用以掌握的观测资料去修正结果的偏差,就能很好的解决上述问题。不仅是对模式结果的修正,在实际预报中,如何给出准确合理的初始条件(初始场)也是一个需要解决的问题。资料同化技术对模式预报的结果有显著影响,是业务化预报中不可缺少的一环。& L' F. A* ]- r' l+ x% M/ Y- q
如今,在业务化预报中数据同化技术发展成熟,基本是以3DVar(三维变分同化)、4DVar(四维变分同化)和集合卡尔曼滤波为主。要想理解3DVar和4DVar,就需要理解贝叶斯理论和极大似然估计,以及一些基本的变分学理论。若想理解集合卡尔曼滤波,就需要懂得最小方差估计等理论的思想。这些方法需要有充分的数学基础,才能更好的理解。因此,本文计划从同化的传统方法讲起,分几篇文章,试图用相对易懂的语言来讲解这些数据同化技术。在最后,从全局的角度分析一下这些方法的相同与不同。
) l% n1 Y# P( k7 Y5 ^3 [7 G( I 如果想深入了解气象资料同化,推荐《资料同化理论和应用(上册)》这本书,关于该书的详细信息见文末参考资料。本文部分内容参考该书,因此沿用了该书的符号表示。
% D$ Q$ `9 E4 ^; \/ P. e9 g# J# g2.最小方差估计 最小方差估计是本文接下来要讲到的逐步订正法和最优插值法的理论基础。之所以在这些方法的视角下,资料同化是统计问题,是因为我们不知道真值是什么,只能通过观测值和模式结果值去估计真值,从而把模式计算的结果趋向于真值方向修正。
2 o# N, E9 O; }! }1 f( x 假设一个真值 ,不妨视为某时刻某个地区的温度值,而对这个地区的温度有 个观测资料, 。首先需要假设这 个观测资料的平均误差是0,误差之间不相关。
1 c# X$ Q1 z. f
3 _8 f A. s7 K! j+ f) V' Z 即可得到线性估计的形式如下。即使用这 个观测资料线性组合出一个分析值 。( C- K% j4 G2 d c
! z. S+ g' m5 _/ W# \! G% C
t, s/ j( H f/ c8 U9 K! ?9 @ B, l) _9 C6 F$ C4 S
因为要满足无偏条件,因此系数的和为1。. L4 a3 J" I" K- F7 `. P
( q3 ]6 o4 |( Y2 `! t/ O
9 H6 _- h% ? w' {* f/ t1 \ 紧接着就可得出分析值的误差方差和观测值的误差方差的关系。
) O4 n! K* G& J% K/ Q n/ S
3 J# c; C. K+ W: j
2 N4 p3 M& x, [ 这样我们就得到了一个有约束的优化问题,形式如下。在满足无偏的条件下,使得分析值的误差方差尽可能小,这样分析结果就变得更可能精准。2 m& F+ x/ h" d& D5 A6 p
7 X' W8 Y# Y$ h: C
" i, X2 [/ k0 \ 在高数中,面对求条件极值的问题,学过一种方法叫拉格朗日乘数法。把上述优化问题即可从有约束优化问题转化成无约束优化问题,求该拉格朗日函数的极小值即可。9 k) j9 z9 t1 _; X. V
, Y L7 I& T$ T6 |) @: w2 V/ N J1 c6 u3 \3 i$ W0 p
求极小值的方法就是使得其对各个量的偏导数同时为0。$ s, F0 \' w& d
( }: L) Y6 E% F6 |6 u) X
3 W, ^5 a% R5 }- Q r" `! j" v1 u! r 这样就求出了各个观测值的权重值,即
3 d( g& S2 a1 ^9 J9 ` i+ i$ G6 ?
2 p+ q! I- R7 {) ^9 }
( e+ V8 @" c m9 t 如果想分析结果的优劣,可以推导出分析值的误差如下。
* H7 a3 v( m s, k p0 V+ J' I- Y! N
2 h- ]/ R0 ^2 r/ Y2 k$ B3 e% | D5 r0 P6 V
从上式可以看出,每增加一个观测点,就算其很不精确(即方差很大),分析值的误差方差也是朝着变小的方向发展,而且误差方差很大的观测值会被给予很小的权重。
. S- p- z; K0 D: E" Y; ` 然而,理想很好,但现实却总是和理想有偏差。因为无法知道真值,进而无法计算背景场的误差方差,从而无法精确得到加权系数。因此,针对不同类型的问题,产生了经验权重函数。
. w) a7 n0 Z) j3.逐步订正法 把上述思想应用到具体问题,就可以得到如下模型。
0 v& k# C" N. j% P7 u# n$ w$ ~
4 c! n% P$ x0 [; s3 h! @9 K
7 F* Y! @7 g0 m6 n# K! E% p7 F 该形式是由最小方差估计推导而来,其中 为分析场, 为背景场。不妨把背景场理解为待同化的场,比如用模式计算的某一步的结果,用这一步的结果结合 观测场去得到一个更准确的分析场 ,以此来修正计算结果。可以看出,该方法的思想是,使用背景场和周围的k个观测点的值与背景场之差加权求和得来。9 V$ t, A9 |3 i" M
1 ~& u5 Y! z+ A3 {$ b+ t( [% X s
上面是从场的角度说明该同化方法的思路,为了更便于理解,从场中某一个点来描述该方法的思路。为了同化某一点的值,首先需要定义一个影响半径 ,意思是要使用在这个半径范围内的观测点来进行同化,比如要同化东方明珠处的气温值,影响半径可以设置为上海这么大,这样就只需要借助上海几个气象站的观测值进行同化即可,而太远的观测点的观测值则意义不大,而且即使使用了权重也会很小。将影响半径 内的总观测点数计为k。两种经验权重函数如下所示,这些权重都是随着观测站的距离变远而减小的。
6 m$ J/ ?( P& o- T& t! C# ^: }: x' s
% s1 b$ c' y" ^/ k: }1 _ ^+ y r" A# U8 E, n. o
综上,该方法的计算公式如下所示。
: O7 e d6 D" G( n ~$ O5 [2 v$ q) {
0 z5 R2 E) `. l 总结一下,该方法为单点分析方案,即在同化不同点的过程是独立的,只与自己周围的k个点做计算。而且是背景场和观测值的增量做加权平均。
6 t( e+ ]1 w* ]( p4.最优插值法 该方法的同化模型和上述逐步订正法的形式一致,只是在计算权重时不再使用经验函数。写成矩阵形式则如下所示。还是延续上文所使用的变量记法, 3 s" P& E. f* |: q
5 Y( @. i, g5 s
( l: _. s0 H$ T: U) T( D( f
3 [+ G" v! y |, N V. G 背景场协方差矩阵如下
( G4 }$ y0 }) \' Q9 P 观测场协方差矩阵如下) H: c, t" P1 h7 A. G3 ?3 z
第i个背景场协方差的向量如下
. N5 P. |" G* ]3 K, u9 _& ^ 使用最小方差估计的方法可推导得到如下所示的权重函数表达式,若对推导过程感兴趣可查阅文末参考资料。
: F, w- p. o+ o0 |: x6 n. I+ v* z
% p: Z- x n" h. v0 g$ e1 S6 T8 @+ Q. |# Z
因不知道所谓的真值,因此无法准确快速的求解协方差矩阵。因此,最优插值法的主要难点在于协方差矩阵的估计。估计协方差矩阵因特定问题而异,本文只对其基本思想简单概述,想了解更多信息可查阅相关资料。
7 u3 Z0 C/ N6 q 集合卡尔曼滤波和变分同化方法所涉及的内容较多,之后会单独更新几篇文章来对其进行介绍。% S) \ ]/ @) |2 U! g& R4 r
版权声明 本文创作的初衷是用于帮助数值模式的学习者。欢迎转载,转载请私信并注明作者和出处,请勿用于任何商业用途。: P; V* |; [ |/ U
参考资料资料同化理论和应用(上册). 邹晓蕾著. 气象出版社, 2009.
$ W. p: v$ E3 ~2 X5 w5 }大气模式、资料同化和可预报性. Kalnay E, 蒲朝霞译. 气象出版社, 2005.: {/ l3 ^" T% R& m9 f4 @
2 A& d( ^! S5 V x7 p% ]; b2 V6 ?
|