看了 Polynomial Chaos: A Tutorial and Critique from a Statisticianís Perspective, 总结一下:
uncertainty quantification:主要研究的是不确定的传播。Given input x, the simulator produces output
一般从下面两种方法进行:
- 一种是MC的方式,从X中采样得到大量的点之后,通过
去进行模拟去刻画Y的分布 - 更普遍一点的方式是构建代理模型
,这个模型在足够接近 的同时还能够高效的进行采样
针对这个问题,在AM(applied mathematics and …)中经常使用Polynomial chaos expansion,而在Stat(statistics)中则经常使用Gaussian process emulator
PCE
PCE: way of representing an arbitrary random variable of interest as a function of another random variable with a given distribution
将一个随机变量表示为给定分布的随机变量的函数(多项式展开)
其中X是一个随机变量,
一些理解性的例子
上述表示不仅仅是可行的,而且往往还有很多种方程能够实现这个事情:比如说可以通过逆变换的方式将均匀分布的随机变量转化为其他分布的随机变量。下面是一个更加广泛的例子:
大致意思是,将X和Y都分解为多个segment,每个segment都能各自对应上去,也可以任意确定之间对应的关系,对应关系的选法有
下面的例子则进一步表示,每个随机变量通过不同类型的函数变换,但是得到的分布可以相同
CDF是单调的,对应的Inv-CDF也是单调的。但是对应的平方不是,所以这是两个不同的方法
可以有
一元的情况
这部分介绍一元的表示,PCE就是将
使用正交基可以将函数表示为下面的形式:
其中
正交性带来的第一点是:各个正交基的均值是0 因为
三种不同的germ下面的正交基 常见于三种不同的情况(有界、半无限,无限):
问题
所以为了得到
The next step is to devise a suitable representation function f . Several examples have been given to show that this is always possible and moreover that there will always be many solutions. In practice, though, apart from the general solution (2) it will not be straightforward to Önd representations. Considerable research e§ort has in the past been spent on e¢ cient ways to sample from given distributions using uniform pseudo-random numbers, but many good sampling methods are iterative or implicit and I cannot see how those could be adapted for PC representations. Even the CDF solution requires the CDF of X to be known explicitly, which may not always be the case in practice. [[Polynomial-chaos stat perspective.pdf#page=7&selection=0,0,20,63]]
就算是
还有 像是之前讨论过的 只是
In practice, this is achieved in the usual way by increasing p until the mode weights appear to stabilise and new weights are small. However, this is really assessing whether fp approximates well to f , and does not guarantee that the distribution of Xp approximates well to that of X. [[Polynomial-chaos stat perspective.pdf#page=7&selection=76,55,99,1]]
多元的情况
大多数情况下
如果
如果
当有一个$\Xi = (\xi1, \xi_2, …, \xi_n)
如果
例如,如果对于两个变量 x 和 y 的二元多项式,基函数集分别是
张量乘积对于多项式来说是基向量的扩展,两组正交基的张量乘积表示的是两组的扩展空间
当有index:$j = (j1, j_2,…, j_m)
当实际应用的时候是被truncated 到P阶的,所以对于上面这个表达式又有
这个时候对于m维,总阶数为p的index的设置,相当于将p阶分配在m维度中,并且允许某个维度没有阶数,可以转化为组合数学中的隔板法,具体的证明方法可以看前面给出的链接。
得到的结论是所有的组合个数是
这个东西大致的增长速度大概是m的p次方,因为
Propagation
主要是对计算模型的结果进行PCE展开
Y = η(X).模型可以写成这种形式,Y以及X一般来说都是随机向量,PCE一般是将Y以及X都做相同阶数的展开:
实际中的计算机模型通常是非线性的,因此方程(12)不能“完全成立”,即不能精确地描述这些模型。因为非线性模型包含了复杂的变量相互作用,这些作用不能简单地用有限阶的多项式来捕捉。所以为判断近似是否充分 一般是逐步增加阶数p知道每个mode的strength变化的很小为止
I believe it is fair to say that the PCE approach does not quantify the approximation error as a compo- nent of uncertainty:[[Polynomial-chaos stat perspective.pdf#page=10&selection=199,56,201,19]]
之后核心的部分主要是估计上面公式12中的
Intrusive
Galerkin projection 是一种数值方法,用于将连续问题(通常是微分方程)转化为离散问题(通常是代数方程),这样就可以在计算机上求解。这种方法是有限元方法的核心:
问题的连续形式:开始时,你有一个连续的问题,通常是一个边值问题或一个初值问题,它由微分方程和边界/初值条件定义。
选择基函数和测试函数:选择一组基函数(也称为试验函数)来表示解的近似,以及一组测试函数来检验这个近似。在有限元分析中,基函数通常与网格单元相关,而测试函数是基函数的副本。
投影到近似空间:将微分方程中的每一项都用基函数展开,然后通过测试函数的加权积分将问题投影到近似空间中。这个过程会生成一个系统的代数方程组。
求解代数方程组:最后,通过求解这个代数方程组来得到近似解。
在数值方法中,将 PCE 结合 Galerkin 方法用于随机微分方程,通常被称为随机 Galerkin 方法。这种方法要求在数值求解微分方程时对方程进行修改,将不确定性直接包含在方程中,这是一种侵入式的方法。这与直接在求解器中加入随机性的非侵入式方法(如蒙特卡洛模拟)相对。
具体方法式将Y以及X的展开带入到方程之中,用p个基函数对其求内积,离散成p个方程组,之后求解。
缺点就是需要手动化简之后再编程进行求解,并且对于不同阶数有不同的情况。而且很多时候Y以及X的基函数选择可能会很不一样,所以上面的化简也会更麻烦
Non-intrusive
就是在方程(求解器)之外加入随机性,主要有两种Monte Carlo以及Regression两种方式:
MC
非侵入式的方式就是用上面的形式直接求解,上面的积分问题要么转换为MC去做,要么使用quadrature rule:
矩形规则(Rectangular Rule):这是最简单的求积方法。它通过将积分区间划分为多个小区间,然后在每个小区间上用矩形的面积来估计函数下的面积。根据所选择的点(左端点、右端点或中点),矩形规则可以进一步细分为左矩形规则、右矩形规则和中点规则。
梯形规则(Trapezoidal Rule):在每个小区间上,梯形规则使用梯形而不是矩形来近似函数下的面积。这通常比矩形规则更精确,因为它考虑了函数在区间两端的值。
辛普森规则(Simpson’s Rule):辛普森规则通过将每对小区间上的函数近似为二次多项式,然后积分这个多项式来提高精度。它基于三点(区间的两端点和中点)上的函数值,比梯形规则通常更精确。
高斯求积(Gaussian Quadrature):这是一种更高级的方法,它选择特定的点和相应的权重来优化积分的近似。高斯求积通常能在少量计算点的情况下提供非常高的精度。
Monte Carlo typically requires a large number of simulator runs, which is impractical for computationally-intensive models, but on the other hand in higher dimensions, tensor products of quadrature rules demand even more simulator runs. Although sparse quadrature rules exist and are more e¢ cient, still quadrature seems impractical when the germ vector is high-dimensional [[Polynomial-chaos stat perspective.pdf#page=13&selection=2,0,6,76]]
Regression
另外一种方式是将其看作回归模型:
Regression is a common way of building a surrogate model and polynomials are the commonest regressor variables for this purpose. Using or- thogonal polynomials helps with the numerical stability of the computations, but orthogonality then needs to be with respect to the empirical distribution of the design points, rather than with respect to the germ distribution. Using PC o§ers no advantages that I can see. [[Polynomial-chaos stat perspective.pdf#page=13&selection=97,0,102,29]]
这个好像意思是使用回归的时候和正交多项式回归没有什么区别