英语原文共 28 页,剩余内容已隐藏,支付完成后下载完整资料
摘要
本文探讨使用核方法对多尺度模型进行加速和模拟的可能性,本论文的关键在于了解由多变量内核扩展给出的使用一个快速替代的微尺度模型的不同规模之间的相互联系。这些内核扩展使用具有统计代表性的微尺度模型的输入和输出来计算。我们提供支持向量机和矢量内核贪婪算法作为研究方法。我们用不同工程学科的两个多尺度模型来证明所产生的替代模型的适用性,这两个模型,第一个是人体脊柱模型耦合宏观体系统的微型椎间盘模型,第二个是模拟饱和多孔介质中的非经典过冲冲击波模型。
关键词:替代模型;多尺度;核方法;贪婪算法;矢量逼近;响应面
第一章 绪论
目前,为工业应用或基础研究开发的模型可以是任意复杂度。尽管计算能力和硬件设备发展很快,但是对模型进行详细全面的模拟仍可能带来不可实现的计算量。在多尺度模型的概念下,尤其是在考虑多尺度现象和它们在不同空间/时间的尺度上的相互联系时,这个问题变得更加严重。通常,大尺度(宏观)模型在进行模拟时用不同的结构对中间尺度或小尺度(微观)模型进行调用,这种方法被称为多次查询概念。这种情况的一个典型的例子也被称为有限元分析方法,在不同的尺度上存在两个有限元模型。[1-3]在这里,为了评估宏观有限元的一个单元或一个时程,至少需要一个完整的微尺度有限元模型,这会导致有限元计算运行时间的延长,并因此使整体仿真的时间成本增加。
在模型降阶领域,处理这些情况的各种方法和思路已经被提出。其中大多数的方法致力于降低微尺度模型的复杂性,它们或者通过提供一个基于投影的简化版,或者引入一个隐藏着微尺度模型和仅在宏观尺度模型的有效借口进行操作的现象的代理模型。对于第一类的方法,微尺度模型的简化通过投影到适当选择(基于模拟)子空间的控制方程来产生。对于参数化的线性动力系统,已经介绍了各种方法,例如[4-7]。对于参数化的偏微分方程,一个重要的方法是减少基础方法,见[8-10]和其中的引用。在这样的背景下,基于模拟的有限元方法已经为几种不同的几何构型发展到提高简化模型的可用性。另一种不同的方法包括使用不同的空间分辨率加快全面模拟的异构多尺度方法[14-15]和通过适当的正交分解提供代替模型[17,18]的简化模型多尺度方法[16]。
第二类方法与响应面法[19,20]密切相关,其中包括通过分析功能对微尺度模型进行替代。大多数方法遵循相同的基本原则,微尺度模型响应的功能性的形式是预先选定的一些尚未确定的系数。在这些方法中,可能最受欢迎的是(多元)多项式插值或样条[21-23],例如适用在[24]的模型简化环境中。另一种众所周知的方法是在地理信息系统的背景下发展出来的克拉格插值法,而最近的一些方法采用全局采样和局部变分方法的复合对简化阶模型进行模拟。这种方法也适用于全模态参数化方法[27]的背景下对配置空间进行近似,目前的合作性工作在骨骼肌模型的背景下得以实现[28,29]。
在本文中,我们考虑反应面方法设定并研究通过核方法提供快速而准确的替代模型的可能性。过去的十年中,这些方法在数据分析、模式识别和机器学习方面产生了巨大的影响。
核方法通常允许更通用或通过功能空间而不是简单的多项式,由于凸优化函数的存在,经常产生全局最优解,并促进再生核希尔伯特空间中的优雅泛函分析。在目前的研究和在模拟导向科学的替代模型中,我们希望促进和演示这些技术的优点。内核的方法包括各种机器学习的应用,如支持向量机[30,31]、正交最小二乘[32,33]或内核插值[35,34]。一个相关的方法是由正交匹配追踪[36]。我们指的是[37,38]对机器学习和对核方法与它们的应用的广泛的、实用的指南。
此外,在目前的演示中,我们专注于所涉及的模型之间的有效接口是适度的维度这一特定的情况,即模型通过小数量的自由的连接。为简单起见,我们假设有一个微观模型和一个宏观模型,它们分别通过C/D来进行粗略和详细的表示。C和D之间的联系通过输入空间(参数),输出空间(响应)联系D,同时也被用来输入C。图1说明了考虑模型的相互作用,其中的多个实例表明,在一般情况下,许多属于的数值被要求与多个对应,这对于C的模拟时必要的。现在,从多尺度模型C的特性中,我们可以考虑微尺度模型D的模拟,作为非线性方程的模拟
在这里,f(x)表示使用输出x对D进行完全的模拟。我们将说明矩阵和向量值变量的粗体大写和小写拉丁字母的正常排版的标量值。
现在,任何代理模型的目的是提供一个近似的尽可能准确地保持响应特性,同时大大降低了评价成本。
图1. 对于宏观和微观模型的通信图
虽然有方法使用分析功能的f(如泰勒展开)来构造近似模型,还有一个更重要的方面必须考虑。通常,由于一个模型的高复杂度,或是因为D是由第三方工具提供的,f必须被当做一个黑盒子来对待。因此,我们假定只有通过给定的xisin;PD来评估D的响应的可能性,甚至更糟糕的,只有一系列的D的输入和响应来开始。在数学上,这意味着计算或拥有N个样本的训练数据Y={yi=f(xi)isin;Pc|i=1hellip;N}和过度训练输入X={x1,hellip;xn}PD。可观核方法将这种情况考虑进去,并且可以仅通过训练集合X和Y来研究D的反应。
通常来说,可观代理模型方法可以被分为两个阶段。第一个阶段时计算耗时的“离线”阶段,输出集合X和Y,并执行训练算法。第二个阶段是在线阶段,它由快速评估所产生的近似多尺度框架的代理模型组成。在我们的工作中,我们专注于训练算法(和应用程序),但是要指出的是,为充分地描述D,拥有足够大的X和Y集合,这是指X和Y在统计上具有代表性是十分重要的。尽管是最好的学习算法也不会依靠糟糕的训练数据来很好地表现结果。
这项工作的目标是在不太涉及数学背景的情况下提供足够的细节,使选定的方法得以执行。详细的算法包括采集支持向量回归法(SVR),见公式【31】和矢量内核正交贪婪算法(CKOGA),见公式【41】。我们选择了这些算法的变形,因为它们在内核方法/近似理论领域中广为人知,而且它们为使用基于内核的近似方法提供了一个很好地起点。我们同样证实了它们在两个不同的实际应用领域的成功。
在下面的章节中,我们建立了必要的背景和符号。我们分别在2.2节中讨论采集支持向量回归法,在2.3节和第3章中介绍矢量内核正交贪婪算法的标量/矢量变形。第四章介绍了多尺度的情况,其中在4.1节介绍了一个人的记住模型,4.2节介绍多孔介质中的饱和超调现象模型。在第5章中,通过数值实验表明所提方法的适用性,在第6章得出结论。
第二章 核方法
在本章,我们给出核方法研究的必要背景,并详细介绍两种算法。我们将介绍标量函数的主要概念,并在第三章讨论矢量方面的案例。通常,我们将设置等。
2.1 准备工作
首先,我们建立了内核及其相关的功能空间的概念。
定义2.1(核方法)
公式被称为正定内核,如果对,那么,我们有:
K被称为半正定,当且仅当其属于上式时。更进一步的,我们通过下式证明:
关于K的核矩阵与X对应,此时当其在上下文中表述清晰时,我们将之写作。
一般假定的核属性是对称的,这指的是,。一些著名的正定核矩阵的有高斯文的兰德仁公式。这些都是基于径向基函数(RBFS)
以及合适的多项式Pn,k,例如,对k=1,2,3,我们得到
在上式中,gamma;是一种超参数确定的核扩张宽度,而对文德兰德内核,k是在这个意义上的平滑的超参数。图2表明在y=0的情况下不同的核与x的关系曲线,需要注意的是高斯内核有无限的支撑和平滑度,而文德兰德内核有紧支撑的、可定制的、有限的平滑度。
目前,任意的核正定矩阵都与一种基于径向基函数(RBFS)联系。这些基于径向基函数(RBFS)为数学分析和算法开发提供依据。
定义2.2 基于径向基函数(RKHS)
让矩阵成为核正定矩阵。那么,这里会出现一个奇特的哈勃功能空间H及其标量积和一个复制属性。
图2 核方法举例,顶点线上n=1,,和。底部线上n=2,我们规定所有的中gamma;=1。
下一步,对任意的,我们将矢量空间的功能函数定义为:
在复制属性中读取为:
备注2.3 (基于径向基函数RKHS)
基于径向基函数RKHS再生性实际上意味着对任意的,允许对其逐点评估。实际上,一种获得H的方式是定义标量积,并考虑。这种方法同样对半正定矩阵使用。更进一步,如果,那么是一个最多的n维希尔伯特空间的X。我们以一个针对基于径向基函数RKHS的更完整的表征举例。
现在,在我们的上下文的关键假设是,也就是说,我们的详细模型的响应是由基于径向基函数的一个功能给出或展示的。由于H一般事前是不知道,一个关键的但很困难的任务是选择正确地功能空间,也就是说,引出K矩阵。作为内核的分析属性的内核继承的功能,一个精心挑选K矩阵被使用,例如,平滑度可以使一个巨大的差异在实践中,这也可以在第五章看到。
假定有一个合适的混合K矩阵与基于向量基矩阵H相联系,核方法致力于使用训练数据X,Y恢复。这意味着要在矩阵中找到近似的,这就是说,我们有如下形式:
其中,表示膨胀系数,是当ci不为零时的扩展中心或支持向量。
备注2.4 (矩阵的选择)
在这个阶段,为甚么是一个合适的子空间用来描述f是不明显的。
图3 对当X={-1,0.5,1.2}时的解释
然而,对这个课题的完整的讨论超出了本文工作的范围,我们将对这项工作中每一个提出的可能算法进行激励。
为了对中功能的基本结构进行解释,图3向我们展示了当X={-1,0.5,1.2}为相应系数时一个的功能的一维例子,由高斯核矩阵引入。红色的虚线图显示每一个被加数各自的中心xi是图中的蓝点,而实红线显示了完整的功能。
这给我们的对于确定“最佳”的表示f的有限维子空间,即合适的逼近计算系数留下问题。其中提供了通过核最小二乘插值[32,35]或SVR[30,38]来确定系数的多种策略。然而,在这项工作中,我们要限制提供计算稀疏扩展手段的限制类的考虑算法。稀疏扩展只有几个非零系数紧凑表示中的f(类似于小参数的截断的傅里叶级数)。这不仅保证了近似的有效性,同时对的评价产生额外的速度,这是多尺度概念代理模型的一个关键点。在下文中,我们采用[31]介绍的原理,提出了一个采集支持向量回归法方程,但是对于不同的损失函数导致稀疏表示的近似为。此外,一个矢量贪婪方案被认为是实现矢量分量同时逼近的关键,这将导致更稀疏的函数逼近。
2.2 支持向量回归
在这些方法中,支持向量机是著名的机器学习技术,并成功地应用于各种领域,其中模式识别可能是应用最为普遍的。支持向量机的一个经典的推导可以在[38,9.1]中得到,而在[30,31]中我们发现了一种更为强调统计方面的方法。为了澄清术语,本文中支持向量机是指一般类型的算法,可用于执行分类或回归。它往往是同义的背景下的分类,但依赖于结果的使用,具体的算法被称为支持向量分类或回归。在这项工作中,我们将坚持统计的观点,试图恢复基本的功能,最大限度地减少错误预测的“风险”。其中,一个关键的方面是损失函数的概念:,评估实际数据yi和预测数据对给定的输出xi之间的差异。在数学上,SVR试图找到经验风险最小化正则函数
其中,是一个正则化参数。通过的正则化是一个重要的方面,我们将在备注2.7评价它的影响。在我们的工作中,对一些,我们要考虑它的不敏感损失
这已经在[42]中首先提出。这个损失函数的支持向量机也被称为SVR。在一般情况下,可以使用许多不同的损失函数,以获得不同的逼近/泛化行为。在我们所采用的情况下,选择不敏感的损失(7)将导致在以下意义上的内核扩展的稀疏性。因此,当其相应的系数ci非零时,只有效地使用其核心,由此产生的扩展尺寸通常可以是小于N的。另一方面,一个更大的允许目标函数在每一个训练点都不同。因此,选择一个合适的值对近似的质量和其任务本身是至关重要的。我们有许多方法去自动选择一个合适的值,例如优化过程中v-SVR包含的参数。我们通过公式[30,37,38]得到更多的关于此方法和其他方法的概念。
现在,一个找到具有-SVR的的标准程序将重新制定原始的优化问题转化为一个等价的约束优化问题的松弛变量的使用。然后用拉格朗日乘子得到一个对偶问题,这在我们的例子中导致另一个优化问题的求解,在之后的命题中陈述结果。在我们的工作中,我们遵循[31]中的方法;但是,经典的方法可在[38,&9.2]中得到。
2.3 内核贪婪算法
在本节中,我们将讨论从贪婪算法族中的一个算法,它提供了求解非线性函数的稀疏逼近的一个相当普遍的方法,只是设计上与SVR非常不同。它们通过使用越来越多的从X作为中心的元素获得投影系数。
我们指的是在一般的希尔伯特空间中,贪婪算法的一个很好的概述和变化,他们的贪婪特性有其在贪婪的步骤下的基础,它决定下一个函数按照一定的最大化准则被添加到现有的线性子空间。通过这种方式,计算的空间是按层次划分的,并且随着m的增加,逼近的质量也随之提高。
上述分析中,这些函数都是从一本特殊的“字典”中选出来的,这是一组定义于矩阵H的函数。更确切的说,我们考虑的字典是由给出的,其中我们假定是由X值(统计值和实际值)代表的。(注2.4)
第三章 矢量核近似
从这一节开始,我们假设F是矢量,即,我们允许任意
定义3.1(矢量希尔伯特空间)
令,则我们将矢量希尔伯特空间表示为:
我们为来自于H的矢量函数的函数空间配备标准内积和范数
在这个定义下,我们假定,并给出一个矢量近似值
其中,。
第四章 应用
在本节中,我们将介绍我们的应用背景并建立第一节中介绍的链接(参见图1)。4.1节介绍人体脊柱微尺度模型,4.2节介绍非经典冲击波饱和超调模型。分离的数值实验描述部分在第5节中介绍。
4.1 人体脊柱的仿真
在计算生物力学中,
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[148252],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。