具有定量输入的贝叶斯网络在海上风险分析中的应用外文翻译资料

 2021-11-29 22:35:51

英语原文共 32 页

具有定量输入的贝叶斯网络在海上风险分析中的应用

Kevin X. Lia, Jingbo Yinb, Hee Seok Banga, Zaili Yangc and Jin Wangc

a韩国首尔中央大学国际物流系;b香港理工大学物流及海事学系;c英国利物浦约翰摩尔斯大学工程技术和海事运营学院)

摘要:本文提出了一种将Logistic回归和贝叶斯网络(BNs)集成到海上风险评估中的创新方法。这一方法已发展并应用于海事行业的个案研究,有可能也适用其他行业。BNs作为一种建模工具,在海事风险分析中的各个方面中得到了广泛的应用。然而,贝叶斯方法还是有缺陷的,它需要过多的先验概率形式的信息,并且在风险评估中往往很难获得这种信息,如果可以的话,在风险分析中,用专家估计(输入)作为不确定性的度量是估计事故先验概率的一种传统方法,也是一种常用的方法。为了解决与主观概率相关的遗传问题(专家估计),本研究开发了一种利用不同海事事故数据资源为BN提供输入的二元Logistic回归方法。通过测量不同类型船舶在不同情况下的安全水平,已取得了相关的风险评估结果。

关键词: 贝叶斯网络, 二元回归, 定量输入, 风险评估

1.介绍

风险评估与管理的概念在危险行业中得到了越来越广泛的应用,并且在这些方面也进行了许多研究(Kristiansen 2005)。风险通常被定义为对事件发生概率的度量,以及它可能导致的伤害或损害的严重程度(Manuele 2003),风险评估被广泛认为是描述风险的系统和科学的过程(Vose 1996)。评估风险的主要目的通常是预防事故或灾难,为了确定高风险地区,必须对绝对风险水平和不同原因的重要性进行量化。安全分析人员面临的挑战之一是了解复杂的安全系统,特别是在罕见事件的情况下(Szwed et al. 2006)。一旦风险信息被量化,分析人员就可以使用它来开发相应的风险控制选项,形成适当的策略并分配资源来降低风险。

罕见事件风险信息肯定会受到事故数据少的影响。在开发用于风险分析的频率数据时,经常会使用到专家判断(Mosleh et al. 1988, Morgan和Henrion 1990)。然而,必须谨慎使用专家判断(Anderson et al. 1999),Kahneman等人(1982)讨论了人们在处理信息和提供判断时所引发的众多不同意见和启发。

通过将数据拟合成逻辑函数,逻辑回归已被证明是预测事故发生概率的一个强大的建模工具。此外,贝叶斯网络(BN)是一种已经开发出来的方法,用于提高对不同原因对风险的依赖性的理解(Netjasov和Janic 2008)。为了构造BN,需要指定变量之间的关系及其条件概率分布。在本研究中,提出了一种集成逻辑回归和风险评估BN的创新方法,利用Logistic回归方法,得到了节点的所有条件概率和先验概率。

运用Logistic回归与BNs相结合的方法,进行了海上风险评估案例研究。航运一直被认为是一项风险相对较高的业务(Li和Wonham1999)。即使随着现代造船技术的发展和导航设备的创新,船舶事故仍然是一个人们关注的焦点。增加对环境保护和相关的安全问题的认识,研究各种各样的海上风险评估和分析,因此形成了一个重要的研究领域(Li 1999, Merrick et al. 2003, Hu et al. 2007, Antatilde; o and Soares 2008, Cariou et al. 2008, Vanem et al. 2008, Havold 2010, Montewka et al. 2010)。船舶事故的原因是多种多样的、复杂的,因此这类研究不同于直接测量风险水平。现在需要的是一个风险评估指标,审查船舶之间的相对安全水平以及一个衡量船舶整体安全的评价机制。良好的指标可以更好的提供关于风险水平的信息。利用BNs对海上事故进行分析,找出最重要的指标,并确定这些指标之间的关系,利用Logistic回归方法和不同来源数据的数据库,可以计算BN节点的先验概率。

本文的其余部分组织如下。下一节将回顾最近的相关文献。第3节介绍了将Logistic回归和BN纳入风险评估的方法,第4部分进行了海事风险分析案例研究,说明了该模型的应用,接下来是第5节中的结论。

2.文献综述

BN越来越被认为是支持因果推理的有力工具。使用BN可以识别事故最重要的指标,更重要的是可以确定各指标之间的关系。Ren等人(2008,2009)将BN的显著特征总结为:

(1)进行逆向推理的能力,

(2)将新观测结果纳入网络的能力,

(3)其本身所固有的因果和概率语义,可用于处理丢失或不完整的数据,

(4)能够提供一种能够说明真实因果关系的视觉表征。

由于这些优点,BNs在许多领域得到了应用。然而,尽管这不是一个新的方法(Damien和Kockelman 2010),贝叶斯在交通学科的许多利基市场中的使用和影响仍然处于早期阶段。贝叶斯方法的主要使用领域是道路安全分析 (Kweon 2010, Lee et al. 2010, Wang et al. 2011)。对于碰撞事故数估计,Hauer(2001)提出了一种易处理的有实证的贝叶斯方法。Shin和Washington(2012)提出了一种改进过的有实证的贝叶斯方法,发现该方法通过负多项式模型是一种时变安全存在下的可推广的安全估计方法。Ma等人(2008)使用贝叶斯方法研究道路设计和其他碰撞计数细节的影响。Shively等人(2010)使用贝叶斯半参数模型来估计碰撞次数与各种道路特性之间的关系。

在海上安全领域,Eleye-Datubo等(2006)使用BN研究了意外风险场景下典型的船舶疏散。Trucco等人(2008)通过将人力因素和组织因素整合到风险分析中,开发了一个贝叶斯信任网络来为海上运输系统建模,利用专家判断的方法估计了BN的条件概率。Ren等人(2008)结合Reason的“瑞士奶酪”模型和BN,对离岸安全进行了评估,先验概率由专家判断得到。Antatilde; o et al. (2009) 运用贝叶斯信任网络为葡萄牙海事局开发了一个海事事故模型和海事事故数据库。Eleye-Datubo等人(2008)研究了向油轮输送石油的过程,建立了一个BN模型来检验系统安全性。然而,人们发现,严重依赖专家个人经验的BN模型可能容易出错。在BN模型中,给定某一事件,可以在整体风险分析中考察其他影响或受该事件影响的因素。

尽管BN拥有惊人的实力和优势,但也存在一些内在的局限性。贝叶斯方法的一个常见弊端是它需要太多的先验概率形式的数据,而这些数据在风险评估中往往很难(如果不是不可能的话)获得(Yang et al. 2008)。随着父节点的增加,条件概率表(CPT)的大小迅速增长,导致计算的复杂性和困难(Eleye-Datubo et al. 2006)。

估计事故发生概率的最常见的方法是考虑事故发生的频率,这被认为是解决安全水平的第一类研究(Soares和Teixeira 2001)。然而,由于缺乏事故统计数据,这一任务十分困难。首先,统计描述了特征与事故之间的关系,但没有描述频率决定因素的影响程度。其次,大多数统计分析都采用了所审查的具体标准、假设和因素,这些可能不容易同其他来源进行比较(Romer et al. 1995)。此外,统计数据只描述过去,对于预测未来事故的发生可能没有多大用处(Gaarder et al. 1997)。安全系统的历史性能通常可以很容易地测量,而对未来性能的预测通常是困难的,特别是事实表明,海上事故通常是非常罕见的事件(Hockaday和Chatziioanou 1986, Chang和Yeh 2004)。

在实践中,如果相关的历史数据很少或者没有,专家评估是风险分析中使用的另一种常用方法。然而,在使用专家提供的主观概率作为风险分析中的不确定性的度量方面存在某些典型问题。首先,专家可能没有考虑到影响技术系统的人为错误的所有可能性(Slovic等,1979)。其次,专家很容易受到经验的影响(Skjong和Wentworth 2001)。

近年来,逻辑回归被认为是用于分类因变量的多元建模的一种正确的方法(Uncles 1987,Franses and Paap 2001),并且逻辑回归模型已经用于海事应用。 Bergantino和Marlow(1998)使用逻辑回归模型来分析船东在采用登记标志时的决策过程。 Jin等人,(2002)和Jin和Thunberg(2005)利用逻辑回归及其数据库开发了美国东北部渔区的渔船事故概率模型。

本文的主要目的是研究各种风险指标的影响,并通过应用基于收集数据的Logistic回归方法确定它们之间的定量关系。研究方法在以下部分中开发。

3.研究方法

BN是概率图形模型,其在有向无环图(DAG)中表示一组随机变量及其条件依赖性。DAG由表示变量的一组节点和表示变量之间的概率因果依赖性的边组成。

变量之间的因果依赖性由节点的结构表示,这提供了BN中因果推理的定性部分。变量和相应状态之间的关系在附加到每个节点的CPT中给出,这提供了定量部分。

3.1建立具有依赖关系的节点

为了构造BN,第一步是指定节点的图形表示。该结构可以通过使用先验信息,借助于根据数据或两者的组合进行的估计来定义。边缘指向它们的节点称为“子节点”,边缘偏离它们的节点称为“父节点”。

影响图(ID)是使用决策和实用程序节点扩充的BN。ID用于建模决策过程和计算可用策略的效用。为了做出最好的决策,实用程序与ID的状态相关联。这些实用程序由实用程序节点表示,每个实用程序节点都具有实用程序功能。一旦做出决定,网络配置的概率就是固定的。然后可以计算每个决策的预期效用。根据最大期望效用原则,可以选择最高的预期效用。

3.2为每个节点创建CPT和先验概率

建立了影响节点及其依赖关系后,可以为每个节点或事件开发CPT。理论上,CPT可以使用历史数据、专家判断或两者的结合来制定。

在本研究中,我们使用Logistic回归方法来提供船舶发生事故的条件概率(Pi)。在二元回归中,因变量yi是二项式,其值为1表示“事故”,0表示“没有事故”。离散因变量以未观测到的连续变量yi*的形式指定,根据规则将其映射到二项式变量yi上。

yi = 1 事故,当yi*gt;0,

yi = 0 没有事故,yi*gt;0, yi*isin;(—infin;, infin;)

考虑随机m维变量Xi=(xi1,,,,,xim),将未观察到的变量yi*定义为Xi的函数。

(1)

其中beta;i表示描述每个风险因素贡献大小的系数的列向量,而εi表示不可观测的随机分量。

使用Logistic回归,估计概率因此可以写成这种形式:

(2)

3.3生成后验概率

BN可以用来估计每个节点的概率如何受到先验和后验概率的影响。一旦从现有数据确定了结构和参数,就可以用BN进行推断了。

利用下面三个方程,相关的概率就可以计算出来了。

联合概率

. (3)

边缘概率

. (4)

贝叶斯概率

. (5)

Logistic回归给出了估计系数beta;i。给定Xi的变量子集xij,条件概率P(Y=yi ,X=xij)就可以用公式(2)计算出来。P(Xi=xij)可以从数据库中获得。所以联合概率,边缘概率和贝叶斯概率就可以计算出来。

3.4验证所建模型

验证是该方法的一个重要方面,因为它对所产生的结果提供了合理的置信度。在这项研究中,已经开发了用于验证模型的灵敏度分析,并且至少应该满足以下两个公理:

公理1:每个父节点的先前主观概率的轻微增加/减少应该毫无疑问地导致相对地增加/减少子节点的后验概率,

公理2:x属性的概率变化与值的组合的总影响量应始终大于x-y(yisin;x)属性集中的一个。

4.海事安全案例研究

4.1 建立具有依赖关系的节点

第一步是设置具有相关依赖关系的节点。根据先前的研究(Knapp and Franses 2007,Cariou et al.2008,Li et al.2009)和伤亡数据分析,已建立的节点表明影响海事总损失的因素包括船龄(VA)和船型 (VS)以及船旗国(FSs)和船级社(CSs)。 VA,VS,FSs,CS和船舶类型(VT)已被确定为船舶总损失的主要促成因素。虽然还有其他一些影响因素,但仔细分析历史总损失数据表明,它们对总损失发生概率的影响微不足道。拟议的框架,包括可能导致船舶全损的所有因素,如图1所示。

图1. 基于贝叶斯网络的船舶事故模型

BN由三种类型的节点组成。 第一种是机会节点。 CS,VT

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。