利用谱聚类和计算数据挖掘算法确定安全死亡原因的临界组合外文翻译资料

 2022-08-08 11:00:28

英语原文共 21 页,剩余内容已隐藏,支付完成后下载完整资料


利用谱聚类和计算数据挖掘算法确定安全死亡原因的临界组合

Rayan Assaad, S.M.ASCE1; and Islam H. El-adaway, F.ASCE2

摘要:虽然职业安全与健康管理局(OSHA)在减少建筑工地安全事故方面发挥了关键作用,但在不同类型的事故中,减少的情况也大不相同。例如,虽然工作中轻伤的数量大幅度减少,但建筑业死亡的人数在前几年有所上升。先前的因工死亡的研究侧重于研究不同因素或变量如何影响建筑业的死亡人数,但缺乏对不同死亡原因之间的关联、相互依赖性和关键组合的研究。因此,要解决建筑行业面临的重大死亡事故,必须采用更先进的管理方法。也就是说,本文旨在通过一种基于数据驱动的算法的方法来弥补这一重要研究领域的空白。本文分析的数据由100份OSHA国家重大事故案例文件组成,这些文件是由OSHA监察主任提供。首先,根据60个与施工死亡最相关的原因(基于先前的研究),构建了100个案例文件的参考矩阵。其次,利用谱聚类算法,根据死亡原因之间的关联程度对这些原因进行聚类。第三,利用频繁模式数据挖掘和Apriori算法,确定了造成建筑工地重大事故的主要原因的关键组合和关联程度。研究结果表明,这60种死亡原因可分为五类。因此,死亡原因的最关键组合是在每个已确定的集群中确定的。此外,调查结果还表明,虽然安全事故可能是由个别关键的原因造成的,但建筑工地上的死亡也可能是由于各种因素的共同造成的,这些因素在个别层面上可能不被认为是关键的,但当与其他因素组合在一起时,就会变得非常关键。本文通过提出一种数据驱动的事故因果分析法来分析建筑死亡事故,构建这一研究领域的主体部分,通过考虑不同原因之间可能的关联和组合,为传统的安全事故分析增加了不同的维度。也就是说,本文为安全专业人员提供了一种主动预测方法,使他们能够采取必要的预防措施,通过事后发现死亡原因的关键组合和关联,来有针对的避免在施工现场发生死亡事故。最终,本文的研究成果将有助于提高建筑业的安全绩效,防止建筑生产事故的发生。

引言

建筑业被认为是经济增长的主要贡献行业之一。例如,美国建筑业占总产出的4.4%(16084亿美元)(美国经济分析局,2018年)。此外,建筑业目前雇佣了全球6%-10%的劳动力(Shohet等人,2019年),但造成了30%-40%的职业死亡(Sunindijo和Zou,2012年)。在建筑业中,几十年来仍然存在着许多难题,从业者和学者仍然没有彻底解决这些问题(Assaad等人,2020b),其中一个难题是安全性问题。尽管人们为提高建筑业的生产安全做出了许多努力,但建筑生产导致的伤亡依然纠缠着工人和生产者(Zhang和Fang,2013年)。事实上,建筑业被认为是许多国家中最危险的行业(Shin等人,2014年),因为它发展到了该出现混乱的时期(Assaad等人,2020a)。例如,在英国,三分之一的因公死亡的事故发生在建筑工地;这也就是说,建筑业的工伤率是所有部门平均工伤率的四倍以上(卫生和安全执行建筑司,2009年)。在韩国,建筑业在所有行业中的死亡率最高(Yi等人,2012年)。

尽管职业安全与卫生管理局(OSHA)在努力减少建筑工地的安全事故方面发挥了关键作用,但在不同类型的事故中,这种减少效果并不明显。例如,虽然轻伤人数从1994年的219000人大幅减少到2015年的80000人(CPWR 2018),但与2011年781人死亡的最低水平(CPWR 2018)相比,前几年建筑死亡人数增加了26%。死亡事故的增加归因于以下事实:建筑工地被人们认为是最危险的工作场所之一(Lee等人,2017年)。因此,现在要迫切的进一步提高建筑业的安全性,降低死亡率。尽管在过去几十年中,建筑工人的安全保障措施有所改善(Hinze et al.2013),但建筑工地上仍然会发生安全事故和伤害,建筑生产的安全被认为是需要得到高度重视的(Bhattacharjee et al.2011)。事实上,与其他行业(Assaad和El adaway 2020a)相比,建筑行业的危险性较大(Abdul Nabi和El adaway 2020),事故率较高。根据美国最新的2017年统计数据,建筑业是所有其他高风险行业中致命工伤人数最多的行业,包括运输和仓储业、农业、专业服务和商业服务业以及制造业等(BLS 2018)。事实上,建筑业的死亡率相当于美国工作场所4836起致命伤害总数的20%左右,超过了任何其他行业(CPWR 2018)。

尽管专家已经开发了许多技术和方法来改善建筑行业的项目管理和决策过程(Assaad等人,2020c),但应采用更先进的管理方法(Yang等人,2019年)来解决建筑行业面临的可能发生的重大死亡问题。然而,由于施工现场作业的独特性质和特点是危险、复杂、不确定和高劳动强度,此类方法很难实现(Tixier等人,2016年;Lee等人,2017年)。也就是说,为了建立更为先进的方法,需要了解与导致死亡的原因或因素及其相互依赖的因素组合和相关的内在复杂性、抽象性和不确定性(Liu等人,2019)。

目标和对象

本文的目的是确定导致建筑业死亡原因之间的临界组合。相关目标是:(1)根据不同的施工死亡原因之间的相互关系对其进行分类,(2)确定导致施工死亡事故的关键原因(3) 确定并量化建筑行业不同主要死亡原因之间的关键组合和关联。值得一提的是,本研究区分了两种不同层次的安全因果关系:直接原因和根本原因。直接原因是导致OSHA合规官直接记录的死亡的最直接原因,并可在坠落、被击中、夹在中间和触电等案例文件中找到。另一方面,OSHA(2016)将根本原因定义为“确定一个或多个可纠正系统故障的事件发生的根本、根本、系统相关原因”。与此相关,根据Goldberg(2003),仅关注安全事故的直接或直接原因,而不是根源或根本原因,并不排除事件的再次发生。也就是说,由于之前的许多研究都是为了研究直接的死亡原因,因此本研究主要侧重于研究根本原因本身之间的关系,以及它们如何结合在一起导致致命的建筑事故。

背景信息

以往许多的研究工作都是为了提高建筑业的安全绩效。然而,建筑安全的研究课题包括许多不同的方面。因此,提供一个与本文研究工作相关的以往研究的回顾是非常重要的,从而正确地了解本文尝试弥补的知识空白和满足相应的研究需求。更具体地说,本节回顾了建筑业和其他密切相关行业的事故分析文献。

    1. 以往建筑业中的事故分析研究

对于建筑业来说,许多对事故原因的研究已经展开。例如,Ayhan和Tokdemir(2020)利用潜在类聚类分析和人工神经网络,基于欧亚地区建筑工地的事故报告中收集的数据,对建筑业的安全属性进行了事故分析。Chiang等人(2017)对香港建筑行业发生事故的时间和发生事故进行了分析,发现在维修、改造、变更和加班工作中发生了更多的致命事故。Choi等人(2019年)比较了美国、韩国和中国建筑业中的致命的工伤害,结果表明,这些行业的伤害较高的也是最常见的事故类型是从高处坠落。Meng et al.(2018)研究了中国建筑业发生的致命事故,并调查了气候因素、时间周期分布和省份分布的影响。Karimi和Taghaddos(2019)研究了德黑兰建筑工程中建筑工人的教育和经验水平对预防致命伤害的影响;他们表明,在大多数事故中,工人的高受教育程度可以使致命伤害的风险显著降低。Al Bayati和York(2018年)分析了死亡评估和控制评估计划的数据,以研究美国建筑业西班牙裔工人的致命伤害,发现西班牙裔工人和所有工人的事故特征存在差异。(2016)建立了一个从建筑事故报告中提取出信息的结构框架,以找出香港高跌落伤亡事故率的一般特征和管理原因。Zhao和Shi(2019)审查了建筑死亡报告,并使用三角测量方法调查了建筑行业中致命的电气伤害的社会技术系统;与此相关,他们确定了典型系统,揭示了其不足,并提供了改进建议。邵等(2019)探讨了中国的建筑施工活动中的致命事故发生模式,发现更多致命事故发生在特定月份、特定日期和特定时间段。Eteifa和El adaway(2017)研究了施工死亡事故的根本原因,发现缺乏针对具体工作的培训是发生意外事故的最主要原因。Dong等人(2017年)分析了建筑业死亡评估和控制评估数据库,以研究建筑业中发生的致命坠落和所使用的防致命坠落系统。

(1)以往在道路和运输系统事故方面的安全研究

针对道路和交通系统的事故进行了大量的分析和研究。与此相关,Sayed等人(1995)在对事故发生因素的评估基础上,利用模糊模式识别和聚类分析方法确定了事故多发地点。Li等人(2016)基于国家安全生产管理局的数据,利用潜在等级对公路交通事故进行了分析,采用聚类方法对交通事故的关键因素进行识别。杨洁篪等人(2014)基于四个事故指标(事故、死亡、陪审团和直接经济损失),采用有序聚类方法,对我国公路进行了合理的划分。贾庆林等(2011)将主成分分析方法应用于佳木斯市道路交通安全。Mosavi等人(2019)使用Jerk聚类分析方法识别高碰撞风险路段,以便观测数据可作为安全的替代措施,并作为预测安全问题的一种方法。Chen等人(2018)基于聚类和计算分析提取道路密度对安全性能的影响。Rahimi等人(2019年)开发了一种用于分析大卡车碰撞的clus-ting方法。王和陈(2013)运用交通冲突技术和灰色聚类方法对我国信号交叉口交通安全评价进行了研究。Zhang等人(2019)使用机器学习方法识别交通事故中的重大伤害严重性风险因素。陈志强等人(2020)运用关联规则,分析了影响我国沪昆高速公路邵阳-新黄段高速公路交通事故的因素。王志强等人(2020a)开发了一个深度聚类模型,用以评估司机驾驶风格并更好地设计个性化自主驾驶,以提高驾驶安全。Poch和Manning(1996)估计了城市交叉口事故发生频率的负二项回归模型,以减少交通事故。Khasnabis和Ramiz Al-Assar(1989)提出了一种基于曝光的技术,该技术利用机会概念在车辆之间进行交互,分析重型卡车事故。Al-Masaeid和Sinha(1994)采用概率方法评估了未分割农村道路路面标线的安全有效性。钟志忠等人(2007)利用序贯聚类方法,提出了一种基于安全剖面和重要安全影响因素的高速公路路段划分新方法。周立和Irisary(2016)提出了一个修正事故能源释放的综合框架,以探讨中国杭州地铁坍塌问题的复杂性。Medina等人(2014)根据车辆和列车的位置和方向、交叉口布局及其周围环境、驾驶员人口统计等详细事故信息,开展了一项研究,以加强对铁路交叉口事故等级的分析。Li等人(2015)根据道路环境、交通设施和车辆等与事故相关的不同因素,对我国交通系统稳定性进行了事故分析。谢志强等人(2020)利用统计分析和基于交通事故、交通流量、道路剖面数据的K-means聚类方法,分析了我国两车道公路交通事故的空间特征及其与线性参数的关系。Jun等人(2009)采用主成分分析法研究了公路追尾碰撞的影响因素,并通过图表分析和聚类方法,对影响因素进行了检测和识别。Lin等人(2011)采用主成分分析聚类分析方法对道路交通安全进行宏观评价,并对相关安全等级进行分类。

(2)其他行业事故分析的安全研究工作

其他的研究也与火灾事故、海上事故和矿难有关。谢等(2019)运用模糊C均值算法和模糊最大支持树聚类算法对我国油库火灾风险的关键因素进行了识别。Balahadia等人(2019年)使用数据挖掘方法分析消防局的火灾事件报告,菲律宾马尼拉消防局通过提供快速、彻底和科学的火灾数据分析,帮助促进火灾事故评估。袁等(2020)利用案例统计和动态贝叶斯网络对火灾事故进行情景推理,帮助决策者制定更有针对性的应急处置措施。Kim和Shin(2020)使用分类机器学习算法改进火灾事故分类和周期性分析,以提供预测重大火灾事故的能力。Ntzeremes等人(2020)提出了一种模拟疏散模型,以提高火灾事故定量风险评估的效率。Yuan et al.(2019)基于23个影响因素,采用解释性结构建模和层次分析法识别火灾事故应急过程中的原因因素。Wu等人(2019)利用计算机视觉方法创建了一种智能火灾探测方法,以满足实时火灾探测在精度和速度上的要求。Zhang et al.(2014)提出了一种利用矩阵变换、聚类法和自举法分析和预测海上事故人为因素组合模式的方法。Zhao和Shi(2019)使用基于密度的聚类和递归神经网络检测海上异常,以提高船舶交通监督员的态势感知能力,从而减少海上事故。Wuellner等人(2019年)对历史事故中的环境条件应用主成分分析和K-均值聚类分析法,有效地生成海事系统的测试场景。Wang和Sun(2011)利用贝叶斯网络对船舶碰撞进行了事故因果链分析,以避免海上事故发生。郭等(2020)运用灰色谐振算子马尔可夫链方法对民航不安全事件的发生率进行预测。吴(2020)利用数据分析方法对煤矿安全风险进行了深入研究,开发了一个能够动态显示煤矿安全生产状况和预测煤矿事故风险的系统。Wang等人(2019a)使用神经网络自动构建煤矿事故本体。Mulenga(2020)利用灰色马尔可夫方法建立了一个数学模型来分析赞比亚的致命矿难。

(3)研究空白和需求

根据对前几小节中关于安全事故的现有文献的广泛回顾,可以得出结论,以前的许多研究工作使用不同的方法提供了关于安全事故的重要结论。尽管如此,本文的研究仍存在一定的局限性和不足。

第一,这些研究中有许多是为了研究导致一般安全事故的因素,而不是导致死亡的因素。例如,张和方(2013)指出,尽管有许多旨在保障建筑工人安全的努力,但工人死亡的事故仍然难以彻底消除。CPWR(2018)发布的统计数据也反映了这一点,该统计数据显示,虽然导致缺勤旷工的轻伤人数大幅减少,但前几年的施工死亡人数有所上升。

第二,如前几节所述,以往对安全事故的研究有限且片面,其多集中于(1)确定导致建筑业死亡事故的个别因素;(2)分析

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[258707],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。