英语原文共 24 页
第32届中国控制会议论文集
2013年7月26-28日 中国西安
基于FOA-SVR的海洋船舶经济航运研究
史步,郭协,张
华南理工大学自动化科学与工程学院,广州510640
E-mail:bhshi@scut.edu.cn,289025881@qq.com,zhangben1988@126.com
1引言
今天,世界上80%以上的发达经济体的货物运输都依赖于海运。海运的主要成本是远洋船舶的燃料消耗,由于燃料价格的上涨,燃料成本已成为航运公司运营成本中最重要的部分[1]。因此,如何减少油耗实现远洋船舶的经济航行并降低航运公司的运营成本和减少大气污染,已成为船舶研究领域的一个重要探讨课题。这个课题具有重要的经济意义和社会意义[2][3]。实际的船舶海洋经济驾驶模型是一个非常复杂的多变量非线性MIMO系统,因此传统的最小二乘回归法无法准确地建立模型[4]。 Pedersen使用神经网络算法来实现远洋船舶经济速度的建模[5]。但是,由于神经网络模型本身存在容易过度拟合和缺少泛化能力以及训练速度太慢的缺陷,所以这种方法无法达到预期目标。Leifsson提出了一种灰盒建模方法[6],它结合了神经网络方法和传统的物理模型来建立远洋船舶的预测模型。这种方法可以在了解精确船舶物理模型的前提下有效地工作。但是对于不同的船体形状,物理模型是不一样的。因此,这种方法很难应用于不同类型的船舶。
在本文中,我们提出了一种Wen-Tsao Pan于2011年发表的基于果蝇优化算法的支持向量回归的改进算法[7]。支持向量回归算法是的支持向量机(SVM)的一种变体。使用基于FOA改进的统计机器学习算法来分析和研究远洋船舶的经济航行。这种基于统计学的方法甚至认为使用少量样本就可以准确地工作。该方法也基于结构风险最小化SRM原理并包含正则化项,这一特性使其与神经网络不同并且不易过度拟合。
2经济速度原理和研究数据来源
从狭义上讲,经济速度(又称慢速蒸汽)是一种航行速度低于额定速度的船舶。它是工业中经济航行被接受和采用的最广泛的方法。人们认为这种方法能够减少燃料消耗并减少二氧化碳的排放[1,8,9]。经济速度概念产生于燃料消耗和速度之间的关系曲线。从理论上讲,发动机的油耗与速度的平方成正比[10]。
(1)
在前面的一个公式中,G是每单位海里的燃料消耗量,是燃料消耗率,C是比例参数,v是船舶在水上航行的速度。如图1所示:
图1:柴油机油耗 - 速度曲线
从图1中我们可以看出,曲线存在一个全局最小值,速度对应的这个最小值称为经济速度。然而,这只是理想状态下的假设。 实际的航行远洋船受多种自然变量的影响。 如图2所示,内燃机燃烧石油驱动螺旋桨旋转,为船舶提供前进动力。当风、洋流、吃水、横倾和纵倾等自然条件发生变化时,船舶遭遇阻力变化,因此我们不应该用恒定的经济速度来航行。
图2:影响远洋船舶的阻力
所以船舶经济速度不能用全球最小的发动机燃料和速度消耗曲线来简单表征,而是应该考虑自然条件变量的多样性扰动来建立航行远洋船舶的真实经济模型。 我们在本文中使用的数据是船舶研究领域的一组来自真正的远洋货船的共同数据[11]。
表1:搜集的一部分数据
3数据预处理,方法和实现
3.1数据调整和筛选
船舶数据所用的采集设备的采样率不同。一些大尺寸的数据,例如端口侧高度有397万个数据点,然而像水流速度这样的小数据只有54万个数据点,所以我们需要同步的来收集数据。
另外,在数据采集过程中一些数据集可能会丢失几个数据点,幸亏数据全部缓慢变化,线性插值算法才能够满足数据插值要求。此外,我们收集的数据可能包含船内各种电气设备引起不同频率的噪声,如果不考虑噪声数据的影响,我们的回归和预测系统性能可能会恶化甚至无法预测,因此,必须采取一些适当的筛选措施。我们在这里使用的筛选方法是局部线性回归滤波器(LLRS)[12],该过滤器使用过滤数据特定范围内的数据点进行协同过滤。如图3所示:
图3:数据过滤
3.2数据相关分析和数据简化
从理论上讲,为了实现经济航行,必须控制柴油机的转速。但是本文中使用的数据源的柴油发动机是通过改变桨距来控制航行速度的恒转速发动机。因此,调整速度依赖于改变桨距大小,所以在本文中,经济航行模型的输出是桨距,输入是其余变量。在对数据进行预处理之后,数据集的数量已经被压缩,但是输入的尺寸仍然是17矢量维度:速度,燃料消耗,燃料温度,燃料密度,纵倾,横摇,真实航向,偏航角,舵,吃水,侧倾,港口水平和右舷水平,经度,纬度,风角,风速,水流量。根据航海导航和实际驾驶经验,并非每个变量都是独立变化的。从相关系数矩阵可以得出结论,输入数集的多个变量是相关的,六对变量的相关系数大于0.70:
在本文中,我们使用了一种基于参考文献[13]中Gram-Schmidt变换的方法,提取出上述主成分,减少数据并删除冗余信息。计算表明,六个主要基础变量的累计净信息量比率达到98.37%,论证可以减少到6维是:纵倾,侧倾,方向舵,吃水,水平和速度。
3.3经济航行数据筛选和数据集划分
并非所有收集的数据都是经济航行下的数据。大多数数据都是非经济数据。为了从大规模数据中筛选出经济航行数据,本文提出了两种分类条件:单位海里油耗划分速度sigma;和流速upsilon;。这两个变量已被用于构建数据的均值K集分析的坐标系。sigma;较小且upsilon;较大的数据被识别为经济航行数据。另外,在上述部分预处理之后,数据集的大小为20,619。根据模型建立的规范,数据集分为训练集(Tn)和验证集(Vd),训练集占样本总数的80%,剩余样本数属于验证集。首先,使用训练集来训练和建立模型。其次,使用验证数据来验证模型。
4由FOA改进的SVR算法
4.1 FOA介绍
FOA是果蝇优化算法。 FOA是一种模拟果蝇群种寻找食物以找到全局优化值的算法。果蝇的身体结构使其优于许多物种,尤其是嗅觉和视觉。果蝇的嗅觉器官可以收集漂浮在空气中的食物气味,甚至可以发现40公里以外的食物气味。然后它飞到食物附近的区域,并使用视觉器官找到食物位置或同伴聚集的地方。果蝇种群的演变如下图4所示。
图4:果蝇种群的进化步骤
FOA的实施步骤如下:
(1)随机初始化果蝇群的位置(,),G的下标表示x轴和y轴坐标,G的上标表示群体的世代。
(2)根据群体的位置,随机生成每个果蝇的位置和方向。 矩阵I用于记录每个果蝇的位置:
(2)
(3)
(4)
(5)
是每个果蝇的随机距离。 这是果蝇的数量。
(3)计算每个果蝇和原点之间的距离(Dist),然后计算S,它是距离的倒数
(6)
I是矩阵I的第i行。
(7)
是一个大于零的小值,它的功能是当Dist等于零时修改特殊情况。
(4)将臭味代入气味浓度判断函数f,以找到果蝇(sm)个别位置的气味浓度。
(8)
(5)找出果蝇组中sm最大的果蝇。
(9)
(6)记录最佳sm和x,y坐标。果蝇组将利用这个位置移动。
(10)
(11)
所以我们可以找到最好的果蝇坐标,
并将其用作下一代的初始位置
(12)
(7)执行迭代优化以重复步骤2到步骤5并判断sm是否大于前一代,如果是,则执行步骤6。
4.2 SVR算法描述
SVR算法是用于回归的SVM方法[14]。 SVM的优点是其泛化能力强于其他神经网络,而且SVM是基于最小误差风险的结构,是全局唯一的最优解决方案。 因此SVM已被广泛用于解决分类和回归问题,是一种密度强大的估算工具。 考虑一组训练数据
其中是输入向量,是对应的目标输出,在给定情况
SVR的标准形式是:
(14)
通过拉格朗日对偶解决双重优化问题:
是内核函数。解决了双重问题后,我们可以得到如下的回归函数:
(16)
主要使用的核函数是线性核,多项式核,sigmoid和RBF。 在本文中,我们使用径向基函数。
4.3基于FOA-SVR的改进算法
根据前面的讨论可以看出,SVR有很多优点,但在实际编程过程中,正则化参数C和核函数参数 是根据经验选择的。一般来说,我们选择了。这些变量的选择直接影响SVR训练效果和实验绩效,但缺乏有效的指导规则。本文首次提出了FOA,以优化SVR建模方法的两个重要结构参数。首先,使用C和初始化果蝇组的位置 :
(17)
根据小组的位置,随机生成每个果蝇的位置:
(18)
将Sm定义为通过将两个参数代入SVR来训练模型而产生的训练效果:
(19)
选择该群体中最大的Sm作为下一代的初始位置和迭代计算。
通常,FOA-SVR算法将需要优化的两个参数设置为果蝇一代的初始位置,然后基于SVR训练发展出的输出性能来找到最大浓度的果蝇个体,并最终迭代优化参数,使SVR具有最佳性能。图5所示算法的具体流程图如下:
图5 FOA-SVR算法流程图
5仿真和结果分析
5.1 FOA-SVR算法与其他算法的比较
在本文中,我们比较了FOASVR和FOAGRNN算法。SVR已在前一节介绍,GRNN是普通回归神经网络的缩写[15]。 GRNN是RBF网络的变体。具体理论和详细推导见参考文献[15]。 GRNN通过激活神经元来近似函数,映射出相应领域神经元的近似输入向量的函数值。与其他神经网络相比,该算法的优点可以看出:更少的可调参数,更快的训练速度和不需要迭代的训练过程。
GRNN具有较少的可调参数,较快的训练速度,并且在训练过程中不执行迭代。
这些算法使用Python和MATLAB来混合程序。首先,在Python中同步和插值数据。其次,对MATLAB中的数据进行过滤和相关的分析。最后,实现FOA,GRNN和SVR算法,并应用FOA优化GRNN和SVR。我们将r2和MSE作为评估标准,预测效果。几种算法预测了下表和下图所示的效果:
表2:几种算法的预测效果
图6:SVR和FOA-SVR的预测效果之间的对比
从前面的图表中可以看出,FOA优化的SVR算法比普通SVR具有更少的均方误差和更好的回归和预测能力。 该改进算法可以准确地预测燃料消耗。
图7:GRNN和FOA-GRNN预测效果图
如图7所示,与普通的GRNN方法相比,FOA优化的GRNN方法在性能参数上有一些改进,但效果不明显。网络基本处于拟合状态,并且算法的输出不遵循输入向量。 这一切都是因为传统的神经网络基于经验风险最小化(ERM)原理,这种网络既没有低效的泛化能力也不容易提升。 另一方面,SVM以结构风险最小化(SRM)原则[16]为基础,同时不影响分类准确率(ERM),并减少分类或回归模型的VC维度,使整个样本集的预期风险尽可能小
5.2基于FOA-SVR的经济模型模拟
从前一节四种算法的比较我们可以看出FOA-SVR算法的回归预测能力是最好的。 在本文中,我们最终使用FOA-SVR算法来建立模拟远洋船舶经济航行的预测模型。 我们使用的模拟数据已经在表1中示出,首先,使用训练集Tn来训练FOA-SVR算法并建立回归模型。 其次,使用校验和集Vd来验证训练模型。 训练和验证结果如图8所示。
图8经济导航模型的桨距预测
回归预测结果与训练集的真实桨距值之间的比较如图8a所示。基于FOA-SVR的回归算法具有很强的回归能力,MSE均方误差= 0.2664,相关系数r2 = 98.85%。
回归预测结果与验证集的真实桨距值的比较如图8b所示。桨距真值与预测值之间的均方误差为0.6905,相关系数为90.84%。预测值和实际值之间的误差很小,并且它们之间的相似性也很大。从该验证结果可以看出,基于FOA-SVR的回归算法对于不熟悉的数据具有良好的泛化性能,并且可以在不同的数据集中顺利地推广。因此,通过该算法建立的预测模型可以预测侧倾来帮助船舶根据不同的天气和海况实现经济航行。
6结论
本文对远洋船舶的经济航行预测模型和算法进行了深入研究。在分析了传统数学回归方法和人工神经网络的缺点后,提出了一种基于果蝇优化算法的支持向量回归的改进方法。该算法的模型构建考虑了外部变量,并能根据外部变量预测经济速度。仿真还表明,该改进算法构建的远洋船舶经济航行模型可以达到我们预定的目标。该算法经
资料编号:[3415]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。