植物幼苗分类算法基准的公共图像数据库外文翻译资料

 2022-12-04 14:45:15

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


植物幼苗分类算法基准的公共图像数据库

Thomas Mosgaard Giselssonlowast;1, Rasmus Nyholm Joslash;rgensendagger;2, Peter Kryger JensenDagger;3,Mads Dyrmannsect;2 and Henrik Skov Midtiby

1丹麦南部大学,Maersk Mc-Kinney Moller研究所,2奥胡斯大学,工程系-信号处理系,3奥胡斯大学,农业生态学系---作物健康

摘要

一个数据库的图像大约960独特的植物,属于12种,在几个生长阶段,是公开提供。它包括带注释的rgb图像,其物理分辨率为ro。 几乎每毫米10个像素。为了规范对用数据库获得的分类结果的评价,提出了一种基于F1评分的基准。数据集可在https: // vision.eng. au. dk/ plant-seedlings-dataset上获得。

介绍

几十年来,研究人员一直致力于针对特定地点的杂草控制系统。所使用的方法从用粗遥感数据构造杂草地图到使用实数。 IME使用地面平台进行精确喷涂,并配备高分辨率图像传感器。所有方法的共同目标是检测杂草--无论是在斑块中还是作为单一植物。虽然有些系统是商业性的,但却是真正的商业突破。尽管一些原型和案例研究显示出了可喜的成果,但这些系统仍将继续。原因可能是,尽管条件和物种组成不同,但仍未发现一种能够进行有力分类的一般方法。人们可能会问,为什么这项任务仍然是个难题? M:植物学家研究物种分类已经有好几个世纪了,在基于内容的图像检索和图像和视频分析领域有实质性的进展。是什么使 这个问题这么难吗?目前的作者认为,一个问题是缺乏基准数据库。几个物种识别的研究包含了图像等预处理步骤的描述。 获取,分割和注释,这表明研究人员在这些主题上花了时间,尽管这些任务中的每一个都是属于自己的领域。支持和鼓励发展 农业物种识别技术,本文提出了一个可供研究人员免费使用的数据库,使其能够直接跳转到对象分析的任务中。 SIS,物种识别或植物外观分析。此外,还提出了一个性能基准,以便使用该数据库可以方便地复制研究结果。 算法性能的比较

其他数据库虽然存在,但其可用性和内容各不相同,这使得它们无法用于针对特定地点杂草控制的物种识别方法。在Agarwal等人(2006)认为植物数据库这样的AST他史密森数据库和其他世界标本馆数据库不具有代表性的样本种内方差捕获。

在Belhumeur等人案中。(2008)描述了一种可以帮助植物学家从叶子形状中识别植物物种的系统。他们说,Suuml;oderkwitz(2001)描述了一个可公开使用的数据库,但Pr ESENT的作者在定位数据库方面没有运气。最近,Meyer(2011)也指出了许多数据库的存在,但它们对于开发机器视觉系统的可用性还有待于研究。 ineditus (Latin=unpublished) (拉丁语)未出版的

由于缺乏知识或能力来应对物种外观的巨大变化,开发一个通用物种识别系统失败了。这项工作的目的是帮助研究人员获得内部的信息。 丹麦农业中一些最常见的杂草种类的正常变异。据信,如果分类方法能够处理这些数据,那么它很可能拥有 能够处理高的类内变化,并朝着自动物种识别的正确方向迈出了一步,例如,可用于特定地点的杂草管理。作者希望 其他人将在这个数据集上尝试他们的方法,并使用它来对照替代方法。

本文所描述的数据是针对地面杂草或物种的发现。这一领域受人尊敬的研究人员认为,最有希望的针对特定地点的杂草控制方法是c。 通常是基于地面的计算机视觉系统(Gerhards,2010),因为遥感等方法需要解决无数的问题才能变得健壮和可靠--其中许多(例如: 太阳角度和云量)超出了用户的控制范围(Thorp和田,2004)。

1.1。图像记录

世界各地的许多研究小组致力于植物识别。通常使用物种样本的图像数据库来评价它们的方法。创建一个示例数据库需要大量的操作。 f时间和计划。数据是用各种设备记录的,从现成的商用相机到专门为特定数据采集任务构建的传感器。这意味着不同研究人员记录的数据质量不同,记录的传感器类型不同,数量不同,更别提不同的物种。其结果是,数据是多种多样的,可以是稀疏的,经常收集非常具体的研究。此外,数据并不总是提供给其他研究人员和比较不同的我。 因此,通过比较公布的论文的结果是困难的还是不可能的。提交人不知道包括样本数量N的植物幼苗图像的任何公开可用数据库。 评估针对特定地点杂草控制的植物物种识别方法的性能。拥有一个可公开使用的数据库将使研究人员能够根据 通用数据集,启用比较,并希望鼓励研究,因为更好地概述不同方法的性能。本文介绍了一个植物幼苗图像的公共数据库。 sinister (Latin=left) (拉丁语)左边(的),左派(的)

为了建立这样一个数据库,需要考虑以下几个问题:应该使用哪些物种;在什么时候进行记录;每个物种应该有多少个样本? 图像采集应使用哪些设备;以及应如何处理照明。为处理这些选择而作出的决定限制了数据库的通用性,但必须 使任务可以完成。只要在采购过程中和所使用的设备都有完整的记录,数据库对其他研究人员就会有很高的价值。

由于不可能包括太多的物种,因此只选择了对丹麦农业产业具有高度重要性的一个子集。泡沫塑料盒用来生长样品。每个框都包含在 平均25个样品。总共使用了56个盒子,每个盒子里只种了一种。据信,在同一个生长阶段,80个个体的样本足以捕获主 一个物种内部的变异,每个物种的4盒被播种,以便允许20%的发芽失败。

图像被记录了20天的时间间隔2到3天的多次,从出现后几天开始。(数据库主要用于试图鉴定植物的研究 在早期生长阶段的物种,以便农民在杂草开始与作物争夺营养之前进行除草。)。单反相机(佳能600 D)是用固定的50毫米镜头记录的。 RGB图像。摄像机放置在离地表约110 - 115厘米的地方,其分辨率为5184times;3456像素,其分辨率为每毫米约10像素。

1.2。菌种的选择

为这一工作选择了14种在丹麦耕地上出现的重要杂草和作物植物种类。这些物种是任何地点特定杂草控制系统操作的植物的子集。 丹麦需要处理。物种清单包括单子叶植物和双子叶植物和杂草种类,见表1。不幸的是,有两个物种根本没有发芽(Redshank,Field Pane) SY)记录12种

1.3。图像记录

杂草防治需要在作物萌发后尽早进行,以避免与杂草竞争对作物的不利影响。使用选择性除草剂的广播喷洒通常是 如果条件允许的话,在作物萌发后20天前进行。基于这一时机,研究人员试图在同一时间框架内完成杂草的评估或控制。在Downey等人案中 ...。(2004)他们在种植10天后收集图像,并收集Woebbecke等人的照片。(1995 B)认为,经过14-23天的植物发育是一个良好的时间,后出苗除草与r。 适合植物外观和除草需要。在早期生长阶段,重叠的植物叶的共同问题也是最小的,从而使所产生的图像材料更易于管理。非 爬行植物能够分析单一植物的物种分类--这是实现自动化站点特有杂草控制系统商业化的主要障碍,正如Snight等人所主张的那样。(2008年) 在其全面和经常被引用的审查文件中。

1.4。采集装置

在270times;210毫米的发泡胶箱中播种植物,并在Flakkebjerg的AUAgro生态学研究机构中进行培育和种植。植物生长在土壤中,土壤表面覆盖着小石头。早期的实验表明,室内潮湿条件下的裸土倾向于形成绿色苔藓层,其可能是基于像素的分割算法的误差来源。

1.5。托盘和金币追踪

每个盒子都有一个单一的品种,并被标记为一个数字,既作为一个数字,也作为一个条形码。每盒中只有一个物种,这有助于追踪物种。每种4盒 WN,确保影响随机箱不可预见的情况不会影响从一个单一的物种,从而误导所有样品。重复的盒子也确保了针对样本的数量,表1列出了每个示例的ID。

1.6。记录和注意事项

为了获取图像,建造了一个定制的摄像机平台。最后的钻机可以在图1a中看到。以下文字将列出并解释与钻机施工有关的注意事项。

操纵:一个由物品部分构成的钻机被用来保持相机,确保固定的相机高度相对于1100至1150毫米的土壤表面。项目结构之间的空格 用粗糙的白色表面的硬质薄板引导,确保光的散射(见图1a)。

光照:为了确保光条件均匀和可比较,使用了内置闪光灯.。在闪光灯前放置了一个扩散屏,以避免阴影。钻机的侧面也是 RKED以最小化点状光源伪影。如图1b所示

震动:为了避免任何类型的运动模糊,在触发摄像机和摄像机获取图像之间使用了一个外部触发器,延迟时间为2秒,这样任何振动都会产生一个 改变到减少。

透镜和焦距: 相机配备固定佳能镜头EF 50毫米01:1。8 II(系列编号8791016624)设置为自动对焦。使用所建的钻机,大约是在相机上方的1.1到1.15米,在固定焦距为50 mm,摄像机传感器尺寸为22.3times;14.9 mm的情况下,可以计算水平和垂直方向的视场。这些计算是基于简单的t。 rigonometry(宾得,1998),结果在方程1。

其中D是传感器尺寸,f是摄像机焦距,theta;是视角。场的深度可以用先前规定的摄像机和镜头参数以及COC来计算。 价值(最不混淆的圆圈)。对于佳能600 D相机,COC是0.019毫米2。通过方程方程可以计算出近(近)和远(远)聚焦极限。(2)至(4)

其中H是超焦距,Dobj是对焦物体的距离,F是光圈f数。计算距离为1100.0 mm的物体的景深,结果为f范围。 rom 1041.17至1166.26毫米,跨越125.09毫米。同样,在计算距离为1150.0毫米的物体的景深时,范围为1085.73至1222.78毫米,跨度为137.05毫米。植物 在记录期间,物体的长度不能超过100毫米,这意味着物体的高度将小于相机与物体之间的距离的10%,并且在可接受的距离内。 使其达到场的深度。

表1:包括在图像数据库中的物种表。ID引用者指向数据库中的发泡胶框ID和文件夹名称。标记为*的ID,不幸的是,没有发芽

  1. 摄像头钻机 (b)摄像机内部 (c)发泡胶盒

图1:记录平台和旧的发泡胶盒。(a)由项目轮廓和白色硬质薄板建造的照相机钻机-相机安装在顶部朝下。(b)在摄像机钻机内部。小卖部 在闪电战中,用扩散器在前面使用。(c)用植物播种的泡沫塑料盒,上面覆盖着小石头。

分辨率 用高分辨率DSLR相机获取N图像,获得5184times;3456 PX。这意味着分辨率可能会高于任何实际的商业系统,使数据库成为理想的。 用于测试;前提是,不处理细节和高分辨率图像的算法也不会工作在质量较低的图像上。 对目标距离的近似pixelresolution限制在每毫米10.6像素时,对象的距离是1.1米和10.1像素/毫米时,对象的距离是1.15米,前面提到的计算结果。

1.7。记录程序

相机的ISO数为100,快门速度为1/60秒,光圈为f7.1。发芽后,每隔2或3天拍摄一次,每次3周,或一直拍摄到盒子。 只是一个绿色的封面。每个盒子每次都是手工放置在摄像机架上的。

示例数据 图2显示了从记录的图像集中提取的随机样本,以及标记矩形的特写。

1.8。拟议基准测度

通过本文提供的公共数据材料,研究人员离比较结果更近了一步。另一个步骤是就业绩衡量达成一致。我们建议 使用通过分层交叉验证任何优选的分类算法得到的分类结果所得出的度量。拟议的程序如下。要使用的数据是Shuf。 逃逸并分成若干不相交的集合(褶皱)。测试中的分类器是用除其中一个外的所有数据进行训练的,训练后的性能用剩余值来评估。 一个。性能的测量采用加权平均F1得分为每一倍,其中的权重应根据类样本大小。此过程导致一个性能度量 每折分类器。现在假设一组加权平均F1分数,SF,构成一组样本,从一个可能的性能结果的总体为被测试的分类器。(() F1评分是一种常用的度量方法(Lu和Wang,2009),它对样本大小和分类器识别真实负数的能力是不变的(Sokolova和Lapalme,2009)。这个测量的pe 由于数据是随机选择的,因此随机变量是随机变量。我们对集合sf执行引导,从相同的总体中生成可选的可能的样本集,以及g 激活1000个引导集。计算每个引导的平均值生成新的性能度量的基本总体样本。生成这些样本可以计算置信区间。这样做的一个简单方法就是 或者,引导集的平均值按上升顺序,Lavg,并为95%置信区间提取,在指数0.05、95%、0.5、95%和1000-0.05分别为0.5、1000和1000-#number3#,ARKY=975。建议的m 用于报告分类器性能的方法是加权平均F1评分的折叠平均以及通过引导获得的相关置信区间。我们建议使用10倍交叉确认。

方程5至9描述了计算的措施。

其中TPc、FPc和FNC分别表示c类的真阳性、假阳性和假阴性。PC是特定类别的精度,RC是类特定的召回。n表示总nu。 样

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[21541],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。