英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
超高速可变焦TAG镜头的新型机器视觉应用
摘要:超高速TAG镜头提供了同时获取大量来自多个位置的信息,对工业机器视觉应用产生了重要影响。
1 、介绍
TAG镜头使用声音来塑造光线,使其成为市场上速度最快的可变焦设备。这种新的作用机制使扫描速度比其他可变聚焦技术快1000倍以上,为机器视觉、成像、对控制焦位或景深至关重要的激光处理方面的新型应用提供了一个新的方向。在一个简单的即可使用的方案中,TAG 镜头提供了一个计算机控制的平台,该平台与现有的光学组件一起工作,以增加超快、高精度的焦距选择, 同时,为用户提供连续高速扫描的选项,有效地扩展了任何光学系统的景深,而不牺牲分辨率或波前质量。在这个报告中,我们将讨论TAG镜头的工作原理,以及如何实现它来为机器视觉应用实现前所未有的成像。
2 、背景
市场上大多数可调光学元件都受到这样一种观念的限制,即在一个表面或者界面的物理变化需要重新确定光线方向。它们通过移动固定镜头的位置 (例如相机自动对焦) 或改变与人眼相似的镜头曲率形状来重新定向光线。这种机制由于需要材料来移动或重塑而速度缓慢,从根本上限制了这些系统的运行速度。TAG光学在折射指数设备中使用了完全不同的梯度方法,在这种方法中,变化率可以快速轻松地控制。简而言之,当声音穿过材料时,它会导致在与声波的反节点相对应的位置发生小的协调密度波动。因为与折射指数材料的密度有关,这些由声音引起的小波动会产生被认为良好的用户可控的折射轮廓指数,从而形成高质量的可调谐光学透镜。
TAG 镜头特别适合机器视觉行业,因为它能够提供用户定义的景深控制, 特别是与使用衍射方法 (如光场或相位屏蔽方法) 的固定元件或其他技术相比。虽然这些技术可以为成像应用提供特殊的好处,但它们需要大量的后端软件计算来重新创建图像,在某些情况下,由于像素化效果,甚至会降低图像分辨率。此外,这些解决方案在景深范围内只提供固定的扩展,并且要求修改后的CCD元件来适应所需的像素密度。TAG的新技术提供了可调的景深控制,因此,可以充当系统中的窗口 (关闭时),或者在成像组件的原始景深中提供多余30X的增加。当在速度至关重要的应用中使用时,TAG镜头可以通过组合来自其范围内所有焦点的信息来创建瞬时Z-投影,这样一次曝光就可以捕捉完整的多维数据。
但更重要的是,TAG镜头并不局限于高景深成像。由于极高的扫描速度,如果使用脉冲照明,也可以同时成像任意数量的平面。在这种情况下,通过将光源与TAG透镜同步,可以对低景深的固定位置成像,并在微秒内更快地转换到第二个位置。这种成像方式将为图像创造拟扩展的景深,但显著提高了图像的信噪比。当将这种成像应用于机器视觉应用时,它允许人们在不改变图像分辨率的情况下,专注于样品的多个特定区域,这在许多质量控制和零件的宏观/微观检验中很重要。
3.结果
设置TAG镜头与机器视觉应用一起工作相对容易。图 1 显示了TAG镜头直接放置在带有35毫米 f 5.6成像镜头的标准机器视觉相机前面的设置。脉冲白光 led 提供照明,以提供受控照明。对于成像物体,我们使用沿着光学轴线相距50厘米的欧元硬币和纸币。在左边的第一个图像中,我们可以看到在没有激活TAG镜头的情况下图像的外观。在这种情况下,可以调整聚焦镜头的位置,以产生聚焦硬币或纸币。然而,对于固定镜头,不可能同时聚焦两幅图像。在右侧的图像中,我们看到了启用TAG的机器视觉的未编辑图像。在这种情况下,同时在两个平面上对焦是可能的,正如我们所看到的,硬币和纸币都是高分辨率的焦点。这种成像是可能的,因为TAG镜头在改变焦平面方面足够快,因此可以在单个相机采集帧中同时采集多个平面。过去,这种效果是使用多种颜色照明来证明的,但是在这种情况下,我们使用的是白光照明。
图1
在这种情况下,TAG镜头与机器视觉集成的第二个例子如图2所示,而不是将TAG镜头放在聚焦镜头前面, 人们可以将TAG镜头放置在相机和显微镜目标之间。在这里,我们使用 4x的物镜来放大填充电路板上的特征。在图 2a 和 b 中,我们显示了TAG镜头关闭时电路板的图像。我们看到,在每个图像中,只有一个平面处于焦点位置,而其余元素处于焦点之外。当我们激活TAG镜头时,我们可以选择多个平面同时对焦。在这种情况下,我们选择了三个平面来查看板上不同尺寸的元素。如图 2c 所示,所有的元素和识别标记都处于焦点位置。
4.结论
图2
TAG镜头正在打开新的可能性,并在成像和处理领域带来新的创新浪潮。首先,设备中没有质量传输,因此可以实现比其他可变聚焦设备快 3 个数量级的速度。第二,TAG镜头不容易受到材料疲劳的影响,因为声音压缩液体的频率没有基本限制,导致寿命长,维护费用低。第三,TAG 透镜具有低球差,是高分辨率成像和处理应用的理想选择。最后,TAG透镜具有聚焦、离焦、重塑或扩展现有光学组件的景深的能力,为用户和工业采用者提供了巨大的价值。TAG镜头的多功能性意味着它可以被纳入从高速传送带系统到大体积安全成像的几乎任何机器视觉应用中。当在速度至关重要的应用程序中使用时,它可以通过组合相机中所有焦点的信息来创建瞬时Z-投影,这样一次曝光就可以捕捉完整的多维数据。
在这个世界上,自动化的、相互连接的人工智能系统控制着从驾驶、农业到制造和政府系统的一切,这听起来像是反乌托邦科幻小说。但是经济学家和历史学家都预测,即将到来的网络物理生产浪潮如此之大,将会定义第四次工业革命——也就是工业 4.0 或工业物联网。
事实上,IIoT革命已经开始了。在这场革命中,工厂生产的所有产品都将被自我维持的、云连接的人工智能网络机器人监控、分析、质量认可、包装和运输。在所谓的熄灯制造中,即使人类回家后,机器也会自动制造从汤到坚果的所有东西,而不需要灯光或热量, 中国的一些公司已经建立了这样一个计划。
新兴的 IIoT 的核心技术是机器视觉,这是一种用于控制自动装配制造设备的计算机成像技术。随着机器视觉使用机器学习发展成为越来越智能的机器人,光子将在传感器、相机、光纤、能够实现这些系统的显示器和成像技术中扮演重要角色。
加速变革
到目前为止,非工业物联网 (IoT)——在可穿戴健身轨道、智能家居和联网车辆等技术中表现最为明显——已经产生了一个相对柔和的效果。但是,像自动驾驶汽车、远程控制的农场以及最重要的是 IIoT 这样的发展可以产生更大戏剧性的变化。
美国马里兰州盖瑟斯堡的市场研究公司 Stratistics MRC 预测,全球工业机器视觉市场将从 2017年的 85.4亿美元增长到 2026年的 168.9亿美元, 7.8% 的复合增长率。推动这一增长的是工业 4.0 自动化的日益发展,需要具备处理复杂身份识别能力的更智能的视觉系统, 检查和分类——比传统的需要人类的加工方法要快得多。亚太地区是全球工业机器视觉市场增长最快的地区,最大的行业是制药、消费电子、汽车、食品加工和半导体。
无论如何应用,机器视觉过程包括四个步骤:图像采集、数据提取、数据分析决策 (如通过/失败) 、并将结果传达到下一阶段。用于图像采集的高分辨率相机中的光学系统没有太大变化,这与美国新泽西州巴林顿埃德蒙光学公司的高级视觉解决方案工程师尼克 · 西施卡所说的一致。
尽管如此,传统的视觉引导机器人过去通常没有视觉或低分辨率视觉, 机器人技术正在向高分辨率成像与光学元件的广泛集成过渡,这些光学元件的设计和制造可以从百年技术中提取更多令人印象深刻的信息。消费光学和智能手机相机的发展——更大传感器上的更小像素; 像场相关象差这样的光学误差的控制, Sischka 说:“较小像素上的曲率和散光也被利用到机器视觉空间中。”
此外,用于拾取和放置、选择和检查的光学元件必须承受较高加速度和抗振动。埃德蒙完成加固镜头的一种方法是将镜头元件粘合在组件中,以帮助保持校准。另一种方法是将可变孔换成固定孔,另一种方法是降低聚焦机制的复杂性。Sischka说: “当每分钟一辆价值 40000 美元的汽车从装配线上下来时,你不能让它们散架。” “你不能让生产线下线,否则你每分钟会损失成千上万的美元。你需要没有停机时间的可靠光学设备。'
大数据,快速解答
HinaLea imaging (美国加州埃默里维尔) 高光谱成像总监 Alex Fong 是 TruTag 技术的衍生产品, 他说,过去几十年的相机还没有完成检查当今消费设备的任务。例如,智能电视、平板电脑和智能手机中的真彩色 OLED 显示器在分辨率上大幅增加,使图像更加丰富和细致。
Fong 说: “消费显示工业是对高性能机器视觉系统需求的主要驱动力。”。“现在我们需要测试甚至眼睛都无法检测到的颜色性能,所以带有 RGB 滤镜的传统彩色相机必须变得更加复杂, 要具有多光谱和色度学功能,以及高效测试色彩描绘质量的复杂算法。”
无论是食品检验、温室植物还是手机,目前的生产都需要制造车间的人来检查和分析产品质量,通常使用便携式或手持仪器。一些应用需要更深入的光谱数据,这也是当今技术水平的所在。在 2017 年度,HinaLea 推出了该公司所说的第一款高分辨率自主高光谱手持相机,型号为 4100H。手持光谱仪使用户能够捕捉被测产品的特写图像, 并在 400 到 1000 nm 的波长范围内生成 550 波段内每个像素的光谱。频谱分析在触摸屏显示器上提供了其目标的即时通过或失败决策。
除了这些基本功能之外,还可以转变为背光相机——例如,确定草莓是否过熟,或者肉是否基于现场检测潜在的化学特征而被确定,而不需要外部数据处理。HinaLea 说,高光谱方法有效地用于农业应用,以区分作物的真菌感染、虫媒疾病和除草剂扩散暴露。对个别化学特征的检测,可以提前准确地告知农民正确的处理方法,减少了数百万的农作物损失。
机器视觉在高光谱领域面临的挑战是减少通过该技术产生的巨大数据块所需的时间。审查、提取和分析这些数据以快速找到可操作的答案可能会在疾病诊断或安全问题等关键领域造成瓶颈。嵌入式系统就是这样形成的,即在相机里的机器学习编程芯片能够处理大量数据,每个客户都可以使用这些数据来管理相机,为他们的特定应用自动化工业程序。嵌入式智能芯片利用具有聚类和分组算法的神经网络来实现摄像机无法单独完成的可操作决策。
Fong 说: “最令人兴奋的进步是人工智能和机器学习给市场带来的。”。“人工智能系统可以比人工分拣或质量管理人员更准确、更不懈地做出决定。这些嵌入式系统不仅可以演算和管理大数据,还可以随着时间的推移改进训练和学习。'
机器视觉摄像机的另一个进步是 CMOS 技术在传感器中的商业应用,取代了电荷耦合器件 CCDs。CMOS 传感器目前的效率非常好,相机行业的公司正在转向为下一代产品改进计算成像。美国亚利桑那图森的 OEM 产品经理史蒂夫 · 史密斯解释说,“传感器性能最近已经达到了 95% 的量子效率 (QE),这使得几乎完美的探测器成为可能。相机的未来在于产生答案,而不仅仅是图像。”
2017年11月,光测量公司推出了一款 CMOS 相机,针对像生物医学细胞成像中那样的微弱信号进行了高分辨率成像。这款名为 Prime BSI 的相机具有 95% QE 、优化的像素尺寸和背面照明,用于暗光源的光收集, 对于全内反射荧光、薄片显微镜和比率成像等活体细胞技术来说,这是一种低噪声的理想选择。该相机采用了先进的计算成像功能,实时处理数据。
深度学习与神经网络
纽约大学医学院,生物化学和分子药理学系副教授伊莱 · 罗德伯格实验室,测试了另一种版本的光学仪器成像技术。罗德伯格实验室使用了用于超分辨率风暴显微镜应用的初期95B的CMOS 相机的单分子检测和定位能力, 专注于在纳米尺度上实时成像分子,研究 DNA 修复背后的机制以及它们如何导致癌症。罗德伯格的团队使用带有定制算法的初级95B 来挖掘和分类图像数据,包括三重相关分析和基于蒙特卡罗的交互分析。该小组最近开始使用神经网络,并正在将机器学习进一步发展来形成分析路径并且更迅速地确定目标机制。
尽管这种高灵敏度、低光的应用还没有进入工厂车间, 但这些机器学习工具在微拷贝、基因组学和诊断中的实际应用可以验证它们向工业的转移。在IIOT连接系统中采用, 基于人工智能的机器学习架构,如深度学习和卷积神经网络 (CNNs) 可对海量数据进行更有效的分析和处理,在评估数字图像或数据块中发现的许多不同类别的对象。这些方法在处理自动化工业过程中变得越来越重要。深度学习的进步包括一些熟悉的名字: 谷歌,脸书,微软,NVIDIA,IBM 和通用电气等等。
深度学习是一种监督机器学习识别特征的理想选择和模式。在“监督”学习过程中,一个用户训练这个系统来确定一个图像中的哪些特征是不是匹配。一个系统的训练越多, 其预测正确答案的概率就越好。一些图像分类需要数十万次标记的样本图像来解决精确分类问题。一旦系统被训练到对于连续可靠的分类来说已经足够了 (例如,“好” 或 “坏” ,根据现有可见裂缝的阈值限制进行分类),建立了模式识别或回归,并且系统在每次输入的情况下继续学习。
这样的培训非常耗时,而且需要大量的计算能力。另一台机器学习架构,CNNs,帮助更快分类比单独的深度学习要小误差范围。
像深度学习一样, CNNs从神经元在大脑中的工作方式得到灵感,也需要用户培训,以及大型的培训和复杂的算法。但是,如果编码很复杂,一些深度学习和神经网络的成果已经互联网用户非常熟悉。谷歌图片搜索,Facebook 自动标注照片的功能,亚马逊的相关产品推荐,个性化的家庭信息和 Instagram
全文共7863字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[1574]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。