英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
科学直通车
Procedia Computer Science 45(2015)236 - 243
高级计算技术与应用国际会议(ICACTA-2015)
SmartGlass:视觉商业应用程序(安卓)
Jay Shaha、Tapan Desaib、Pooja Shahc *
a在美国加利福尼亚州南加州大学攻读计算机科学硕士学位
b在MIS,Syracuse Uniersity,纽约,美国寻求MS
cSoftware Engineerat Igate,印度孟买
摘要
本文介绍了基于Android平台的VisualGlass 视觉商业应用程序。视觉商业是一种通过基于图像的搜索在线获取产品的方法,而电子商务主要用于基于文本的搜索。本文的主要目的是建议以SmartGlass形式进行基于文本搜索的替代解决方案。如上所述的视觉商务是基于图像的搜索,即基于图像识别进行搜索,并且应用程序以来自各种在线商店的产品的形式向最终用户显示输出。
copy;2015作者。由Elsevier BV发布。这是CC BY-NC-ND许可下的开放获取文章
(http://creativecommons.org/licenses/by-nc-nd/4.0/).
同行评审由国际先进计算技术与应用会议科学委员会(ICACTA-2015)负责。
关键词:SmartGlass;图像处理;视觉商务;视觉搜索;电子商务。
1. 介绍
数字世界越来越拥挤。随着公司通过电子商务补充其传统的商品销售途径,网站数量猛增至数百万。只有美国人在网上交易中花费了1860亿美元,而85%的亚洲人在网上购物。零售业的成功不再仅限于实体店。
* Jay Shah。电子邮件地址:shahjaykiran@gmail.com;塔潘德赛。电子邮件地址:tapan.123desai@gmail.com;Pooja Shah。电子邮件地
址:
1877-0509copy;2015作者。由Elsevier BV发布这是CC BY-NC-ND许可下的开放获取文章
(http://creativecommons.org/licenses/by-nc-nd/4.0/).
同行评审由国际先进计算技术与应用会议科学委员会(ICACTA-2015)负责。 doi:10.1016/j.procs.2015.03.127
Jay Shah et al. / Procedia Computer Science 45 (2015) 236 – 243 |
237 |
这是显而易见的,因为零售商现在为客户提供在线商店界面的增加。网络泡沫爆发后,电子商务出现了繁荣。Amazon.com的净资产 - 一个顶级电子商务网站是900亿美元1。这清楚地表明了网上购物对世界上庞大人口的重要性。
同样,视觉搜索方法也出现了繁荣。视觉搜索是一种需要注意的感知任务,其通常涉及对特定对象或特征(目标)以及其他对象或特征(干扰物)中的视觉环境的主动扫描。视觉搜索可能会改变搜索营销的竞争环境。
SmartGlass是基于视觉搜索的电子商务应用程序。SmartGlass主要面向移动用户,对于想要吸引数百万移动用户关注的人来说,它将变得至关重要,他们预计会在几年内占据大部分网络流量。
本文的其余部分组织为 - 第2部分,涵盖了现有系统的评论,其中概述了现有系统,例如:Google Goggles和CamFind。第3节介绍了提出的系统,该系统提供了SmartGlass应用程序的基本概念。第4节是关于实现,它提供了SmartGlass应用程序架构的详细块解释。第5节描述了评估和结果。论文以结论和未来范围结束。
2. 审查现有系统
2.1. 谷歌图像搜索
虽然Google Goggles不是专用的视觉商务应用程序,但所提供的结果可以帮助用户购买产品。谷歌护目镜的确切工作在某种程度上基于文本识别。每当用户单击图片时,应用程序扫描图像并检索文本。然后,该文本将作为查询在Google搜索引擎中发送,并显示结果。这些结果可能包含电子商务门户链接。虽然这些应用程序不用于视觉商务,但它是视觉搜索领域的第一个进步之一。应用程序仅搜索图像中的文本,因此它不适用于其中没有任何文本的随机图案或彩色图像。此外,显示的结果采用Google搜索结果的形式,应用程序不会直接重定向到电子商务门户2, 3。
2.2. 卡姆珀
它允许用户拍摄任何感兴趣对象的照片并接收其标识并同时向用户提供关于所拍摄项目的信息。CamFind
就像Google Goggles,但是超越了它。CamFind的准确度高于85%,而Google Goggle的准确率在15%到20%
之间。此外,CamFind还能够以任何角度识别物体。
一旦将识别返回给CamFind,应用程序就会将用户带入“意图屏幕”。在“意图屏幕”内,向用户呈现以下选项:价格比较,类似图像,地理位置(找到项目的最近位置)以及互联网搜索结果。CamFind还具有扫描和识别条形码以及QR码的功能。它还拥有翻译和语音搜索功能。此外,用户可以将iPhone相机胶卷上的图片上传到应用程序中,以便识别它们。CamFind的最佳功能是从任何点击的图像中读取图案或颜色,并根据这些标准给出项目。CamFind识别整个对象而不仅仅是文本4。
3. 拟议的制度
SmartGlass可以定义为电子商务的可视化搜索。视觉搜索意味着通过图像而不是文本在万维网上搜索某些内容。视觉搜索引擎基于算法匹配图像,其考虑在图像中找到的图案和特征点,然后其用于识别图像上下文并给出相关信息。SmartGlass致力于移动视觉搜索的概念。用户可以直接从顶级电子商务门户网站购买产品,只需扫描他们想要购买的产品,然后应用程序就会给出结果5。移动图像搜索器是一种设计的搜索引擎
238 Jay Shah et al. / Procedia Computer Science 45 (2015) 236 – 243
专门用于移动电话,通过移动电话,您可以通过使用自己的移动电话或使用某些单词制作的图像在互联网上找到任何信息。通常,这种类型的搜索引擎使用按示例查询或按示例查询的技术,它使用图像的内容,形状,纹理和颜色在数据库中进行比较,然后使用从查询中提供近似结果电子商务API。
首先,从移动设备捕获的图像被发送到服务器,在那里将其与基于图像直方图的现有数据集进行比较,图像模式(涉及形状,颜色,纹理)和特征点各自聚集以给出置信水平到图像的上下文(图像实际描绘的是什么)。最后,当整个过程结束并且图像被识别时,图像上找到的图案或文本在查询形式的电子商务API中匹配。从查询中检索的结果以聚合形式显示给用户或搜索者。
简而言之,SmartGlass是一个安卓的应用程序,它使用移动相机接收图像。该应用程序使用光学字符识别和图像处理6-7来为扫描图像提供上下文。图1显示了该应用程序的基本步骤:(a)使用移动设备捕获图像;(b)捕获图像将其发送到服务器;
(c) 获取相关内容。
a) b) c)
图1:(a)使用移动设备捕获图像;(b)捕获图像将其发送到服务器;(c)获取相关内容
SmartGlass是视觉搜索和电子商务的独特融合。该模块使用Voila Jones和PHOG的混合实现。在此模块中,用户无需单击所需对象的照片。相反,他们只需将相机悬停在物体上。然后将图像与现有数据库进行比较,为扫描图像提供上下文,从而检测对象。一旦识别出对象,就会使用他们的API在顶级电子商务门户中搜索它。这些API首先与应用程序链接,以便通过门户轻松访问。一旦在门户中识别出对象,它们就会以汇总形式显示给用户,并提供其价格和可用性。
4. 履行
图2给出了SmartGlass应用程序的系统架构。
图2. SmartGlass系统架构
Jay Shah et al. / Procedia Computer Science 45 (2015) 236 – 243 |
239 |
4.1. 视觉搜索
视觉搜索模块基于数据库技术,爬虫和光学字符识别(OCR)引擎。用户必须单击他/她想要搜索的文本的图像。然后由OCR引擎读取该文本。然后将该文本作为查询传递给服务器。服务器由MySQL数据库组成,每天由两个爬虫填充。然后在数据库中搜索查询。一旦找到结果,它们就会被发送回移动设备。响应很快,结果显示在3秒的范围内。Visual Search的主要功能是不使用任何现成的搜索引擎8,而是在我们自己的数据库中聚合新闻并显示用户的结果。
视觉搜索算法:
-
- 扫描单词内容
- 从图像中提取文本内容
- 拼写检查检索到的内容
- 发送到服务器的文本
-
服务器端编程
- 将句子分成单词
- 删除停用词
- 根据扫描的单词搜索相关新闻文章
- JavaScript Object Notation(JSON)对检索到的文章进行编码并将其传递给设备
- 解码设备上的JSON11响应
- 显示结果。
- 文件捕获
该模块中的文本由OCR引擎读取。然后将识别的文本传递给服务器。服务器中存在另一个OCR以提高文本准确性。然后,检索到的文本以可编辑的格式传递回用户移动设备。编辑文本后,使用文档转换器将文档转换为PDF格式。保存的文档也可以在所有社交网络平台上共享。
4.3. 实时信息
此功能使应用程序可自定义。该应用程序可以链接到用户定义的电子表格或现场ERP系统。该模块再次使用OCR引擎并从图像中读取文本。然后从链接的电子表格或ERP系统匹配文本,并将结果显示给用户。电子表格可以包含可由用户填写的任何数据。应用程序向电子表格发送查询并从中检索信息。实时信息适用于拥有重型机器的大型工厂,因为可以从机器快速检索信息。
实时信息算法:
- 扫描单词内容
- 从图像中提取文本内容
- 拼写检查检索到的内容
- 发送到服务器的文本
-
服务器端编程
- 将句子分成单词
- 删除停用词
- 连接到要监控内容的ERP / Excel /电子表格
- 过滤掉与搜索到的内容匹配的行
- 根据所需信息将结果标准化为统一格式
- JSON对结果进行编码并将其传递给设备
- 解码设备上的JSON11响应
- 显示结果
240 Jay Shah et al. / Procedia Computer Science 45 (2015) 236 – 243
4.4. 视觉商务
视觉商务是视觉搜索和电子商务的独特融合。该模块使用Voila Jhones算法实现。在此
模块中,用户无需单击所需对象的照片。相反,他们只需将相机悬停在物体上。使用该算法从数据集中识别该对象。一旦识别出对象,就会使用他们的API在顶级电子商务门户中搜索它。这些API首先与应用程序链接,以便通过门户轻松访问。一旦在门户中识别出对象,它们就会以汇总形式显示给用户,并提供其价格和可用性。可以使用各种机器学习算法随时间扩展数据集。
视觉商务算法:
-
- 扫描单词内容
- 从图像中提取文本内容
- 拼写检查检索到的内容
-
发送到服务器的文本<!--
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[442094],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。