还没体验过无人超市?手把手教你用计算机识别技术自己开一家!

时间:2019-09-26 19:03来源:未知 作者:admin 点击:
2016年年末,Amazon无人超市横空出世。在这家无人超市,店内的相机能够自动追踪你拿取的商品;完成购物后,你无需排队等候收银,只用直接走出超市。 自此之后,阿里和京东也已相继加入战局,先后推出无人超市体验店。一时间,无人超市的概念已实现了大规模普

  2016年年末,Amazon无人超市横空出世。在这家无人超市,店内的相机能够自动追踪你拿取的商品;完成购物后,你无需排队等候收银,只用直接走出超市。

  自此之后,阿里和京东也已相继加入战局,先后推出无人超市体验店。一时间,无人超市的概念已实现了大规模普及。

  无人超市的“黑科技”到底是什么呢?今天,文摘菌就为大家科普其中最重要的一环——基于计算机视觉技术的物体识别。

  超市里的智能货架需要能够追踪到客户拿走了什么商品。我们可以用两个物品识别模型来实现这个功能,一个用来跟踪手部动作以获取被拿起的物品。另一个独立模型则用于检测货架的空间。请看下面的动画,同时使用两个模型可以大大降低误判。

  无人超市的需要解决的另一难点是,实现摄像头对物品的一次性识别,这样我们就不需要在结账的时候一件一件物品地扫描过机了。

  直接通过购物车里的摄像头检测所买的物品,在你走出超市的那一刻就自动结帐。这个不要太酷哦!

  为此,我们需要建立另一个识别模型,用以检测识别物品的种类以及数量。请看下面的动画(即使物品只有部分可见仍能被准确识别出来)。

  我们可以通过下载网上的公开数据集或者自己创建数据集两种方式来收集图片。这两种方法各有利弊。我一般是两种综合使用,比如手部的探测可以使用如Ego Hand数据集(印第安纳大学制作的第一人称视角的手势数据)这样的公开数据集。

  这个数据集包含大量手的形状、肤色和动作的变化数据,在实际应用中非常有用。

  另一个方面,对于在货架或者购物车里的物品,最好收集自己的数据,因为我们要确保图像数据是来自各个角度的。

  在建模之前,建议对数据进行强化,比如使用图像处理库如PIL(Python Imaging Library)、OpenCV(跨平台计算机视觉库)对图片数据进行处理,以产生不同亮度、大小、旋转方向等的额外图片。这样处理能够生成大量新的样本让模型更加稳健。

  我们可以使用 Python开发的labelimg(图片标注工具)来实现并且用Qt(Qt Company开发的跨平台C++图形用户界面应用程序开发框架)开发界面。

  这是一个非常好用的工具,使用PascalVOC格式(图像识别和物品分类)创建注释可以很容易用Tensorflow Github里分享的代码生成TFRecord 文件(Tensorflow图像数据格式)。

  在建模的时候你需要做的一个重大决定就是选择物品检测模型。在COCO数据集上训练过的最新模型如下:

  识别速度和准确率之间总是效益相悖难两全的。个人认为对于实时的手部检测,最好使用SSD模型(Single Shot Detector单次激发检测)或者更快的RCNN(区域卷积神经网络)。而对于货架或者购物车里的物品我更愿意使用识别慢一点但准确度更高的模型如Faster RCNN Resnet(快速区域卷积神经网络残差网络)或者Faster RCNN Inception Resnet(快速区域卷积神经网络初始残差网络)。

  在构建完第一个版本的无人超市后,你就要进入漫长的改进阶段了。没有模型是完美的,随着你的测试,你自会发现它的不如意之处。接着你就要用你的直觉来判断,这些不足是否能被消除,以使模型更精准:或许你应该使用另一个模型,又或许,根本没有模型能得到你期望的准确度。如果幸运的话,你只需要增加训练数据的样本量来提升模型的性能。

  读完这篇文章,是不是觉得无人超市也没有想象中的那么神奇了呢?当然了,无人超市背后的技术远不止计算机视觉,无人超市的真正落地也依旧存在了各类技术难点——亚马逊的无人超市至今仍处于员工内测阶段;阿里和京东的无人超市虽然率先向公众开放,但顾客体验却也不敢恭维。如果你等不及无人超市的大规模落地,那就从这篇教程出发,自己先开上一家简易版的无人超市吧!

  普罗米修斯给了人类火种,它既温暖炫目,又危机四伏。亚马逊和阿里也给无人零售点了一把火,这把火带来的是希望还是毁灭呢?市场火热去年12月亚马逊推出线下无人售货便利店——AmazonGo,顾客选好自己想要...博文来自:yangdashi888的博客

  人工智能一浪接一浪地席卷全球,AI的其中一个重要分支——计算机视觉,也如雨后春笋,不断涌现出新的想法和应用。人脸识别已经逐渐渗透我们的日常生活,红姐统一图库通天报。机器能够认准人脸,想必大家都有所耳闻;而另一类计算机视觉...博文来自:IT技术精选文摘

  夏乙问耕编译整理量子位出品公众号QbitAI无人超市,未来趋势。上面这段视频,展示了逛亚马逊的AmazonGo无人超市是种怎样的体验。毫无疑问,一个完善的无人超市需要复杂的技术支撑。现在,挑战来了。...博文来自:量子位

  实战七:手把手教你用TensorFlow进行验证码识别(中)目录准备模型开发环境生成验证码数据集输入与输出数据处理模型结构设计模型损失函数设计模型训练过程分析模型部署与效果演示四、模型结构设计1.图像...博文来自:Mind_programmonkey的博客

  实战七:手把手教你用TensorFlow进行验证码识别(上)目录准备模型开发环境生成验证码数据集输入与输出数据处理模型结构设计模型损失函数设计模型训练过程分析模型部署与效果演示一、准备模型开发环境1....博文来自:Mind_programmonkey的博客

  实战七:手把手教你用Tensorflow进行验证码识别(下)目录准备模型开发环境生成验证码数据集输入与输出数据处理模型结构设计模型损失函数设计模型训练过程分析模型部署与效果演示七、模型部署与效果演示1...博文来自:Mind_programmonkey的博客

  一:Git是什么?    Git是目前世界上最先进的分布式版本控制系统。二:SVN与Git的最主要的区别?   SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而干活的时候,用的都是自己的电...博文来自:u011494050的专栏

  购买课程后添加小助手为好友(微信ID:csdn02)加入课程讨论群。AI100特邀阿里2017云栖大会APISolution大赛一等奖团队的联合创始人智亮先生,他将给大家介绍当前图像识别领域中先进的深...博文来自:ai100的博客

  实战三:手把手教你实现物体识别一、基于Haad+Adaboost实现人脸识别1.原理介绍(参考下面的博客文章)博文来自:Mind_programmonkey的博客

  实战四:手把手教你实现数字识别一、KNN实现数字识别1.原理最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全分配时,便可以对其进行分类。但是怎么可...博文来自:Mind_programmonkey的博客

  手把手教你做人脸识别和关键点检测(基于tensorflow和opencv)人脸识别和关键点检测这是我的第一篇博客。写这个博客的原因,是最近一直有点丧,突然觉得在舒适区呆习惯了,想做一点突破。自己最近一...博文来自:weixin_44936889的博客

  手把手教你玩转OpenWRT路由器系统,视频教程合集以NewifiD2(新三)路由器为基础,录制了OpenWRT系列视频教程,欢迎观看。《【视频教程】手把手教你用虚拟机安装ubuntu操作系统》《【视...博文来自:XinAncao_的博客

  手把手教你搭建caffe及手写数字识别(Ubuntu下且附mac纯通俗教程)博文来自:gdfyug的博客

  手把手教你做python无人驾驶车辆控制之车辆运动学模型(一)博文来自:weixin_39549161的博客

  机器学习零基础?手把手教你用TensorFlow搭建图像识别系统(一)干货博文来自:chaihuimin的专栏

  首先推荐一门课程,中国科学技术大学罗昭锋老师主讲的《文献管理与信息分析》,附上下载地址电子资源/database/9-工具软件/然后上传...博文来自:的博客

  一:Git是什么?Git是目前世界上最先进的分布式版本控制系统。二:SVN与Git的最主要的区别?SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而干活的时候,用的都是自己的电脑...博文来自:daisy的博客

  手把手教你TestComplete_验证码识别    今天blog开张,来个重量级的,我想需要这个的人应该还是挺多的。 在日常测试工作中,通常打开浏览器之后就是登录,为了避免灌水或者工具的黑客行为,现...博文来自:Testingba工作室

  恭喜你完成了自己的C语言编译器,本章中我们发一发牢骚,说一说编写编译器值得注意的一些问题;编写编译器时遇到的一些难题。本系列:手把手教你做一个 C语言编译器(0):前言手把手教你做一个C语言编译器(1...博文来自:benpaobagzb的博客

  人脸识别介绍平台环境需求技术点系统流程细节设计人脸检测人脸关键点定位人脸特征提取模型的训练模型的部署MySQL数据库的使用MFC工程的搭建软件使用人脸识别介绍人脸识别技术是一项非接触式、用户友好、非配...博文来自:Tonyfys Blog

  Markdown是什么?顾名思义mark嘛,down嘛。就是记下来呗。其实从学术上来讲,它是一种标记性的语言,以“所见即所得”著称。它是以内容浏览为核心的。其语法以及格式可谓是超级超级的简单,基本上几...博文来自:weixin_33762130的博客

  手把手教你使用AndroidStudio开发手机管家视频教程 下载地址:百度网盘博文来自:weixin_44216004的博客

  手把手教你如何用Jenkins自动化部署项目博文来自:libusi001的博客

  前言每当看到别人精美的个人博客时,不知你是否有一点点的羡慕。别急,现在我就来手把手教你搭建自己的个人博客。在技术日趋成熟的今天,有着很多种快速生成博客的框架:Hexo,Jekyll,Wordpress...博文来自:catalinaLi的博客

  手把手教你搭建caffe及手写数字识别作者:骁哲、李伟、小蔡、July说明:时间:一、前言  在前面的教程中,我们搭建了tensorflow、torch,教程发布后,大家的问题少了非常多。但另一大框架...博文来自:结构之法 算法之道

  今天打开发现垃圾邮箱又有一封钓鱼网站的邮件,本来准备要随手删掉,可想到可能还有人不知道什么是钓鱼网站,那今天就手把手实例讲解一下,你的邮箱和银行密码是如何被盗的。先说一下什么是...博文来自:a930716的专栏

  授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!

  我分析了2万条饿了么、美团红包记录,这些是红包最多的APP(附数据集)

  我们可以从Alexa语音助手的错误中学到什么:用户对话界面的设计性挑战

  只看视频不动手的你可能学了门假课程,李飞飞计算机视觉成名作斯坦福CS231n作业详解重磅来袭!

  luopeng12345:博主您好,小白才接触这里,想问个问题: 1、图中不同颜色的点聚集在一起表示什么? 2、比如采用您的算法将我提取的68张人脸照片的128维数据作为data输入,然后随着我把数据从(128,68)增加到(128,100)点的颜色也增加了,这说明找到了更多的主成分吗? 3、www.40167.com。相同颜色的点没有集中聚集就说明 降维效果不好吗? 希望能得到博主的回复,最好的祝愿送给博主!

(责任编辑:admin)
相关内容:
Marcus十大理由质疑深度学习? AI大事件 胶囊网络的TensorFlo AI迷路了怎么办?Facebook正在 2017 NIPS 哪家强?我们统计了 机器学习先驱清华演讲:计算思
服务评价  | 诚聘英才  | 友情链接  | 联系我们  | 投诉建议
版权所有:95160商旅网
香港马报生肖图| 香港六合现场开奖结果| 管家婆心水论坛| 特马生肖走势图分析| 香港2018直播开奖记录| 香港最快开奖现场直播| 心水论坛高手资料大全| 彩图信封脑筋急转湾| 霸王龙六合网| 彩霸王玄机单双各四肖|