卧槽!AI 质检竟然还能这么玩???

公众号关注 “GitHubDaily”

设为 “星标”,每天带你学编程!

随着 AI 技术的逐渐成熟,越来越多的企业希望借助 AI 技术,实现智能质检。

传统质检更多依靠有经验的人工劳动力来实现质量检查甚至分拣,但这样的方式,许多场景会有检查效率低,审核质量不稳定,人力投入成本高且难招聘等诸多问题。那么,企业如何快速实现智能质检?

斥巨资组建资深 AI 团队?需要投入的资金和时间都是巨大的,一般企业很难承受;

找 AI 巨头定制方案?定制费和定制灵活性通常成正比,对于中小企业来说很难取舍;

因此,寻求使用门槛低、可贴合自身业务需求定制 AI 模型的工具,培养自己的 AI 工程师,成为众多企业的诉求。

5 月 13 日 - 15 日,AI 快车道 —EasyDL 产业应用系列质检主题公开课,连续三天开课,完整解析业务场景和定制 AI 软硬一体解决方案,小时级成功变身 AI 应用专家!

EasyDL 是百度大脑面向企业开发者推出的零门槛 AI 开发平台,提供智能标注、模型训练、服务部署等全流程功能,内置丰富的预训练模型,支持公有云 / 私有化 / 设备端等灵活部署方式。EasyDL 已在工业、零售、制造、医疗等领域落地。

课程摘录如下,完整视频和实录内容,请访问 EasyDL 论坛查看(文末有入口)

主题:医药物流中的药盒检测软硬一体方案

时间:2020 年 5 月 13 日

讲师:浙江工业大学信息工程学院 付明磊、百度高级研发工程师 哈利

亲爱的各位朋友大家晚上好,我是来自浙江工业大学的付明磊,非常荣幸能够参加 AI 快车道 EasyDL 应用产业系列公开课。今天我分享的是医药物流行业分拣现状及痛点与 EasyDL 检测软硬一体方案。

今天我会首先介绍医药物流行业分拣的现状和痛点,再重点讲解如何使用 EasyDL 专业版进行检测模型的定制和部署。

现在我国各地区均建有医药物流配送中心,来对接各大医院和药店。根据售订次数和订货量,我们把药品分为 A、B、C 三个等级:其中 A 类实物量少,但是价值高,出货方式是整箱出货;C 类药品品种多,实物量多,价值低,往往是零散出货,B 类在 AC 之间。今天分享的就属于 C 类分拣,出货量大,但是出货频率低,以往都是人工分拣方式,并且每个供货分拣的区域比较大,这种人工分拣加人工复核的方式,使得药盒分拣效率低。

近年来,随着互联网医药的快速发展、医药流通市场的逐步规范,以及两票制推行,我们的医药物流显现出两个明显的特点:第一是拆零占比大,也就是说整箱药品被拆开进行零散分拣的比例越来越大;第二就是订单的碎片化程度高,因为我们可以看到,有越来越多的药店可以从医药物流企业进货,这种商品的分拣和复核给物流企业带来了巨大压力,因此采用机器人替代人工复核的呼声越来越高。

药盒检测是我们实现机器人分拣的技术难题之一。我给大家介绍三点原因,第一就是药盒的种类非常多,现在在我国最新的医保目录内药品有 2643 种,目录外药品更多,我看到一个数据,我们国内现在各类药品加起来可能超过了 10 万种,而且不断有新药在研发。第二,药盒检测的背景比较复杂,大家可以看到中间这张图,药盒是分层堆积在药箱里的,下层会对上层的药盒产生比较大的背景干扰。第三,要求检测速度比较快。正是因为这三个原因,所以药盒检测对我们工厂是有难度的。

随着机器学习,特别是深度学习在复杂数据上的表现越来越优秀,很多企业希望把人工智能的方法、深度学习的成果应用到自己的产品和服务中。但是,即使使用了预训练模型或者开源框架,对许多不了解深度学算法的人来说仍很有挑战,另外机器学习不是产品的核心技术,而我们需要额外维护深度学习的算法团队,付出的成本也是非常高。因此,需要找到一种能够快速使用,高性能,深度学习,而成本低廉的方法。

那么,使用 EasyDL 如何开发专业版的药盒检测模型呢?

总体流程是这样的:

首先我们需要分析业务需求,EasyDL 专业版里支持图像分类,物体检测,文本分类,短文本匹配等六种模型,对药盒检测而言可使用的是物体检测模型。

第二是准备数据,这个环节看上去很枯燥,但是大家一定要重视,在这个环节我们需要完成的是数据上传和数据标注,但是大家一定要注意,我们给模型提供的数据需要尽量与真实数据场景一致,比如说我们在药盒检测时候,我们的机械臂上使用的是英特尔的,我们在进行药盒采样和药盒原始数据集也都是用这个采集的。

第三是创建项目,大家要根据自己的习惯和开发方式选择,刚才也提到了,这里支持脚本调参和 Notebook 两种方式。第四就是配置任务并启动训练,在这边我们需要配置训练集和评测集,评测集是可选的,需要选择预训练模型,大家可以根据自己的需要、训练精度和预测的时间等来选择预训练模型。

现在物体检测有四种模型,之后就可以启动训练,交给百度的云平台后端进行训练。完成模型训练以后,我们可以通过模型训练的评估结果给出的评估报告,查看评估效果,大家也可以用测试集进行实际测试,看看这个模型能不能满足自己的训练要求。在这个过程中,EasyDL 支持数据闭环,可以持续快速优化模型效果。

主题:如何使用 EasyDL 实现零件瑕疵质检

时间:2020 年 5 月 14 日

讲师:广西科技大学物联网工程专业导师 李炜、百度高级研发工程师 木木

李炜:大家好,我们开始今天晚上的分享。

我是来自广西科技大学物联网工程专业导师李老师,我今天想要跟大家分享一下如何使用百度 EasyDL 经典版来定制喷油器阀座质检的模型,开始之前我想跟大家介绍一下,我比较喜欢有互动,如果大家能发弹幕,我们在分享的过程中也能够做及时沟通,如果没有人发我就只能自己编弹幕了。

我的分享主要分为两个部分。

第一部分是我们做喷油器阀座质检项目的一些简单的介绍,就是这个项目的来源和项目的难点、痛点在哪里。

第二部分就是给大家介绍一下使用 EasyDL 平台经典版部署一个喷油器阀座质检的模型,结合我们的分拣机械臂使用。

我要介绍的是一个校企合作的项目,我们的合作伙伴是柳州源创电喷技术有限公司,它属于汽车产业中的配套环节,生产汽车喷油器,它在整个汽车发动机里是很关键的部位,设备有着相当高的壁垒,长期被国外的企业把持住,源创电喷技术有限公司突破了这个壁垒,能够大量生产汽车和摩托车的喷油器,所以也是属于一家高新企业。

我介绍一下具体的项目。在传统的人检过程中,这个阀座是喷油器当中非常关键的环节,它有点像螺丝帽,所以我们要把这个类似螺丝帽外层和内部通道的瑕疵检测出来,所以我们分为两个步骤:

第一个步骤,先对它的内层瑕疵做检测,用一个摄像头采集,上传到平台上检测。第二个步骤是对外层瑕疵做检测,检测完以后再进行一个复核检测,最终完成了这个检测过程,传统就是靠肉眼去做检测的。

在这个检测过程中遇到了很多问题,这些问题都是常见人工视觉检测遇到的问题,比如长期做一个动作容易疲劳,注意力容易不集中,也会导致效率低。

我们在实际工厂需求调研的时候,发现检测工人在检测到一段时间必须要起来走动一下,视力会感到疲劳。而且随着人工成本不断增加,企业在这个环节需要投入的成本需要提高,并且检测生产率也相对不是很高。

目前市场上能够检测的这些设备都是非常昂贵的,都需要做到定制化,少则就要十几万,像康泰斯这样的企业,它还是做大的设备,就是广泛平台的。如果想要适配每一种阀座,它的设备研发成本是非常高的。所以我们想通过自己去做检测算法,就是用人工智能,尤其是深度学习的这些办法做检测,确实也能达到很好的效果。

这个是我们在设计过程中,用深度学习方式做的集成的自动化检测流程。

首先第一部分就是通过一个抖料盘,不断的把零件抖动到上料等待区,有一个上料机械臂夹取零件放到摄像头等待区域,采集好以后我们用下料机械臂把零件放到等待区当中,在这个缓冲的过程我们会上传到 EasyDL 平台,然后会有一个 API 接口,我们会调用,再进行分类,就是上传识别,识别完以后我们就会进行分类,这是分类的分装盒。

我们的硬件设计的思路就是有几个组成部分,一个是上料机,第二部分就是机械手,分为两个,一个是上料机械手,一个是下料机械手。因为我们是要实现内外层的识别,所以我们会用到双摄像头的方案,现在我们在后期的更新当中,找到了一些大景深的摄像头,我们最后使用单摄像头进行数据采集和识别。最后在等待区当中就是等待识别结果,然后进行分类,这是我们硬件的设计方案。

软件方面,主要是依托我们的 EasyDL 平台,EasyDL 平台在训练模型上,因为它的底层系统设计的非常完善,可以快速上传训练集,然后进行标注,标注好了以后可以一键式地训练模型。第二步,需要我们做一个硬件的控制,有很多种方式,我们选择的是 Qt 软件。

在设备兼容器上来说是非常好的,我们可以针对不同的阀座训练不同的模型,我们可以在 Qt 软件通过调用不同模型接口实现多种类型的检测,这么设计我们的 UI 界面也非常的人性化,操作起来也特别简单。

在我们使用机器检测以后,和传统的人工检测相比,我们可以在检测率和检测时间上和检测间隔上有一些区别。人工检测率上准确率由于人类的特点,人眼长期检测会有一些疲劳,容易造成一些错检,所以复检的准确率一般在 75% 到 85% 之间,机械检测正确率保证在 95% 以上,也跟我们的训练模型是有关系的。

这个阀座的检测上,检测时间机器慢一些,因为我们的机械结构决定的,因为要对内层和外层元件进行检测,要转动摄像头,所以生产节奏就被托慢了。检测的件数就不用说了,机器可以长时间不间断的进行检测,只要我们需要检测的物料能够持续供应,人工检测的话大概每天在 1000 到 2000 件左右。一会我和大家分享一下我的一些比较粗浅的看法。

我先讲讲我们训练的过程。

首先,我们要登录 EasyDL 经典物体检测模型平台,点击物体检测模块,点击前往。然后要在这个检测模型当中创建一个模型,比如我们叫阀座的检测,创建好模型以后会把真实采集到的样板进行上传,并在线进行标注,标注好了以后可以点击训练,平台就可以自动帮我们训练,然后还会提醒我们,有短信通知告诉我们什么时候完成这个模型的训练,当时使用的是云服务 API 这个方式调用,就是我们在实际生产当中需要联网,联网之后通过 API 调用识别结果。

当然在后期,咱们这里还可以选择设备端 SDK 的部署,服务器端 SDK 部署,以及硬件 EdgeBoard 的部署方式,这样的方式能实现离线预测,因为在实际生产当中,企业对于联网方式其实是不太喜欢的,首先是数据的泄露风险,第二个是在工厂当中要拉一条专线做联网,其实也是成本非常高的,在后期的实践当中我们也要推荐设备端的部署和 EdgeBoard 的部署方式。

主题:如何利用 EasyDL 进行视觉定位及生产质检

时间:2020 年 5 月 15 日

讲师:抖音 AI 网红 无魂胜有魂、百度高级产品经理 郑老师

无魂胜有魂:大家好,我是抖音上的无魂胜有魂,很高兴今天能在这里和大家进行交流。我后面可能会放一些幻灯片,可能有一些视频,在我的抖音号里也都有,也欢迎大家观看。

今天主要跟大家交流一下在生产加工中,可能会用到图像视觉以及图像定位进行质检,以及机械臂相关的一些应用的案例。

这是几个生产过程中遇到的场景,第一个,这个图是溶喷布在电子扫描显微镜下的图像的样子,要对溶喷布进行检测。第二是中药制剂,要把这些中药的颗粒煮成中药。第三个,这有一个锯,自动锯金属的圆柱,切成一片一片的。最后一个是 CNC 加工的机床,也就是所谓的数控机床,这是几个需要用到视觉定位的场景。

咱们再说一下传统工业里使用的视觉算法和现在 AI 算法的区别。

以前的视觉算法主要靠像素比对的方式,如果大家有进行图像编程可能知道,图像都是三个颜色,靠比对像素,也可以是 RGB 也可以是 YUV,也可以是其他的色彩模型,靠比对像素来判断物体是不是这个物体,或者说这个物体的尺寸,或者一些其他方面。

所以,这种编程方式比较复杂,至少一个程序员不仅仅是要会编程,还要了解各种色彩模型,还要知道各种几何算法,包括一些图像匹配的算法,就是很多的知识你才能开发传统方式的视觉的软件。

如果你们拍照片就知道,同样一张白纸,在白天日光下拍是白色的,晚上拿到室内的光线,如果家里灯光偏冷是蓝色,暖的话是黄色,读出来 RGB 的值就不是纯白色,或者偏黄或偏蓝,这是白平衡的问题,虽然可以纠正,但是或多或少还是有一些偏差。

有颜色的偏差读出来 RGB 值就是不一样的,所以你比对 RGB 的值就会有误差,就识别不出来。所以传统工业上图像识别方法都是对相机,对镜头,对灯光要求很高的。前两天我听一个朋友说,他们工厂以前花了几十万的视觉质检系统,由于灯光坏了,换了一个灯泡,当然不是我们一般见到的灯泡,灯泡就两三万块钱。

为什么呢,首先这个灯泡一定要白平衡非常准确,而且亮度也是非常准确的,比如在它的灯泡使用周期内,步入两年三年五年,光线是不能衰减的,这些才能保证用工业相机拍出来的相片,RGB 的值是始终稳定的,如果光线绳检,RGB 值变了,再进行像素比对的时候就识别不出来了,这也是以前视觉识别软件非常非常贵,因为开发很贵,相机很贵,灯光很贵,镜头也很贵,甚至镜头要经常擦,比如在高的粉尘下都无法使用,后面我会有一个视频专门讲拍相片即便不准确,AI 算法也可以比较准确的识别。

EasyDL 有一个特点,它是一个定制识别的模型,它可能和之前接触的通用模型不一样,比如拿手机识别,这是一本书或者一只猫、一只狗,和这种情况不一样,因为在工业场景中,通常是在固定的环境下,比如只在这一个机器或者检测的位置上,一个模型我只需要辨别这一个物体或者几种情况就可以,我不需要把所有用到的物体都集中在这一个模型中,所以它是定制识别,就很少受到模棱两可情况的干扰,所以识别精度能够更高。

EasyDL 还有一个好处,你只要训练一个图片集,可以有多种部署方式,从比较简单的云端计算,到用 CPU 计算也可以,显卡计算也可以,还有专门的软硬一体方案。

显卡计算会比较快,而且显卡有一个优势,第一可以买二手显卡,你也可以买新显卡,用两三年以后可以二手出掉,所以显卡的硬件资源很多。只不过目前百度这边的 EasyDL 只支持 N 卡,还不支持 A 卡,如果你要进行视频识别,你需要很高帧率的识别,你可以用显卡也可以用水冷的方式,这个就跟前两年挖币是一样,肯定知道显卡散热的各种各样的方式。

还有百度 VMX 加速卡,特点就是功耗低,能够在比较低的功耗下提供相对比较高的运算能力,后面会有百度专门的高级产品经理详细介绍这两个产品。我只说一下我自己的体验,我觉得这个东西比较适合用在树莓派或者是无人机、小车,比如你跟随一个小车,用这个卡很方便,而且很节能,对电池要求也不高。

后面这个 FZLite 这个卡本身就是 LINUX 主机,里面预装了系统,只要把这个模型拷进去再进行编译和部署就可以了,识别我一般都用的最高精度的识别,也就 600 多毫秒,1 秒钟能识别接近于 2 张的速度,如果我是做一些定位的应用,基本上够用。并且后面这两种里面都包含序列号,也就是说你买了这两个卡以后直接就可以用,而且是无限制使用,不需要额外再付费,这是我自己觉得是挺好的,性价比挺高。

再说一个案例,就是小龙虾的测量,如果你们看了罗永浩的直播,罗永浩在第一次直播的时候卖的小龙虾,大家普遍觉得比较小,我也买了,我就用 AI 的算法对小龙虾进行了测量。

测量物体大小的时候有两种方法,一种是测量同时加一个标注物,你给它一个标准尺寸,给你要测量物体一个参照。还有一个方法,比如相机镜头和被测物体的距离全都是固定的情况下,也可以直接把像素尺寸转换成实际的物理尺寸,直接转换也是可以的,你一定要先解决这个才可以。

有两个体验,每个人都可以做一下,而且是不需要懂代码,不需要编程就可以体验,一个是饼干的质检,大家可以当成是饼干公司的工程师,在生产线上进行质检,可以找任何品类的饼干,掰开也行揉碎也行,拍不同的照片,传到图片集里进行标注,比如我这里把碎开的饼干和缺一块的饼干进行不同的标注,不同情况可能在后续的工序中进行不同的处理,碎开直接包到包装里了,如果是缺一块可能就要扔掉或者处理掉。

训练的时候可以选择高精度算法,专业版也可以选择 YOLO 网络,你还可以看报告,EasyDL 里可以验证,可以拍一些非图片集里的照片判断一下你识别的是否准确,如果不准确就再把这些新的照片也加进去识别,再重新训练一下模型就可以了。

郑老师:感谢无魂胜有魂老师的分享,我们训练模型的目的是为在实际项目中使用,而现在实际项目部署方式大概有两种,一种是公有云部署,一种是私有化边缘化部署。

公有云部署最大的优点是方便、省心省力。它可以进行集中式托管、有网络即可接入、无需搭建环境、通过 API 调用,可以说是非常便捷。但公有云也有存在很多限制,比如数据安全、网络稳定性、流量带宽成本等问题,所以许多项目真正落地都是通过边缘部署这种方式,更加的实时、稳定、方案可控。

下面我重点介绍 EasyDL 的边缘部署硬件 EdgeBoard。

EdgeBoard 是百度面向嵌入式与边缘部署场景打造的硬件加速方案,适用于机器视觉智能化监控与分析,具有高性能、低成本、使用简单等三大优点,可无缝兼容 EasyDL 模型训练平台。我们和世界最大的芯片厂商 intel&FPGA 芯片领域最大的厂家赛灵思合作,打造了两个系列硬件产品 ---FZ 系列和 VMX 系列。硬件形态上有盒子形态、计算卡形态、也有加速卡形态。

下面是 EasyDL 和 EdgeBoard 软硬一体方案的几张小图。我们可以看到有盒子、计算卡和加速卡三种硬件形态,他们的算力分别是 3.6T/1.2T/1TOPS,最便宜的型号 VMX 只要 699 元。这三款 EdgeBoard 已经对 EasyDL 图像分类 / 物体检测模型做了深度适配可应用于工业分拣、视频监控等多种设备端离线计算场景。

下面分别介绍一下这几款硬件。第一个是计算盒方案,是一款微型的边缘 AI 服务器。它有 FZ5 和 FZ9 两个型号。FZ9 目前在折扣优惠中,FZ5 含 license 只要 4169 元。单看解码能力,FZ5 版本支持 8 路 1080P 解码,FZ9 版本算力高达 3.6TOPS,含预处理耗时,resnet50 模型推理全流程可以做到 60 帧每秒。

在满足实际应用场景需求的前提下,相较于 GPU 服务器,他的价格做到了 20 倍的节省。计算盒的体积也特别小,长宽高只有 12105cm。质量只有 200 多克。特别易携带、易部署,功耗仅仅只有 10-25W。如果我们有物体检测分类相关的项目部署,我特别推荐买它,非常适用于视频监控场景、边缘化部署。

比如最近国家在推的名厨亮灶智能监控工程,一个餐厅后厨 2-4 个摄像头,配上一个盒子,在 EasyDL 上训练好模型后,即可直接使用,具有非常高的性价比和实用性。再比如电力施工监控,有些施工场所人迹罕至,交通极不便利,需要人工背负设备,并通过移动电源供电,这款盒子质量 200-300 克,功耗低至 10-25w,就非常合适。大家可以通过二维码了解更多关于这个产品的信息。

第二个产品硬件是 FZ 系列的 Lite 版,更低的尺寸、重量,也做到了更低的价格,含 EasyDL license 只要 1179 元起。

目前在 FPGA 实现的加速方案硬件领域内,很少有能和 FZ3 Lite 做到品质价格相当的产品,可以说是业界良心,当之无愧。这个价格也适合开发者、高校师生用来教学学习。

Lite 版自带 linux 系统,有丰富的拓展接口,比如 PCIE,JTAG,UART,GPIO 等接口,非常适合用来打造智能化设备,比如智能抓拍机、智能菜品识别电子秤等,可以作为这些设备的主控板,在部署模型的同时,也能用来开发一些轻量型的业务程序。

如果你想用来开发学习、打造智能化设备,推荐买它。同样,大家可以通过右下角的二维码了解更多硬件产品信息。

第三个型号,刚才无魂胜有魂老师介绍过,就是我们的这款 VMX 加速卡。采用了 intel myraidX 芯片方案,0.5-2.2W 功耗做到了 3TOPS 综合算力,1TOPS 神经网络加速算力。

极低的功耗,4CM 长宽极低的尺寸,通用的 Type-C 接口,非常适用于存量设备的智能化升级。VMX 是一款协处理器,它通过 Type-C 接口连接宿主机,可支持 linux/window 等宿主机,对安卓系统我们也在适配中。

含 EasyDL SDK 699 元的低价,不仅可以买来开发学习,插上个人电脑,就可以体验从模型开发训练到部署的整个流程,是 AI 学习利器。也可以用在存量设备的智能化升级里,无需更改设备,只要有 USB 或者 PCIE 接口,就能平滑实现智能化升级。比如说刚才说垃圾分拣这个设备还有无人机等。

好,这一页主要是把刚才讲的三个硬件的一些相关的参数放到一块进行对比。EdgeBoard 硬件形态形成了比较好的产品矩阵,普适于各种场景部署,大家可以扫描进行更多的了解,也可以在 QA 环节进行提问。

EasyDL 与 EdgeBoard 软硬结合方案,极大的降低了 AI 开发应用门槛。

我们只需要几个步骤就可以轻松上手 EasyDL 软硬一体方案,第一步在 EasyDL 选择对应的硬件方案 SDK 进行下载,如坐下有,下图所示,选择 EdgeBoard 硬件方案。

第二步可扫码购买或者搜索购买 EdgeBoard 软硬一体方案,购买后可通过 AI 市场订单详情或者 EasyDL 控制台获得序列号,之后按照文档进行部署、激活、调试效果,短短几个步骤非常简单。

主持人:好,时间差不多了,感谢两位老师。

现在给大家介绍一下软硬一体方案推出新的优惠政策,假如您现在想尝试一下 EasyDL 软硬一体方案,或者未来能用到,可以在 5 月 13 到 6 月 13 购买任意 EasyDL 软硬一体方案,可以获得专业版脚本调参等价训练时长。

比如购买一套 EasyDL-VMX 加速卡软硬一体方案,699 元,可获得软硬一体方案一套 + 专业版脚本调参 26 小时 GPU-V100 训练时长 / 32 小时 GPU-P40 训练时长 / 41 小时 GPU-P4 训练时长。换算一下基本就是五折优惠,也是史上最大的活动力度了。

QA 环节摘录:

Q: 物体识别数据标注是人工标注的吗?是不是能够上传已经标注好的数据?

A: 刚才明磊老师演示了数据标注的流程,就是需要进行人工标注。当然平台也是提供了智能标注的能力,用户只需要标注 30% 的数据,我们就可以把剩下的数据全部标注完。并且支持批量上传已经标注好的数据。可以多人同时标注。

Q: 能不能上传我们的用户代码,用户训练的自定义?

A: EasyDL 专业版支持两种训练方式,一种是脚本调参,我们会提供预制训练代码模板,用户可以提供修改。另外提供 Notebook 开发方式,在 Notebook 环境里用户可以完全自定义训练的代码,就可以任由用户进行发挥,Notebook 会提供一些算力,像 V100 之类的算力。

Q: 机械臂末端高度怎么控制?

A: 一个是很常见的机械臂的问题,我们也是根据实际的环境慢慢调起来的,采用了 ROS 中的 Moveit。

Q:零件的三种瑕疵检测模型,当时的数据集大概有多大?当时的数据有先做过什么处理吗?

A:我们自己采集了有几万张,具体我没有统计。但是这个数据集应该用了四五百张吧,就是我们实际在部署到实际生产环境当中的模型,训练了四五百张。

实际处理没有做过太多,之前因为数据集不够的时候做过一些黑白处理,做了分割处理,但是后来发现检测效果并没有太大的提升,而且在深度学习里有一个概念叫做端对端,有可能你做过处理以后反而不见得,相当于你把特征自己做了一个区隔,可能在神经网络当中,可能就少了一个维度的特征,也不见得是好事情。

Q:您这次零件瑕疵质检项目里用的摄像头分辨率是多少?

A:500 万,但是跟实际的采集有关系。

Q:您遇到过拍摄瑕疵的时候有光源反光的问题吗?

A:这也可以作为一个课题和大家分享一下。其实在目标检测这个领域,难的真的不是识别算法,首先因为这个算法是开源的。其次,像 EasyDL 平台或者谷歌的 Tensorflow 平台,它都能做到很好的检测效果,但是其实真正难的是在于你怎么采集到这个有效的数据,是非常难的。像刚才这个小伙伴问到光源反光,这个就完全不能工程运用,一旦反光,采集的东西是无效的,就没有办法做实施。

还有我们之前还接到一个案子,它是做汽车挡风板的,板子上有几十个点需要做检测,还有凹凸,它需要做智能检测的方案很大的成本都花在了采集图片上,首先我要多轴的机械臂技术数据的采集,因为要不停转换角度进行图像拍摄,这个成本是非常非常高的,有可能这个机械装置很可能比人工的检测成本高出很多,实际这个装置的生命周期可能三年,你要付出几百万,人工可能只付出几万就可以做检测了。所以在目标检测或者说视觉瑕疵检测里最关键是数据采集和数据标注上,后期的算法现在真的非常成熟,各家都有非常好的产品做支撑。

Q:机械臂如何视觉算法带动机械臂运动,如何对机械臂运动方向进行预判提高控制效率?

A:实际上我所有在机械臂的视觉识别都是在机械臂停止的状态下拍的照片识别的,并不是实时的视频的识别。也就是说我并没有做运行方向的预判,因为本身我用这款机械臂它是碳纤维集成的机械臂,比铸铁的机械臂钢性差一些,有一些震颤,如果在运动中识别精度是没有那么高的,因为有一些抖动。

好像拿着钓鱼杆,把摄像头放在钓鱼杆前面,拍出来的照片和运动轨迹可能不一样,所以我并没有做这个运动轨迹和图像识别的适配,我是靠多次识别进行的,机械臂逐渐的逼近要拿取的物体,也是解决了镜头机变的问题。最开始离的比较远,变形比较大,但是用三四回逐渐逼近物体,放在图片的正中间的时候我再进行抓取,这样也不用很复杂的算法就解决了,等于是一种暴力计算的方式来做的这个。这个问题就是这样。

Q:另外一个问题,计算卡和加速卡有什么区别?

A:FZ3 是带 LINUX 主控系统的,可以直接理解成一个小型电脑,在上面开发业务程序,进行业务控制。加速卡其实是一款协处理器,需要通过宿主机进行工作,和宿主机之间进行数据通讯,还有加速相关程序的调用。所以,我们往往说这个加速卡是能够给设备带来平滑升级的,设备不需要替换它的主控板,只要有相应的接口就可以使用我们的加速卡,然后把 EasyDL 的模型、Paddle 模型进行部署和调用。

Q:有同学问,模型可以直接推进到设备里吗?

A:现在的方案是,我们需要在 EasyDL 上进行下载的操作,这个操作下载到个人电脑上之后,可以通过文档里提供的部署方式,拷贝到设备里进行部署,这是一种。

同时,我们也在不断地优化这些硬件的易用性,近期在开发 EdgeBoard 管理系统,就是在设备的内部,可以做到可视化的把 SDK 通过界面操作部署到硬件里,并且这套可视化系统可以很好地和摄像头进行联动,通过视频的地址,网络摄像头的地址,把整套流程跑起来。

Q:还有同学问热量分布如何,散热有什么要求?

A:这个我回答一下。其实一个主板或者开发板它最主要的功耗的元件在主芯片,目前 VMX 这款卡我们做到 0.5W 到 2.2W 功耗,所以在售卖的时候基本上不需要带散热片甚至散热器,当然说局部温度可能会高一点,但是在实际的应用场景里我们可能会放到设备的腔体内,会做一些结构上的连接,让它更好的通过腔体散热。

FZ3Lite 这款我们配了风扇,实际功耗是 5 到 12W,很多时候不用风扇,我们配一个铝的金属散热片或者外壳也能做到被动式散热。盒子的形态散热比较高,我们采用的是主动散热的方案。

扫码查看完整视频和实录内容,或访问 EasyDL 论坛 — 质检主题公开课贴查看:

猜你喜欢

转载自blog.csdn.net/sinat_33224091/article/details/106233047