聊聊我作为计算机视觉工程师的日常工作,一个项目搞了几个月....

计算机视觉是一个大方向,应用场景非常丰富,包括但不限于美颜、人脸是被、医学影响、安防监控、视频理解、无人驾驶、虚拟现实等等。

除了这些经济效益很大的应用之外,还有一些经济效益比较小的应用。比如改作业APP,处于不同场景的计算机视觉工程师,工作是有大区别的,像我自己加上实习,做图像大概有六七年了吧。算是累积了一些经验,但是我依然是一个非常普通的程序员。除了自己做过的业务,其他场景也不太好妄言。

接下来我想介绍一下曾今参与过的一个项目。

经过我与多位一线工程师确认,这个项目涉及到的工作,具备一定的囊括性。也就是说,这里面涉及到的工作流程和技术栈,是具备通用性的。

我曾经在一家安防企业做了2年,这是一家设备商,客户需要在林区瞭望塔安装摄像头,实时监控森林火灾的情况。这里面涉及结构、硬件、软件和图像处理,因此不同岗位存在协作问题。我和同事主要负责图像处理和硬件部分,拿到需求之后首先开会分析业务场景,显然这是一个2D图像的检测识别问题,目标是明火和烟雾,目标和背景都是复杂多变的,且只有少量数据。

当时深度学习已经开始火起来了,深度学习号称人工智障嘛,没有数据就没法搞,我看到客户提供的数据太少了,按照惯例,就用谷歌搜了一波公开数据集。搜到了一点,但是和我们场景差别比较大。另外考虑到端侧部署,就拟定采用传统图像处理技术来做。

思路敲定之后就开始弄了。

首先在网上疯狂搜索相关业务场景的论文,找到一篇英国剑桥大学发的SCI文章,用的也是传统的图像处理方案,下载之后丢到谷歌翻译成中文,花了半天时间读完之后,发现并不是适合我们。没办法,只能继续找,又找到一篇美国康奈尔大学发的一篇文章,同样研读评估之后,发现比较适合我们,于是我们就开始了复现。

在实验阶段,用Python的opencv捣鼓了几天,包括各种预处理,混合高斯模型、形态学处理、小波变换等等,折腾了一遍终于有一个小的demo了,测试了一下,效果还行,终于松了一口气。然后把这个demo用C++写了一遍,放到一个linux工控机里面跑,顺便给客户展示了一遍,在客户带领之后,到一个森林公园进行测试。

可是结果却敲了我一棒子,在公司还不错的demo在实际环境下立马崩溃,惨不忍睹。没办法,只能回到公司重新分析数据,跟客户更多的业务逻辑沟通,找相关论文,重新写代码。调BUG,调各种模型的参数,来来回回的尝试很多次,最后又跑了一趟林区测试,结果还是不行。

因为我们在测试的时候是中午,阳光比较火辣,极端光照环境下我们的烟雾检测模块直接崩溃了,完全不可用.....

注意,前面讲述的工作内容,涉及一些同学们需要掌握的通用技能,python、C++、Linux、opencv、传统图像处理技术,以及论文筛选和复现,还有就是搞图像都要懂的一个尝试,无论你的算法模型有多先进,无论你是传统模型还是深度学习模型,光照问题会让你立马凉凉。

OK!到目前为止,已经过去了几个月,连图像算法都没搞定。

感觉自己已经竭尽所能了,可就是无法应对一些极端环境下的测试。我们部门老大是港大的博士,还不是一样没有办法,这玩意不是拼智力,是拼体力的吧。我仿佛看到了我的同事头发又掉了几根,又摸摸自己的头发,还好,没怎么掉,还是那么帅!

未完待续...........(后来是解决了,下次有空再更新)

免费分享一些我整理的人工智能学习资料给大家,整理了很久,非常全面。包括一些人工智能基础入门视频+AI常用框架实战视频、图像识别、OpenCV、NLP、YOLO、机器学习、pytorch、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文等。

下面是部分截图,文末扫码加我免费领取(AI技术问题我也可解答一二)

目录

一、人工智能免费视频课程和项目

二、人工智能必读书籍

三、人工智能论文合集

四、机器学习+计算机视觉基础算法教程

 五、深度学习机器学习速查表(共26张)

学好人工智能,要多看书,多动手,多实践,要想提高自己的水平,一定要学会沉下心来慢慢的系统学习,最终才能有所收获。

点击下方名片,扫码免费下载文中资料。

猜你喜欢

转载自blog.csdn.net/gp16674213804/article/details/126480108