数据标注公司的相关调研

AI行业现状

目前人工智能行业大热,各种AI项目如火如荼,虽然较之前行业的态度已经冷静了许多,很多项目都到了真实落地的阶段,但人工智能的前景依旧被绝大多数人看好。

机器学习的大头在训练数据集的采集和标注上,数据这块的成本也占了30%以上。很多大中型的企业会留存用户的很多数据,而这也是他们主要的原始数据资料来源,而对于其他的玩家以及那些想要研究点不一样的算法的玩家,就会寻求外部的数据采集,有可能是直接买,也有可能自己或者找外包进行采集和标注。

因为数据标注的需求众多,也因此顺势生成了一条数据标注产业链,大量数据标注公司如雨后春笋般出现,为AI企业提供数据标注服务。这就正是“人工智能”大业中至关重要的“人工”这部分。但如果“人工”数据这部分把握不好,那可能就是人工智障了。

目前数据标注的类型主要是图像、语音和文本三大类,涉及到的大家比较耳熟的领域有人脸识别、无人驾驶、智能客服等。

数据标注的方式

对于AI企业来说,在行业竞争如此激烈的情况下,数据标注的成本和数据质量控制就显得尤为重要。

财大气粗的公司会直接自己开发标注工具、自己雇佣实习生去标注、自己雇人质检,这样做获得的结果目前来看是最好的,但是其中所付出的巨大的人力成本是我等中小玩家承受不了的,毕竟开给算法人员的工资还得那么高对吧?

对于资金不那么充裕的长尾企业来说,选择数据标注外包是最好的方式,那么到底外包给谁?谁的性价比最高?

数据标注公司调研

之前有看过CSDN上的一篇博客——《AI发电厂——数据标注公司(国内数据标注公司服务调研)》,在此基础上我们又问了几家目前百度能直接搜出来的公司,应该是比较知名的吧,另外还有一些比较偏的渠道找到数据标注团队(为了省钱不择手段),反馈如下,仅供大家参考:

  1. 龙猫数据

百度搜索里龙猫数据的广告一直排名第一第二的位置,再加上有朋友聊到,近日龙猫数据发布文章表示新推出开放平台的新服务模式,号称可直接和数据标注团队对接从而节约支出成本30%,出于好奇了解了一下,结果只是我们提交需求,自己定价,然后把数据交给龙猫的人,再由他们发布给众包团队。因为是零散的众包人员标注,所以不存在宣传所说的直接对接,龙猫建议把价格定高一些,否则标注人员可能不会做?另外,还要收取30%的服务费???那我的降低的30%的成本降在哪儿了???

  1. 倍赛数据

联系之后,因为订单金额不够被拒,不过听说近期会推出saas版的数据标注平台,还不知道怎么样,可以期待一下。

  1. 百度众测

百度毕竟打出了“All in AI”的口号,内部的数据标注需求应该很多,可能也是因为这个原因没有反馈吧。

  1. 京东众智

听说京东众智只接受5w以上的数据标注订单,所以也就没有报太大的希望,但是还是问了一下,居然接了?不知道是不是因为接到的项目太少,所以连小项目也开始接了,给我配的客户经理说是京东众智的开放平台现在在内测阶段,可以让我的项目试一下,然后给我找了两个团队给我报价,分别是0.07/框和0.08/框,但是需要我自己去管理项目,他们就不参与了,所以也没有收我额外的费用,虽然现在功能还是有很多不好用的地方,但是价格相对合理,所以就先用着了。

  1. 数据堂

订单金额达不到要求,被拒绝了。

  1. 某不知名的数据标注淘宝卖家

这个应该直接是数据标注外包团队,但是不知道如果数据给他们的话会不会再转包出去,给我的报价是0.15/框,真是贵啊…

所以最后成交的是京东众智,小订单真的是处处碰壁啊,不过也可以理解项目管理的人员成本可能比较高,这个行业本身的利润空间可能就不大。但是还是想表扬京东众智和我对接的项目经理姐姐!实在是太有耐心了!除了线上操作的部分,从开始沟通到项目正式运行期间的过程非常顺畅,令人满意!

不过也有令人费解的地方,直接让客户和标注团队接触了,他们这么做的意义是什么,难道不怕直接撇开他们吗?对于他们这种模式是否能走得更远还存疑,不过就目前来看,对于我们这些提需求的人还是很好的。

以上的调研结果是基于我目前的需求情况,不同的需求询问的结果会有偏差,建议大家多方询问再进行比较。

猜你喜欢

转载自www.cnblogs.com/xiaohuangya666/p/10894221.html
今日推荐