现代光电测控及仪器实验室
通用链接 English 手机版

深度学习的加速器——AI数据采集标注平台,即将面向用户开放

发布时间:2019-06-14 点击次数:

近年来,由于深度学习强大的特征学习能力,使其在机器视觉的高级和低级任务中都取得了巨大的成功。众所周知,监督学习离不开数据标注(图像标注、视频标注、语音标注、文本标注和3D点云标注等),数据量的大小很大程度上决定了算法性能的上限,所以有效的训练数据是模型准确性保证的关键。当前进行数据标注多为单机、离线、人工的标注方式,这种方式不仅耗时耗力,而且无法保障标注数据的质量。

摩米视觉标注系统登录界面

摩米视觉实验室在进行深度学习算法开发过程中也遇到类似问题,因此开发了一套基于云计算的AI数据采集标注在线平台。该平台基于SaaS云计算模式,集成了物联网网关功能,支持样本数据自动云端采集和监控、支持千万级别海量样本库存储、支持多机构多用户同时在线标注,具有智能标注功能,同时支持标注任务分发、标注审核、标注员任务完成量、标注质量统计。本平台不仅弥补了线下标注数据多人协作困难、采集困难、数据易泄露等缺陷,而且能够极大地提高深度学习算法模型的训练效率。


作为国内最先实现复杂粪便环境下显微细胞智能识别的实验室,我们一直在持续关注临床应用中识别准确率的提高,基于该平台已完成医院检验科白带检查机、粪便检查机中镜检有形成分百万+级的数据集标注。在此数据集的基础上开展相关研究后,样本识别准确率提高了10个百分点,位居行业领先水平。图片

平台在线标注界面展示


目前,我们将该平台的功能进行了进一步完善,计划将其对外公开上线,主要针对两类客户群体进行开放:


面向深度学习研究机构开放:对于在深度学习开发过程中存在批量框图困扰的单位或部门,都可以基于这个平台完成相关的标注任务。若现有数据标注功能无法完全满足开发需求,我们可以对平台功能进行升级定制,从而解决深度学习研究数据源的样本真值(Ground Truth)标注问题。


面向普通用户开放:采用按量标注、薪酬补助的方式吸引大量用户参与数据标注,以在短时间内即可完成大量的数据标注任务。目前,平台已经积累了一定量的兼职标注用户群体,尤其欢迎具有相关专业知识背景的用户。图片

    

深度学习标注平台管理后台