佳都科技正式跨入人工智能“世界杯”第一阵营

亿欧网 06-19

近日,佳都科技凭借着领先的视觉深度学习技术,在计算机视觉识别领域的顶级赛事 WebVision 竞赛中位列前五,跻身国际第一阵营。

据了解,WebVision 竞赛是 2017 年成立的新的大规模图像识别任务权威挑战赛事,由 CVPR ( IEEE Conference on Computer Vision and Pattern Recognition 的缩写,即 IEEE 国际计算机视觉与模式识别会议 ) 组织、Google 协办。Webvision 2019 数据集包括 5000 类,1600 万张图片,数据量庞大,训练识别难度大幅增加。今年共吸引到全球 154 只参赛队伍参赛,涵盖众多顶尖科技公司和知名高校,佳都科技以 77.92 的优异成绩入选前五,仅次于阿里、商汤、华为、百度。

图片来源:WebVision 官网

人工智能 " 世界杯 ",WebVision 逐步接棒

人工智能由 " 深度学习 " 技术所驱动,尽管目前看来,深度学习技术表现非常出色,但其需要大量的标注数据来支持。多年来,ImageNet 数据集已被视为评估大规模计算机视觉算法的基准,ImageNet 的数据集是人工标注和平衡的干净数据,但其花费的人力成本是巨大的:通过近五万人,耗时两年多时间,标注数百万张图片数据。

而 WebVision 用于计算机的训练数据都是从互联网通过以词搜图的搜索引擎爬取,并未经过人工标注或筛选,数据包含大量噪声——图片与其标签或类别不符的 " 脏 " 数据,且不同类别之间的数据量差异之大可达三十倍。这极大增加了使用深度学习算法训练模型的难度,对深度学习算法的提升有更大的帮助,却更加贴近于实际应用。商业、金融、医疗等领域拥有海量但缺乏专业人士标注或标注不统一的数据,对人工智能技术的落地尤为关键。

" 非人工标注 " 数据的获取成本要低很多,可是对深度学习算法的要求却非常高,传统的 " 有监督 " 学习已经不适用,而半监督学习(Semi-Supervised Learning)则成为主流。ImageNet 的既定数据库已经很难使深度学习算法获得突破性进展,因此,人工智能 " 世界杯 "ImageNet 挑战赛退役,由 WebVision 接棒。图像识别比赛不再停留在处理 " 实验室 " 干净样本数据中,而是开始挑战极度不平衡且有噪声的互联网图像识别,真正走向实际应用场景。

本次竞赛,佳都科技采用类半监督学习方式,利用噪声数据直接训练粗模型,基于粗模型对训练数据分配权重,再利用加权的数据训练精模型,逐步引入噪声提升模型的泛化性。训练模型采用数据融合、标签平滑、零 gamma 初始化、混合训练等策略提升训练精度,并且,采用残差网络及其变种作为基线网络。

具有佳都特色的 " 自主研发 + 协同创新 " 的研发体系,正在发挥威力

佳都科技是专业的人工智能企业,专注于计算机视觉领域,人脸识别静态识别率高达 99.9%。实际商业应用才是图像识别技术商业化落地的关键,佳都科技人脸识别技术已形成一系列产品和解决方案,落地于轨道交通、公共安全、城市交通、A.I. 创新应用多个航道,实现 A.I. 与主赛道业务的深度融合。

一直以来,佳都科技坚持 " 技术立身 " 的