中华人民共和国国家发展和改革委员会

首页 > 专题 > 中国“互联网+"行动百佳实践
案例86.旷视科技:人工智能云计算平台,开启人工智能新生态
北京旷视科技有限公司
  导读:北京旷视科技有限公司以人工智能科学中的机器视觉为突破点,坚持用技术和数据驱动企业成长并积极推进人工智能商业化。旷视科技以先让机器看懂世界,再让机器真正思考为使命,希望赋能机器,用人工智能造福人类,通过搭建以“互联网+”为基础的人工智能云计算平台——Megvii Cloud,同时建立人工智能生态圈,推动人工智能技术产业化发展,为企业用户提供开放、全面的智能服务。通过大数据、云计算和机器学习技术使Megvii Cloud人工智能云平台能够和智能终端紧密融合并协同交互,Megvii Cloud能够为跨行业为不同领域的企业用户提供智能行业解决方案,帮助企业拓展、加强现有业务并完成数字化、智能化升级。

  一、基本情况

  (一)旷视科技简介

  旷视科技成立于2011年,是一家以机器视觉为核心的人工智能企业,自主研发的的视觉感知网络,智能硬件,智能云服务等产品技术居世界领先水平,2014年旷视科技被认定为国家级高新技术企业,2015年,被认定为中关村高新技术企业,经过将近五年的时间,公司迅速发展,现有员工220人。

  旷视科技的人工智能云平台(Megvii Cloud)与智能物联平台(Megvii SensorNet)两大核心产品,为企业用户提供全方位的行业智能解决方案和智能数据服务。其中人工智能云平台中的Face++人脸识别云平台已成为世界最大的人脸识别服务平台,每日调用量接近2000万次。

  目前,旷视科技产品及技术解决方案已经在金融、安防、教育、交通等重要行业领域中应用,已与包括中信银行、中国电信、国家公安部第一研究所、万科、阿里巴巴、清华大学、铁路总公司等龙头企业在内300余家企业、政府部门应用和合作,近三年已带来收入2287万元,利税200万元。

  (二)Megvii Cloud人工智能云平台项目说明

  Megvii Cloud人工智能云计算平台是一个商用的机器视觉和人工智能公有云计算平台,包含SaaS服务以及PaaS服务平台,为商业用户和独立软件开发商提供先进的识别、分类算法和成熟的机器视觉解决方案,通过人脸识别、物体识别、场景识别、文字识别、行人检测、图片分类等技术实现图像结构化并能够被检索。基于先进的深度学习技术和团队领先的核心算法能力,Megvii Cloud云平台孵化的服务和产品已经为众多开发者和企事业单位提供了智能解决方案,并正在与众多软件服务商联合建立智能生态系统。

  其中,Megvii Cloud PaaS服务孕育了Face++,以及最早应用深度学习视觉技术的商业化SaaS平台——基于公司核心图像识别技术(包括人脸识别和文字识别)的FaceID在线身份验证服务,目前FaceID并已覆盖80%金融行业认证业务。

  (三)互联网+”人工智能云平台的社会价值

  有了互联网+”为基础的人工智能云平台将能够为社会带来巨大经济效益,提升生产效率和人民生活质量,人工智能可以为企业节约相当一部分人力成本。以旷视的人脸识别身份认证服务为例,传统银行以网点为核心的庞大业务量将逐渐转移到每个人手上的手机、平板电脑等智能设备上,客户自助完成业务办理,节约了排队时间成本和柜台的资源成本。而在安防领域,人工智能可以代替办案人员查阅、比对海量的信息,帮助公安机关快速破案,有效打击犯罪维护社会治安。从更宏观的角度,人工智能产业化将成为经济发展的新引擎,人工智能能够渗透到每一个行业,每一个生产环节,增强人的能力,使人类取得跨越式进步。

  二、主要做法

  Megvii Cloud人工智能云平台基于人工智能、云计算和大数据等关键技术,提供对机器学习研发过程端到端的技术支撑,从数据、模型、算法到应用程序接口,再到行业应用的完整生命周期自动化管理,目标是从根本上提高人工智能,尤其是人工神经网络、深度学习等前沿技术的服务化水平、应用化效率和创新速度,并为计算机视觉应用领域,如金融、安防、零售、企业管理、物业管理、自动驾驶、工业制造等行业,提供有针对性的更精准、更智能、更广泛的技术支撑。

  (一)核心技术创新性

  公司的核心技术是基于深度学习技术的计算机视觉算法(包括人脸识别,文字识别,行人和车辆识别,监控视频智能分析和结构化等技术)和提供算法训练和运行平台的深度学习计算平台。

  深度学习技术基于海量的图像和视频训练数据,构建包含数万乃至数亿可学习参数的多层人工神经网络模型进行训练,从而使得训练好的模型可以应用于图像和视频分类,图像和视频中的物体检测和识别等多种智能任务。相比于上一代机器学习和人工智能技术,深度学习构建的模型大大强化了模型复杂度,包含参数规模十分庞大,神经网络的层数也大大增加,甚至可以达到上百乃至上千层神经网络,从而使得模型的学习能力大大提高,能够从事更加复杂的图像和视频认知和分析任务。同时,由于模型复杂度的上升,深度学习也要求大量训练数据的获取和大规模异构计算平台的搭建来完成训练任务。传统的机器学习任务训练数据一般是MB或者很小的GB规模,深度学习则拓展倒TB级别的训练数据规模;传统的机器学习一般使用单台服务器,深度学习则需要包含上百块图形计算单元(GPU)的高性能计算机群 (HPC)。

  公司从2012年底开始运用深度学习技术,是国内最早使用深度学习技术的人工智能企业之一。公司的核心计算机视觉算法技术多次参与国际算法评测竞赛,在FDDB人脸检测,300-W人脸关键点检测,LFW人脸识别,ICDAR鲁棒图像和视频文字检测和识别,SVHN街景图像门牌数字识别等各种评测比赛种获得第一。针对一系列产品场景中的需求,公司申请了近两百项技术发明专利,将核心技术和产品应用有效结合起来。公司搭建深度学习计算平台构建了数据获取和存储,数据处理和增强,模型训练,训练集群管理和监控,任务调度,模型发布和封装的全流程端到端深度学习训练框架,极大地提升了新技术研发的效率,将传统实验室的月为周期的技术研发流程缩短到天。

  (二)平台主要产品及创新商业模式

  Megvii Cloud人工智能云平台包含SaaS服务(FaceID身份验证解决方案、智能商业、智能安防解决方案)以及PaasFace++人脸识别平台和Image++图像识别平台)。通过商业化运作已经形成由不断循环的技术-数据-业务构成的,螺旋上升的人工智能闭环。其中,技术即深度学习算法,数据即标注化的图像数据,产品即人工智能云平台。

  1、Face++人脸识别云服务

  Face++人脸识别技术平台将人脸识别的核心算法都存储在云端,为企业开发者和人脸识别技术爱好者提供了API(应用程序接口)SDK(软件开发包),以及订制化的云计算服务,从而帮助其他公司集成面部识别技术。

  2、Image++ 新一代的图像识别云服务

  Image++ 是旷视科技有限公司继 Face++ 人脸识别云平台之后推出的图像识别技术平台。通过基于Deep Learning的智能识别算法,Image++ 可以自动识别出每张图片的内在信息,实现真正解构化图片中的元素并将其转化为数据,并将图像数据价值最大化。

  3、远程核身解决方案(FaceID

  现有在线验证方式(如绑定同名的其他行实名银行账户),往往存在交叉验证复杂,过程易中断,用户流失率高等问题。而由Megvii Cloud深度学习引擎驱动的的FaceID在线辅助验证方案通过人脸识别及证件识别技术,能够便捷安全地实现远程互联网用户身份、证件验证。企业用户只需要在客户端APP中嵌入FaceID活体检测SDK,再连接FaceID服务端即可实现从端到云的在线核身全流程。目前,FaceID已经在中信银行、江苏银行、蚂蚁金服等金融机构和Uber、滴滴共享平台、以及武汉人社认证中实现规模化应用。

  4、智能企业解决方案

  通过端到端的人脸识别技术方案来帮助政府机关、企事业单位、医院学校、酒店服务在区域性的安全防护、门禁识别系统、VIP贵客迎宾、访客登记、陌生人提醒、考勤管理、展会签到、企业CRM系统集成等方面做到互联网+”式的智能化管理,从而提升企业效能、为企业创造更多价值。

  5、智能商超解决方案

  旷视科技为传统线下门店提供智能商超解决方案,基于视频监控及其他安防子系统的大数据挖掘,智能识别顾客性别、年龄,VIP定位,记录顾客停留时长、各个柜台时间节点客流变化等情况,并为经营者提供客流统计、热力图、客流统计、人脸识别、热点分析、行为分析等技术,帮助经营者实现对商品空间、人力资源的优化配置的可视化管理。

  6、智能生活解决方案

  结合社区“互联网+”趋势,智能生活解决方案以人脸识别为入口,为地产、物业等机构提供人脸识别可视对讲系统、房地产应用APP、访客管理、物业管理、社区安防等服务。

  7、智慧安防解决方案

  基于人脸识别的智慧安防解决方案,可广泛应用于视频监控、入侵警告、出入口控制、门禁、电子巡更、联网告警灯主要安防领域,有效解决公安、海关、机场、铁路等政府安全相关机构对于可疑人员身份确认、实名制认证、人脸电子围栏、重点人员布控告警灯实战诉求。快速准确地完成认证合一、以及超大库的人脸搜索比对。

  三、经验效果

  自2012Megvii Cloud云平台的首个产品Face++上线以来,已经为1亿人“刷脸”,Face++也成为全球服务用户最多的人脸识别服务平台,包括Face++在内的云产品和解决方案覆盖移动互联网、金融、安防、地产、零售、办公等多个重要领域,基于此,旷视已经与蚂蚁金服、中信银行、国家公安部第一研究所、Uber、中国电信、清华大学、万科集团等300余家企业、政府部门实现深度合作,并为其提供行业智能解决方案和智能数据服务。

  (一)赋能机器,变革生产力

  未来,人工智能将会像电力、网络一样成为社会基础设施渗透到各行各业。而人工智能就像人类的大脑一样需要通过认知、感知、分析并作出决策,其中感知是一切行为的前提,不论是智能机器人、无人机、自动驾驶汽车,都需要拥有一双机器之眼,而Megvii Cloud人工智能云平台就是开启了智能终端的智慧之眼,由人赋予其人类的感知、分析能力,从而在一些重复性、规模化操作的工作上替代人力,提升人们的生活质量降低生产成本。

  以FaceID为金融行业服务为例,远程身份认证打破传统金融业务受制于网点服务时间和地点等资源限制,实现金融服务与客户需求的快速对接,可以帮助银行快速推广创新金融业务,节省了客户的时间成本和银行运营柜台的人力、物力成本。而在安防领域,人工智能可以代替办案人员查阅、比对海量的信息,帮助公安机关快速破案,有效打击犯罪维护社会治安。从更宏观的角度,人工智能产业化将成为经济发展的新引擎,人工智能能够渗透到每一个行业,每一个生产环节,增强人的能力,使人类取得跨越式进步。

  (二)营造互联网+”时代的人工智能生态环境

  互联网的第一要素就是云,云不仅是数据中心还蕴含着互联网+”的发展趋势,而人工智能生态将成为互联网生态的下一个演变趋势。实现人工智能必须要巨量、高质的数据资源,我们正处于“互联网+”时代的成熟期,同时也是下一个时代生态的成型期,这时候对于数据的积累和处理方式十分重要。

  今年5月份,发改委印发《互联网+”人工智能三年行动实施方案》,其中明确了人工智能的总体思路、目标与主要任务。该方案指出,2018,将在重点领域培育若干全球领先的人工智能骨干企业,建成基础坚实、创新活跃、开放协作、绿色安全的人工智能产业生态势在必行。

  旷视科技秉承打造杰出人工智能企业的信念,跟随政策指引,联通上下游产业从基础框架做起构建以Megvii Cloud 为中心的人工智能生态链条。随着人工智能产业化的推进,Megvii Cloud 已经积累了实际业务中的海量真实数据,通过模型和算法的优化使计算机的判断和决策更为精准、智能。