中华人民共和国国家发展和改革委员会

首页 > 专题 > 中国“互联网+"行动百佳实践
案例85.科大讯飞:“互联网+”语音云开放平台,推动智能人机交互应用创新
科大讯飞股份有限公司
  导读:科大讯飞是目前中国最大的智能语音技术提供商,也是亚太地区最大的语音上市公司,争创中文语音产业国家队。科大讯飞基于自主知识产权的语音及人工智能技术,自2010年起推出全球首个智能语音交互的语音云开放平台,为各类移动互联网创业者和创新性企业提供低门槛高质量的语音交互服务,合作伙伴可以像使用水、电一样即开即有、按需取用。通过为网络教育、智慧医疗、智能家居、车载电子、机器人等各行业领域提供领先的语音及人工智能技术开发能力,推动语音产业创新创业孵化,已基本形成覆盖大型电信级到小型嵌入式应用,从手机到车载,从家电到玩具等全行业的中文语音产业链;产业集聚效应进一步增强,具有核心技术竞争力的互联网+”语音产业生态正在加速构建。

  一、基本情况

  (一)科大讯飞公司介绍

  科大讯飞是从事智能语音及人工智能技术研究、软件产品开发、语音信息服务的国家级骨干软件企业。公司在智能语音及人工智能技术领域有着长期的研究积累,并在语音合成、语音识别、自然语言理解、口语翻译等多项语音及人工智能技术上拥有国际领先的成果。科大讯飞是我国唯一以语音技术为产业化方向的国家863计划成果产业化基地国家规划布局内重点软件企业国家创新型企业,并被工信部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。两次荣获国家科技进步二等奖;两次获得中国信息产业自主创新最高荣誉信息产业重大技术发明奖。科大讯飞于2008年在深交所上市,现已发展为亚太地区领先的语音上市公司,拥有中文语音主流应用市场70%的份额。

  (二)讯飞语音云开放平台介绍

  讯飞语音云开放平台作为全球首个开放的智能交互技术服务平台,致力于为开发者打造一站式智能人机交互解决方案。用户可通过互联网、移动互联网,使用任何设备、在任何时间、任何地点,随时随地享受讯飞语音云开放平台提供的听、说、读、写等全方位的人工智能服务。目前,语音云开放平台以+的形式向开发者提供语音合成、语音识别、语音唤醒、语义理解、人脸识别、个性化彩铃、移动应用分析等多项服务;国内外企业、中小创业团队和个人开发者,均可在讯飞语音云开放平台直接体验国际领先的语音交互技术,并快速集成到产品中,让其具备能听会说能思考会预测的应用能力。

  二、主要做法

  (一)共享语音及人工智能共性核心技术

  科大讯飞在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先水平的成果。语音合成方面,连续十一年(2006-2016)蝉联国际语音合成大赛(Blizzard Challenge)第一名,首次实现英文合成自然度突破4.0分,跨过实用门槛,并且多语种合成已涵盖全球27种语言。语音识别方面,最近连续三届在美国国家标准技术研究院(NIST)组织的国际语音识别大赛中名列第一;在车载环境下, 2015年在宝马全球中文语音技术测试中荣膺桂冠。机器翻译方面, 2015年在NIST国际机器翻译评测大赛中,获中英双向翻译第一名。

  依托语音云开放平台,科大讯飞将领先的智能语音技术向移动互联网开发厂商和用户同时开放,让开发者和中小企业可以几乎零成本的加入到创新的产业集群中来,大大降低了语音产业的创新创业门槛,使得移动互联网应用开发伙伴可在很短时间内构建出能听会说的特色移动互联网应用。目前,语音云平台已经将最核心的语音识别、语音合成以及语义理解等能力向开发者进行了开放。未来随着技术的不断成熟及创新突破,将持续开放语音唤醒、离线语音合成、离线命令词、声纹识别、人脸识别、声纹识别、语音评测等技术能力。同时还可为用户提供定制化的技术解决方案支持。

  (二)开放语音及人工智能应用开发能力

  在共性技术共享的基础上,语音云平台提供语音云服务开放接口,支持各类应用程序调用和开发,能够为不同的终端设备提供实时智能语音交互服务能力。国内外企业、中小创业团队和个人开发者,可以像使用水、电那样,即开即有、按需取用,快速集成到其应用解决方案或产品中。

  另外,平台提供的集成远场识别、方言识别、全双工、纠错及多轮交互在内的多项关键突破为一体的全新语音及人工智能交互解决方案——AIUI,可以一站式解决用户及开发者的需求,让智能人机交互技术应用更简单、实用。应用场景包括机器人、智能家居、智能硬件、车载终端等。

  目前,已有腾讯QQ、高德地图、小米、滴滴打车、京东、携程、天天动听、头条新闻等知名应用集成接入了讯飞语音云开放平台。在机器人和人工智能领域,则有优必选、狗尾草、康力优蓝、小鱼在家等知名厂商开发集成语音及人工智能应用。

  (三)支撑语音行业应用示范验证

  在语音及人工智能共性技术及应用开发能力提供的支撑下,越来越多的企业、开发者加入到了中文语音产业生态链中。在这个庞大的有机生态链中,既有互联网企业、智能硬件厂商、智能家居厂商,也有传统的通信、金融、教育等行业应用机构。这些企业与开发者在进行语音技术的开发、应用之前,总是面临未知的行业风险与成本,新兴行业尤为如此。得益于多年的行业实践经验,科大讯飞积累了大量的行业应用数据和用户信息。在互联网+”的理念和大数据分析技术的指导下,可以精确的对语音技术市场的发展走向做出预测、判断、分析,提供专业的行业示范验证服务。通过技术与经验分享,中小企业与开发者可以通过语音云平台,对自己的理念、产品进行对照验证。并且语音云开放平台可为产业链上的企业与开发者提供丰富的行业模拟/虚拟应用场景,不断完善解决方案,加快产品的迭代、升级,贴近实际应用环境,更加满足行业用户需求。

  (四)构建全新的平台商业模式

  打造探索互联网+”时代的新型广告平台,为基于语音云开放平台的创业者、开发项目,实现运营及商业变现,形成自我造血的良性循环,具有重要的支撑意义。

  科大讯飞广告平台拥有丰富多样的广告形式、海量优质的广告资源、先进智能的广告聚合,新颖独特的互动创意。除了传统的banner、插屏、全屏等广告形式,平台还支持原生广告、声音广告和语音互动广告等形式。除此之外,平台还拥有庞大的用户数据库和强大的大数据分析能力,支持多种精准定位技术;通过分析用户喜好与行为,可实现有针对性地向目标受众推送广告内容,精准定位目标人群,让品牌广告直达用户,大幅度提升广告价值。同时确保良好用户体验,有效保证了广告的高点击率,大大提升了平台的商业变现能力。

  目前,科大讯飞广告平台已吸引了众多的优质广告主伙伴,覆盖汽车、金融、电商、游戏等各类垂直行业,合作客户包括中国电信、中国移动、奥迪、宝马、奔驰、中国银行、中国建设银行、欧莱雅、可口可乐、京东、大众点评等国内外知名企业。

  (五)打造面向语音及人工智能产业的创业孵化体系

  以语音及人工智能产业链为中心,通过创业苗圃孵化器加速器路径,采用线上+线下的孵化方式,依托语音创新创业孵化器,提供专业创业导师、资金、创业训练、交流对接平台等高附加值的软性服务,突显专业化、集成化、市场化、高端化。基于语音云,不仅为入孵企业提供专业的基础服务平台,如软硬件配套服务、投融资服务、人才引进等。还在政策、融资、法律和市场推广等方面为创业者提供系统的培训和咨询服务,缩短孵化周期,提高孵化成功率。

  同时,为了鼓励行业创新、形成产业集群效应,科大讯飞还在全国范围内积极与各地政府、机构合作,设立语音产业创业基金,建设创新创业基地。进入基地的入孵企业不仅可以获得科大讯飞领先的技术、开放的平台服务支撑,还将享受当地政府的政策优惠。科大讯飞定期在这些创新创业基地举办技术沙龙、创业培训、宣传支持,邀请公司高级管理及技术团队、业界知名创业导师为创业者提供创业指导。

  目前,科大讯飞正在广东、重庆、洛阳、长春等地区与当地政府及相关部门进行合作,试点语音创新创业空间建设。

  三、经验效果

  语音云开放平台助力语音及人工智能技术的成果转化及产业应用,在移动互联网、教育、智能车载、智能家电、公共安全等各行业领域形成了蓬勃发展态势。目前,平台已拥有移动、电信、联通、华为、联想、海尔、腾讯、美的等2000多家开发伙伴,涵盖了语音技术应用各领域的龙头企业;自2010年发布运营以来,平台累计接入终端数超过7亿,日均语音交互20亿次;第三方合作伙伴及创业团队超过15万家,其中在智能硬件上的应用14371个。语音产业生态系统日臻完善。

  (一)聚拢顶尖的语音及人工智能技术研究资源,实现源头创新

  语音产业是典型的技术先导型产业,为确保核心技术始终居于业界领先地位,同时为语音云开放平台满足合作伙伴及创业开发者对语音及人工智能技术持续不断的能力需求,科大讯飞与国内在中文语音及语言领域积累深厚而又最具互补的清华大学、中国科技大学、哈尔滨工业大学、新疆大学、西藏大学、兰州大学、云南大学和内蒙古大学等紧密合作,成立产学研合作实验室,从源头上聚拢了核心技术研究资源。通过建立长期和深层的合作机制,调集和整合智能语音及人工智能领域高等院校、科研机构、产业界等各方资源,形成完整的技术创新网络,针对该领域的关键及共性技术难题开展联合攻关,让这些科研院所专注于各自优势方向的研究、发展和创新,为语音云共性技术开发平台提供了源源不断的新鲜血液及成果。通过更多领先的语音及人工智能技术能力的供给,使得合作伙伴及创业者拥有了高水平高质量的技术起点,产品核心竞争力得到进一步提高。

  (二)构建大创客带动小创客产业集群发展模式,打造语音产业生态

  国家各部门高度重视语音产业发展。工信部与安徽省签署《关于共同推进安徽省语音产业发展合作备忘录》,成立部省领导小组联席机制共同推进语音产业发展;国家发改委、科技部先后设立语音领域的国家工程实验室和高新技术产业化基地,进一步促进语音产业集聚发展。

  科大讯飞创新性构建大创客带动小创客产业集群发展模式,利用云计算将核心技术以讯飞语音云开放平台开放给创业者,并让开发者共享运营平台和渠道资源。2015粒子创客空间获批国家级孵化器,实现向全方位创业服务孵化器的转型。目前基于语音云开放平台的第三方创业团队及合作伙伴超过15万家;而在最近1年时间内,新增开发及创业团队增长超过200%。这种以大创客带动小创客,拉动产业集群的大众创业,成效远优于传统孵化器模式。目前已有40多个项目落户国家智能语音产业示范基地(合肥高新区)进行孵化及创业,涵盖教育、文化、医疗、智慧城市、智能终端、互联网等多个产业领域。正在接触及意向入驻的合作企业、创业项目超过200个。

  依托语音云开放平台,将促进语音和人工智能技术与汽车、家电、手机、机器人等产业深度融合,推动关键技术不断创新突破,力争在人工智能引领的新一轮的信息发展浪潮中占领技术及产业制高点,为我国在语音及人工智能领域抢抓先机,形成产业核心能力,建立国际竞争优势提供重要支撑。