智能音箱能否成为AI的首张王牌?百度DuerOS给出了答案

来源:www.xjctc.net   时间: 2020-03-01

人工智能领域再次熙熙攘攘,这次是因为智能语音助手。

在百度推出DuerOS开放平台之后,国安广仕的下一代G2人工智能机顶盒和配备DuerOS的智能语音遥控器登陆河北。在未来两年内,预计河北省将有200万以上的用户享受人工智能带来的生活变化。与此同时,阿里还推出了内置中文人机通信系统AliGenie的智能音箱,加上腾讯此前推出的小型微型智能语音解决方案,智能音箱已成为BAT的另一个战场,谁能成为中国版Echo也成为技术界的一个大话题。

业内人士认为,声称在8月份发布自己的智能扬声器的阿里和腾讯更像是智能语音领域的一个“觉醒”。自亚马逊Alexa推出至今已近两年。 Apple的Siri,谷歌的助手和微软的Cortana也在领先。即便在家中,Fast Company也将百度排在去年年底最具创新性的人工智能和机器学习公司之列,仅次于谷歌和小发猫。百度深度语音识别系统Deep Speech2被选为MIT 2016十大突破性技术之一。

正如第三方分析公司Canalys的分析师Jamo所说,智能扬声器对人工智能技术有很高的要求。虽然目前的语音识别方案相对完整,但它并不是人工智能技术(如深度学习)的短期补偿。只有根深蒂固的人工智能才能成为一个重要的参与者。

这一次,百度的DuerOS处于最前沿

巧合的是,在阿里推出“天猫精灵X1”的同时,百度还系统地解释了百度对人工智能语音交互的重视及其人工智能开发者大会的雄心壮志。它得到了DuerOS开放平台的支持,并试图进入AI。该领域重新创建了Android操作系统生态系统。

一个是针对智能硬件,另一个是Android风格的操作系统生态系统。与百度相比,阿里在智能语音交互领域的行动仍然很晚。

这些巨头的目标是智能音频,这在某种程度上证实了技术将成为下一代交互式门户网站的既定事实,甚至在某些领域取代现有的图像,动作和其他人机交互方法。为实现这一雄心勃勃的目标,很难实现智能音频等纯硬件产品。毕竟,智能音频需要经历一系列过程,例如数据积累,业务改进和云服务部署。

阿里和百度的不同选择与两家公司的人工智能知识无关。早在2013年初,百度就建立了百度深度学习研究所(IDL),并在三个月后在硅谷建立了硅谷人工智能实验室。那时,人工智能的概念在行业中处于上升趋势。在大公司中,只有少数像百度这样的玩家试图系统地布局。随着业界对人工智能的未来持续保持乐观,技术巨头已经改变了对人工智能的态度:如果你失去了这个领域,你将失去未来。

自2014年以来,阿里,腾讯等已经开始布局人工智能领域,试图跟上百度等先锋的节奏,并导致智能语音交互成为彼此的战场之一。然而,当追随者仍然在思考智能硬件的方向时,百度的DuerOS已经开始进行开放的生态探索。

为什么生态学有未来?

为什么BAT将战争烧到智能语音交互领域?一个公认的声明是智能语音交互是基于语音输入的新一代交互模式,因此被认为是新的物联网门户。

诚然,作为一种新型的人机交互模式,智能语音交互可以实现人机对话,即通过说话可以获得反馈。配备终端硬件的智能语音系统,制造商可以在这样的“适合”下进入家庭的每个角落:在客厅看电视,在卧室看空调,在厨房看冰箱,这些将成为物联网时代。人机共存的具体场景。

换句话说,如果广泛使用语音交互,智能语音系统企业将受益于从组件到内容服务的整个产业链的重建。对此,百度还直接表示,对话人工智能系统DuerOS将成为百度在下一个时代重返巅峰的核心。

然而,要实现这样的场景,不仅要深入培养语音语义识别技术,还要构建完美的生态学。从PC时代的PC时代到移动互联网时代的Android和iOS,再到智能语音时代的辉煌,巨人们一直想要实现的是打破信息孤岛,开放性往往被证明是是最正确的答案。在人工智能时代,我们拥有相同的业务逻辑,开源和开放的系统级,吸引足够的服务和硬件合作伙伴,连接更多的终端和数据,最终实现“万物互联”的场景。

为了建立生态,百度提出了两项重要措施。一个是收购KITT.AI,一个专注于语音唤醒和自然语音交互技术的人工智能创业公司,并先后发布了DCS(DuerOS会话服务)和DBF(DuerOS Bot框架)。这两个基本协议使DuerOS成为国内软件和硬件的“最完整”解决方案。其次,百度在硬件方面与科胜讯,英特尔,MTK,瑞芯微,全智,RDA,瑞昱,高通等公司合作。不同的开发套件,包括个人版套件,轻量版,标准版,开放式集成电路设计,开放式结构设计等完整的集成参考设计,吸引更多硬件厂商加入。

百度方法的启示是什么?

当然,在人工智能的幌子下,百度从系统层面开放的尝试没有限制,包括科技大学,云智生等,但百度的做法是否正确?

百度将DuerOS开放平台分为三个层次:智能设备开放平台,对话核心系统和技能开放平台。简而言之,对话系统提供算法能力,如语音技术,自然语言处理技术,搜索技术,多轮对话技术和其他大数据,如知识地图;技能层,整合音乐,音频,新闻,娱乐等.10个类别,100多种学生的对话技巧和第三方内容资源,如爱奇艺和懒人,开发者可以免费使用。算法层是上面提到的几种软和硬解决方案的组合。

了解百度的雄心并不难。通过这些开源技术和服务,开发人员可以在不同的场景中实现智能应用程序,轻松设计满足其需求的产品,而不仅限于“扬声器”的形式。语音互动平台配备终端硬件,实现更智能化的产品,构建良性生态产业链。这是百度当前和未来努力的重点。

也许Amazon Echo的成功可以证明这种策略是有效的。 Echo似乎并不喜欢发布之初的市场。即使在音质输出和设计方面没有失去专业级产品,亚马逊也推出了完整的音乐流媒体服务。当许多开发人员访问Echo时,亚马逊也试图向更多开发人员开放Alexa,使这个智能语音助手更“有趣”,销售开始一路上升。

DuerOS的诀窍在于它只需修改17行代码即可在几秒钟内将Amazon Alexa设备迁移到百度DuerOS,这极大地方便了开发人员的“位置转移”,特别是对于国内开发人员。事实上,在此之前,整个过程需要至少五个开发人员花费三到六个月。百度秘密业务部门总经理景伟也公开呼吁开发商在中国选择DuerOS。

一般来说,像BAT这样的巨头拥抱语音交互是一个不争的事实。然而,阿里的生态建设有点前瞻性。虽然推出了AliGenie平台,但它鼓励第三方开发产品与百度DuerOS合作。阿里的重点仍然是他自己。腾讯尚未在该领域形成明确的战略布局。业内很多人都说,从战略角度来看,百度的DuerOS是一个很大的生态策略,而天猫精灵X1等几乎就是复制Echo。

然后问题就来了。将阿里和腾讯两次唤醒,他们会在智能语音领域再次遵循百度DuerOS的节奏吗?

  • 友情链接:
  • 版权所有© 新疆计算机培训中心 | 新ICP备10201303号-1 | www.xjctc.net . All Rights Reserved | 网站地图