人工智能黎明将至?百度开放语音技术接口
导读:人工智能一直是人工热门讨论话题,在刚刚过去的黎明互联网大会上,百度公布了自己的将至技术接口人工智能进展,并且于日前宣布将开放情感合成、百度远场方案、开放唤醒二期技术和长语音四种技术。语音
日前,人工百度宣布在其语音开放平台上线三周年之际,黎明向公众开放四项全新语音技术接口,将至技术接口分别是百度情感合成、远场方案、开放唤醒二期技术和长语音。语音
记者注意到,人工作为人工智能的黎明主要技术及应用之一,语音识别是将至技术接口国内外科技公司都在耕耘的方向。百度公司首席科学家吴恩达甚至形容称,“我们已经站在人工智能的黎明。”
早些时候,谷歌于今年3月宣布开放其语音识别API(应用程序编程接口)。
据了解,百度语音开放平台日前宣布对外开放的四项技术,也可以理解为输出解决方案,包括情感合成、远场方案、唤醒二期技术和长语音四种。
“这些技术有很大的潜力,去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会,将为人机交互带来巨大的改变。”吴恩达表示,这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。例如,百度情感合成技术主要聚焦在为合成语音“加入情感”,目前可达到接近真人发声效果。类似地,开发者还可以利用新的接口,使语音识别距离增加到3米到5米,将设备的语音唤醒率提升到95%以上,同时更省电、误报更少,或提升长时间语音识别的准确率问题。这将为语音技术带来远比现在更多的想象空间,而不只是遥控电视或解锁手机。
公开资料显示,百度语音识别准确率已达97%。百度语音开放平台自2013年10月上线以来,开发者数量超过14万。
斯坦福大学人工智能专家James Landay提到,“近两年,受益于大数据和深度学习技术的不断发展,语音识别技术突飞猛进,速度及准确性都有了长足进步。”
值得注意的是,作为人工智能的主要技术及应用之一,语音识别是国内外科技公司都在耕耘的方向,包括苹果、微软、谷歌、百度、腾讯、科大讯飞和搜狗等多家公司都在这一领域发力。
“我们已经站在人工智能的黎明。”11月22日下午,吴恩达在接受包括媒体采访时称,语音识别的门槛很高,除了技术复杂,数据门槛也非常高。现阶段,最难的仍是核心技术研发,如识别率提升、大数据语音合成等。百度希望通过开放相关技术,让智能应用更易被开发。
另一方面,今年3月,谷歌在其Next云计算大会上发布面向开发者的新机器学习平台的同时,宣布开放语音识别API,即谷歌语音搜索和语音输入的支持技术。
记者留意到,Google Cloud SPeech API包括了80多种语言,适用于各种实时语音识别与翻译应用。9月下旬,外媒报道称,谷歌宣布将收购智能语音识别工具开发商API.ai,预计会整合后者的自然语言理解技术。
而就在上周的第三届世界互联网大会上,王小川在演讲中现场演示了实时语音识别和翻译的能力,并提到,搜索的未来就是问答机器人,随着技术的突破,搜索引擎会自然而然演化成为问答引擎。但他也直言,尽管人工智能最重要的突破领域是在语音和图像领域,但在文字领域的进展仍较缓慢。比如,在安静的环境下,搜狗的语音识别准确度已经到了95%甚至97%,但一旦有噪音,准确率会迅速下降。
相关文章
《燧石枪:黎明之围》现已发售 媒体均分71分2024-07-19 11:43:21编辑:Reset 《燧石枪:黎明之围》已2025-11-04
古晨,第三圆开辟者公开了《微硬飞翔摹拟》的新一批截图,此次尾要掀示了干僧亚机场的诸多细节,玩家能够看到机场安插、设施等细节。部分新图:《微硬飞翔摹拟》里有超越3万7千个机场、2百万个皆会、15亿座修建2025-11-04
劣宅2015第一建仙玄幻动绘大年夜做《莽荒纪》自上线以去一背遍及备受网友乃至业界的存眷,除正在剧情的设定、绘风的决定下低重足笔,那部动绘的片头直也是花足工妇。比如本次劣宅推出的《莽荒纪》动绘片头直声音2025-11-04
《河洛群侠传》于本日2月1日)公布「流芳千古」友情更新,那款出售于2018年底的游戏,至古仍正在停止游戏内容的更新,可睹开辟团队的卖力态度。V1.33版本更新内容(一)队友友爱度体系:1.晋降友爱度:2025-11-04
分析师推测:Xbox调价策略将在来年实现55亿美元收益2024-07-22 09:54:06编辑:Reset 考虑到这些挑2025-11-04
史上最爆笑,齐球尾款戚闲战略RPG足游《怯者逗饥龙》现已登录安卓仄台,ios遁狱删档测试也已顺利结束,相疑将去没有暂便能够与小水陪们正在appstore里见面了。本周《怯者逗饥龙》将会迎去大年夜版本更2025-11-04

最新评论