谷歌宣布开放语音识别API,将与Nuance对抗

猿团 | 2016-03-25 11:55:24

谷歌Next云计算大会今日在美国旧金山召开。谷歌在会上发布了面向开发者的新机器学习平台,并开放语音识别的API(应用程序编程接口)。最初为了吸引开发者的兴趣,该API将是完全免费使用。过了一段时间后,该API将可能需要支付一个低成本的定价,这一点我们当然可以理解。谷歌方面可能会选择过一段时间,等它成为同行业的龙头老大后再次提高这些价格。

谷歌语音API

谷歌母公司Alphabet董事长埃里克·施密特(Eric Schmidt)在主题演讲中表示,机器学习技术是未来(Machine Learning is Next)。谷歌机器学习负责人杰夫·迪恩(Jeff Dean)随后介绍称,随着近年来机器学习技术的逐渐成熟,谷歌正加快步伐在主要平台部署机器学习技术。除了此前战胜李世石而闻名的围棋程序 AlphaGo,更有用户熟知的搜索、YoutubeAndroid、地图、Gmail等核心产品。

谷歌新机器学习平台将作为云服务提供给开发者,帮助他们加快开发各种商业应用。开发者可以借助谷歌已经使用的机器学习技术开发各种新产品与技 术。这个新平台包括:帮助开发者用自己的数据组建机器学习模型,同时为开发者提供一个训练模型。开发者可以借助谷歌的诸多云服务工具,训练自己的机器学习模型。

今日的另一个大新闻是,谷歌开放了自己的语音识别API,即谷歌语音搜索和语音输入的支持技术。Google Cloud SPeech API一开始将免费提供,以后再进行收费。谷歌的这次的云语音API将覆盖超过80种语言,并且该应用支持实时和批量处理模式,它以“看,听和翻译,”的方式为该应用提供了一整套的API。谷歌说,它与谷歌键盘的语音搜索和语音输入应用相比,它是基于同样的神经网络技术的。当然它还有一些其他有趣的特性,比如在嘈杂的环境中它仍然能够实时工作。

在语音识别领域,谷歌语音API将不仅会影响到Nuance公司和其他语音识别提供商,同时也被看作是对苹果的攻击,因为苹果的虚拟助理Siri所拥有的语音识别功能也是谷歌的对手。Siri也没有为了开发者能够让自己的应用使用Siri技术而提供自己的API。

  • 城市合伙人