加入收藏 | 设为首页 | 会员中心 | 我要投稿 云计算网_泰州站长网 (http://www.0523zz.com/)- 视觉智能、AI应用、CDN、行业物联网、智能数字人!
当前位置: 首页 > 综合聚焦 > 创业热点 > 经验 > 正文

扎克伯格开发笔记:打造Jarvis的日子,我庆幸自己从未停止过编程

发布时间:2016-12-26 11:41:34 所属栏目:经验 来源:雷锋网
导读:副标题#e# 雷锋网按:作为一家科技巨头的CEO,扎克伯格却依然保持写代码的习惯。可怕的自制力,超强的执行力,当比你有钱的人还比你更聪明更勤奋的时候,雷锋网编辑不禁开始怀疑人生。 以下文章来自扎克伯格的笔记“Building Jarvis”,由雷锋网(公众号:雷

声音和语音识别

扎克伯格开发笔记:打造Jarvis的日子,我庆幸自己从未停止过编程

尽管我认为文本在与AI沟通方面比人类意识到的更加重要,但是语音也仍将占据非常重要的地位。语音最大的好处是它的速度。你不需要掏出你的手机,打开App,然后开始打字,你需要做的仅仅是说话。

为了能够让Jarvis能够拥有语音识别功能,我需要为Jarvis建一个能在后台采集语音信息的的App。虽然Messenger Bot能够做很多事,但是要实现语音交互对它来说还是比较困难的。我设计的Jarvis专用App能够让Jarvis在我把手机放在桌上的时候,听我说话。我可以在各个房间里都放上手机,这样我就可以在每个房间都可以和Jarvis对话了。虽然这和亚马逊的Echo很相似,但是根据我的经验,当我不在家的时候会经常用手机和Jarvis对话。因此把手机当作主要的交互入口比家庭设备更可靠。我已经开发了iOS版的Jarvis App,下一步计划开发安卓版的App。从2012年起我就没有开发过iOS的App了,在这次的开发过程中,Facebook为开发App和语音识别提供的工具链让我印象非常深刻。

虽然语音识别系统最近已经有了很大的进步,但是目前还没有哪一个AI系统在理解会话语言方面做的足够好。语音识别依赖于听懂你的话并预测你将要说什么,因此相比非结构化语言,结构化的语言要容易理解的多。

语音识别系统,或者更广泛的机器学习系统,都有其限制,它们往往更适用于特定的问题。比如理解人和机器的对话与理解人和人之间对话是不同的。当你用来自谷歌的人机对话数据来训练机器学习系统,那么这个机器学习系统在理解Facebook上人与人之间对话的表现将会相对较差。训练一个能够只需要近距离对话的AI,和训练一个在更大的空间范围内使用的AI(比如Echo),也有很大的不同。这些系统的限制很多,这意味着我们离更通用的AI系统还有很大的距离。

从心理学层面上来说,一旦你对着一个AI说话,那么就会比你使用文本或者图形界面与计算机交互要投入更多感情。我观察到的很有意思的一点是,当我为Jarvis 植入声音之后,我会希望它能更幽默一些。其中一部分原因是因为它现在可以与Max对话,我希望对话有趣一些,能够逗Max开心。另一部分原因感觉它一直在我们身边。我教了他一些有趣的小游戏,比如我和Priscilla可以问它我们应该挠谁的痒痒,他会随机告诉我们一个名字:Max或者Beast。我还会增加一些经典台词,比如“对不起,Priscilla。恐怕我做不到”。

在语音这一领域还有很多需要探索。AI技术刚刚变得能够成为一款伟大产品的基础,在未来的几年它会变得越来越好。同时,我认为最好的产品应该可以随身携带而且可以进行私密性对话的。

Facebook的工程环境

作为Facebook的CEO,我并没有多少时间写代码,但我从未停止过编程。不过这些日子以来我主要是在创建我的个人项目Jarvis。我本来只希望今年能够了解一些AI的现状和进展,但是我发现学到的远远超出了我的预期,感觉自己就像是Facebook的一个工程师。

(编辑:云计算网_泰州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读