人性化AI准则所提出的有力启示。
这是Marques Brownlee在YouTube上的一个视频,链接在这里:视频链接
就像许多其他人一样,几个月前当我听到Humane的人工智能设备Pin的公告时,我也非常兴奋。然后我立即预定了一个,花费了780美元。尽管我对这个设备的第一个版本能否真正发挥作用持怀疑态度,但我相信通过使用最新的技术来体验未来,这样可以帮助我们了解未来的可能方向。
或许不出所料,Humane AI Pin 的初始评论一直相当负面的评价。该设备反应速度太慢,无法完成许多基本任务,还会产生错误信息,并且缺少一些重要功能,。技术还不够成熟,但再过几年,也许情况会有所改变,那时候可能会好一些。(不过,Humane 的一些问题确实是自己造成的——例如,考虑到现代 TTS 模型的优秀表现,我完全看不出设备为何要使用如此僵硬的语音。)
在思考是什么让一个新的科技产品成功时,回顾历史是有帮助的。以最早的苹果 II 机、黑莓手机和 iPod 为例。所有这些设备都依赖于当时最先进的技术(尽管它们都有明显的局限性),但它们仍然取得了巨大的成功。不过,还有一些产品,如 Google Glass、Google 的 Stadia 云端游戏平台和 Lytro 光场相机 却都失败了。为什么?
一个简单的测试:匹配技术能力的10倍用例从 Humane 的 AI 别针中学到的错误教训是,认为技术还不成熟。我不这么认为。有很多成功的产品,尽管技术有限,它们仍然成功了。关键在于(a)即使存在这些限制,使用场景也必须非常吸引人,以及(b)技术必须对使用场景足够有效。Humane 的别针在这两个方面都失败了。很多其他的前沿科技产品也失败了,情况类似。这似乎是一条如此简单的规则,我对更多科技公司(咳,谷歌)在构思新产品时没有谨记这一点感到惊讶。
让我们以早期的个人电脑,比如苹果II为例。尽管它的配置糟糕,价格不菲,且存在诸多限制,苹果II在VisiCalc这个功能上表现得非常出色,这使得无数人受益。与使用纸质记录和手工计算相比,VisiCalc带来了至少10倍(甚至可能是100倍或1000倍)的提升。同样,最初的Macintosh使真正的文字处理和桌面排版成为可能。当时的替代方案是使用打字机。不难看出,尽管早期的个人电脑文字处理软件非常原始,它们相比打字机来说仍要好100倍。
尽管问题多多,黑莓手机依然大受欢迎。当时没有黑莓,人们必须坐在电脑前,通过拨号上网来收邮件。尽管今天的黑莓手机看起来已经过时,它仍然很吸引人,符合当时的科技水平。
原来的iPhone值得注意的是,它没有其他应用,只有系统自带的几个。这个设备集电子邮件、网络浏览、电话通话和音乐于一体,尽管有这个严重的限制,用户体验依然非常吸引人。
另一方面,像谷歌眼镜哪里出了问题呢?就像 Humane 的别针一样,它没有提供任何突破性的使用场景。能够从脸上获取通知或拍照的功能并不足够吸引人,尤其是考虑到设备糟糕的外观设计。相比之下,那些看起来像普通眼镜的智能眼镜在市场上表现得更好。
在Stadia上玩游戏,体验仅略优于Xbox,但它高延迟和游戏库质量差的问题却成了硬伤。
Lytro 相机提供了拍摄后可调整照片焦距的功能,这在最好的情况下也只是个非常小众的功能——绝对不是那种10倍的提升,即使是专业摄影师也觉得一般。此外,光场传感器带来的好处都被照片质量差所抵消。
这不仅仅关乎关键应用关于“杀手级应用”已经写了不少,但我认为在“杀手级应用”的定义上往往有所缺失。很多时候,杀手级应用仅仅被描述为运行在底层硬件或技术上的补充。然而,杀手级应用模型往往会忽略的一点是,这款应用必须比现状好十倍之多,无论现状如何是何种情况。如果只是因为你可以以更低的价格或稍微低一点的质量从其他地方得到类似的东西,这还不足以成为杀手级应用。杀手级应用必须如此吸引人,以至于它必须是完成这项工作的唯一选择。
不管杀手级应用或设备是什么,应用程序的关键功能必须与现有技术能力有很强的重叠。VisiCalc 并不需要更高级的规格,也不需要花哨的颜色图形,只要 Apple II 能提供的功能就足够了。在原始的 iPod 上播放音乐只需要一个基本的按钮界面和 LCD 屏幕就够了。如果这些应用程序需要更高级的硬件规格或多点触控显示屏才能使用,它们就不可能成功。
Humane 是如何出错的Humane 团队似乎在设计他们的 AI 针扣时忽略了这些基本要素。要与智能手机竞争,门槛非常高——每个人都已经随身携带智能手机,而且智能手机的质量远超 AI 针所能提供的。没有任何 Humane 针扣的功能是智能手机做不到的,虽然用手机做某些事情可能稍微笨拙一些(而且,可以说,手机在大多数方面都比 AI 针扣做得更好,更实用)。
这也显而易见地表明,Humane 团队正在尝试用当今的技术无法实现的事情。无幻觉、低延迟的大型语言模型支持的问答系统,通过语音实现这一点,目前还无法做到。可穿戴、始终在线的机器视觉(用于AI别针的手势检测)目前也无法实现。
2024年的成功AI Pin产品会是什么样子?我可以想象Humane可能会开发一款可穿戴的智能手机配件,它提供现有AI Pin的基本相机、语音控制和投影功能,但与提供大部分智能功能的智能手机配对。这种设备可以单次充电使用一整天,参考Apple Watch的成本,售价大约为300美元——也不需要像现在AI Pin那样每月额外支付24美元的数据费用。
这样的产品无疑会比命运坎坷的AI Pin更成功,但它仍然没有一个颠覆性的应用场景。对于类似别针形式因素的设备,一个可能的应用场景是个人记忆助手。一个可以全天候记录我的所作所为,并帮助我回忆这些信息的可穿戴设备会是一个很大的改变。不过,我认为技术可能还没完全准备好。
在这里,这家初创公司 Humane 的问题似乎在于其自负——认为他们可以用第一版设备完全替代智能手机。这简直太离谱了,不知道这家初创公司 Humane 为什么选择这条道路。
共同学习,写下你的评论
评论加载中...
作者其他优质文章