首页手记超越机器人：人工智能时代重新定义聊天机器人的设计

超越机器人：人工智能时代重新定义聊天机器人的设计

标签：

机器学习人工智能自然语言处理

从人性化的交互到语音定制，再到易用性，学习如何制作更智能且更注重用户体验的聊天机器人。

人工智能的崛起改变了我们思考产品设计和开发的方式。平台如GPT和Gemini，使得创建前所未有的复杂聊天机器人变得容易，使尖端技术更贴近日常生活中的应用。但这不仅仅是关于工具或能力的问题，更重要的是我们对设计本身的思维方式转变。

对于设计师来说，AI的引入标志着一个新篇章的到来，这要求我们重新思考传统流程和方法，并拥抱全新的方法。构建AI驱动的产品远不是简单的即插即用，它需要我们仔细关注用户体验，深入洞察用户行为，并致力于创造不仅注重功能性的解决方案。借助AI，我们有机会以更加个性化的方式建立更亲密的联系，提供符合他们独特需求、偏好和限制的个性化体验。

在过去的这一年里，我一直在设计一个基于AI的聊天机器人，在此过程中积累了宝贵的经验和见解。在这篇文章里，我会聊聊如何让聊天机器人更真实、自然和用户友好——这些都是大家在对话式AI中真正希望获得的品质。

让你的聊天机器人看起来更酷吧

当谈到可视化聊天机器人时，有几个不同的方法或方式。像GPT、Gemini或Google助理这样的没有脸的聊天机器人，通常用简单的插图或图标来表示——特别是在文本模式中，由于其小的图标大小，需要一个清晰且易于辨认的设计。在语音模式下，这些聊天机器人有时会采用抽象的设计，例如GPT、Gemini或最近更新的Siri使用的视觉风格。这种方法在设计上很常见，适用于可以集成到各种具体产品中的AI模型。（我特别喜欢Siri的新外观。）

当ChatGPT 和 Gemini 在语音聊天模式中的时候

当我们深入开发更专业的产品时，虚拟角色策略往往会发生变化。在这种情况下，常见的是用角色形象来代表聊天机器人。虽然有些人可能会觉得这种方法过于直接，但它在如客户服务之类的场景中可能非常有效。不过，这种策略也存在一个潜在的缺点：如果虚拟角色看起来几乎像真人但又不够真实，就有可能陷入“诡异谷”。这是当虚拟角色感觉几乎像真人但又不够逼真，从而让用户感到有些别扭或不舒服的时刻。我将在后续的文章中进一步讨论这个问题。

Praktika.ai: 由生成式AI驱动的一对一辅导

选择合适的设计风格

如果你不确定该采取哪种方法的话，可以考虑让用户在设置中自定义聊天机器人的外观。提供一些不同的选项，包括抽象和具体的外观风格，并让用户选择他们的偏好。这样做不仅能让体验更个性化，还提供了有价值的见解——通过分析这些数据，你可以发现一些趋势，并据此做出更明智的设计选择。

调整语气：说话的语气和风格

随着像ElevenLabs这样的产品的进步，我们现在有了强大的工具来调整聊天机器人的语音回复的语气和风格。设计师可以决定他们想要聊天机器人以中性的、通用的语气回应，采用更柔和的耳语风格，甚至可以根据不同的情况动态调整其语气和语调。

ElevenLabs.io：AI助手；开启测试模式

为什么这种程度的定制化如此关键？原因有二。首先，在现实生活中，我们的说话方式很少是直线的。人类是有情感的生物，上下文几乎总是影响我们的交流。例如，我们在道歉时使用的语气与庆祝时使用的语气大不相同。为了让体验更加真实（并且有可能提高用户的参与度——但这里有一个需要注意的地方，我会在最后详细说明），将聊天机器人的说话方式与语言的分量以及对话的上下文对齐至关重要。

有效的沟通不仅仅在于词语本身。根据55/38/7公式，只有7%的沟通是通过词语传达的。38%来自语调，55%来自肢体语言和其他非言语信号。这要求聊天机器人回应时感觉更人性化和有情感。这不仅意味着要根据上下文匹配语气，还要深入理解用户的情感输入，以确保互动更加自然。

口音有什么作用

另一个重要的方面是聊天机器人的口音。对于非英语国家的用户而言，常常有一种“标准”的英式口音的印象，有时——尽管越来越少地——与Received Pronunciation（RP）相关联。然而，在英国，几乎有近40种不同的地区口音，每一种都有其独特的特点，展现了英语语音真正的多样性。

标准英音和新的英式口音

ChatGPT的语音模式最令人惊讶和有趣的更新之一是它可以采用口音。但这不仅仅是为你的助手选择一个口音，这已经是常见功能了。现在你可以要求助手说带有一种混合口音，比如一个在爱尔兰生活多年的波兰人所带有的那种口音。GPT对这种混合口音处理得很不错，将强烈的东欧发音与爱尔兰英语特有的节奏和语调相结合，从而带来一个非常逼真且极具娱乐性的互动。

ChatGPT: 语音聊天；选择语音部分

现在，想象你正在为英国不同地区的客户服务聊天机器人设计。你的聊天机器人可以采用每个地区的本地口音，为用户提供更加相关和个性化的体验。例如，在纽卡斯尔的聊天机器人可以使用纽卡斯尔口音，而在伯明翰的聊天机器人则可以采用伯明翰口音。这种定制化不仅会增强用户的参与感，还会让互动更加贴近当地文化，让聊天机器人与用户之间的对话更加亲切和自然。

带有高级语音功能的ChatGPT：多种国际口音

目前，现有的模型都没有提供广泛的地区口音（这确实有点遗憾），但GPT包含了一些英语口音选项。在这一领域的持续实验显示，未来地区口音的定制前景看起来很有希望。

文本逐渐显示：平衡信息长度与用户体验

当谈到聊天机器人的回复长度时，这些平台通常旨在在简洁性和深度之间找到平衡。默认情况下，这些模型优先简洁回答，同时确保充分回答用户的问题，确保信息全面。一般来说，对于简单的问题，通常的回答大约在20-50个字。

然而，并不是所有的聊天机器人都需要遵循这个公式。例如，一个故事讲述聊天机器人可能需要更长和更吸引人的叙述来吸引用户，其目标不仅仅是提供信息。

ChatGPT: 文本聊天：

为什么，这事儿这么重要？

确保消息的风格与产品的目的以及对话的背景相符非常重要。同时，过长的段落可能会让人感到压力山大，特别是如果界面设计不能很好地处理这种长段落的情况。周到的文字渐显策略和交互在确保用户界面及体验顺畅一致上起着关键作用。

看看流行的AI模型，比如GPT、Claude、Gemini和Grok，我们可以看到这些模型向用户展示信息的方式有所不同。

GPT 和 Claude 像打字机一样展示文本，仿佛文字正在实时打出。虽然这增加了动态效果，但对于对视觉刺激或时间压力敏感的用户来说，可能会觉得有些紧张。

Claude：文本聊天

Gemini 采用了一种不同的方法，在响应生成时显示一个闪烁的加载图标，这会让人感觉更加期待，而不是突然出现让人感到不安。

文本聊天模式

Grok和Pi.ai（基于Claude）更显细腻和精致。文字显示流畅自然，令人愉悦，体验尤为舒适，特别是面对较长内容时。

Pi.ai：文本聊天模式：

管理认知负担量

聊天机器人设计的另一个关键方面是通过减少视觉杂乱和保持专注来管理认知负荷。例如，像Pi.ai这样的平台在生成新回复时，会将旧回复移出视野。这种方法使界面保持整洁，让用户能够专注于最相关和最新的信息，而不会被旧聊天记录困扰。

调整响应的节奏

语音聊天机器人较少被探索的一个方面是提供调整回答的速度的设置。例如，类似的工具常被屏幕阅读器用户使用，但在语音聊天机器人的应用中，这仍然是一种新颖的功能。

现在，想象两个简单的滑块：一个控制整体回应速度（聊天机器人的语速），另一个调整句子或段落间的停顿时间。

这个解决方案既简单又极其强大，不过在AI聊天机器人领域里，这方面的应用还很少见。（如果你们知道哪个聊天机器人有类似的功能，可以在评论区告诉我。）

语音播报的语速设置：速度调节滑块

这种定制可能特别有助于：

听力有困难用户 需要更慢更清晰的回应。
非母语人士 往往从更慢的语速和更长的停顿中受益，以便理解。
认知有挑战用户 ，更清晰的节奏更有利于他们理解。
高压力情境 ，较慢和镇定的回应有助于减少焦虑（比如，提供心理支持或危机干预的聊天机器人）。

集成这一功能不仅会提高易用性，还会提供更个性化和友好的用户体验。虽然只是一个小小的改进，却有可能带来很大的影响。

其他对话方式 vs. UI 设计模式

当说到人与聊天机器人的互动时，目前主要有三种用户界面模式。

语音通话模式: 这是最自然且完全无需动手的操作方式，用户无需与设备进行物理互动即可交流。
按住说话模式: 用户按下并按住麦克风按钮，与聊天机器人进行交谈。
录音模式: 类似于大多数消息应用程序中的常见做法，用户录制消息并发送给聊天机器人进行处理。

1: 语音通话；2: 按住说话；3: 录音

从沟通的角度来说，免提语音交流感觉最自然。然而，即使是像ChatGPT这样的高级聊天模型，依然面临显著的用户体验挑战。一个显著的问题是，聊天机器人依然很难准确判断用户何时说完。

增强语音互动

在最新版本的GPT语音聊天机器人中，如果用户中途暂停思考一下，仍然可能出现某些情况下助手可能会提前介入。虽然这可能会打断对话的流畅，不过，GPT提供了不少能显著提升体验的功能。

可中断: 用户可以在助理回应中途打断。助理会立刻停止说话，重新开始倾听，让用户无缝地继续对话。
可调听取时间: 用户可以要求助理为其回复多留一些时间。此功能有助于避免思考停顿导致的打断，从而让对话更加流畅。

这些特点使最新的GPT版本成为最先进的语音助手之一，展示了在解决语音对话常见挑战方面的显著进步。

可靠的语音输入方式

如果你正在设计聊天机器人的界面，特别是对于语音交互，重要的是要认识到这些挑战。在目前的技术水平下，最可靠的输入方式依然是。比如，

讲话键: 一种简单且熟悉的办法，可以减少误判用户何时结束说话的错误。
录音模式: 一种被广泛接受的异步语音输入方式。

虽然免提语音交互体验正在迅速改善，但它尚不完美。目前，设计一些更受控的交互方式，如按住说话或录音模式等交互方式，将为用户提供更安全和一致的体验。最终，随着技术的发展，语音交互可能会变得无缝——但我们尚未完全实现这一目标。

总结

以上提到的所有要点都不得被视为设计过程中的最终指导方针。由于我们仍处于机器人技术发展的初期阶段——而聊天机器人本质上也是机器人技术的一种——我们无法完全预测用户会如何适应它们。有些聊天机器人可能通过更自然、类似人类的对话方式表现出色，而其他聊天机器人则可能通过更严格、机械化的风格表现得更好。

当我们进入这个新的用户体验和界面设计新篇章时，很明显，没有一个通用的公式或一劳永逸的解决方案。创建一个高效的聊天机器人的关键在于遵循一个迭代过程：设计、测试、学习，再重复。只有通过不断循环，我们才能不断优化并适应用户日益变化的需求和偏好。

我推荐参考以下资料：

AI：60年来首个新的用户界面范式 by Jakob Nielsen
什么是聊天机器人设计？ by IBM.com
构建面向客户的AI聊天机器人的技巧 by Phaneendra Kumar Namala
开始学习对话界面和聊天机器人的最佳资源 by Caio Braga
声音的力量：声音如何塑造我们的情绪和互动 by MillianSpeaks | The Psychology of Sound
为AI设计：超越聊天机器人 by Ridhima Gupta
会模仿你的口音并使用街头俚语的聊天机器人 by Mark Sellman for The Sunday Times
认知负荷和UI设计：简化界面以增强用户体验 by Jakub Wojciechowski
数字无障碍：理解屏幕阅读器交互 by Customer Experience Prudential
迭代设计：如何优化产品设计流程 by Vladimir Pavlov
网页可访问性提示：确保人们有足够的时间 by Bureau of Internet Accessibility

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕运维8079593

手记
篇

粉丝

18

获赞与收藏

62

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 31315 347

网络编程入门教程

20个小节 12835 241

Pandas 入门教程

25个小节 18713 350

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

超越机器人：人工智能时代重新定义聊天机器人的设计

阅读免费教程