谁是最好的免费聊天机器人?

ChatGPT vs. 必应聊天 vs. 巴德

免责声明(源自此处):本文不是赞助文章。我与OpenAI、Microsoft或Google没有任何关联。本文对聊天机器人进行了公正的概述,旨在使其更加广泛地为人所接受。

要直接跳到结尾并查找最佳聊天机器人,请点击此处。

ChatGPT中文站
Three chatbots having a rap battle, Image by Bing Image Creator. source
  1. 为什么此事关乎我?
  2. 标准
  3. 普通智能
  4. 连接外部世界
  5. 记忆
  6. 附加功能
  7. 可靠性
  8. 结论

为什么我应该知道?

我已经使用OpenAI的ChatGPT约有6个月了,使用Microsoft的Bing聊天近3个月,使用Google的Bard一个月。 我使用ChatGPT和Bing来进行数据科学工作的个人辅助,回答理论性问题,撰写文章和专业帖子(见1,2,3),甚至还为一些职业建议提供了帮助。 我试用了Bard,只是为了了解它是否确实是又一个伟大的谷歌产品,当然也是为了看看它如何与ChatGPT和Bing聊天相比较。

标准

首先,我们受到非常严格的限制:

我只评价完全免费使用的聊天机器人。

让我们快速解释我们的标准,按重要性排序:

  • 一般智能——最重要的品质。 智能聊天机器人有多聪明?它能理解简短、模糊和拼写错误的信息吗? 它是否以之前的信息为背景进行回答?
  • 连接外部世界 - 另一个可以为用户带来巨大价值的智能方面。互联网连接对于总结或过滤特定网站内容特别有用。如果我们需要聊天机器人的答案由在线来源支持,则它也非常有用;询问新闻也很有趣。
  • 记忆 — 机器人允许您返回以前的聊天记录吗?聊天会话是否受预定义的消息数量限制?这是一个重要的特点:虽然清空聊天很适合快速查询,但如果您与某个聊天记录“有长的历史”,那么该聊天记录可以更加定制,以满足您特定的需求,从而用于长期项目。
  • 附加功能-不是聊天机器人每天需要的,但仍然非常有用。如果您厌倦了必须把一切都写下来,那么有机器人建议后续问题或者包含鼠标点击组合工具是相当实用的。内置于聊天中的文本转图像引擎可以节省大量时间。
  • 可靠性——服务中断频率有多高?访问容易吗?无论使用哪种浏览器,您是否都能获得完整的聊天功能?它会按您的要求执行所有操作吗?

现在,这是每个标准的比较:

普遍智能

ChatGPT和必应聊天的比较比较直观:ChatGPT的免费机器人基于GPT3.5,而必应聊天使用GPT4。但这有关系吗?如果你只是问一些简单的问题,你可能不会注意到区别。但是,那些深入交谈的平台重度用户可能会看到区别。以下是两种GPT版本在类似谜语等更复杂的查询中测试的示例:

ChatGPT中文站
@j450n_l. “GPT-4 is a lot better at riddles than GPT-3.” Reddit, 12 Oct. 2022, source, Screenshot. Accessed on 19 May 2023.

然而,这种比较有一个陷阱,因为Bing聊天有三种不同的对话样式:更精确(绿色)、更平衡(蓝色)和更具创意(紫色):

ChatGPT中文站
Conversation with Bing Chat. Source

我只使用创意模式,因为创意模式不仅更有想象力 - 它也比其他模式更聪明。

ChatGPT中文站
Always choose creative mode! Image from Bing Chat.

让我向你展示为什么。

这是什么意思? (zhè shì shén me yì sī?)

精准模式

ChatGPT中文站
Conversation with Bing Chat. Source

精准模式纠正了拼写错误。它对贝叶斯网络的解释很好,但相当简短且缺乏信息。我无法从中理解什么是DAG,以及贝叶斯网络如何“表示疾病和症状之间的概率关系”。

平衡模式

ChatGPT中文站
Conversation with Bing Chat. Source

这个解释也很好,知道贝叶斯网络使用的其他名称可能更有用。即便如此,我仍然不明白网络是如何工作的。

创意模式

ChatGPT中文站
Conversation with Bing Chat. Source

创意模式第一次并没有得到我想要的结果——也许因为它的创新性允许更多可能的单词来替换当前的拼错。随后的问题建议已经有了正确的拼写,当我使用它时,我不仅得到了一个包含重要单词粗体格式的解释,还得到了一个清晰明了的图表解释:

每个节点对应一个随机变量,每个边表示相应随机变量的条件概率。

为了练习的目的,让我们也尝试一下ChatGPT:

ChatGPT中文站
Conversation with ChatGPT.

那是个不错的解释!也许有点过多信息,但是 ChatGPT 会输出长的结果,因为这个机器人无法像必应聊天一样参考来源。

你想问巴德的智力如何?

嗯...

ChatGPT中文站
Conversation with Bard.

没错,它完全搞错了,以为我在问“一个弹低音吉他的人群”。

巴德不如其他人聪明吗?

与ChatGPT和Bing Chat相反,Bard基于PaLM 2。哪一个被认为更聪明?意见不一:

ChatGPT中文站
Conversation with Bard.
ChatGPT中文站
Conversation with Bing Chat

惊喜!巴德回答说PaLM更聪明...不过Bing聊天平衡一些。

尽管如必应所建议的那样,我的使用必应聊天推理的经验要好得多。我曾经给这两个机器人提出了一个有趣的挑战:我给它们发送了特定数量的信息,都是关于相同主题的,然后问它们认为我来自哪个国家。必应聊天只需要多问一个问题就能把它答对,而对于巴德机器人,则需要大约20个问题…

获胜者:必应聊天(创意模式)

ChatGPT中文站
Bing has three modes — but you Creative is the most intelligent one. Image by Bing Image Create, source

与外界的连接

聊天机器人智能或准确地说是知识的明显问题是,培训模型需要数百万美元,并且不能定期进行。因此,它们的模型是在截止日期之前从互联网导入数据进行训练,然后用于未来数月甚至数年的时间。

ChatGPT中文站
Cutoff in September 2021, ignorant about anything new. Conversation with ChatGPT
ChatGPT中文站
Cutoff in September 2021, but can use web searches. Conversation with Bing Chat
ChatGPT中文站
Cutoff in January 2023, with many excuses. Conversation with Bard

然而,有一个相当简单(但危险)的解决方案 - 连接聊天机器人到互联网上。

ChatGPT中文站
No internet, no idea who Bard it. Conversation with ChatGPT
ChatGPT中文站
The cutoff date of 2021, but has knowledge of 2023’s Bard. Conversation with Bing Chat.

注意力+互联网就是你需要的一切。

此外,互联网连接不仅可以扩展聊天机器人的知识范围,超越它们受训数据的限制,还可以让我们做一些惊人的事情,如查看你的领英主页或总结一篇论文。

ChatGPT中文站
Attention + Internet is all you need for summarizing the paper “attention is all you need”. Conversation with Bard.
ChatGPT中文站
Who has the better explanation of this article? Conversationwith Bing Chat.
ChatGPT中文站
Intelligent but rather ignorant. Conversation with ChatGPT.

ChatGPT 是明显的失利者。但是谁是获胜者?

ChatGPT中文站
Interesting, well written — but what are the sources? Conversation with Bard.
ChatGPT中文站
Incorporates citations inside the text. Conversation with Bing Chat.

Bing 聊天的引用方式就像学术论文一样,非常出色。 你不必完全信任机器所说的话,只需跟随链接自己查找。当然,你也可以使用这些链接深入探究主题或作为支持你想要建立的论点的来源。

获胜者:必应聊天

记忆

另一方面,智能的一个方面是记忆过去的能力。在这种情况下,记住用户之前的查询,因为大多数情况下,需要多次交流才能理解你的意思。你可以和史上最聪明的聊天机器人对话,但如果每次退出浏览器时都会刷新,或会话内的信息数量受限制,那么这个强大的智能将是相当有缺陷的。

此外,有时需要按照您想要查询的方式构建提示。如果您通过一系列长消息教授您的聊天机器人以特定风格编写某些内容或掌握您感兴趣的自动化新技能,则可能会发生这种情况。

谁有最好的记忆?

Bard似乎只记得用户的查询,而没有给出实际的答案。我也找不到任何明显的会话区分;每个查询似乎都是独立的。

ChatGPT中文站
Just past questions, no answers. Conversation with Bard.

另一方面,Bing聊天不仅可以显示你以前的查询,还可以显示答案。你甚至可以回到旧的聊天并继续对话。唯一的问题是(很大的问题)是聊天仅限于30个用户查询(如果您使用Chrome,则为5个)。

ChatGPT中文站
We got back to an old chat — but reached the 30 queries limit. Conversation with Bing Chat.

最终的赢家无疑是ChatGPT:

ChatGPT中文站
You can raise a chat from the dead, even if it ended 6 months ago and keep the conversation going! Conversation with ChatGPT.

ChatGPT的记忆力非常出色。我能回忆起我和他在一月份的对话,而且没有任何限制或界限地继续对话。令人印象深刻。

胜者:ChatGPT

额外功能

在这个标准中,我汇总了所有那些不是基本属性但肯定能让聊天机器人更加复杂和有用的额外干净的特质。

那些是:

建议跟进问题

如果您注意到上面的截图,您可能会发现在每个必应聊天回复之后,都有三个推荐的后续问题气泡。很多时候,这些问题看起来已经理解了我的原始查询意图,即使机器人尚未理解。这里有个例子:

ChatGPT中文站
It didn’t understand the question but did ask the right follow-up question… Conversation with Bing Chat.

随后的问题也出人意料地直截了当:

ChatGPT中文站
That’s exactly what I wanted to ask about — an example of a network. Conversation with Bing Chat.

下一个也是这样:

ChatGPT中文站
Like magic, it again understands what I wanted to ask. Conversation with Bing Chat.

最終你會發現自己根本不需要寫作 —— 所有你想學習的東西幾乎都會自動引導你。有時,這些問題甚至會啟發你進入一個你從未考慮過的新思路。

ChatGPT中文站
Yep, you’re asking the right questions ?. Conversation with Bing Chat.

内置附加工具

Bing聊天还内置了另一个工具,令人非常烦恼的是,它只能在Edge浏览器中访问。该工具称为Compose,它允许我们以更有组织、更易于鼠标操作的方式创建内容。Compose让你可以设置构图的语调、格式和长度,尝试不同的草稿,并使用后续需要进行编辑的气泡:

ChatGPT中文站
Write professional content with just a few mouse clicks. Compose tool by Bing Chat.

让我们采用Bing的Compose建议的第一个想法,“如何使用贝叶斯网络进行因果推理”,并将其转化为一篇长的信息性博客文章:

ChatGPT中文站
A 550 words informational blog post written in seconds, using an idea that was also invented by the machine. Compose tool by Bing Chat.

这篇博客文章很好,但缺少来源。幸运的是,我可以通过另一个鼠标单击来添加它们:

ChatGPT中文站
Citations added, post completed. Compose tool by Bing Chat.

我实际上使用了必应的Compose来写一篇文章的整个内容,合理地比较勒布朗·詹姆斯和迈克尔·乔丹。

图像创建

似乎遥远的岁月里,Dall-E 文本生成图像器就已经诞生了。Dall-E 及其继任者在生成式 AI 和 AI 普遍性方面引起了巨大轰动,但始终与随后的新 LLM 保持相对独立。直到现在:

ChatGPT中文站
A revolution! You can create images inside a Chat now. Conversation with Bing Chat.

请注意向聊天机器人提出创建文本到图像提示的小技巧 - 这总是能提高生成的图像质量。

ChatGPT中文站
You can change the created image as much as you want; also the great suggestion by follow-up ballons. Conversation with Bing.

另一个惊人的事情是创造出来的图像数量似乎无限!或者更准确地说,每个聊天会话最多限制30条消息,但图像数量是无限的。

这是最终结果:

ChatGPT中文站
“A chatbot and a text-to-image prompt bot walking together on a sunny day. The chatbot is a blue sphere with eyes and a mouth, and the text-to-image prompt bot is a green cube with a screen displaying an image. They are holding hands and smiling at each other. The background is a park with trees and flowers. Draw this scene in a realistic style.” — prompt and image by Bing Chat and Image Creator. Source.

ChatGPT和Bard都没有这些额外的能力。

获胜者:必应聊天

可靠性

几乎每个使用ChatGPT的人都可能因为高需求而遇到使用该服务的问题。实际上,我的一些同事已经购买了Plus订阅以确保始终可用 - 但有时即使Plus订阅也不可用!

然而,使用Bard和Bing Chat,我从未遇到过可用性问题。

尽管如此,服务被拒绝的原因不仅仅是过载。Bing聊天的对齐非常严格,每当对话变得有些深刻或黑暗时,你就会立即被踢出聊天室。

ChatGPT中文站
Microsoft is more afraid Bing will answer this question truthy. Conversation with Bing Chat.
ChatGPT中文站
You’re naive, Bard. Conversation with Bard.
ChatGPT中文站
ChatGPT seems to have the most balanced personality out of the three. Conversation with ChatGPT.

另一个关于Bing Chat服务的问题涉及浏览器。Bing Chat强制你使用Edge浏览器,如果你通过扩展程序绕开该浏览器,你将无法获得完整的聊天功能(聊天记录,撰写,30条信息长的会话)。

然而,Bing 在可访问性方面也有很大的优势,因为它是唯一拥有指定应用程序的搜索引擎:

ChatGPT中文站
Bing Chat’s app. Screenshot by author.

巴德没有应用程序,但可以从Android上完美运行,并且具有使用Google帐户的主要优势。最后,虽然Google和Microsoft保存了帐户以允许您快速进入聊天并开始提问,但我似乎总是需要进行更多操作才能登录到我的OpenAI帐户。

ChatGPT中文站
ChatGPT — MORE than just one mouse-click away. Screenshot by author.

获胜者:巴德

结论

您已经走了这么远!那么,最好的聊天机器人是什么或者谁呢?让我们汇总每个标准的得分:

普通智能 - Bing 聊天

与外界的连接 - 必应聊天

记忆 - ChatGPT

附加功能-必应聊天

可靠性 — 巴德

在每个标准上给予相等的权重,Bing聊天是3-1-1的赢家!

ChatGPT中文站
And the winner is… Bing Chat! Image by Bing Image Creator. source

我毫不害怕地说我是Bing聊天的忠实粉丝。是的,它的记忆很短(每次会话最多30条消息),有时因为处理问题的过深而将我从聊天中踢出去(请在此处查看戏剧性的结局)。我喜欢它的原因是它非常聪明!它不仅能迅速理解我的意图,后续建议还非常精准,粗体格式和引用特别有用,而且能够创建无数的图片,并利用后续建议来塑造它们,非常了不起。干得好,Microsoft,你们推出了一个非常优秀的产品……

然而,我几乎每天都使用ChatGPT。聊天机器人极其具备长久的记忆力,在进行长期项目时非常有帮助。是的,它并没有互联网连接,但别忘了它接受了大量的知识训练,远远超过我们所需。其长期记忆力和非常长的输出方式让我想起开发派出的严肃研究倾向。

有时我也同时使用两者,ChatGPT用于长时间和更深入的对话,而Bing Chat用于快速,聪明和引用的回应,可以验证ChatGPT。

哎呀,看来Bard还有很长的路要走 ?。然而,像大多数谷歌产品一样,我猜它迟早会有更好的结果,甚至可能超过其他产品。

2023-10-20 16:41:35 AI中文站翻译自原文