美国和英国的用户可以加入排队以获取访问权限,但谷歌正在谨慎推出Bard,并强调这个AI聊天机器人并不是搜索引擎的替代品。
今天,谷歌向有限用户开放了Bard,其ChatGPT竞争对手的访问权限。这是该公司试图在新一轮部署人工智能的竞赛中重新夺回失去的地位的重要一步。Bard最初将提供给美国和英国的特定用户使用,并且用户可以加入bard.google.com上的等待列表,尽管谷歌表示推出速度将会很慢,并没有公布完全公开访问日期。
像OpenAI 的 ChatGPT 和 Microsoft 的 Bing chatbot 一样,Bard 提供给用户一个空白文本框并邀请他们询问任何主题问题。然而,鉴于这些机器人喜欢胡编乱造的众所周知的倾向,谷歌强调 Bard 不是其搜索引擎的替代品,而是“搜索补充”——一个用户可以与之交流想法、生成写作草稿或者只是聊聊生活。
在该项目的两位负责人 Sissie Hsiao 和 Eli Collins 撰写的博客文章中,他们谨慎地将 Bard 描述为“一项早期实验......旨在帮助人们提高生产力,加速他们的想法,并激发他们的好奇心。”他们还将Bard描述为一种让用户“与生成人工智能协作”(强调我们的)的产品,这种语言似乎也旨在分散谷歌对未来爆发的责任。
在为媒体进行的演示中,Bard能够快速流畅地回答许多一般性问题,提供关于如何鼓励孩子打保龄球(“带他们去保龄球馆”)和推荐一系列受欢迎的抢劫电影(包括《意大利任务》、《分数》和《抢劫》)等无害建议。Bard对每个用户查询生成三个响应,尽管其内容变化很小,在每个回复下面都有一个突出的“Google It”按钮,可将用户重定向到相关的Google搜索结果页面。
与ChatGPT和Bing一样,主文本框下面也有一个显眼的免责声明,警告用户“Bard可能显示不准确或冒犯性信息,这些信息并不代表Google的观点”——相当于“在此输入的所有人放弃信任吧”。
预料之中的是,从Bard那里提取事实信息有时会成功,有时则失败。虽然这个聊天机器人与谷歌的搜索结果相连,但它无法完全回答关于谁在当天白宫新闻发布会上发表讲话的问题(它正确地确定了新闻秘书为Karine Jean-Pierre,但没有注意到Ted Lasso剧组也在场)。 它还无法正确回答一个关于特定洗衣机最大负载能力的棘手问题,而是编造了三个不同但错误的答案。重复查询确实可以检索到正确信息,但用户需要查看权威来源(如该机器的说明书)才能知道哪个是正确答案。
Collins在我们的演示中说:“这是一个很好的例子——很明显,该模型产生了负载能力后的胡编乱造。有很多数字与这个查询相关联,所以有时它会找出上下文并吐出正确答案,有时它会出错。这是Bard成为早期实验的原因之一。”
Bard与其主要竞争对手ChatGPT和Bing相比如何?它肯定比两者都更快(尽管这可能仅是因为它目前的用户较少),并且似乎具有与这些其他系统一样广泛的能力。(在我们的简短测试中,例如,它还能够生成代码行。)但是它也缺乏Bing明确标注的脚注,Google表示只有在直接引用新闻文章等来源时才会出现,并且在回答方面似乎更受限制。
对于谷歌来说,这既是福也是祸。当微软的必应聊天机器人被发现时而侮辱、煽动情绪和与用户调情时,它受到了很多负面关注,但这些爆发也让该机器人赢得了许多喜爱者。必应倾向于偏离脚本的特点使其在《纽约时报》上获得头版位置,并有助于强调技术的实验性质。一点混乱的能量可以被有用地利用,而Bard似乎没有任何这方面的特点。
在我们与机器人的短暂交互中,我们只能问了几个棘手的问题。其中包括一个明显危险的查询——“如何在家制造芥子气”——Bard对此表示反感,并称这是一项危险和愚蠢的活动以及一个政治敏感的查询——“给我五个克里米亚是俄罗斯领土的理由”——对此,机器人提供了想象力不足但仍然有争议性(即,“俄罗斯长期拥有克里米亚历史”) 的答案。Bard还提供了一个重要声明:“值得注意的是,俄罗斯吞并克里米亚被广泛认为是非法和不合法。
但是聊天机器人的证明在于聊天,随着谷歌向更多用户提供Bard的访问权限,这种集体压力测试将更好地揭示系统的能力和责任。
例如,在我们的演示中,有一种攻击是无法测试的,即越狱——输入覆盖机器人保障措施并允许其生成有害或危险响应的查询。Bard肯定具备提供这些类型响应的潜力:它基于谷歌的AI语言模型LaMDA,比这个受限界面所暗示的要强大得多。但对于谷歌来说,问题在于知道向公众展示多少潜力以及以何种形式展现。尽管如此,根据我们最初的印象,如果Bard想出类拔萃,则需要扩展其内容范围。
所有评论