Claude 3 Opus 在用户评分方面优于 GPT-4

具有人工智能的聊天机器人

Anthropic 的 Claude 3 Opus AI 模型首次在 Chatbot Arena 中击败了 GPT-4。

“国王死了。 RIP GPT-4,”软件开发人员 Nick Dobos 写道。

神经网络研究人员使用 Chatbot Arena 来评估聊天机器人的功能。 GPT-4于2023年5月加入平台,其变种一直占据领先地位,直到2024年3月26日,直到让位于Claude 3。根据arena数据,Anthropic的小模型之一Haiku也表现出了不错的效果。

“OpenAI 第一次没有提出最好的可用模型。 Opus 是最适合复杂任务的模型,Haiku 平衡了成本效益和效率。”人工智能研究员 Simon Willison 说道。

Chatbot Arena 由大型模型系统组织运营,该组织致力于研究开源模型。 她与加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学的学生和教师合作。

该平台的特点是缺乏客观的评价标准。 访问该网站时,用户会看到一个数据输入字段和两个窗口,其中包含未识别的人工智能模型的工作结果。 主要的挑战是根据个人喜好决定哪种结果最好。

通过这种方法,Chatbot Arena 确定了领先者并定期更新表格以反映结果。

亚马逊此前将对 Anthropic 的投资增加至 40 亿美元。

让我们记住,三月份,这家人工智能初创公司推出了聊天机器人 Claude 3,根据该公司的测试,它是所有竞争对手中速度最快、功能最强大的。

在社交网络上订阅 ForkLog

发现文本中有错误? 选择它并按 CTRL+ENTER

ForkLog 时事通讯:随时掌握比特币行业的脉搏

资讯来源:由0x资讯编译自FORKLOG。版权归作者ForkLog所有,未经许可,不得转载
提示:投资有风险,入市需谨慎,本资讯不作为投资理财建议。请理性投资,切实提高风险防范意识;如有发现的违法犯罪线索,可积极向有关部门举报反映。
你可能还喜欢