Claude 3 Opus 在用户评分方面优于 GPT-4

发表于 2024年3 月29日星期五下午 5:29:11

Anthropic 的 Claude 3 Opus AI 模型首次在 Chatbot Arena 中击败了 GPT-4。

国王死了

RIP GPT-4克劳德作品#1 ELo

Haiku 击败了 GPT-4 0613 和 Mistral large 这对于它的便宜和快速来说是疯狂的 https://t.co/XWmvTE6h75 pic.twitter.com/fAwzJScLTH

— 尼克·多博斯 (@NickADobos) 2024 年 3 月 26 日

“国王死了。 RIP GPT-4，”软件开发人员 Nick Dobos 写道。

神经网络研究人员使用 Chatbot Arena 来评估聊天机器人的功能。 GPT-4于2023年5月加入平台，其变种一直占据领先地位，直到2024年3月26日，直到让位于Claude 3。根据arena数据，Anthropic的小模型之一Haiku也表现出了不错的效果。

“OpenAI 第一次没有提出最好的可用模型。 Opus 是最适合复杂任务的模型，Haiku 平衡了成本效益和效率。”人工智能研究员 Simon Willison 说道。

Chatbot Arena 由大型模型系统组织运营，该组织致力于研究开源模型。她与加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学的学生和教师合作。

该平台的特点是缺乏客观的评价标准。访问该网站时，用户会看到一个数据输入字段和两个窗口，其中包含未识别的人工智能模型的工作结果。主要的挑战是根据个人喜好决定哪种结果最好。

通过这种方法，Chatbot Arena 确定了领先者并定期更新表格以反映结果。

亚马逊此前将对 Anthropic 的投资增加至 40 亿美元。

让我们记住，三月份，这家人工智能初创公司推出了聊天机器人 Claude 3，根据该公司的测试，它是所有竞争对手中速度最快、功能最强大的。

在社交网络上订阅 ForkLog

发现文本中有错误？选择它并按 CTRL+ENTER

ForkLog 时事通讯：随时掌握比特币行业的脉搏

资讯来源：由0x资讯编译自FORKLOG。版权归作者ForkLog所有，未经许可，不得转载