产品发布
2024/6/20
18,702 次阅读Anthropic发布Claude 3.5 Sonnet:性能超越GPT-4o
Anthropic发布了Claude 3.5 Sonnet模型,在多项基准测试中超越了GPT-4o和Claude 3 Opus。该模型在编码、数学推理和视觉理解方面表现突出,同时价格仅为Claude 3 Opus的五分之一。
Claude 3.5 Sonnet是Anthropic迄今发布的最强模型。在编码能力方面,它在HumanEval基准测试中达到了92%,超过GPT-4o的90%。在数学推理方面,MATH基准测试得分71.1%,大幅领先竞品。Claude 3.5 Sonnet还引入了Artifacts功能,可以在对话中实时创建和预览代码、文档等内容。