大模型能力榜单

展示主流大模型的能力排行，数据来源：SuperCLUE / LMSYS Chatbot Arena / AlpacaEval

数据说明

• 综合得分 = 各项得分的加权平均
• 数据来源：SuperCLUE评测集、LMSYS Chatbot Arena、Arena-Hard等
• 价格数据来自各厂商官方定价（2026年5月）
• 得分范围：0-100分，数据每周更新