大模型能力榜单

展示主流大模型的能力排行,数据来源:SuperCLUE / LMSYS Chatbot Arena / AlpacaEval

数据说明

  • • 综合得分 = 各项得分的加权平均
  • • 数据来源:SuperCLUE评测集、LMSYS Chatbot Arena、Arena-Hard等
  • • 价格数据来自各厂商官方定价(2026年5月)
  • • 得分范围:0-100分,数据每周更新