会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一!

最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一

时间:2025-12-09 05:05:53 来源:十堰新闻网 作者:企业 阅读:291次

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!

豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)一同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包含DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1另有DeepSeek-V3。

来自SuperCLUE

汇报指出,国内外第一梯队大模型在中文领域的通用实力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner体现最为亮眼。国内推理模型角逐格局初露端倪。

SuperCLUE是产业权威的通用大模型的综合性测评基准。本次2025年5月汇报聚焦通用实力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本领会与创作六大任务,总量为1579道多轮简答题。

(责任编辑:企业)

推荐内容
  • 鸿蒙版Kimi重磅更新:鸿蒙电脑独有截屏提问+三大核心功能同步上线
  • 李梓豪新歌《龙鸣》震撼上线礼赞华夏精神
  • 引领兆瓦新标杆!深圳科华闪耀亮相北京充换电展
  • 快手“超级宠粉节”正式开启,新粉红包、整点爆品秒杀等惊喜福利等你解锁
  • 碰一碰、实况窗等独家感受加持,鸿蒙版大众点评焕新本地生存业务
  • 青春开嗓,引爆口喉健康声浪|三金西瓜霜亮相2025Y2Y品牌年轻节