中文通用大模型基准测试 SuperCLUE 发布,ChatGPT居首、讯飞星火国内第一 环球资讯

时间:2023-05-10 11:09:06 来源: 蓝鲸财经


(资料图片)

蓝鲸教育5月10日讯,日前,中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试可通过多个维度,考验目前市面上主流的中文 GPT 大模型的能力。

利用 SuperCLUE 测试基准,该机构对市面上主流的支持中文的通用大模型进行了评测与排名。结果显示,GPT-4 排名第一,已经非常接近人类的能力。国产大模型中,讯飞科技研发的星火认知大模型总排名第三,国内排名第一。由于大模型不断迭代,该排行榜会定期更新,并于CLUEbenchmarks官方网站公示。

据介绍,该基准测试关注的问题包括:中文大模型在不同任务上的表现如何?与国际代表性模型相比,中文大模型的表现达到了何种程度?中文大模型与人类表现相比如何?SuperCLUE 测试基准可以考验目前市面上主流的中文 GPT 大模型的能力,评测维度涵盖基础能力、专业能力、中文特性。

责任编辑:

标签:

精彩推送

blackice黑冰品牌介绍_黑冰睡袋

成立于2009年,是超轻羽绒产品知名品牌,实现了重量和保暖的结合,满足了轻量化和保暖的要求,性价比高。产

来源:2023.05.06

广西区图书馆考试什么_广西区图书馆

1、第一种情况:官网服务器正在维护。2、第二种情况:机房出现问题,造成线路不通,访问不到服务器。3、第

来源:2023.05.06

书法作品简介怎么写_书法作品简介 世界新消息

1、你可以介绍下你临习的颜体,他的生平,风格,及艺术生涯.  增加同学门对书法的了解,因为练习书法最好

来源:2023.05.06

天天最资讯丨ChemoID平台预测的治疗可延长胶质母细胞瘤患者的生存期

3月2日发表在CellReportsMedicine上的新的多机构期临床试验数据发现,癌症干细胞测试可以准确地决定更

来源:2023.05.06

泰国政府:合众汽车将在泰生产电动汽车,面向东南亚市场销售

彭博5月5日消息,合众新能源汽车将启动在泰国的生产并在东南亚销售。泰国政府发言人TipananSirichana周六在

来源:2023.05.06

国家中医药管理局:提供中医养生保健服务的机构及其人员不得从事诊疗活动

国家中医药管理局印发《中医养生保健服务规范(试行)》。其中提出,提供中医养生保健服务的机构及其人员不

来源:2023.05.06

全球快报:英国伦敦一地铁火警被触发 乘客砸窗逃生

00:21当地时间5月5日晚,英国首都伦敦一地铁触发火警,人们用锤子把车窗玻璃打碎,随后乘客通过车窗爬了出

来源:2023.05.06

【聚看点】郑州市医疗保障局中牟分局:召开廉政教育活动动员部署会

河南经济报记者刘学中通讯员刘彦华4月25日上午,郑州市医疗保障局中牟分局召开廉政教育活动动员部署会。郑

来源:2023.05.06

小姐姐“熬”过五一假期 火速领取体彩500万大奖

4月28日晚,也就是五一假期正式开始的前一天晚上,就在大家沉浸在五一假期即将开启的喜悦中时,没想到体彩7

来源:2023.05.06

新闻快讯

X 关闭

X 关闭

新闻快讯