天津大学大模型评测报告:GPT-4和百度文心一言显著领先


(相关资料图)

编程客栈()8月15日 消息:8月12日,天津大学和信创海河编程客栈实验室举办了一php次大模型技术与评测研讨会,会上发布了首份大模型评测报告。

该报告对国内外14个大语言模型进行了中文综合能力评测,结果显示,GPT-4和百度文心一言相对于其他模型综合性能领先。

在此次评测中,GPT-4对参评模型的主观题回答进行了打分,结果显示,GPT-4认为文心一言生成的中文内容质量更高。相比人工评价,在基于 GPT-4的自动评测中,文心一言的总得分超过了 GPT-4,位居榜首。

天津大学表示,大模型有望重塑人工智能的发展模式,国产大模型正在迎头赶上国际类似模型,并在某些指标上实现了超越。百度文心一言在评测中展现了强大的实力,具备了android在相关行业落地的技术基础。

百度表示,百度在大模型生编程态的构建上具备先发优势,目前已经有15万家企业申请接入文心一言测试。

推荐DIY文章
当智能健身走向全民化:AEKE轻力量家庭智能健身房引领未来
海艺AI:迎合“AI时代”发展潮流,刷新绘图市场传统认知
布局产业新高地!海星医药健康创新园B区奠基仪式隆重举行
未来五年500亿投入打底,北汽蓝谷锚定细分市场增量
【展会直击】华秋慕尼黑上海电子展精彩ing,助力电子产业高质量发展!
桂花网蓝牙网关助力司乘人员职业健康监测
精彩新闻