百川智能发布金融大模型Baichuan4-Finance,准确率领先GPT-4o近20%

2024-12-23 14:34:01 新浪网 

新浪科技讯 12月23日下午消息,百川智能宣布发布全链路领域增强大模型Baichuan4-Finance。据悉,在高质量金融数据的基础上,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。其金融专业能力和场景应用能力均领先GPT-4o。

在中国人民大学财政金融学院新近发布的评测体系FLAME评测中,该模型登上榜首。具体来看,FLAME由两个方向的评测基准组成:一,FLAME-Cer主要面向模型的专业金融能力评测,覆盖了CPA、CFA、FRM等14类权威金融资格认证;二,FLAME-Sce则侧重模型的场景应用能力,包含10个一级核心金融业务场景,21个二级细分金融业务场景,近百个三级金融应用任务。

在FLAME-Cer评测中,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。GPT-4o是金融领域公认的综合实力最强的通用模型之一,而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。

在FLAME-Sce评测中,Baichuan4-Finance一级核心金融业务场景的整体可用率达84.15%,其金融数据计算、金融知识理论等场景的可用率更是超过90%,实际应用场景中的表现非常优秀。

此外,为让模型在提升专业能力的同时不损失通用能力,该模型还打造了一套全链路领域增强方案,覆盖高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程,实现了模型专项能力和通用能力同步提升,提升了模型多元场景可用性。(文猛)

责任编辑:石秀珍 SF183

(责任编辑:郭健东 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读