大模型的2.0阶段:低成本+高精度,垂直赛道加速破局 --解读金仕达卫宁“知问”大模型

2023-10-12 19:30:40 保观 微信号

保观 | 聚焦保险创新

进入公众号,可点击右上【···】设为星标哦

毫无疑问,大模型应用正在加速进入2.0阶段。

在1.0阶段,ChatGPT以强大的语言交互能力完成了一次属于AI的破圈,也让大模型进入了大家的视野。

虽然C端用户的热情在逐渐冷静下来,对长于技术应用开发的中国市场来说,大模型在各垂直领域的落地才刚刚开始,这显然是一条更实用、商业模式更清晰的路线。大模型的2.0阶段,重点就是要让大模型在业务流程中真正发挥作用。

我们可以明显感受到垂直领域大模型的“爆发”:亚马逊推出了智能家居全新的Alexa语音助手,背后有大语言模型支持;百度发布了中国首个“产业级”医疗大模型“灵医大模型”。

盘点目前已经发布的大模型,金融、医疗健康是两个非常重要、广泛的应用赛道。

最近,医疗保险科技公司金仕达卫宁推出了专门用于解答医保和商业健康险领域专业知识、报销、理赔相关政策的大语言模型——“知问”,希望为客户打造一款医保与商保领域专业的智慧顾问。

围绕“知问”和大模型的相关话题,我们对金仕达卫宁副总经理、产品临床中心兼创新业务中心负责人王尚前进行了专访,一起聊了聊他们对大模型的理解和应用,希望能为行业提供一些基于实践的参考经验。

深耕医保与商保,“知问”让信息问答化繁为简

金仕达卫宁成立于2012年,是医疗保险和商业健康险数字化风险控制解决方案与服务提供商,业务包括医保基金监管、医保支付方式管理、医保基金运行与审计管理、商业健康保险智能风控、医疗机构精细化管理等,致力于通过运用大数据、人工智能等技术,服务于医保管理部门、商业保险公司及医疗机构,打造智能化的医疗保险、商业健康险风控新模式。

在医保领域,金仕达卫宁针对医保管理推出多种一体化解决方案,包括医保智能监控解决方案、医保基金运行与审计解决方案,以及宏观决策大数据分析解决方案等。从2019年开始,金仕达卫宁参与建设和运维了国家医保局医保信息平台医保智能监管子系统、基金运行及审计监管子系统、宏观决策大数据分析应用子系统、运行监测子系统、数据中台,并为全国20多个省的医保管理部门提供相关服务。

在商保领域,金仕达卫宁则提供了健康险智能核保与风险防范、智能核赔与反欺诈、人群画像与风险模型、惠民保、保险产品精算、营销推广、长护险照护管家等服务。

经过十多年的发展,金仕达卫宁在医保和商保领域已经有丰富的专业积累。

此次推出的“知问”专注于严肃、复杂的医保和商保领域,是一款智能问答系统。关于为什么做“知问”大模型,王尚前告诉我们,首先是因为Transformer带来了技术突破,使自然语言的应用有了更好的效果。他的团队在使用ChatGPT时也发现了通用大模型的一个缺点,即在回答专业垂直领域问题的时候非常欠缺。因此,需要有垂直领域的大模型在通用大模型产品无法应对专业领域问题的时候,填补这一缺口。

金仕达卫宁在服务客户的过程中发现,这几年医保政策变化比较多,药品、耗材、医疗服务项目医保报销目录和报销比例更新很快,普通人要准确了解这些繁多琐细的报销细节和监管要求,需要掌握大量相关知识。而商业健康险产品范围广,从住院手术、门诊治疗到重疾保障,每一项都有独特的保障内容、限额和免赔规定。普通人经常会被众多的保险产品、复杂晦涩的保险条款搞的晕头转向。

基于上述这些痛点,金仕达卫宁在医保领域有超过十年的经验,医保知识库规则库积累了大量的医药学知识、医保政策规范、医保管理规范、法律法规、医保信息业务编码和监管规则等,可以用于医保垂直领域大模型的开发。

“知问”的主要功能是向医保经办人员、医疗机构工作人员,以及商业健康保险购买者和保险代理人提供不受时间和空间限制的高质量、化繁为简的信息咨询和决策参考服务。

在医保领域,“知问”可以回答一系列与医保相关的问题,如医保政策规定、异地报销比例、医保目录中支付条件的限制、违规场景以及案例等,帮助用户快速获取最新、最准确的医保信息。

在商保方面,“知问”能够回答保单、理赔、保险条款等问题。王尚前介绍到,“知问”主要服务于惠民保,因为惠民保有很强的地区性差异,很多参保人也不了解惠民保的具体作用,惠民保的运营方很需要有工具可以辅助解释参保人的问题。

医保知识问题的测试集中,“知问”回答的准确率达到80%;面对复杂的商保条款,其回答准确率达到86%。对于95%的查询,“知问”都能在3秒内给出回答。涉及深度计算或复杂条款分析的问题,“知问”也能在5秒内给出回答。

“知问”大模型能满足不同机构和用户的需求,可以植入任何前端场景,例如医保局、医院等机构的网页、手机端的APP、公众号、微信小程序等,可以在一个月内部署上线应用。

垂直领域模型怎么做?抓住“三要素”

从技术角度来看,“知问”的专业表现主要基于三个要素:合适的基座模型、优质的专业数据和先进的训练方法。

王尚前介绍,“知问”选择了一些开源大模型作为基座模型,例如Meta公司的LLAMA模型、百川、清华的ChatGLM等。这类模型有很多预制规则,能够确保问题回答有更好的精确性,“知问”对这些基座模型选型应用,确保最适用于专业垂直领域。在训练过程中,金仕达卫宁也设置了很多医保、商保领域的预制规则,以提高回答的效率和准确性。

在此基础上,“知问”加入专业医保和商保领域的数据进行训练,如多年积累的医药学知识、全国各地的医保政策规范、医保管理规范、法律法规、医保信息业务编码和监管规则等,做到能够应对全国不同城市客户的需求。在商保领域,与惠民保相关的知识比较简单;相较而言,医保的知识较为复杂,这不仅是由于医保的专业性强,还因为各省、市的医保政策差异较大。金仕达卫宁积累的医保相关知识颗粒度可以细化到地级市。

垂直领域的模型,金仕达卫宁倾向于把模型做“小”,做专业化,针对客户需求做个性化。即以自身的数据积累为基础,再针对专门的监管机构、各地区的医保经办等人员,从需求出发,利用他们提供的有针对性的、非公开的数据进行训练,例如某一类别的医保政策,既避免了硬件资源的过度消耗,同时更实现了其模型在这一领域的精细化和精准度,最终确保模型的效果。

大模型的开发都离不开大量优质数据的支持,“知问”的数据主要来源于金仕达卫宁在医保和商保领域十几年的积累,有丰富、权威且可靠的语料。这些长期业务中沉淀下来的数据经过了实际验证和用户反馈,加之金仕达卫宁参与了国家医保局的医保知识库和规则库建设,本身有较强的专业性、针对性,基本不需要额外投入大量成本进行标注。

为了保证语料的高质量,金仕达卫宁对知识的获取、验证和维护过程进行了严格的把控,并采用先进的知识表示、编码和维护技术,确保语料的权威性和可靠性。在业务中,金仕达卫宁也在不断进行专业数据的调整和更新,确保了全国范围内的统一性、通用性和标准性。

金仕达卫宁在数据使用上采取了谨慎的策略,由于其服务领域的高度专注,只选择与医保和商保相关的信息来训练模型。

接下来,金仕达卫宁还准备进一步做一个政策知识库,通过呈现结果加信源的方式,提供更精准的信息和更好的体验。

为了提供更准确的回答,“知问”不仅依赖于丰富的知识资源,还采用了前沿先进的训练技术和专业的业务场景对齐,这里的关键技术包括专业知识的预训练、应用场景的任务指令训练、全面精准的知识搜索、上下文学习、思维链推理等。

以任务指令训练为例,这是一种让模型在接收到特定指令后,能够按照指令进行操作的训练方式。这类训练通过设置提纲,确保“知问”能够理解同一问题的不同组织方式,既包含一般用户的通俗问法,也包括从业人员的专业问法,从而提高在具体应用场景中的准确度,这也是目前“知问”模型的一大优势所在。

同时,“知问”非常注重法律合规和用户数据安全,通过多种措施全力保证用户数据的安全与隐私。

大模型的未来:垂直领域应用将大显身手

通用大模型燃起了生成式AI的烈火,而得益于专业性、针对性以及为特定行业创造的价值,垂直领域已经成为接下来大模型应用的新方向。

垂直大模型的一个主要优势在于增强特定领域应用的能力。通过利用特定领域的专业知识进行训练,这些模型可以深入研究某一领域的复杂性,成为专业人士不可或缺的工具。例如,在医疗领域,大模型可以帮助诊断罕见疾病,提出个性化治疗计划,并及时了解最新研究和动态。

垂直大模型的另一个优势是具有定制和适应性的潜力。通过定制训练数据,并针对特定领域微调模型,可以最大程度上确保模型符合某个领域的独特要求和术语,从而增强用户体验,确保更准确的输出。此外,微调可以持续改进,并适应不断变化的行业趋势,变得更加有效和可靠。

但是,开发垂直模型也有一定的难度。王尚前告诉我们,金仕达卫宁在开发“知问”模型的过程中,主要的难点在于基座模型的选择和语料设计。

目前,开源基座模型众多,如何选择最适合医保和商保垂直领域的模型,对每种模型效果的评估、具体的评估方法,都带来了困难。另外,人员成本、机器配置也都带来了额外困难,例如,比较众多开源模型中选型耗费的代价非常大。

另一点就是语料设计,一问一答并不能达到预期的训练效果,需要设计考题考纲、问题变种等模式。在这基础上,在输出环节再加入一些限制规则,才能确保模型的效果。

在功能方面,除了“知问”目前切入的专业知识问答领域,王尚前也指出,AIGC还可以提高数据统计的效率,而且金仕达卫宁也会考虑在未来加入核保、核赔等风控应用,满足客户的需求。

整体而言,王尚前很看好大模型的发展。和过去的技术不同,大模型在业务流程中的应用使用户可以通过自然语言与这些新工具交互,不需要再学习专业的技术语言,这也是新一波人工智能技术赋能效率提高的关键。而且,我们每天在产生大量数据,有了这些要素的“打磨”,大模型的功能会更加强大。

关于大模型接下来的发展,未来的核心在于客户需求的竞争,要足够好用,获得用户端的认可。为了满足客户的需求,会出现越来越多的垂直领域大模型,当然,这些大模型的功能也会更加专业化、精细化。

大模型应用的关键之一在于对数据的掌握,垂直领域的专业大模型更是如此。在这一点上,保观认为,从金仕达卫宁的“知问”大模型可以看出,掌握数据积累的垂直领域参与者拥有更多机会。

虽然大模型要实现成熟、广泛的应用,以及摸索出可持续的商业化模式还有待时日,但可以看到,通用大模型的发展解决了很多基本问题,很多企业也已经行动了起来,在借助大模型降本增效的探索之路上持续进步。我们也会持续关注行业的最新动态,挖掘更多优秀经验,期待与大家有更多交流!

点击“阅读原文”,购买保观最新行业报告

本文首发于微信公众号:保观。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

(责任编辑:张晓波 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读