5月13日,AI企业零一万物发布千亿参数Yi-Large闭源模型,零一万物创始人兼CEO李开复在发布会上介绍,在第三方权威评测中,零一万物 Yi 模型在全球头部大模型的中英文双语 PK 上表现出色。最新出炉的斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度) 排到了世界第二,仅次于GPT-4 Turbo,Win Rate则排到了世界第一。
实际上,随着各家大模型能力进入到力求对标GPT4的新阶段,大模型评测的重点也开始由简单的通用能力转向数学、代码等复杂推理能力。在更全面的大模型综合能力评测中,Yi-Large的部分指标也超越GPT4、Claude3、Google Gemini 1.5等同级模型。
发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE模型训练,将冲击 GPT-5 的性能与创新性。
在C端商业化方面,近期上线的一站式AI工作站“万知”则是零一万物基于闭源模型 Yi-Large 所做出的 “模应一体” 2C 生产力应用。实际上,以往发布的大模型2C应用大多定位于“聊天机器人”,万知则针对找、读、写三个场景,将通用问答场景作为交互方式,搭配长文档解读、PPT制作等功能,目前免费向公众开放使用,李开复也亲自担任“首席体验官” 听取用户反馈。
在中国大模型进入第二年之际,李开复认为,国内大模型赛道的竞跑从狂奔到长跑,终局发展将取决于各个选手如何有效达到“TC-PMF”(Product-Market-Technology-Cost Fit,技术成本 X 产品市场契合度)。大模型从训练到服务都很昂贵,算力紧缺是赛道的集体挑战,行业应当共同避免陷入不理性的ofo式流血烧钱打法,让大模型能够用健康良性的ROI蓄能长跑。
最新评论