智谱AI总裁王绍兰：大模型技术进步的陡峭曲线没有放缓迹象

2024-05-07 06:34:36 每日经济新闻

腾讯QQ
QQ空间

每经记者周逸斐每经编辑陈旭

2024中关村论坛年会近日举行。本届论坛以“创新：建设更加美好的世界”为主题，上百位顶尖专家、上千名演讲嘉宾围绕科技创新引领社会进步、民生改善、可持续发展等议题，共话开放创新，共谋发展机遇，为建设更加美好的世界贡献智慧和力量。

在清华大学主办的平行论坛“2024世界数字健康论坛”上，智谱AI总裁王绍兰发表了题为“大模型时代的探索和思考”的主旨演讲。《每日经济新闻》记者从论坛现场获悉，智谱AI为本次中关村论坛年会提供了大模型技术支持，打造了“2024中关村论坛年会”会务智能体，为参会者提供全面实时的会议信息、日程查询、议题概览等服务。

围绕大模型领域相关话题，王绍兰在论坛期间接受了《每日经济新闻》记者（以下简称NBD）的专访。

仅有强大基座模型不够

NBD：2024中关村论坛年会上，清华大学联合生数科技发布了首个长时长、高一致性、高动态性视频大模型Vidu，外界评价其为国产版Sora（美国人工智能研究公司OpenAI发布的人工智能文生视频大模型），您觉得国内已经进入Sora阶段了吗？

王绍兰：在大模型研发的历程中，我们越来越意识到实现通用人工智能（AGI）的道路很长，踽踽独行不如齐力同行。

生数科技在文生视频模型方面有比较突出的能力，是智谱已经投资的十多家AI大模型产业相关创业公司之一。目前许多企业都拥有行业领先的技术实力，这是一种鲜明的技术导向。

我们也发起了智谱Z计划，专门支持大模型原始创新，覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等各方面。

我们觉得，仅仅有强大的基座模型还不够，只有打通大模型产业生态圈上下游，与客户、不同生态位的合作伙伴一起，才能推动中国人工智能产业全面发展。

NBD：您在论坛现场提到，我国大模型发展比国外晚了一年，当前外界有人认为中国大模型研究在沿袭国外的技术，您认为该如何缩小与国外先进水平的差距？

王绍兰：我认为，中国要建立起具有独立自主知识产权、安全可控自研的国产大模型。大模型是AI技术设施的关键底座，大模型竞争是国家科技战略竞争，中国一定要有自主创新的大模型产品。

我们目前有国产全自研的核心技术，从底层算法、预训练框架、团队搭建，甚至到国产化硬件的适配，智谱的全链路技术都由我们团队自主研发，完全自主可控。

坦白地说，智谱跟世界顶级水平仍然存在差距。承认这一差距，是要认清方向并去追赶。我们与世界顶级水平之间的差距虽然在缩小，但仍然存在，对此团队还是有压力的，但同时也非常有动力。我们希望认清这个差距，并且靠自身努力追上差距。当然，除了国产、自研，我们同样注重技术的高效迭代和创新。

大模型商业化方兴未艾

NBD：上一个AI繁荣周期涌现的“AI四小龙”前期融资能力是比较强的，但后期普遍遭遇了商业化的艰难探索。您认为中国的大模型在商业化过程中该怎样避免类似的情况？

王绍兰：生成式AI不再强烈地依赖标注，不再依赖具体的任务和场景，它的泛化能力更强。由于能力本身的泛化性和通用性，我们合作的伙伴遍布各行各业，聚焦不同的领域。

如果只是把大模型当作一个技术浪潮，那么它总有巅峰和低谷。但如果你把大模型看作一场技术革命，那么一切的视角、想象空间都变了。大模型催生了前所未有的新空间、新市场，它的革命性不仅在于改造旧的世界，还将开辟一个前所未有的新世界。

我认为，大模型技术进步的陡峭曲线还没有放缓的迹象，大模型商业化之路方兴未艾。2024年将是AGI元年，人工智能的革命性潜力将进一步释放，不仅体现在技术领域，也将给商业世界带来颠覆性影响。这不是将来时，而是进行时。

NBD：当前，从AI到大模型，从大模型到大模型商业化落地，有人认为最大的拦路虎是技术问题，还有人认为是商业化模式问题。从现状来看，您支持哪种观点？

王绍兰：技术能力跃升和商业化并不矛盾，坚持技术和商业化两条路线，共同的方向就是推动中国大模型产业的全面发展。

在技术方面，我们从底层算法、预训练框架、团队搭建，甚至到国产化硬件的适配，全链路技术都由团队自主研发，完全自主可控。在商业化方面，针对不同的用户需求，我们总结出了三种主要商业模式：API（应用程序编程接口）、云端私有化、本地私有化。从生产、营销、综合投放、销售，到转化、服务、用户体验、售后等，每个环节我们都已经积累了许多落地案例。

最近我们刚刚公布了一批大模型商业化案例，覆盖智能汽车、金融、咨询、数字营销等诸多领域。

算力困境是客观存在的

NBD：当前国产大模型在商业化上有没有出现一些共性问题？智谱AI如何规避这些可能的挑战？

王绍兰：算力的困境是客观存在的，我们在国产算力适配方面有了很多进展。

第一，从GLM（通用语言模型）预训练框架搭建之初，我们就非常注意算力的利用率问题，在这方面做了大量的工作，目前还在进行。第二，智谱一开始就在国产算力适配方面，进行了投入。第三，在国产算力适配情况方面，2022年以来，GLM系列模型支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理，当前已支持昇腾、神威超算、海光DCU等十余种国产硬件生态。

NBD：国内不少生成式AI企业都在布局出海，智谱AI在国际化方面有何布局？

王绍兰：我认为国际化方面的布局需要一步步来，智谱目前在技术上的努力已经获得国际认可。

比如，近日，大模型权威评测组织LMSYS（由几所高校共同建立的AI研究组织）推出了基准测试——Arena-Hard，智谱研发的ChatGLM3和新一代基座大模型GLM- 4排名仅次于GPT- 4Turbo（ChatGPT发布的语言模型）和Claude 3 Opus。

另外，在今年ICLR（国际表征学习大会）和WWW（国际万维网大会）上，我们都有幸获邀作大会主旨报告，这也是国内第一次有大模型相关的主旨发言出现在国际顶级会议上。

我认为，对于智谱来说，目前最关键的还是把核心技术突破和商业化落地两个方面做好，我们也希望推动更大范围的共建与探索。

（责任编辑：董萍萍）

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字

智谱AI总裁王绍兰：大模型技术进步的陡峭曲线没有放缓迹象

最新评论

相关推荐

热门阅读

和讯特稿

智谱AI总裁王绍兰：大模型技术进步的陡峭曲线没有放缓迹象

最新评论

相关推荐

热门阅读

和讯特稿

推荐阅读