今日,证券时报记者从百度内部渠道获悉一份李彦宏最新的内部讲话。在该讲话中,李彦宏谈到了对大模型开源与闭源的路线选择,并回应了AI创业者应该专注模型还是应用等话题。
以下为内部讲话的核心论断:
1、闭源模型在能力上会持续地领先,而不是一时地领先。
2、模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源,比如Linux、安卓等等很不一样。
3、闭源有真正的商业模式,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。
4、闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。
5、无论中美,当前最强的基础模型都是闭源的。通过基础模型降维做出来的模型也是更好的,这使得闭源在成本、效率上更有优势。
6、对于AI创业者来说,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要非常长时间的坚持才能跑出来。
7、既做模型又做应用的“双轮驱动”,对创业公司不是好模式。创业公司的精力和资源都很有限,更应该专注。既做模型又做应用,势必会分散精力。
关于百度文心大模型为什么不开源
“一年前文心刚刚发布的时候,我们内部是有过非常激烈的讨论的,最后当然大家也知道这个结果,我们的决定是不开源。为什么不开源?当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。在这种情况下,多百度一家开源不多,少百度一家开源也不少。”在内部讲话中,李彦宏在谈及为什么文心大模型不开源时说道。
李彦宏认为,目前像Llama、Mistral这样主流的开源模型其实都是有相当影响力的,国内的智源、百川、阿里的通义也都是开源的。因此,市场上不缺百度这一家开源的模型。而且百度要开源的话,还得自己去维护一套开源的版本,这是不划算的。
关于开源与闭源哪种路径更好
更重要的是,李彦宏认为闭源模型在能力上会持续地领先,而不是一时地领先。“为什么会有这个判断?因为我们觉得模型开源的意义其实不是很大,这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用,它没有经过大算力的验证。”李彦宏说。
在许多业内人士看来,由于开源可以集中全球开发者的资源与智慧,因此开源模型的能力终将在未来超越闭源模型。但李彦宏认为,模型开源不是一个众人拾柴火焰高的情况,这跟传统的软件开源,比如Linux、安卓等等很不一样。“由于是模型带来的开源,我们也不知道参数为什么变成了那个样子,这种情况下很难实现众人拾柴火焰高。虽然Llama也鼓励大家去贡献各种各样的数据、代码,但是实际上大家明白最主要的开发者就是Meta这些人,它并不是一个真正由大家一起来协同开发的产品。”李彦宏说。
李彦宏认为,闭源才有真正的商业模式,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。同时,他表示闭源在成本上也有优势。因为只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。“今天不管是在中国也好、在美国也好,最强的基础模型都是闭源的,而各种各样的小模型、最好的小模型,都是通过大模型蒸馏来的。通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。”李彦宏表示。
关于创业者要做模型还是做应用
关于创业者如何在大模型时代“掘金”,李彦宏在内部讲话中也分享了自己的看法。
当前,一些做模型的创业公司讲求“双轮驱动”,既做模型,也做应用。李彦宏认为这不是一个好的模式。“既做模型又做应用,势必会分散精力。创业公司的精力和资源都是有限的,同时做两件事情和只做一件事情哪个成功率更高是不言自明的。在任何情况下我们都非常讲专注力,当资源有限的时候更应该专注,而不是去搞所谓的‘双轮驱动’。”李彦宏表示。
在李彦宏看来,AI创业者的核心竞争力不是模型本身,因为这太耗资源,而且需要非常长时间的坚持才能跑出来。创业者真正的优势应该是在某一个领域的知识、数据。当前市面上有许许多多的模型,在特定应用当中怎么样使用这些模型的组合是创业者可以干的事儿,是可以提供价值增益的。
对于很多创业者而言,最主要的担忧就是自己做的AI应用能力最终会被基础模型的能力覆盖。李彦宏对此表示,这种担心没有任何道理,基础模型不会通吃AI应用。他举例说道,在移动时代,微信没有去吃掉拼多多,滴滴也没有变成腾讯的一部分,它们都各自提供了自己独特的价值,有自己非常不一样的竞争力。“它们的兴起都是依赖移动生态里的一个封闭平台——微信,但是它们并不怕微信去抢它的饭碗,所以没有必要担心基础模型通吃AI的应用。”李彦宏表示。
校对:王蔚
最新评论