天风证券:模型架构变化有望带来的能力进步将直接打开大模型应用的更广阔空间

2024-08-15 08:18:11 每日经济新闻 

每经AI快讯,天风证券(601162)研报表示,从IntelligencePerToken到InlligencePerTask的模型变化是重要方向。1)训练阶段,大模型训练预计继续遵循“ScalingLaw”。云、创业公司、主权AI将继续大量采购算力并建设数据中心,追求继续提升IntelligencePerToken,预计全球训练集群将持续扩容,在训练集群超过10万片GPU后,对数据中心的建造、部署、供电、互联构成新挑战。计算密度、互联密度、功率散热密度与存储密度将有望快速提升。2)推理阶段,我们认为树状搜索/自博弈等方式有望快速提升IntelligencePerToken,我们看好在计算阶段GPU与CPU的高速互联。以及在应用阶段,我们认为模型新架构带来的规划能力逐步提高;数学、代码与通用能力也将逐步提升。此外,与市场普遍观点不同,我们认为2024年模型架构的变化将成为最重要的变化,模型架构变化有望带来的能力进步将直接打开大模型应用的更广阔空间。

每日经济新闻

(责任编辑:张晓波 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读