罗福莉：大模型迈入后训练时代，顶尖团队预训练与后训练算力比达1:1

资讯 2026-04-24 , 14:21

据动察 Beating 监测，小米大模型团队负责人罗福莉指出，大模型竞争已从预训练主导的 Chat 时代，全面转向后训练（Post-train）主导的 Agent 时代。当前的核心赛点是「如何在 Agent 上做好强化学习（RL）的 scaling」。这一范式转变直接导致算力分配的重构。罗福莉透露，在 Chat 时代，用于研究、预训练和后训练的算力比例约为 3:5:1；而在如今的 Agent 时代，合理的算力分配比例变为 3:1:1，即预训练与后训练的算力投入已基本相当，目前顶尖模型团队在这两项的投入比例已达到 1:1。同时，系统架构的要求也发生巨变。过去的 RL 基础设施主要以「模型推理引擎」为核心，处理纯文本演算；现在的基建必须以「Agent」为核心，支持异构集群调度，并能容忍 Agent 在复杂工作流中因各类不可控因素中断的模糊性。

雷電財經提醒：請廣大讀者理性看待區塊鏈，切實提高風險意識，警惕各類虛擬代幣發行與炒作，站內所有內容僅系市場信息或相關方觀點，不構成任何形式投資建議。如發現站內內容含敏感信息，可通過舉報或聯繫我們，我們會及時處理。

14:21 , 2026-04-24

罗福莉：大模型迈入后训练时代，顶尖团队预训练与后训练算力比达1:1

雷電財經提醒你:

投資有風險，入市須謹慎。本資訊不作為投資理財建議。

罗福莉：大模型迈入后训练时代，顶尖团队预训练与后训练算力比达1:1

關聯標籤

市場行情 (24h)

恐懼貪婪指數

罗福莉：大模型迈入后训练时代，顶尖团队预训练与后训练算力比达1:1