摩尔线程完成基于国产GPU的AI训练全要素验证,性能逼近英伟达基线
北京智源人工智能研究院发布众智FlagOS统一技术栈验证结果,摩尔线程基于AI训推一体全功能GPU智算卡MTT S5000,完整适配FlagOS训练全要素软件栈。其面向Qwen3-0.6B语言模型完成了1T Tokens从头训练验证,实现连续6天以上、超过14000步的无中断稳定训练,Loss曲线平均相对误差控制在0.82%以内;在标准下游任务评测中,较行业标杆基线(英伟达)提升1.65个百分点。
相关股票
21 只 · 按关联度排序
和
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
东
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
*
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
浙
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
铜
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
胜
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
威
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
卓
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
东
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
麒
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
顺
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
杰
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
华
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
麦
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
利
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
联
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
晶
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
中
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
拓
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
弘
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。
科
80%
加载行情
刚刚有个消息挺提气的——摩尔线程那边搞定了国产GPU的AI训练全要素验证。
说白了就是他们用自己研发的MTT S5000这款卡,对接大模型训练跑通了全流程,拿Qwen3-0.6B这个模型做了1T Tokens的从头训练,连续跑了6天多、14000多步,愣是一次都没崩。而且最后在下游任务测评里,性能比英伟达的基线还高出了1.65个百分点。
这意味着什么?之前大家老担心国产GPU能不能真刀真枪跑大模型训练,现在看来至少从技术验证这块已经摸到门槛了。当然你说完全追上英伟达那还早,但差距确实在缩小。
这事儿对芯片板块肯定是利好,尤其是算力、国产替代这些概念最近本身就有资金盯着。