DoNews 7月25日消息,在2025世界人工智能大會(簡稱“WAIC 2025”)開幕前夕,階躍星辰今天在上海正式發(fā)布了新一代基礎(chǔ)大模型——Step 3。
作為階躍的主力基座模型,Step 3兼顧智能與效率,旨在面向推理時代打造最適合應(yīng)用的模型。
Step 3將于7月31日面向全球企業(yè)和開發(fā)者開源,為開源世界貢獻(xiàn)最強(qiáng)多模態(tài)推理模型。
同時,階躍星辰還宣布聯(lián)合多家國內(nèi)領(lǐng)先的芯片、平臺廠商發(fā)起成立“模芯生態(tài)創(chuàng)新聯(lián)盟”,將通過推動模型和芯片產(chǎn)業(yè)鏈聯(lián)合創(chuàng)新,加速大模型應(yīng)用的落地。
此外,階躍星辰與上海國有資本投資有限公司達(dá)成深度戰(zhàn)略合作,將圍繞加強(qiáng)資本鏈接、生態(tài)業(yè)務(wù)合作等方面進(jìn)行全面的深度合作。
作為一家以實(shí)現(xiàn)通用人工智能(AGI)為目標(biāo)的基礎(chǔ)大模型公司,階躍星辰始終專注于基礎(chǔ)大模型的研發(fā),持續(xù)推進(jìn)模型的技術(shù)迭代。
階躍星辰創(chuàng)始人、CEO姜大昕表示:“從Step 1到Step 2兩代基模的快速迭代,促使我們深入思考什么才是最適合應(yīng)用的模型。隨著大模型進(jìn)入到強(qiáng)化學(xué)習(xí)發(fā)展階段,新一代推理模型成為主流,模型性能的提升固然顯著,但這是否完全等同于模型價值?面對這一產(chǎn)業(yè)之問,我們必須回歸客戶需求,立足真實(shí)應(yīng)用場景,探索模型創(chuàng)新落地的可行路徑。這是我們研發(fā)新一代Step 3基礎(chǔ)模型的出發(fā)點(diǎn)?!?/p>
新一代基模 Step 3:推理時代最適合應(yīng)用的模型
隨著大模型技術(shù)邁向推理時代,階躍星辰提出,最適合實(shí)際應(yīng)用的大模型需要滿足強(qiáng)智能、低成本、可開源和多模態(tài)四個特征。
這四個維度缺一不可,因?yàn)閱吸c(diǎn)能力強(qiáng),無法滿足用戶對于模型的綜合需求。唯有模型全面發(fā)展,才能讓模型真正用起來?;谶@樣的研發(fā)理念,階躍星辰打造了新一代基模Step 3,專為追求性能與成本極致均衡的企業(yè)和開發(fā)者設(shè)計:
Step 3是階躍星辰首個全尺寸、原生多模態(tài)推理模型,兼顧模型效果與推理成本,是在模型架構(gòu)創(chuàng)新、算法工程協(xié)同設(shè)計上的一次大膽嘗試與Scale Up。Step 3采用 MoE 架構(gòu),總參數(shù)量 321B,激活參數(shù)量 38B。
Step 3擁有強(qiáng)大的視覺感知和復(fù)雜推理能力,可準(zhǔn)確完成跨領(lǐng)域的復(fù)雜知識理解、數(shù)學(xué)與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜單上取得了開源多模態(tài)推理模型的SOTA成績。
在確保性能的前提下,階躍星辰持續(xù)推進(jìn)模型成本優(yōu)化。在推理時代,模型性能隨思維鏈的增長而提升,解碼效率因此成為降低成本的關(guān)鍵。
目前,主流開源模型雖然針對解碼進(jìn)行了大量優(yōu)化,但其優(yōu)化方案主要適配國際高端芯片,在中端及國產(chǎn)芯片上的解碼效率仍有提升空間。
Step 3旨在通過系統(tǒng)性的技術(shù)創(chuàng)新,實(shí)現(xiàn)模型降本增效的目標(biāo)。
在架構(gòu)設(shè)計階段,Step 3便充分考量系統(tǒng)與硬件的特性,實(shí)現(xiàn)廣泛硬件平臺上的高效推理。
憑借系統(tǒng)和架構(gòu)創(chuàng)新,Step 3實(shí)現(xiàn)了行業(yè)領(lǐng)先的推理解碼效率。根據(jù)原理分析,Step 3在國產(chǎn)芯片上的推理效率最高可達(dá)DeepSeek-R1的300%,且對所有芯片友好。
在基于 NVIDIA Hopper 架構(gòu)的芯片進(jìn)行分布式推理時,實(shí)測Step 3相較于 DeepSeek-R1的吞吐量提升超70%。
這些都是在不犧牲激活參數(shù)量、不降低注意力容量的條件下實(shí)現(xiàn)的。這些結(jié)果充分驗(yàn)證了 Step 3具備廣泛的普適性,在多種硬件環(huán)境下部署,均能顯著地降低推理成本。
目前,Step 3已授權(quán)國內(nèi)多家芯片公司,并完成了芯片適配。
同時,Step 3將于7月31日正式面向全球企業(yè)和開發(fā)者開源,為開源世界貢獻(xiàn)最強(qiáng)的多模態(tài)推理模型。
Step 3已經(jīng)通過開源技術(shù)報告,與全球開發(fā)者分享了大幅降低推理成本背后的系統(tǒng)架構(gòu)創(chuàng)新。
成立兩年多以來,階躍星辰構(gòu)建起“1+N”的Step系列大模型矩陣。“1”是指Step 3基礎(chǔ)大模型;“N”則為Step系列的多模態(tài)大模型矩陣,廣泛覆蓋語音、視覺理解、圖像編輯、圖像和視頻生成、音樂等領(lǐng)域。
本次WAIC期間,階躍亦升級了多模態(tài)模型,包括階躍首個多模理解生成一體化模型Step 3o Vision,第二代端到端語音大模型Step-Audio 2。目前,所有這些模型都可以在“階躍AI”官網(wǎng)(stepfun.com)和 “階躍AI” App(應(yīng)用商店搜索下載)進(jìn)行體驗(yàn)。
全產(chǎn)業(yè)鏈聯(lián)合創(chuàng)新,讓大模型真正用起來
要讓大模型真正能用起來,需要從模型、芯片、平臺到應(yīng)用的全產(chǎn)業(yè)鏈協(xié)同創(chuàng)新。
階躍星辰宣布聯(lián)合近10家芯片及基礎(chǔ)設(shè)施廠商,共同發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”,致力于打通芯片、模型和平臺全鏈路技術(shù)。
通過底層聯(lián)合創(chuàng)新提升大模型適配性和算力效率,該聯(lián)盟將為企業(yè)和開發(fā)者提供高效易用的大模型解決方案,加速應(yīng)用落地。
該聯(lián)盟的首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無問芯穹、寒武紀(jì)、摩爾線程、硅基流動等。
目前,華為昇騰芯片已首先實(shí)現(xiàn)Step 3的搭載和運(yùn)行。沐曦、天數(shù)智芯和燧原科技等也已初步實(shí)現(xiàn)運(yùn)行Step 3。其它聯(lián)盟廠商的適配工作正在開展。
發(fā)布會還宣布了上海國有資本投資有限公司與上海階躍星辰智能科技有限公司的深度戰(zhàn)略合作,雙方將圍繞加強(qiáng)資本鏈接、生態(tài)建設(shè)、業(yè)務(wù)協(xié)同、應(yīng)用賦能等方面進(jìn)行全面的深度合作。上海國投生態(tài)體系將在近期參與投資階躍星辰的最新一輪融資。
階躍星辰戰(zhàn)略性聚焦智能終端Agent的方向,重點(diǎn)布局汽車、手機(jī)、IoT設(shè)備等關(guān)鍵應(yīng)用場景,目前頭部客戶效應(yīng)顯著:已覆蓋國內(nèi)超過一半頭部國產(chǎn)手機(jī)廠商,深度合作打造手機(jī) Agent體驗(yàn);聯(lián)合吉利推出AI智能座艙,成功實(shí)現(xiàn)行業(yè)內(nèi)端到端語音大模型首次量產(chǎn)上車。另一方面,階躍星辰積極拓展垂直行業(yè)的應(yīng)用,與金融財經(jīng)、內(nèi)容創(chuàng)作、零售等領(lǐng)域的行業(yè)頭部公司深度合作,共同打造面向 C 端的場景化應(yīng)用體驗(yàn)。