近日,榮耀在世界人工智能大會(WAIC)期間,正式發(fā)布自研多模態(tài)感知大模型——MagicGUI大模型并開源。MagicGUI參數(shù)規(guī)模為7B(70億),支撐底層 AI 智能體的多模態(tài)感知與自動執(zhí)行規(guī)劃能力,達到行業(yè)領先水平。MagicGUI面向全球軟硬件開發(fā)者正式開源,旨在推動AI真正落地。
榮耀MagicGUI大模型采用全新的 AI 算法方案,在訓練過程中創(chuàng)新性地引入了多樣化多模態(tài)訓練數(shù)據(jù),并提出創(chuàng)新的"繼續(xù)預訓練+強化微調"兩階段訓練方案,在榮耀Magic V5常用場景用機操控中的準確率達到91.5%,較行業(yè)同類頂級開源模型提升16.4%。
在數(shù)據(jù)工程方面,榮耀構建了高效的數(shù)據(jù)采集與構造框架,優(yōu)化數(shù)據(jù)配比與篩選方案,形成多樣且高質量的訓練數(shù)據(jù)集;訓練中引入空間增強的復合獎勵函數(shù)、DF-GRPO 強化學習算法等創(chuàng)新方法,大幅提升模型數(shù)據(jù)利用效率與泛化能力,使其在未經訓練的新場景中仍能保持穩(wěn)定性能,實現(xiàn)跨場景適應。
對比評測結果顯示,MagicGUI 大模型已達到行業(yè)領先水平。在行業(yè)開源和榮耀內部榜單測試中,移動端的視覺定位能力、頁面理解問答能力、單步操作能力、動作序列拆解執(zhí)行能力4類任務跑分全面領先。
(圖:單步操作能力、動作序列拆解執(zhí)行能力的模型效果對比)
在實際應用中,榮耀Magic V5作為首款搭載MagicGUI 大模型的折疊屏旗艦,其智能助手YOYO實現(xiàn)了從單智能體任務執(zhí)行到多智能體協(xié)同的升級。借助MagicGUI大模型賦予的感知、推理、規(guī)劃、反思、執(zhí)行任務的全鏈路能力。例如,在出行場景下,用戶僅需語音指令,YOYO即可自動調用高德、滴滴等應用,完成地址修改、車型選擇、取消訂單等操作。同時,該模型支持操作過程中的異常檢測和人工接管,確保交互流暢性。在隱私安全方面,榮耀表示MagicGUI已通過ISO/IEC 27701、ISO/IEC 27001等國際認證。
除技術研發(fā)外,榮耀還參與了多項AI行業(yè)標準的制定。在WAIC人工智能標準化國際合作論壇上,榮耀與中國電子技術標準化研究院、阿里、百度等企業(yè)共同發(fā)布了《智能體協(xié)議共建共享聯(lián)合倡議》,推動AI技術的規(guī)范化發(fā)展。截至今年6月,榮耀已經聯(lián)合20余家企業(yè)推動了終端智能化分級指南標準落地,并牽頭多個AI終端標準立項及起草,以促進產業(yè)協(xié)同。
MagicGUI的開源是榮耀推動AI終端生態(tài)發(fā)展的重要舉措,標志著榮耀在AI領域的進一步布局。榮耀將模型的技術報告、參數(shù)配置、評估數(shù)據(jù)等核心要素向公眾開放,是榮耀踐行阿爾法戰(zhàn)略“開放、共創(chuàng)、共享”理念的體現(xiàn)。這種理念,在研發(fā)過程中也得到體現(xiàn)。榮耀此前已與復旦大學合作成立自然語言處理大模型校企聯(lián)合實驗室,在自然語言處理、多模態(tài)大模型等領域展開研究,MagicGUI大模型即是雙方的合作成果。
榮耀MagicOS副總裁孫建發(fā)表示:“我們始終堅持‘以人為中心’,將科技與人文相結合,加速推動AI融入每一位用戶的生活。MagicGUI不僅是技術成果的分享,更是我們推動AI終端生態(tài)的責任。目前榮耀MagicGUI大模型報告已登陸GitHub平臺,模型與相關測試數(shù)據(jù)將于近期上線相關開源平臺?!?/p>