DoNews5月21日消息,今天召開的 2025 年 I/O 開發(fā)者大會上,谷歌推出了 Gemma 3n 端側(cè)多模態(tài) AI 模型,可以在手機(jī)、平板和筆記本電腦上本地運(yùn)行,處理音頻、文本、圖片和視頻多種數(shù)據(jù)類型。
Gemma 產(chǎn)品經(jīng)理 Gus Martins 透露,Gemma 3n 可以在內(nèi)存小于 2GB 的設(shè)備上運(yùn)行,采用 Gemini Nano 同款架構(gòu),但性能表現(xiàn)更出色。他強(qiáng)調(diào):“Gemma 3n 為設(shè)備端 AI 應(yīng)用帶來了驚人的表現(xiàn)力?!?/p>
Gemma 3n 的最大亮點(diǎn)在于采用了谷歌 DeepMind 開發(fā)的 Per-Layer Embeddings(PLE)技術(shù),顯著降低了模型的內(nèi)存需求。盡管其參數(shù)量分別為 5B 和 8B,但內(nèi)存占用僅相當(dāng)于 2B 和 4B 模型。
谷歌宣稱,Gemma 3n 的內(nèi)存占用分別低至 2GB 和 3GB。此外,通過 PLE、KVC 共享和高級激活量化等技術(shù),Gemma 3n 在移動設(shè)備上的響應(yīng)速度提升 1.5 倍,質(zhì)量也優(yōu)于 Gemma 3 4B 版本。
Gemma 3n 在非英語語言處理上也有突破,尤其在日語、德語、韓語、西班牙語和法語中表現(xiàn)優(yōu)異,在多語言基準(zhǔn)測試 WMT24++ 中,該模型得分高達(dá) 50.1%。
用戶無需任何設(shè)置,目前可通過 Google AI Studio 直接在瀏覽器中使用 Gemma 3n;開發(fā)者則可通過 Google AI Edge 集成本地功能,支持文本和圖像理解與生成,未來還將擴(kuò)展更多能力。