天眼查App顯示,中國移動通信集團浙江有限公司、中國移動(浙江)創(chuàng)新研究院有限公司、中國移動通信有限公司及中國移動通信集團有限公司聯(lián)合研發(fā)了一項創(chuàng)新技術(shù),該技術(shù)名為“自定義區(qū)域動態(tài)視頻生成方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品”,已于2024年9月5日申請專利,并于同年12月31日公布。
該技術(shù)屬于人工智能技術(shù)領(lǐng)域,主要通過獲取用于視頻生成內(nèi)容描述的文本及作為視頻背景的圖片,用戶可在圖片中選取自定義區(qū)域,生成掩碼圖片。隨后,將文本、圖片和掩碼圖片輸入至訓(xùn)練完成的視頻生成模型,最終得到目標(biāo)視頻。
視頻生成模型通過在預(yù)設(shè)擴散模型中嵌入時序?qū)R模塊和/或圖像控制模塊得到。時序?qū)R模塊用于確定目標(biāo)視頻中每幀圖像的時序,而條件控制模塊則至少用于根據(jù)掩碼圖片確定目標(biāo)視頻的動態(tài)區(qū)域。這一創(chuàng)新技術(shù)通過增加時序?qū)R模塊以及條件控制模塊,優(yōu)化了視頻生成質(zhì)量及內(nèi)容,并通過掩碼操作實現(xiàn)指定區(qū)域的動態(tài)生成,解決了現(xiàn)有技術(shù)無法進(jìn)行動態(tài)區(qū)域選擇、視頻內(nèi)容難以控制的問題。
該技術(shù)的研發(fā)標(biāo)志著中國移動在人工智能視頻生成領(lǐng)域邁出了重要一步,未來有望在視頻制作、廣告設(shè)計等多個領(lǐng)域得到廣泛應(yīng)用。
風(fēng)險警告:本文根據(jù)網(wǎng)絡(luò)內(nèi)容由AI生成,內(nèi)容僅供參考,不應(yīng)作為專業(yè)建議或決策依據(jù)。用戶應(yīng)自行判斷和驗證信息的準(zhǔn)確性和可靠性,本站不承擔(dān)可能產(chǎn)生的任何風(fēng)險和責(zé)任。內(nèi)容如有問題,可聯(lián)系本站刪除。