4月15日,可靈AI在北京中關村國際創(chuàng)新中心舉行“靈感成真”2.0模型發(fā)布會,宣布基座模型再次升級,面向全球正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。
自去年 6 月發(fā)布以來,可靈 AI 便在 AI 賽道上一路狂奔,展現(xiàn)出強大的發(fā)展?jié)摿Α?shù)據(jù)顯示,其已累計完成超 20 次迭代,憑借不斷優(yōu)化的性能和豐富的功能,吸引了來自全球各地的用戶。截至目前,可靈 AI 全球用戶規(guī)模已突破 2200 萬,月活用戶數(shù)量在短短 10 個月內(nèi)增長 25 倍,這一成績在競爭激烈的 AI 市場中堪稱亮眼。同時,超 1.5 萬開發(fā)者和數(shù)千家國內(nèi)外企業(yè)客戶,如小米、亞馬遜云科技、阿里云、Freepik、藍色光標等,將可靈的 API 廣泛應用于不同行業(yè)場景,累計生成約 1200 萬個圖像和超過 4000 萬個視頻素材,可靈 AI 正逐漸成為 AI 時代視頻創(chuàng)作的新基礎設施。
快手高級副總裁、社區(qū)科學線負責人蓋坤在發(fā)布會上表示,可靈 AI 一直致力于提升模型基礎質(zhì)量,增強畫質(zhì)清晰度,并引入更多創(chuàng)新功能,以滿足用戶多樣化需求。可靈 AI 的愿景是讓每個人都能用 AI 講出好故事,實現(xiàn)更加精準的復雜創(chuàng)意表達。然而,蓋坤也指出,當前 AI 行業(yè)在生成內(nèi)容的穩(wěn)定性以及用戶復雜創(chuàng)意的精確傳達方面仍面臨諸多挑戰(zhàn),要實現(xiàn) “用 AI 講好每一個故事” 的目標,必須全方位提升基模型能力,定義人和 AI 交互的 “全新語言”。

在這樣的背景下,可靈 AI 在 2.0 模型的迭代中,正式發(fā)布了 AI 視頻生成的全新交互理念 Multi-modal Visual Language(MVL)。MVL 由 TXT(Pure Text,語義骨架)和 MMW(Multi-modal-document as a Word,多模態(tài)描述子)組成,它打破了傳統(tǒng)文字表達在影像信息傳達上的局限,使用戶能夠結(jié)合圖像參考、視頻片段等多模態(tài)信息,將腦海中包含身份、外觀、風格、場景、動作、表情、運鏡在內(nèi)的多維度復雜創(chuàng)意,直接高效地傳達給 AI?;?MVL 理念,可靈 AI 推出了多模態(tài)編輯功能,用戶不僅可以用圖像作為輸入生成創(chuàng)意視頻,未來 MMW 還將引入聲音、運動軌跡等更多模態(tài)信息,為用戶提供更加豐富的表達途徑。
?
發(fā)布會上,快手副總裁、可靈 AI 負責人張迪發(fā)布了全新的可靈 2.0 大師版。這一版本在語義響應、動態(tài)質(zhì)量、畫面美學等方面實現(xiàn)了顯著提升,是一次技術、體驗、美學的三重突破??伸` 2.0 大師版全面升級了視頻及圖像創(chuàng)作可控生成與編輯能力,上線的全新多模態(tài)視頻編輯功能,能夠靈活理解用戶意圖。創(chuàng)作者可以在一段視頻的基礎上,通過輸入圖片或文字,對生成的視頻內(nèi)容進行元素的增加、刪減、替換,極大地提高了二次編輯和處理的靈活性。
?

在圖像生成大模型領域,可圖 2.0 同樣表現(xiàn)出色,處于行業(yè)領先水平。它具備強大的復雜語義理解能力、電影級的畫面質(zhì)感、多條件的可控風格化生成等多項核心優(yōu)勢。在團隊內(nèi)部的多項勝負率評測中,相較于 Midjourney V7、FLUX1.1 [pro] 以及 Reve 等行業(yè)領先的圖像模型,可圖 2.0 均保持明顯優(yōu)勢??蓤D 2.0 的文生圖能力迎來全面升級,大幅提升了指令遵循能力,顯著增強了電影美學表現(xiàn)力,還擁有更多元的藝術風格,可支持 60 多種風格化的效果轉(zhuǎn)繪,讓模型出圖的創(chuàng)意和想象力實現(xiàn)大幅躍升。此外,可圖 2.0 還上線了局部重繪和擴圖等實用的圖像可控編輯功能,以及全新的風格轉(zhuǎn)繪功能,用戶只需上傳一張圖片加上風格描述,就能一鍵切換圖片的藝術風格,同時精準保留原圖的語義內(nèi)容。
?
可靈 AI 2.0 的發(fā)布,不僅為個人創(chuàng)作者帶來了更強大的創(chuàng)作工具,也為眾多行業(yè)帶來了新的發(fā)展機遇。AIGC 技術的迅猛發(fā)展,正在重構包括廣告營銷、專業(yè)創(chuàng)作、影視、娛樂創(chuàng)意等在內(nèi)的多個行業(yè)。
?
以二次元 AI 創(chuàng)作社區(qū)產(chǎn)品貍譜為例,可靈 AI 為其帶來了創(chuàng)新突破。貍譜 1.6 版本在人物運動流暢度、鏡頭移動等方面展現(xiàn)出卓越性能,助力貍譜成功接入 “動態(tài) LIVE” 和 “新春萌偶搖” 兩大功能。其中,“動態(tài) LIVE” 實現(xiàn)了 “圖 - 影 - 音” 快速創(chuàng)作,“新春萌偶搖” 在春節(jié)期間引發(fā) 60 萬用戶轉(zhuǎn)播。未來,雙方將基于貍譜的優(yōu)質(zhì)內(nèi)容數(shù)據(jù)與可靈的算法能力,打造動畫模型,推動 AI 成為內(nèi)容引擎,并共同孵化優(yōu)質(zhì)創(chuàng)作者,構建更活躍的創(chuàng)作生態(tài),攜手開啟二次元內(nèi)容產(chǎn)業(yè)的新篇章。
?
可靈 AI 超級創(chuàng)作者、《新世界加載中》總導演、異類 Outliers 創(chuàng)始人陳翔宇在分享中表示,“可靈 AI 可全面融入劇集級創(chuàng)作流程”。AIGC 相較于實拍和動畫,不僅提升了創(chuàng)作效率,更是革命性地釋放了試錯空間。異類 Outliers 團隊從劇本創(chuàng)作到內(nèi)容發(fā)行,完成了一次完整的影像工業(yè)化創(chuàng)作流程,實踐證明可靈 AI 是一個能夠穩(wěn)定、大規(guī)模嵌入劇集創(chuàng)作流程的生成式協(xié)作大模型。在 AI 的輔助下,導演及編劇團隊的大量內(nèi)容創(chuàng)意實現(xiàn)了更富有想象力的表達,陳翔宇認為 “AIGC 也許是下一代內(nèi)容結(jié)構的雛形”。
?
為了進一步激發(fā) AI 愛好者們的創(chuàng)作熱情,快手副總裁、可靈 AI 負責人張迪在發(fā)布會現(xiàn)場正式發(fā)起 “可靈 AI NextGen 新影像創(chuàng)投計劃”。該計劃將投入千萬資金,為 AIGC 創(chuàng)作者提供全球宣發(fā)、IP 打造和保障等支持,以全資出品、聯(lián)合出品和技術支持等靈活多樣的合作方式,助力 AI 好故事走向世界。同時,可靈 AI 面向全球創(chuàng)作者發(fā)出征集邀約,邀請用戶共同打造全球首支用戶共創(chuàng) AI 創(chuàng)意短片,讓創(chuàng)作者的靈感和創(chuàng)意登陸上海、香港、東京、巴黎、多倫多等世界多地廣告大屏。
?
此次可靈 AI 2.0 的發(fā)布,在技術創(chuàng)新、功能升級以及行業(yè)應用等方面都取得了重大突破,為全球創(chuàng)作者提供了更強大的創(chuàng)作平臺,也為 AIGC 技術在各行業(yè)的深入應用奠定了堅實基礎。正如蓋坤所說,可靈 AI 將持續(xù)大力推動技術創(chuàng)新,用人與 AI 交互的全新語言,幫助用戶實現(xiàn)復雜創(chuàng)意的精確表達。未來,可靈 AI 有望在 AI 創(chuàng)作領域繼續(xù)深耕,引領行業(yè)發(fā)展潮流,讓 “每個人都能用 AI 講出好故事” 的愿景早日成為現(xiàn)實,為全球內(nèi)容創(chuàng)作產(chǎn)業(yè)帶來更多驚喜和變革。