日韩亚洲土豪大屌老王探花,亚洲有码中文字幕在线观看

DoNews > 商業(yè) > 字節(jié)跳動(dòng)豆包視頻生成大模型發(fā)布：首次突破多主體互動(dòng)難關(guān)

字節(jié)跳動(dòng)豆包視頻生成大模型發(fā)布：首次突破多主體互動(dòng)難關(guān)

楊亮 2024-09-24 16:21:38

383235

分享到

DoNews9月24日消息，9月24日，2024火山引擎 AI 創(chuàng)新巡展在深圳舉辦，豆包大模型家族迎來新成員：全新發(fā)布豆包·視頻生成模型、以及豆包·音樂模型、豆包·同聲傳譯模型、豆包通用模型pro 和文生圖模型、語音合成模型等垂類模型大幅升級(jí)。

豆包·視頻生成模型能遵從復(fù)雜 prompt，解鎖時(shí)序性多拍動(dòng)作指令與多個(gè)主體間的交互能力。

該模型支持高效的 DiT 融合計(jì)算單元、全新設(shè)計(jì)的擴(kuò)散模型訓(xùn)練方法和深度優(yōu)化的 Transformer 結(jié)構(gòu)，可以實(shí)現(xiàn)更充分地壓縮編碼視頻與文本，支持一致性多鏡頭生成，能夠大幅提升視頻生成的泛化能力。

官方介紹稱，無論是語義理解能力，多個(gè)主體運(yùn)動(dòng)的復(fù)雜交互畫面，還是多鏡頭切換的內(nèi)容一致性，豆包視頻生成大模型均達(dá)到業(yè)界先進(jìn)水平。

火山引擎總裁譚待表示，豆包視頻生成大模型支持多風(fēng)格多比例的一致性多鏡頭生成，可應(yīng)用在電商營銷、動(dòng)畫教育、城市文旅、微劇本等領(lǐng)域。

此外，譚待表示，豆包大模型發(fā)布以來使用量爆發(fā)式增長(zhǎng)。截至 9 月，豆包語言模型的日均 tokens 使用量超過 1.3 萬億，相比 5 月首次發(fā)布時(shí)猛增十倍，多模態(tài)數(shù)據(jù)處理量也分別達(dá)到每天 5000 萬張圖片和 85 萬小時(shí)語音。

此前視頻生成模型大多只能完成簡(jiǎn)單指令，豆包視頻生成模型則能實(shí)現(xiàn)自然連貫的多拍動(dòng)作與多主體復(fù)雜交互。

有創(chuàng)作者在搶鮮體驗(yàn)豆包視頻生成模型時(shí)發(fā)現(xiàn)，其生成的視頻不僅能夠遵循復(fù)雜指令，讓不同人物完成多個(gè)動(dòng)作指令的互動(dòng)，人物樣貌、服裝細(xì)節(jié)甚至頭飾在不同運(yùn)鏡下也保持一致，接近實(shí)拍效果。

據(jù)火山引擎介紹，豆包視頻生成模型基于 DiT 架構(gòu)，通過高效的 DiT 融合計(jì)算單元，讓視頻在大動(dòng)態(tài)與運(yùn)鏡中自由切換，擁有變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語言能力。豆包視頻生成模型具備專業(yè)級(jí)光影布局和色彩調(diào)和，畫面視覺極具美感和真實(shí)感。

深度優(yōu)化的 Transformer 結(jié)構(gòu)，則大幅提升了豆包視頻生成的泛化能力，支持 3D 動(dòng)畫、2D 動(dòng)畫、國畫、黑白、厚涂等多種風(fēng)格，適配電影、電視、電腦、手機(jī)等各種設(shè)備的比例，不僅適用于電商營銷、動(dòng)畫教育、城市文旅、微劇本等企業(yè)場(chǎng)景，也能為專業(yè)創(chuàng)作者和藝術(shù)家們提供創(chuàng)作輔助。

標(biāo)簽: 豆包大模型

字節(jié)跳動(dòng)豆包視頻生成大模型發(fā)布：首次突破多主體互動(dòng)難關(guān)

掃描二維碼查看原文

分享自DoNews

關(guān)于我們| 電子協(xié)議| 合作聯(lián)系| 蜀ICP備2024059877號(hào)-1

網(wǎng)站信息

京公網(wǎng)安備11010802023059號(hào)

精品一区二区无码毛片|中日无码av中文字幕久久|先锋影音中文字幕一区|国产乱码久久久久久高潮视频|手机AV每日更新在线观看|国产原创剧情一区二区三区