DoNews 9月23日 消息(李昊原)人工智能有三大要素:算法、算力和數(shù)據(jù)。其中后兩者,是人工智能的物質(zhì)基礎,而算法,更像是人工智能的靈魂。
1956年,達特茅斯大會正式提出了“人工智能(Artificial Intelligence)”這一概念,受時代背景限制,這時的人工智能準確率和效率遠遠低于人類水平,并未引起太多反響;上世紀80年代,BP(Back Propagation)算法被提出,引發(fā)了人工智能的第二輪高潮,但受算力限制導致應用難以落地,這波浪潮再次進入低谷;2006年,深度學習被提出,同時硬件資源不斷豐富提升,算力瓶頸得到了突破,引發(fā)了迄今為止的第三次人工智能高潮,并日益深刻地改造著世界。
這場改造已經(jīng)滲透到了各個行業(yè),比如在影視行業(yè),2001年,史蒂文·斯皮爾伯格導演的電影《人工智能》還著重在探討人性,2018年同樣由他導演的《頭號玩家》,已經(jīng)像使用說明書一般,向觀眾展示了人工智能技術在未來世界的廣泛應用。
同樣的變化也發(fā)生在中國,9月18日,在湖南長沙,2021世界計算大會落下了帷幕。與此同時落下帷幕的,還有大會的專題活動——第二屆“馬欄山杯”國際音視頻算法大賽頒獎盛典暨高峰論壇。
據(jù)了解,由芒果TV聯(lián)合馬欄山視頻文創(chuàng)園主辦的本屆算法大賽共設置了視頻補全、視頻推薦與音樂節(jié)拍檢測三大賽題,與音視頻行業(yè)的場景密切結合?;顒蝇F(xiàn)場,芒果TV頒發(fā)了不同賽題的冠亞季軍獎,并公布了芒果TV首個虛擬主持人“YAOYAO”。提起芒果TV,不少人第一時間的反應還是《乘風破浪的姐姐》和《披荊斬棘的哥哥》,一家長視頻平臺為什么要舉辦算法大賽?這個賽事又創(chuàng)造了哪些價值?
解決真實的問題
這些問題,在隨后的頒獎儀式上,得到了集中的回答。
本屆算法大賽賽題關注的都是目前視頻行業(yè)的痛點問題,比如如何提高推薦算法的精準度,擦除視頻中的人物或元素等。以往靠人力成本高效率低,如果人工智能算法可以解決這些問題,對芒果TV這樣的視頻平臺能產(chǎn)生極大的效益。通過舉辦算法大賽的方式,不但能集思廣益,提出有效的解決方案,而且能夠吸引有解決能力的人工智能人才——這兩者都是芒果TV需要的。
第二屆“馬欄山杯”算法大賽頒獎典禮暨高峰論壇現(xiàn)場
首先頒發(fā)獎項的賽道是“視頻補全”,獲得冠軍、亞軍和季軍的隊伍(或個人)分別是“rainbow”,“景-artii”隊和“沖呀皮卡丘”隊。中國科技大學信息科學技術學院教授、博導陳志波介紹,早在文藝復興時期,意大利的藝術家就通過修復的方式,讓中世紀時代的壁畫恢復如新,這項工作稱之為“inpainting”,這也成為了目前研究領域?qū)D像視頻的修復和補全這項工作的定義。
隨著數(shù)字媒體的不斷涌現(xiàn),“inpainting”技術在越來越多應用領域得到應用,比如對老照片的修復,對照片遮擋、污染的去除,目前人工智能對圖像視頻的修復和補全有著廣闊的應用場景,但理論研究上也存在相應的挑戰(zhàn),不管是算法的性能還是其復雜度,以及針對實際應用的優(yōu)化,都有很大的潛在空間。
“整個賽道的設計還是非常符合實際運用的廣泛需求,”陳志波評價道,“比如說后期的編輯要把一些物體進行抹除,像背景、文字,logo等。大賽組織者是從實際應用的需求來設計整個賽道的具體任務,包括固定區(qū)域挖空后進行填補,對視頻里動態(tài)目標檢測后進行消除,還有一些處理隨機背景噪聲,局部水印等任務?!?/p>
獲得第一名的“rainbow”,目前是西安電子科大的在讀博士,去年就是同一賽道的第二名。他所設計的算法,正如許多已經(jīng)在現(xiàn)實中得到廣泛應用的算法一樣,不論是在主觀性的指標上,還是在耗時、算法的復雜度上都達到了比較好的均衡。陳志波介紹,“rainbow”的算法主要是基于2020年的“Spatial-Temporal Transformation”,但針對實際應用的需求做了大量的工程性的改進和策略上的優(yōu)化,包括半精度參數(shù)的選擇,包括對輸入圖像進行裁剪,減少對內(nèi)容的占用。
第二個頒發(fā)獎項的賽道是“視頻推薦”,獲得冠軍、亞軍和季軍的隊伍(或個人)分別是“線性回歸”隊、“OTTO”隊和江離。
視頻推薦是一個非常經(jīng)典的賽題,任務要求據(jù)用戶已經(jīng)看的過視頻,預測用戶下一個要看什么視頻,或?qū)κ裁匆曨l感興趣。這個賽道在第一屆“馬欄山杯”國際音視頻算法大賽就已經(jīng)存在,可見其對視頻行業(yè)的重要性,今年的比賽設置在“看了又看”的模塊上進行升級,不僅希望推薦匹配用戶感興趣的內(nèi)容,同時更強調(diào)內(nèi)容的主流價值觀和用戶的長期體驗,非常具有挑戰(zhàn)性。
浙江大學計算機科學與技術學院副教授、博導趙洲介紹,本次排名前三的隊伍,在算法的設計上殊途同歸,都將算法分成了召回、排序和回歸三個模塊。獲得第一名的“線性回歸”團隊在每一個模塊都有突出的亮點,技術路徑非常詳盡和合理,運用到的技巧也很有趣。
最后一個頒獎的賽道是“音樂節(jié)拍檢測”,獲得冠軍、亞軍和季軍的隊伍(或個人)分別是吳健、王志宇和“十一月的肖邦”隊。音樂節(jié)拍檢測算法,能夠極大地豐富音樂的沉浸感和可玩性,具有廣闊的應用前景,本次大賽的賽題主要就是節(jié)拍的檢測,選手用1100個數(shù)據(jù)來訓練,100個數(shù)據(jù)作為測試,然后根據(jù)準確率來決定優(yōu)勝。
中國科學院語言聲學與內(nèi)容理解重點實驗室主任顏永紅介紹,對音樂的自動分類、分析與檢索是一個新的研究領域,在還沒有智能機的時代,搜索音樂只能通過歌名、演唱者或者歌詞,做音樂信號處理,目的就是要讓計算機具有理解音樂的能力?!皣H上對音樂方面的研究,最基礎的像音符的識別、節(jié)奏的識別,再高一點就到流派的識別,包括對主旋律的提取和對樂器音色的分析,對和弦的識別等,再往上就可以用來做教學質(zhì)量的評價和音樂檢索?!?/p>
據(jù)統(tǒng)計,本屆算法大賽共吸引了全球十多個國家與地區(qū)1959支隊伍參賽,覆蓋了全球知名高校、重要科研院所與知名互聯(lián)網(wǎng)企業(yè),最終優(yōu)勝團隊的算法達到了業(yè)界頭部的水平,相比第一屆算法大賽,本屆吸引到的隊伍數(shù)量要比去年多出51.4%
不為技術設限
2017年底,盧海波加入芒果TV。起初是作為廣告中心技術團隊的負責人,后來成為產(chǎn)品技術中心的負責人。在電視媒體時代,湖南廣電做出了在中國極具影響力的視頻內(nèi)容,到了移動互聯(lián)網(wǎng)時代,內(nèi)容創(chuàng)作同樣重要,但由于場地和展現(xiàn)形式都發(fā)生了變化,技術在視頻產(chǎn)業(yè)的重要性凸顯。
芒果TV
“我們需要依靠技術來更好地理解我們的用戶,在這個基礎上指導節(jié)目的策劃生產(chǎn),視頻產(chǎn)品從策劃生產(chǎn)到播放、互動的形式,也是不一樣的。如果我們不在技術上面跟得上,配合內(nèi)容團隊的話,內(nèi)容團隊的創(chuàng)作就會受限,一是效率不高,二是缺少數(shù)據(jù)的支持?!北R海波告訴記者,除了內(nèi)容方面外,芒果TV在企業(yè)運作方面也自研了完整的內(nèi)部系統(tǒng)平臺,來提高公司運營的效率。
但對技術的投入不僅需要真金白銀,還需要優(yōu)秀的技術人才,在招聘人才的過程中,盧海波發(fā)現(xiàn),許多人對芒果TV有很深的誤解?!八麄冇X得,芒果TV就是把湖南衛(wèi)視的內(nèi)容拿過來,然后做一個播放器播出來,我們招技術人員時,很多技術人員不認為我們是互聯(lián)網(wǎng)產(chǎn)品技術團隊,就是做播放器的,所以招人,尤其是招算法的人很難?!币虼?,承辦算法大賽,對芒果TV來說有重要意義,既可以讓外界知道芒果TV對技術很重視,還可以接觸到許多工程師、高校教師和學生,最終有利于吸引人才。
芒果TV產(chǎn)品技術中心智能算法部產(chǎn)品應用組算法的工程師王心瑩,就曾在去年首屆的算法大賽上,以“炸米餅啊”戰(zhàn)隊的名義,獲得了特定點位跟蹤賽道的冠軍。王心瑩碩士畢業(yè)于倫敦大學學院計算機圖形視覺圖像專業(yè),曾獲得CVPR2020活體檢測競賽單模態(tài)賽道第五名,也是上一屆所有賽道冠軍里唯一一個單槍匹馬作戰(zhàn)的,當時她正在福州一家專注深度學習/機器學習領域的公司擔任算法工程師,當問到她參賽的原因,她坦誠地講,點位跟蹤賽題的要求與她平時的研究領域十分契合,除此之外,芒果TV提供的待遇和對人才的重視也是吸引她的地方。
比賽中,她別出心裁地將“醫(yī)療圖像配準方案”應用于解題思路中,當時其他戰(zhàn)隊中幾乎沒有人使用這個方法,最終以MSE0.588的絕對優(yōu)勢成績遙遙領先拿到了第一名。而她的優(yōu)異表現(xiàn)也吸引了盧海波的注意,在極力的邀請以及給出優(yōu)渥的入職條件后,王心瑩也答應了這份offer。
第一屆“馬欄山杯”算法大賽視頻點位跟蹤冠軍王心瑩
同期入職的不只有王心瑩,在第一屆算法大賽的前后,芒果TV共計引入超過50名一線算法人才,而這些人才的引進,也為芒果TV帶來了技術上的質(zhì)變——在 CVPR2021 視頻人體時空定位賽事中,芒果TV的團隊與國內(nèi)外高校、研究所團隊同臺競技,一舉拿下全球亞軍。同時,他們開發(fā)的首個大規(guī)模商用的自動化3D視頻現(xiàn)實增強系統(tǒng),目前也已可以支撐數(shù)十億產(chǎn)值廣告收入。
“我是這么認為的,我們(芒果TV)不會為自己設一個限制,什么要做什么不做,我們有責任去探索、去研究新的技術,既是為了未來做準備,在這個過程中我們做出了好的東西,我們也會把它對外輸出,甚至商用,實際我們不少技術已經(jīng)進入這個階段了,”談到對技術的重視,盧海波告訴記者,“我們湖南廣電人是有開拓精神的,我們從一個傳統(tǒng)媒體走到現(xiàn)在這樣的新型主流媒體集團,我們也是‘不守規(guī)矩’的,也許再過十年,我們會是最大的互動娛樂媒體平臺,只要我們自己不為自己設限,我覺得我們可以做很多的事情?!?/p>
2015年,我國首次將人工智能納入國家重點計劃,并在2017年上升至國家戰(zhàn)略,人工智能的創(chuàng)新水平持續(xù)提升。去年9月17號,習近平總書記考察了馬欄山視頻文創(chuàng)產(chǎn)業(yè)園,以“守正創(chuàng)新”點題,指明了“文化+科技”的文創(chuàng)產(chǎn)業(yè)發(fā)展方向,而“北有中關村,南有馬欄山”的文化戰(zhàn)略定位目標,也顯示了湖南人的雄心壯志。
正如湖南廣播影視集團有限公司(湖南廣播電視臺)黨委書記、董事長、芒果超媒股份有限公司黨委書記、董事長張華立在算法大賽致辭中所說的那樣:“以芒果TV為原點,通過大賽的新算法進行鏈接,我們希望不斷延伸產(chǎn)業(yè)鏈條,拓展合作平臺,進一步豐富芒果生態(tài)。 ”