DoNews6月28日消息,由深度學習技術及應用國家工程研究中心主辦,百度飛槳、文心大模型聯(lián)合承辦的WAVE SUMMIT 深度學習開發(fā)者大會2024在京召開。會上,百度重磅發(fā)布文心大模型4.0 Turbo,并公布一系列技術、產(chǎn)品、生態(tài)最新成果。
文心大模型4.0 Turbo發(fā)布,速度更快 效果更好
人工智能的目標是模擬、延伸和擴展人的智能。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰認為,大模型為通用人工智能帶來曙光,可以從兩個角度解讀,一是人工智能技術的通用性,二是能力的全面性。在技術的通用性方面,大模型在面向不同任務、語言、模態(tài)、場景時,通用性越來越強;在能力的全面性方面,理解、生成、邏輯、記憶是人工智能的四項基礎能力,創(chuàng)作、解題、代碼、規(guī)劃、決策等人工智能的典型能力,基本上都是這四項基礎能力的綜合運用。這四項能力越強,越接近通用人工智能。
大會現(xiàn)場,王海峰發(fā)布了文心大模型4.0 Turbo,網(wǎng)頁版、APP、API陸續(xù)面向用戶開放。通過數(shù)據(jù)、基礎模型、對齊技術、提示、知識增強、檢索增強和對話增強等核心技術的持續(xù)創(chuàng)新,以及飛槳文心的聯(lián)合優(yōu)化,文心大模型 4.0 Turbo的速度更快,效果更好。
百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰
在強大的基礎大模型基礎上,進一步創(chuàng)新智能體技術,包括理解、規(guī)劃、反思和進化,能夠做到可靠執(zhí)行、自我進化,并一定程度上將思考過程白盒化,讓機器像人一樣思考和行動,能夠調(diào)用工具自主完成復雜任務,在環(huán)境中持續(xù)學習實現(xiàn)自主進化。目前,文心一言累計用戶規(guī)模已達3億,日調(diào)用次數(shù)已達5億。
大會還發(fā)布了中國工程院朱有勇院士及團隊與百度共同打造的首個農(nóng)業(yè)智能體——“農(nóng)民院士智能體”。它基于文心智能體平臺創(chuàng)建,學習了朱有勇院士的研究成果以及相關的農(nóng)業(yè)知識,可以為農(nóng)民解答生產(chǎn)生活中的問題,促進科技助農(nóng)惠農(nóng)。瀾滄拉祜族自治縣竹塘鄉(xiāng)黨委書記丁杏杏、云山村村民李福受邀來到大會現(xiàn)場,分享了使用“農(nóng)民院士智能體”為他們的農(nóng)業(yè)生產(chǎn)帶來的便利。
此外,百度還發(fā)布了飛槳新一代框架——飛槳框架3.0。截至目前,飛槳文心生態(tài)已凝聚1465萬開發(fā)者,服務37萬家企事業(yè)單位,創(chuàng)建95萬個模型。
文心大模型日均提問量提升78% 提問平均長度提升89%
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜現(xiàn)場分享了文心大模型應用觀察、最新產(chǎn)品數(shù)據(jù)及基于文心大模型的創(chuàng)新應用,同時她宣布文心大模型4.0 Turbo API 向開發(fā)者開放使用,披露了星河共創(chuàng)計劃最新進展、飛槳文心生態(tài)成果等。
她表示,過去半年文心大模型取得了顯著進展,用戶日均提問量增加78%,提問平均長度提升89%。截至目前,文心大模型已累計生成70億行代碼、創(chuàng)作5.9億篇文章、編撰百萬篇專業(yè)研報、解答了1.7億學習問題,輔助1.3億人次工作等。文心大模型為用戶提供的幫助從簡單需求延伸到更多元、復雜的任務。與此同時,文心大模型還支持了大量的應用創(chuàng)新。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜
在大模型應用落地過程中,選擇合適的模型對應用效果至關重要,吳甜詳解到。在具體能力表現(xiàn)上,文心輕量級模型適合解決確定場景的問題,具備出色的性能和成本表現(xiàn);文心3.5具有良好的通用性,適用于日常信息處理和文本生成任務;文心4.0模型規(guī)模更大、能力更強,具備更強的理解能力、邏輯推理能力與更豐富的知識,提供專業(yè)且深入的幫助;文心4.0工具版基于智能體技術,善于綜合運用多種工具和數(shù)據(jù),按要求完成非常復雜的任務。
大會現(xiàn)場,吳甜還宣布文心大模型4.0 Turbo API 面向開發(fā)者開放。即刻起,開發(fā)者登錄百度智能云千帆大模型平臺即可使用文心大模型 4.0 Turbo API服務。
據(jù)了解,文心大模型星河共創(chuàng)計劃推出一年以來,已經(jīng)與廣大開發(fā)者共同創(chuàng)造55萬AI原生應用,推出1000+實用的大模型工具,涌現(xiàn)出長光衛(wèi)星、華晨寶馬、維普資訊等優(yōu)秀應用共創(chuàng)案例,此外還與行業(yè)領軍機構共創(chuàng)了1000B+高質(zhì)量稀疏數(shù)據(jù)。在人工智能應用創(chuàng)新的道路上,數(shù)據(jù)的重要性無可替代。百度將持續(xù)推進文心大模型星河社區(qū)數(shù)據(jù)共創(chuàng)計劃發(fā)展,除持續(xù)聘請千人專家團隊加入文心導師,指導文心大模型學習更多元的專業(yè)領域知識,還將通過CCF百度松果基金設立高校專項課題,聯(lián)動區(qū)域政企資源打造文心數(shù)據(jù)生態(tài)中心,匯聚各方資源,支持更多數(shù)據(jù)伙伴,共創(chuàng)產(chǎn)業(yè)數(shù)據(jù)。
大會現(xiàn)場,上海體育大學“長江學者”特聘教授、美國國家體育科學院院士劉宇宣布上海體育大學與百度研發(fā)的國內(nèi)首個面向體育行業(yè)的大模型——上體體育大模型正式對外發(fā)布。目前,上體體育大模型及其科研團隊正服務游泳、田徑、體操、蹦床、攀巖等多支國家隊備戰(zhàn)巴黎奧運會。
飛槳發(fā)布新一代框架3.0 專為大模型設計
文心大模型的持續(xù)快速進化,得益于百度在芯片、框架、模型和應用上的全棧布局,尤其是飛槳深度學習平臺和文心的聯(lián)合優(yōu)化。
百度AI技術生態(tài)總經(jīng)理馬艷軍詳細介紹重磅發(fā)布的飛槳新一代框架——飛槳框架3.0,新一代框架面向大模型、異構多芯進行專屬設計,向下適配異構多芯,充分釋放硬件潛能;向上一體化支撐大模型的訓練、推理。新版本同時具有動靜統(tǒng)一自動并行、編譯器自動優(yōu)化、大模型訓推一體、大模型多硬件適配四大能力。
百度AI技術生態(tài)總經(jīng)理 馬艷軍
據(jù)介紹,訓推一體是飛槳框架的特色能力之一,大模型訓推一體,讓訓練與推理的能力相互復用,為大模型全流程提供統(tǒng)一的開發(fā)體驗和極致的訓練效率。飛槳框架3.0還為大模型硬件適配提供了功能完善、低成本的方案,建設了面向硬件廠商的代碼合入、持續(xù)集成、模型回歸測試等研發(fā)基礎設施,為硬件適配提供了全套保障。
新一代框架為文心大模型的訓練與推理提供了更強大的支撐,也提供了壓縮、推理、服務等全方位支撐。
在AI for Science領域,飛槳框架3.0為科學計算提供了高階自動微分、編譯優(yōu)化、分布式訓練能力支撐,還建設了面向通用數(shù)理問題求解的賽槳PaddleScience以及專注于生物計算的螺旋槳PaddleHelix工具包。飛槳框架3.0還原生支持復數(shù)技術體系,這對于如氣象預報、汽車/飛行器氣動分析等場景下的數(shù)據(jù)特征分析具有重要意義。
Comate發(fā)布中文名“文心快碼” 版本升級至2.5
大會現(xiàn)場,百度智能代碼助手Comate迎來全新發(fā)布和品牌煥新。百度副總裁陳洋宣布品牌升級,發(fā)布了中文名“文心快碼”,寓意“碼隨心動,快人一步”。文心快碼的“快”主要體現(xiàn)在三大方面:開發(fā)速度快、業(yè)務迭代快、企業(yè)落地快。在百度,單位時間提交代碼數(shù)量增加35%、研發(fā)單周交付占比達到了57%,整體研發(fā)提效14%以上,與此同時,典型客戶喜馬拉雅一個季度落地采納率就可以達到了44%,數(shù)據(jù)均業(yè)界領先。
目前,百度80%的工程師已經(jīng)在深度使用文心快碼,其中代碼采納率已達到46%,新增代碼生成占比29%。而文心快碼的落地經(jīng)驗僅用了3個月就賦能喜馬拉雅深度落地。文心快碼還已應用到包括上海三菱電梯、軟通動力、吉利汽車、晶合集成電路和奈雪的茶等上萬家企業(yè),覆蓋金融、汽車、機械制造、軟件服務等諸多領域。
百度副總裁 陳洋
現(xiàn)場,陳洋還發(fā)布了文心快碼2.5版本,介紹其在知識增強、研發(fā)流程全域賦能、企業(yè)級安全等方面實現(xiàn)了能力提升。在之前續(xù)寫、解釋代碼、問答等能力的基礎上,新版本可深度解讀代碼庫、關聯(lián)權威公域和私域知識生成新的代碼,生成的代碼更加安全,并且可以智能檢測安全漏洞、一鍵修復漏洞,支持混合云部署等。
目前,文心快碼提供標準版、專業(yè)版、企業(yè)版、企業(yè)專有版4大版本,大會期間限時放送文心快碼專業(yè)版3個月會員卡,開發(fā)者可以通過百度搜索文心快碼進入官網(wǎng)領取。
文心大模型和飛槳共同打造的底層技術基座愈加堅實,上層典型應用也愈加繁榮、全面開花。如今,AI技術正煥活甲骨文,甲骨文信息處理教育部重點實驗室與百度文心大模型攜手,探索甲骨文的數(shù)字化保護與傳承之路?,F(xiàn)場,雙方打造的“來自甲骨文的回答”互動程序正式上線,通過調(diào)用文心一言的對話能力及對甲骨文文字的釋義,讓古老的甲骨文“活起來”。
AI技術也正成為野生動物“守護官”。國際愛護動物基金會(以下簡稱“IFAW”)與百度聯(lián)合發(fā)布“AI守護官2.0版”,通過飛槳平臺開發(fā)工具PaddleX定制打造的模型,提高了鑒別野生動物制品的準確度,縮短了耗費時間,持續(xù)迭代優(yōu)化,用技術讓野生動物保護更加高效。
如今,大模型為代表的人工智能加速各行各業(yè)轉(zhuǎn)型升級,賦能經(jīng)濟,產(chǎn)業(yè)應用的廣度和深度持續(xù)拓展。正如王海峰所說,人工智能基于深度學習及大模型工程平臺,包括算法、數(shù)據(jù)、模型、工具等,也已經(jīng)具備了非常強的通用性,并具備了標準化、模塊化和自動化的特征,推動人工智能進入到了工業(yè)大生產(chǎn)階段,通用人工智能將加速到來。