如果你想點一杯咖啡外賣到家,使用傳統(tǒng)的手機App,你的操作流程大概率是這樣的:點開外賣App,輸入咖啡(或咖啡品牌),找到一家滿意的店鋪,選擇想喝的品類,選擇是否去冰、是否減糖,輸入或選擇送到的地址,點擊下單,輸入密碼或人臉識別付費……
但如果手機搭載了AI Agent(AI智能體或AI代理),你只需對著手機說一句“幫我點一杯咖啡盡快送到家”,不用再進行任何操作,它便能主動識別你所處的位置,打開外賣App,準(zhǔn)確猜測你的喜好選擇咖啡品牌、品類,并自動完成付款……
2025世界人工智能大會(WAIC 2025)7月26日在上海開幕,AI智能體成為與會者熱議的話題。事實上,自大模型開始比拼落地應(yīng)用后,AI智能體便反復(fù)被提及。那聽了這么多,AI智能體到底是什么?目前發(fā)展到哪個階段了?
WAIC 2025 7月26日-28日在上海舉行 中新經(jīng)緯攝
和傳統(tǒng)智能助手有何區(qū)別?
“你可以將其理解為一個‘全方位的秘書’。”高通公司AI產(chǎn)品技術(shù)中國區(qū)負(fù)責(zé)人萬衛(wèi)星用一句通俗易懂的話向中新經(jīng)緯解釋何為AI智能體。他提到,AI智能體的“全方位”,是指它不僅能幫你完成簡單的垂類任務(wù),而且能處理覆蓋生活、工作等方方面面的復(fù)雜任務(wù)。
“AI智能體會讓生活和工作更簡單、更美好?!比f衛(wèi)星表示,用戶只需說一句話,Agent就能自動完成任務(wù),讓工作生活都變得更輕松,而它的感知性和專屬化,能真正做到“想你所想”。
據(jù)中國銀河證券6月發(fā)布的研報,摩根士丹利發(fā)布的深度研究報告《AI Agents Knocking at the Door》提到,AI Agents不再僅僅是輔助人類的工具,它們將越來越多地成為執(zhí)行任務(wù)和做出決策的主體,從簡單的自動化工具進化為具備自主理解、行動和學(xué)習(xí)能力的“數(shù)字勞動力”。該篇報告將AI Agents視為能夠感知環(huán)境、規(guī)劃任務(wù)、調(diào)用工具,并靈活迭代的自主軟件。
高通供圖
AI智能體不僅是一個簡單的應(yīng)用程序,也是一個完整的系統(tǒng)。“完成一個看似簡單的任務(wù),AI智能體往往需要至少4個步驟?!比f衛(wèi)星以AI智能體“點咖啡”舉例,當(dāng)用戶發(fā)布語音指令時,智能體首先要通過語音轉(zhuǎn)文字模塊,將指令轉(zhuǎn)成文字信息;然后調(diào)用相當(dāng)于“大腦”的大模型,理解指令意圖;接著搜尋個性化記憶,自主了解用戶習(xí)慣在哪個App點咖啡、喜歡什么口味的咖啡、家庭地址等信息;最后查詢數(shù)據(jù)庫把信息補齊后生成提示詞,調(diào)用點咖啡的軟件接口或者在App里點擊完成相關(guān)操作。
萬衛(wèi)星介紹,模擬點擊是目前AI智能體的運行方式之一。簡單言之,就是AI智能體模仿人的點擊操作,但人不用親自動手,只需下達(dá)指令就行。這種模式下,智能體完成整個任務(wù)耗時多少主要取決于操作步驟的多少,比如需要翻幾個頁面。“目前能看到一些指標(biāo)顯示,單步操作已經(jīng)大概能控制在2秒以內(nèi)了?!?/p>
在萬衛(wèi)星看來,和“我說一句,它回一句”的傳統(tǒng)智能助手相比,AI智能體扮演的更像是一個統(tǒng)籌決策者的角色。他介紹,聊天機器人和語音助手比較依賴于專業(yè)且明確的指令,完成的任務(wù)是單一清晰的,并且在解決任務(wù)時仍舊以人的決策為主。
在“人為主、AI 為輔”的任務(wù)解決模式下,AI 只負(fù)責(zé)執(zhí)行。但像個“小秘書”的AI智能體改變了這一模式,它要幫用戶解決復(fù)雜問題,而不是一步一步和用戶交互著完成。萬衛(wèi)星稱,真正的AI智能體應(yīng)該以“AI為主、人為輔”的方式解決問題,即人只需要發(fā)布任務(wù),或者最后驗收結(jié)果就行,盡量讓機器和AI承擔(dān)更多主體工作。
在現(xiàn)實世界如何應(yīng)用?
榮耀手機AI產(chǎn)品專家白晨對中新經(jīng)緯表示,過去的應(yīng)用程序(App)將被具備執(zhí)行力的AI智能體所替代,手機將成為用戶的助理和伙伴,把“能聽你說”變成“替你去做”。比如,你下班回家時已經(jīng)不需要再打開打車軟件,查看路況、選擇車型、根據(jù)預(yù)估車費和時間下單叫車,而只需對手機說“我要回家”,它會自動完成這一切,然后告訴你:10分鐘后在公司門前,乘坐車牌尾號888的網(wǎng)約車,預(yù)計7點到家。
在WAIC 2025騰訊展臺,智能座艙服務(wù)Agent正化身出行服務(wù)助手,演示了在餐飲點單、取號訂座、機酒預(yù)訂等場景下,如何“懂你所說、知你所想、代你操作”。比如,用戶在駕車路上僅需說一句“幫我下單一杯少冰的冰椰拿鐵”,Agent即可協(xié)助在微信小程序上選擇順路的咖啡店,用戶確認(rèn)即可基于微信車端小額免密支付完成下單,取餐信息會自動推送到手機微信上,用戶到店取餐時可以直接用手機亮出二維碼核銷。
從實際應(yīng)用場景來看,目前AI智能體主要用于客戶服務(wù)、個人助理、管理電子郵件并充當(dāng)生產(chǎn)力工具。萬衛(wèi)星提到,一些廠商正合作推出“做行程規(guī)劃”的Agent,在該領(lǐng)域Agent能不錯地完成任務(wù),而點咖啡、點餐類Agent小應(yīng)用,目前發(fā)展也不錯?!跋鄬Σ惶珡?fù)雜、對整合協(xié)調(diào)能力要求不過高,也不特別涉及多領(lǐng)域執(zhí)行的通用任務(wù),加上用戶指令很明確的話,Agent是能勝任的?!?/p>
DCCI互聯(lián)網(wǎng)研究院院長劉興亮告訴中新經(jīng)緯,Agent能跨平臺、跨領(lǐng)域、多步驟整合行程安排與提醒。用戶手機內(nèi)置的Agent可以讀取日程中的會議變動、自動發(fā)郵件申請時間調(diào)整、通過外賣平臺訂早飯、根據(jù)出行路線推薦順路菜市場并生成購物清單……未來“智能日程+生活助理”Agent,極具爆發(fā)潛力。
目前發(fā)展到什么階段?
AI技術(shù)演進的速度可以說是“人間一天,AI一年”。萬衛(wèi)星認(rèn)為,Agent的底層技術(shù)及上層應(yīng)用,從2024年開始發(fā)展就非常快。他認(rèn)為,在Agent領(lǐng)域,“過一天就可能有全新的變化”。
業(yè)內(nèi)人士普遍認(rèn)為,2025年將成為“智能體元年”。AI智能體憑借著深度思考、自主規(guī)劃、做出決策并深度執(zhí)行的能力,AI在發(fā)展路徑上正實現(xiàn)一次范式突變?!拔艺fAI答”正轉(zhuǎn)向“我說AI做”,并被逐漸應(yīng)用到各類商業(yè)場景中。
智能終端Agent是階躍星辰重點布局的領(lǐng)域。據(jù)該公司相關(guān)人士向中新經(jīng)緯介紹,過去兩年,階躍星辰自研的Step系列大模型,已搭載至汽車、具身智能、物聯(lián)網(wǎng)等頭部企業(yè)的旗艦產(chǎn)品中,50%以上頭部國產(chǎn)手機品牌與階躍合作AI智能體。7月25日,2025世界人工智能大會前夕,階躍星辰在上海發(fā)布了新一代基礎(chǔ)大模型——Step 3。
WAIC 2025期間階躍星辰與千里科技、吉利發(fā)布的下一代智能座艙AgentOS(預(yù)覽版) 中新經(jīng)緯攝
階躍星辰相關(guān)人士介紹,Agent爆發(fā)需要兩個必要條件,一個是多模態(tài)的能力,另外一個是慢思考的能力,這兩個能力恰好在2024年取得了突破性的進展。所以,2025年Agent將會大規(guī)模爆發(fā),將成為“智能體元年”。
萬衛(wèi)星也表示,OpenAI發(fā)布的O1、O3模型、Deepseek R1模型相繼出現(xiàn),說明大模型在多模態(tài)支持、思維鏈(COT)能力上越來越成熟,這為Agent的落地提供了可行性。最近OpenAI、Manus等都推出了自己的Agent相關(guān)應(yīng)用,落地場景越來越多。此外,Token(在信息技術(shù)領(lǐng)域是一種用于身份驗證、安全訪問控制或數(shù)據(jù)完整性保護的數(shù)字標(biāo)識符)成本變低,各個App也在推出自己功能的核心API(應(yīng)用程序編程接口),開放給第三方調(diào)用。這些都會給Agent帶來體驗上的進步。
“今年我們看到很多Agent相關(guān)產(chǎn)品落地,大家能明顯感受到Agentic AI(智能體AI,比AI Agent更自主)產(chǎn)品帶來的交互變革,以及對工作效率和便利性的提升?!痹谌f衛(wèi)星看來,今年端側(cè)在Agent領(lǐng)域的機會很大,因為感知性和個性化的優(yōu)勢,行業(yè)或多或少會把一些模塊、方案部署到端側(cè)。
“雖然現(xiàn)在模型能力越來越強,支持多模態(tài)、有思維鏈能力,但在解決復(fù)雜問題上,確實還有差距?!比f衛(wèi)星提到,在AI智能體“點咖啡”的實際場景中也可能出錯,比如點錯口味,或者卡在某個步驟。
萬衛(wèi)星表示,現(xiàn)階段AI Agent在應(yīng)用時還未徹底實現(xiàn)全自動化?!爸饕窃谀承┐怪鳖I(lǐng)域的特定應(yīng)用中,智能體可以實現(xiàn)大多數(shù)任務(wù)的自動化,但最后還需要加入人工干預(yù)。”他解釋,這種人工干預(yù)可能是進行一些糾錯工作,也可能是在點餐的過程中完成最后的付款操作。具體來說,智能體在“完成任務(wù)的可靠性和準(zhǔn)確性”“提高通用性”以及“打通生態(tài)”方面還有進步空間。
AI智能體未來還會在哪出現(xiàn)?
對于AI智能體的理想樣態(tài),萬衛(wèi)星稱,讓“人工干預(yù)徹底消失”確實比較復(fù)雜。但單從應(yīng)用場景和消費者便利性來看,讓AI智能體或者機器人獨立完成復(fù)雜任務(wù)是大家追求的目標(biāo)。這實際上是朝著Agentic AI的方向發(fā)展——即完全高度自主,能夠獨立行動,強調(diào)自主性的AI類型。
未來,AI智能體是否只會出現(xiàn)在手機上?還有哪些類型的終端設(shè)備可能會成為它的搭載平臺?
萬衛(wèi)星認(rèn)為,手機無疑還是AI智能體最大的入口,因其算力中心、交互中心和感知中心的地位,手機仍會在Agentic AI中處于中心位置,但它可能不再是唯一入口。PC、AI眼鏡、耳機、智能座艙,甚至智能家居、IoT設(shè)備等,都有可能成為搭載AI Agent的重要平臺。
萬衛(wèi)星還提到,如今用戶已經(jīng)習(xí)慣直接和“小愛”“YoYo”這類助手對話了,交互路徑已經(jīng)逐漸從“人找App”變成“人找Agent來統(tǒng)一調(diào)度App”,流量流向也隨之改變,未來AI智能體成為新的流量入口是毋庸置疑的,而這還可能催生出應(yīng)用商店3.0、4.0類的全新商業(yè)模式。