精品一区二区无码毛片|中日无码av中文字幕久久|先锋影音中文字幕一区|国产乱码久久久久久高潮视频|手机AV每日更新在线观看|国产原创剧情一区二区三区

智能體重構(gòu)金融業(yè):AI廠商如何“造錘找釘”?

撰文 | 李信馬

題圖 | DoNews制作

不久前,國務院印發(fā)了《關(guān)于深入實施“人工智能+”行動的意見》(下文簡稱“《意見》”),其中,“智能體”一詞被反復提到。

比如在總體要求中提到,到2027年和2030年,新一代智能終端、智能體等應用普及率分別超70%和90%,到2035年,我國全面步入智能經(jīng)濟和智能社會發(fā)展新階段。《意見》中還進一步提到:“在軟件、信息、金融、商務、法律、交通、物流、商貿(mào)等領(lǐng)域,推動新一代智能終端、智能體等廣泛應用?!?/p>

還有在優(yōu)化應用發(fā)展環(huán)境方面:“培育人工智能應用服務商,發(fā)展‘模型即服務’、‘智能體即服務’等,打造人工智能應用服務鏈?!?/p>

“智能體”的英文是“Agent”,早在上世紀有關(guān)人工智能的學術(shù)探討中就已出現(xiàn)。但當下的“智能體”概念,卻是大模型興起后的“舊瓶裝新酒”。中國信息通信研究院不久前發(fā)布的《智能體技術(shù)和應用研究報告(2025年)》中,定義“智能體通常是指能夠感知環(huán)境、理解指令、規(guī)劃決策、執(zhí)行任務的軟件系統(tǒng)或硬件實體”。?

理論上,具身智能也是智能體的一種形態(tài)?制圖:DoNews

2025年,“智能體”的概念開始爆火,在不久前的世界人工智能大會(下文簡稱“WAIC”)上,相關(guān)的產(chǎn)品和發(fā)布幾乎與具身智能平分秋色。啟明創(chuàng)投主管合伙人周志峰在演講中曾表示,智能體的爆火,根本原因是基礎(chǔ)模型能力提升:“上下文窗口更大、能使用外部工具,核心還是‘推理能力’的增強?,F(xiàn)在甚至出現(xiàn)了‘智能體的摩爾定律’——任務處理復雜度每七個月翻一倍?!?/p>

而直接原因,就是年初DeepSeek V3/R1 模型的發(fā)布,將推理成本大幅降低至當時OpenAI對應模型的5%。之后全球的主流大模型陸續(xù)跟進,推理成本差不多降到了去年同期的1/100。在啟明創(chuàng)投對人工智能未來的十大展望中,智能體就占到了兩個:

未來12-24個月,Agent形態(tài)將從“工具輔助”走向“任務承接”,首批真正意義上的“AI員工”將進入企業(yè),廣泛參與客戶服務、銷售、運營、研發(fā)等核心流程,不再僅作為助手存在,而是具備協(xié)同作業(yè)、主動反饋、承擔OKR等能力,推動從成本工具向價值創(chuàng)造轉(zhuǎn)變。

多模態(tài)Agent將不斷走向?qū)嵱没軌蛉诤弦曈X、語音、傳感器等多源輸入,進行復雜推理、工具調(diào)用與任務執(zhí)行,在醫(yī)療、金融、法律等行業(yè)率先實現(xiàn)突破。

無論是政策的指向,還是在機構(gòu)的預測中,金融行業(yè)都被重點提到。相比其他行業(yè),金融行業(yè)在落地智能體方面有得天獨厚的優(yōu)勢:有場景、有數(shù)據(jù),重要的是“有錢”,有預算。

服務金融行業(yè)的人工智能應用服務商層出不窮,而“落地智能體”也成為時下金融行業(yè)熱門的話題。在WAIC,就有多家企業(yè)進行了相關(guān)產(chǎn)品的發(fā)布。比如,螞蟻數(shù)科發(fā)布了金融推理大模型Agentar-Fin-R1,容聯(lián)云推出了容犀Agent & Copilot平臺。人工智能行業(yè)被戲稱為“拿著錘子找釘子”,本文也將以這兩家企業(yè)為例,從“造錘子”和“找釘子”的角度,來分析智能體應用在金融機構(gòu)的落地。

(注:文中內(nèi)容來自DoNews對兩家企業(yè)的采訪,有整理。)

01、“造錘子”之算力

通過下面螞蟻數(shù)科AI產(chǎn)品矩陣的示意圖,可以直觀的看出,智能體的落地,一般分為四個層次。

最底層依舊是算力,再往上是我們熟悉的大模型,再往上則是智能體平臺,上文提到容聯(lián)云的容犀Agent & Copilot平臺,還有螞蟻數(shù)科此前發(fā)的智能體平臺Agentar都位于這一層級,再上一層就是應用層,也對應不同場景下的智能體。

拍攝、整理:DoNews

容聯(lián)云大模型產(chǎn)品負責人唐興才認為,在智能體的構(gòu)建方式上,不同的服務商是大同小異的,都是從底層算力平臺管理入手,進一步構(gòu)建模型體系,模型管理之上,再結(jié)合具體的應用場景搭建平臺,例如質(zhì)檢系統(tǒng)、洞察分析系統(tǒng)、客服系統(tǒng)或營銷系統(tǒng)等。

不同企業(yè)的算力水平不可同一而論,比如銀行財大氣粗,可以撥款幾十億建數(shù)據(jù)中心,有的機構(gòu)則選擇花幾百萬買小型機,但用更少的算力,得到更好的業(yè)務效果,是所有企業(yè)共同的追求。

所以服務商首先要幫金融企業(yè)把算力用好,比如螞蟻數(shù)科集成了一整套云原生架構(gòu),在AI工程能力上也有所積累,可以為客戶建立算力平臺和私有化算力中心。容聯(lián)云在產(chǎn)業(yè)鏈上的定位更接近于應用廠商,會與阿里云、騰訊云等云廠商達成算力方面的合作。

對服務商來說,將算力用好,更多是看用什么尺寸的大模型。一般來說,參數(shù)規(guī)模越大,大模型的能力越強,大模型的能力直接決定了智能體的能力,而模型的參數(shù)規(guī)模越大,對算力的要求自然也就越高。

螞蟻數(shù)科發(fā)布的金融推理大模型Agentar-Fin-R1就包含32B和8B兩個版本,對此,螞蟻數(shù)科CTO王維的看是,模型的尺寸取決于在什么樣的場景下,需要什么樣的算力:“模型的尺寸越大越好嗎?它一定存在邊際效應的衰減。今天選擇8B或者32B,就是說在絕大多數(shù)場景下,這是一個比較主流、折中的選擇。我賣你一個手機十萬塊錢,你肯定不會買,賣五千塊錢你就會買,但是賣三五百,你會嫌性能不夠好,它就是消費價值中合適的折中。”

唐興才也舉了個例子,他們會從實際的數(shù)據(jù)量出發(fā),比如金融質(zhì)檢這個場景,一天要檢測多少通會話,假如有一萬通會話,再去判斷選用多大尺寸的模型?!拔覀儗?B、14B、32B、72B的模型都進行了測試,最終選擇的是32B的模型,在保證效果和算力消耗上達到一個均衡,大概一兩張卡就能很好的覆蓋這個場景,整體投入也不是特別高?!?/p>

另外,金融行業(yè)對合規(guī)類的要求極高,還需要做國產(chǎn)GPU的適配,保證在信創(chuàng)的環(huán)境下也能跑出比較好的效果。比如唐興才介紹,之前容聯(lián)云主要適配的是昇騰,最近也在做阿里平頭哥的適配。

02、“造錘子”之大模型

在WAIC上,螞蟻數(shù)科喊出了一句口號:AI智能體產(chǎn)業(yè)價值釋放的關(guān)鍵,在于“水平通用”向“垂直專用”的戰(zhàn)略轉(zhuǎn)變。

首先明確幾個點:通用大模型在垂直領(lǐng)域并不好用;人工智能應用服務商也并不需要構(gòu)建通用大模型;重要的是如何將通用大模型打造成好用的行業(yè)大模型,其核心就是“數(shù)據(jù)”。

對第一個點,螞蟻數(shù)科金融AI產(chǎn)品總經(jīng)理曹剛的解釋是:“為什么通用大模型到了垂直領(lǐng)域不能開箱即用?因為大家最常見用大模型的方式是Prompt,非常簡單和初級。在金融領(lǐng)域,你想用Promp把最簡單的投資策略或者市場分析給搞出來,都是不切實際的,它沒有足夠深入的行業(yè)知識。”

王維也表示:“一個不能理解行業(yè)的大模型,它就不懂行。什么是懂行的呢?你是A銀行,我是B銀行,你們銀行有你們銀行的‘行話’,在我們銀行就是另外的說法。而且,不同銀行的數(shù)據(jù)集合策略不一樣,即使同一個行業(yè),不同的企業(yè)也有不同的稟賦,同一個業(yè)務,比如說理財推薦,A銀行更推薦理財基金類的產(chǎn)品,B銀行可能更傾向存款類的產(chǎn)品?!?/p>

不過,開源的通用大模型可以成為行業(yè)大模型可靠的基座。有趣的是,在基礎(chǔ)模型的選擇上,螞蟻數(shù)科和容聯(lián)云都選擇了Qwen3.0,可見對其成熟度的普遍認可,在第二選擇上,螞蟻數(shù)科選擇螞蟻集團自研的百靈大模型,而容聯(lián)云選擇了DeepSeek。不過王維也表示:“今天做產(chǎn)業(yè)AI,不應該局限于某個特定的基礎(chǔ)模型,我們后面會出螞蟻百靈模型版本,甚至我們客戶需要用DeepSeek或者其他的開源模型,我們也會考慮?!?/p>

金融行業(yè)是一個要求極高、審慎的行業(yè),對幻覺的容忍度極低。和文章開頭提到的模型推理能力的提升,直接推動了智能體發(fā)展的觀點類似,王維通過過去幾個月螞蟻數(shù)科的實踐,認為模型推的推理能力正變得越來越重要:“金融行業(yè)復雜場景的業(yè)務,需要模型整個推理的鏈條和推理的邏輯都很清晰,才能真正解決問題?!?/p>

想要用智能體解決金融行業(yè)的問題,金融推理模型是必選項,而想要提升模型的推理能力,螞蟻數(shù)科將重點總結(jié)為“3個E”——高質(zhì)量數(shù)據(jù)、過程中要兼顧數(shù)據(jù)和訓練的消耗,還有持續(xù)迭代。

拍攝:DoNews

“金融專業(yè)能力必須用好的金融數(shù)據(jù)去投喂,”王維說:“說到底,大模型是解決問題的,你必須要對任務有足夠多的識別,就像考試要有明確的大綱一樣??荚嚧缶V決定了會考你什么知識點,以及對知識點你掌握的怎么樣。掌握好了就不要浪費過多的算力,掌握得不好要如何進行加訓?所以,要減少幻覺和對算力的消耗,就必須持續(xù)對這件事情進行修正和追蹤。我們的邏輯就是,特定的金融任務體系和高質(zhì)量的數(shù)據(jù),成為我們金融推理大模型專業(yè)度的表現(xiàn)?!?/p>

在數(shù)據(jù)層面,螞蟻數(shù)科背靠螞蟻集團這棵大樹,能獲取千億級金融專業(yè)數(shù)據(jù)語料,構(gòu)建的金融任務分類體系包括6大類、66小類場景,覆蓋了銀行、證券、保險、基金、信托等金融全場景。相較之下,容聯(lián)云訓練金融大模型早期是通過以往積累的存量數(shù)據(jù),之后則是在金融客戶中尋找創(chuàng)新意愿較強的企業(yè)共創(chuàng),后者提供數(shù)據(jù),容聯(lián)云提供技術(shù)和資源,來推動應用落地,再基于標桿案例去開拓新的客戶?!伴_源的Qwen3.0和場景落地之間隔的是數(shù)據(jù),選擇數(shù)據(jù)的能力是我們產(chǎn)品的核心競爭力。具體來說,就是按照規(guī)范,在客戶龐雜的歷史數(shù)據(jù)里面快速選擇出符合場景的優(yōu)質(zhì)數(shù)據(jù)跑到模型里面去?!碧婆d才說。

服務商基于同樣的開源模型,獲取不同的數(shù)據(jù),再通過各自的訓練算法來提高大模型對復雜金融任務的學習效率與性能,在實際應用中,都表現(xiàn)出了相對通用大模型的明顯優(yōu)勢。螞蟻數(shù)科曾宣布,Agentar-Fin-R1金融推理大模型在多個主流金融基準測試中,力壓一眾通用模型取得最高分。

圖源:螞蟻數(shù)科

“舉個例子,有些場景中不使用一些核心的智能體技術(shù)和支持工程的技術(shù),它(通用大模型)可能只打50分、60分,但是你使用了這些技術(shù),能夠?qū)?shù)據(jù)進行微調(diào),對知識進行有效的提取,它的分數(shù)可能到90分。”王維解釋道。

唐興才也表示:“你拿Qwen3.0的裸模型去直接跑質(zhì)檢業(yè)務,也就百分之五六十的準確率。我們靠選數(shù)據(jù)的能力,把這個場景的數(shù)據(jù)標準定下來,訓練好的模型準確率能達到96%以上。”

03、“造錘子”之智能體

人工智能的發(fā)展,一直是從技術(shù)驅(qū)動不斷向市場驅(qū)動轉(zhuǎn)移。從通用大模型到行業(yè)推理大模型,再到智能體,AI能夠解決的問題越來越多,落地的價值也越來越高。

《智能體技術(shù)和應用研究報告(2025年)》中指出:“智能體通過多模態(tài)交互、大小模型協(xié)同、任務分解與規(guī)劃、工具調(diào)用等技術(shù),構(gòu)建起從感知到執(zhí)行的完整閉環(huán)系統(tǒng),有效解決了大模型‘有腦無手’的難題,進而實現(xiàn)更廣泛的互動和功能擴展。隨著多智能體系統(tǒng)正逐步成為構(gòu)建智能生態(tài)的重要支撐形態(tài),以MCP、 A2A等為代表的大模型和智能體通信協(xié)議,為信息孤島和通信兼容性問題提供了有效的技術(shù)解決方案,降低了智能體系統(tǒng)集成復雜性,進一步拓寬了智能體能力邊界?!?/p>

智能體的核心價值,不在于多,而在于突破了以往的AI產(chǎn)品達不到的業(yè)務深度。就像螞蟻數(shù)科CEO趙聞飆在WAIC的演講中所說,與其做一兩千個智能體業(yè)務,不如在一到兩個業(yè)務里解決難題。

智能體的爆火始于去年年底,當時螞蟻數(shù)科就投入到這一賽道,之后推出了Agentar智能體開發(fā)平臺,在今年7月16日,中國信通院發(fā)布的2025年首批可信AI智能體評估結(jié)果中,螞蟻數(shù)科占據(jù)了不同方向的兩個席位。

圖源:中國信通院

中國信通院對通用智能體和場景智能體的定義在于,前者關(guān)注智能體平臺和工具、智能體技術(shù)能力、智能體應用服務、多模態(tài)智能體、多智能體協(xié)同等維度,后者聚焦數(shù)據(jù)分析智能體、客服智能體、搜索智能體、知識管理智能體等場景智能體。

不過這里筆者是有一些疑惑的,按照這個標準,Agentar其實也符合中國信通院對行業(yè)智能體的定義:面向金融、政務、汽車、手機、工業(yè)、教育、醫(yī)療等垂直行業(yè)。

而容聯(lián)云的容犀Agent & Copilot平臺,主要包括質(zhì)檢代理、坐席助理、坐席代理、洞察代理四個智能引擎,覆蓋營銷、客服、質(zhì)檢、數(shù)據(jù)洞察等,倒是比較標準的金融行業(yè)智能體。

雖然在王維看來,智能體元年的高峰期已經(jīng)快過去了,但智能體還處于發(fā)展的早期,無論是對其的定義,還是產(chǎn)品層級的明確,都還未塵埃落定。在智能體賽道,王維認為,螞蟻數(shù)科處于第一梯隊,尤其是在金融和能源領(lǐng)域做的很深入,不過,他也承認,當下是智能體“百花齊放”的時期,賽道的競爭將會是一場長跑。

“用三年之后智能體的水平評判,今天的大家都不合格,螞蟻數(shù)科想走的路就是在垂直領(lǐng)域持續(xù)奔跑,特別是在金融領(lǐng)域把螞蟻的稟賦更大程度的發(fā)揮出來?!?/p>

對于未來的智能體,唐興才倒是覺得,基礎(chǔ)模型和智能體是上下層的關(guān)系,也許有一天,基礎(chǔ)模型足夠強大了,能夠完全理解所有的場景,智能體自然而然就消失了?!斑@一天可能會來到,或者未來它會發(fā)展成什么程度,我們也不知道。但到來之前,我們作為應用廠商,只能擁抱現(xiàn)在的AI,盡快的讓它落地去做出價值,做一些力所能及的事情,不管我們是大浪潮里的一滴水,或者是什么別的,都必須先把自己投入到大浪潮里去做?!?/p>

04、“找釘子”

聊完“造錘子”的事情,再聊下具體的應用落地。在上一輪的AI浪潮(大模型之前)中,金融行業(yè)的諸多場景就被反復挖掘過,理由有幾個:

其一,金融行業(yè)數(shù)字化水平高,有良好的數(shù)字化基礎(chǔ)設(shè)施。

其二,金融行業(yè)有較高的附加值,AI技術(shù)能帶來的價值創(chuàng)造空間更大。

其三,金融行業(yè)普遍具備較充裕的預算支持,更傾向于擁抱新技術(shù),對創(chuàng)新的包容度也較高。

不過,由于以往的技術(shù)水平限制,金融行業(yè)中的智能體市場依舊是一個“富礦”。曹剛認為,智能體在營銷、風控、銷售等場景的滲透率較低,首先是因為技術(shù)成熟度的原因,很多機構(gòu)還處于觀望狀態(tài),對于是否在核心業(yè)務上應用智能體還是比較謹慎;其次,是許多場景對專業(yè)度的要求極高,比如銀行的零售業(yè)務包括十四個大場景,上百個小的細分場景,智能體需要一個個去深入攻克;再就是成本的問題,即使大模型的推理成本已經(jīng)大幅降低,但技術(shù)投入的成本,還是不一定低于其帶來的商業(yè)價值。

螞蟻集團本身就有龐大的金融業(yè)務,其自研的金融大模型,包括AI云平臺、智能體應用開發(fā)平臺等,都是脫胎于螞蟻集團自身的長期實踐,比如在支付寶App里,就有理財顧問和問答咨詢的智能體服務,再由螞蟻數(shù)科作為螞蟻集團AItoB的排頭兵,對外做商業(yè)化的輸出。

螞蟻數(shù)科的打法偏向于“大而全”,先覆蓋通用的場景,再深入解決業(yè)務難題。王維總結(jié)螞蟻數(shù)科的優(yōu)勢,首先是人才多,“做大模型這個東西,沒有一定的人才密度很難做”;其次是有錢,“沒有足夠多的錢,買不到足夠多的算力,做不出足夠好的訓練效果,甚至你買不起卡,人才也不會來你這里”;再然后是有場景,許多智能體應用在螞蟻集團的場景中已經(jīng)跑通了。

“我們是不是最好的,不好說,但我們都占一點,”王維說:“把螞蟻的經(jīng)驗輸出出來,我們認為是非常有價值的,也能夠給行業(yè)帶來更多的智能體應用標桿?!?/p>

在Agentar平臺上,也積累了不少來自銀行、證券、保險等行業(yè)的案例,還有部分典型的智能體應用,以及上百種MCP服務,螞蟻數(shù)科也在不斷提升Agentar平臺的兼容性和適配性。

而容聯(lián)云更傾向于“找場景,先算帳”。這個算帳,既要算場景的價值產(chǎn)出,還有算要投入多少的算力、數(shù)據(jù)和模型開發(fā)成本,看是否值得去做。再然后,是看能不能做,既要科研部門有做的意愿和能力,也要業(yè)務部門能主動參與合作。第三,是上線之后,還能不斷的迭代。滿足這些條件的,才能做成標桿案例。

比如金融行業(yè)中的質(zhì)檢場景,如果營銷業(yè)務因為觸犯合規(guī)被投訴,就要停止展業(yè),對部門影響極大。“之前快速發(fā)展期,可能也不是那么嚴地查你,大家都用人去抽檢,或者睜一只眼閉一只眼不怎么查,現(xiàn)在消保金融監(jiān)管總局都在嚴查這個事情,之前的一些常規(guī)手段像是用敏感詞、人工抽檢就不夠用了——一天幾萬通電話人工沒法檢查的。”

唐興才介紹,之前長江證券計劃招募二三十人來做這件事,但與容聯(lián)云合作,最后完全用AI完成,這樣單個項目的價格是45萬到60萬之間,后續(xù)每年只需要六七萬的服務費?!拔覀儸F(xiàn)場有兩個人在那兒待了一個多月,和質(zhì)檢員天天坐在一起,理解這個場景,看質(zhì)檢到底是怎么要求的,要響應到什么程度,把這些東西都融合到我們的AI產(chǎn)品里面?!?/p>

容聯(lián)云未來的規(guī)劃是將業(yè)務鏈條上的場景節(jié)點串起來,在智能體深入場景的基礎(chǔ)上,做的更寬,成為業(yè)務線或者網(wǎng)絡的結(jié)構(gòu)?!艾F(xiàn)在有一種說法是,一個企業(yè)可能會有50到100個智能體,每個智能體就像以前的AI應用一樣,就負責一個小場景,但未來大模型變得特別聰明,我感覺這些場景是不是也能打通,這樣一個智能體就可以干很多活。就像鋼鐵俠里的賈維斯,它可以做很多事情,至于它是不是還有AI管家,那無所謂?!碧婆d才說。

在今年5月19日舉辦的微軟 2025 Build 大會上,微軟CEO薩提亞·納德拉宣布:“我們已經(jīng)進入了AI Agent時代,正在見證AI系統(tǒng)如何以全新方式幫助我們解決問題?!鳖愃频挠^點,黃仁勛、扎克伯格、馬斯克等也做過表達。

對金融行業(yè)來說,當企業(yè)更關(guān)注成本、部署效率和實用性等現(xiàn)實問題時,可能就意味著智能體已經(jīng)經(jīng)過了技術(shù)驅(qū)動到市場驅(qū)動的關(guān)鍵拐點。對于未來,王維認為,在一個開放競爭的市場中,一些公司有各自擅長的某些領(lǐng)域,相互間形成生態(tài)和產(chǎn)業(yè),才是最健康的狀態(tài)。

“我相信產(chǎn)業(yè)當中不僅有螞蟻數(shù)科,還會有很多很好的參與者,讓金融行業(yè)變得更加務實,解決真實的問題。只有這樣,才會有更多的預算被投入進來,行業(yè)的效率也會更高,增長的本質(zhì)是生產(chǎn)力的提升,如果說AI在金融行業(yè)得到了比較好的落地,一定會產(chǎn)生更大的經(jīng)濟效益和社會效益。”王維說。

標簽: AI 人工智能
智能體重構(gòu)金融業(yè):AI廠商如何“造錘找釘”?
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號-1