精品一区二区无码毛片|中日无码av中文字幕久久|先锋影音中文字幕一区|国产乱码久久久久久高潮视频|手机AV每日更新在线观看|国产原创剧情一区二区三区

講真,馬斯克的Grok-3,“碰瓷”不了DeepSeek

撰文 | 雁? 秋

編輯 | 李信馬

題圖 | 豆包AI?

前不久,一場(chǎng)高規(guī)格民企座談會(huì)讓坊間議論紛紛。這是中央時(shí)隔6年3個(gè)月再度專(zhuān)門(mén)召開(kāi)民營(yíng)企業(yè)座談會(huì),會(huì)上,中國(guó)互聯(lián)網(wǎng)和科技產(chǎn)業(yè)的精英齊聚一堂,釋放出新質(zhì)生產(chǎn)力、科技創(chuàng)新產(chǎn)業(yè)向好的趨勢(shì)。

年輕的梁文峰也在其中,他與任正非、曾毓群等老一輩企業(yè)家同座,而他的DeepSeek正成為在場(chǎng)各家業(yè)務(wù)的連接橋梁。

沒(méi)過(guò)多久,馬斯克旗下xAI公司突然發(fā)布新一代大語(yǔ)言模型Grok-3,號(hào)稱(chēng)是“地球上最聰明的人工智能”,計(jì)算能力是去年8月發(fā)布的Grok 2的10倍,推理能力超越包括ChatGPT和DeepSeek在內(nèi)的其他領(lǐng)先AI模型。

一場(chǎng)橫跨太平洋的“AI對(duì)戰(zhàn)”瞬間點(diǎn)燃科技圈,在外界看來(lái),Grok 3令A(yù)I行業(yè)競(jìng)爭(zhēng)更加激烈。誰(shuí)是在實(shí)驗(yàn)室里“秀肌肉”,誰(shuí)又能將技術(shù)變成實(shí)實(shí)在在的生產(chǎn)力,是未來(lái)這場(chǎng)風(fēng)暴的中心。?

01、訓(xùn)練:一個(gè)賭“壕氣”,一個(gè)用“巧思”

Grok-3是馬斯克與團(tuán)隊(duì)xAI為挑戰(zhàn)OpenAI、ChatGPT而精心打造的產(chǎn)品,被稱(chēng)為“地球上最聰明的人工智能”。

在官方的直播演示中,Grok-3和Grok-3 mini在數(shù)學(xué)、科學(xué)和編程基準(zhǔn)測(cè)試上,超越了包括GPT-4o、DeepSeek-V3和Gemini-2 Pro等主流模型。

同時(shí),具備推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning則超越了DeepSeek-R1和OpenAI的o3 mini等。

看得出,DeepSeek已經(jīng)與頭部大模型比肩。

自打這個(gè)國(guó)產(chǎn)大模型爆火后,包括硅谷在內(nèi)的許多AI公司都開(kāi)始重新評(píng)估用堆算力和參數(shù)來(lái)推進(jìn)所謂的“擴(kuò)展法則”,是否仍然適用。因?yàn)镈eepSeek顛覆了以往發(fā)展AI就是要不斷的堆算力、堆GPU的燒錢(qián)路子,而是采用了一條分布式算力+混合云優(yōu)化的路線(xiàn):通過(guò)動(dòng)態(tài)調(diào)度公有云、私有服務(wù)器甚至邊緣計(jì)算資源,結(jié)合自研的模型壓縮技術(shù)(如稀疏化訓(xùn)練),在千億參數(shù)規(guī)模下實(shí)現(xiàn)了訓(xùn)練成本降低40%以上。

然而目前看來(lái),馬斯克并不這么認(rèn)為。事實(shí)上,xAI一直是追求“大力出奇跡”的代表,相關(guān)負(fù)責(zé)人表示:

“如果你看看所有性能的來(lái)源,當(dāng)你有一個(gè)非常強(qiáng)大的工程團(tuán)隊(duì)和最優(yōu)秀的AI人才時(shí),唯一需要的就是一個(gè)強(qiáng)大的集群,才能產(chǎn)生巨大的智能?!?/p>

某種意義上,Grok3也是大力出奇跡的結(jié)果,馬斯克為其攢下了“壕”無(wú)人性的算力家底。據(jù)了解,xAI團(tuán)隊(duì)在122天內(nèi)讓第一批10萬(wàn)塊GPU投入使用,是“目前最大的完全連接的H100集群”。之后又用了92天的時(shí)間,將數(shù)據(jù)中心的容量繼續(xù)翻倍,并基于這些成果構(gòu)建出了Grok-3。

而被拿來(lái)進(jìn)行對(duì)比的DeepSeek-V3模型,則是在配備了2048個(gè)英偉達(dá)H800 GPU的集群上進(jìn)行訓(xùn)練的。H800是英偉達(dá)特供中國(guó)市場(chǎng)的AI芯片,在性能上不及先進(jìn)的H200、H100等。

雖然如此,擁有更高集群的Grok-3在演示時(shí)也未呈現(xiàn)出“地球最聰明”的狀態(tài)。直播中Grok-3一度“思考卡殼”,在任務(wù)時(shí)因?yàn)轱@示“Thinking Hard”后很長(zhǎng)一段時(shí)間沒(méi)有反應(yīng),等待幾秒后演示人員關(guān)閉了頁(yè)面開(kāi)啟下一話(huà)題。

有網(wǎng)友親自下場(chǎng)向Grok 3提問(wèn),在面對(duì)下圖中“比薩斜塔上兩個(gè)球哪個(gè)先落下”這樣常識(shí)性的問(wèn)題時(shí),Grok 3也仍然無(wú)法應(yīng)對(duì),因此被戲稱(chēng)為“天才不愿意回答簡(jiǎn)單問(wèn)題”。

圖源:x(谷歌翻譯)

盡管如此,馬斯克稱(chēng)未來(lái)他們將會(huì)進(jìn)一步加大數(shù)據(jù)中心的建設(shè)力度,xAI的下一個(gè)計(jì)算集群會(huì)成為世界上最強(qiáng)大的集群,能耗達(dá)到1.2GW,相當(dāng)于數(shù)十萬(wàn)戶(hù)家庭1年的用電量。

網(wǎng)友犀利的評(píng)價(jià):“自DeepSeek-R1之后,我們只應(yīng)考慮效率更高的進(jìn)步,而不僅僅那些規(guī)模更大、且比競(jìng)爭(zhēng)對(duì)手耗能更多的進(jìn)步?!?/p>

02、開(kāi)源:一個(gè)“擠牙膏”,一個(gè)全開(kāi)放

一般情況下,企業(yè)依靠高算力而堆出來(lái)的高性能模型,會(huì)基于成本考慮選擇閉源或延遲開(kāi)源。

關(guān)于Grok-3,馬斯克并未當(dāng)場(chǎng)宣布開(kāi)源,而是表示:“當(dāng)下一個(gè)版本完全發(fā)布時(shí),將開(kāi)源Grok的上一個(gè)版本,也就是當(dāng)Grok-3成熟穩(wěn)定時(shí),我們將開(kāi)源Grok-2。”

2月20日,馬斯克轉(zhuǎn)發(fā)xAI的推文,宣布短期內(nèi)Grok 3.0向所有人免費(fèi)開(kāi)放。不出意外,Grok-3會(huì)延續(xù)“基礎(chǔ)版開(kāi)源+高級(jí)功能付費(fèi)”的策略。這樣既能吸引開(kāi)發(fā)者貢獻(xiàn)算力(社區(qū)訓(xùn)練反哺主模型),又能用開(kāi)源生態(tài)倒逼競(jìng)爭(zhēng)對(duì)手。

圖源:x

而在剛剛過(guò)去的兩周,以DeepSeek為中心的朋友圈迅速擴(kuò)容。國(guó)外,有包括微軟、英偉達(dá)、亞馬遜等世界級(jí)云計(jì)算巨頭;國(guó)內(nèi),三大基礎(chǔ)運(yùn)營(yíng)商、超過(guò)15家芯片廠(chǎng)商,還有手機(jī)、車(chē)企、云服務(wù)、金融在內(nèi)的200多家企業(yè),多地政務(wù)服務(wù)系統(tǒng),甚至兩款“國(guó)民級(jí)應(yīng)用”騰訊微信、百度搜索也先后宣布接入。

大模型到底應(yīng)該開(kāi)源,還是應(yīng)該閉源?這個(gè)話(huà)題討論已久,企業(yè)基本上走出三條路子:

  • 只做開(kāi)源,沒(méi)有盈利模式,只有大公司燒得起,Meta是少數(shù)走這條路的;
  • 開(kāi)源閉源并行,比較靈活,既有收入又能獲取用戶(hù),包括微軟、谷歌、阿里云、騰訊云等,均踐行這條路;
  • 只做閉源,相當(dāng)于走了一條簡(jiǎn)單直接邏輯清晰的路,亞馬遜、華為盤(pán)古、還有以前的文心一言(百度)、GPT-4(OpenAI)均如此。亞馬遜、谷歌云在過(guò)去一年的營(yíng)收增速都有所提升,這被認(rèn)為是大模型拉動(dòng)的結(jié)果。

在發(fā)展過(guò)程中,企業(yè)的觀(guān)念也在發(fā)生變化。長(zhǎng)期以來(lái),OpenAI因?yàn)椤覆籵pen」(不開(kāi)放)而備受爭(zhēng)議。OpenAI首席執(zhí)行官薩姆·奧特曼曾為下一個(gè)模型的開(kāi)源項(xiàng)目征集意見(jiàn),“做一個(gè)相當(dāng)小但仍需要在GPU上運(yùn)行的o3-mini級(jí)模型,還是做一個(gè)我們能做得最好的適合手機(jī)運(yùn)行的模型?”

就在看似閉源OpenAI遙遙領(lǐng)先之時(shí),DeepSeek開(kāi)源大模型的出圈又帶來(lái)了巨大的不確定性。薩姆·奧特曼稱(chēng)OpenAI在開(kāi)源AI軟件方面“一直站在歷史的錯(cuò)誤一邊”,他還透露,雖然并非所有員工都同意其觀(guān)點(diǎn),但OpenAI內(nèi)部正討論公開(kāi)AI模型的權(quán)重等事宜。

開(kāi)源或閉源,這其中摻雜了商業(yè)利益、技術(shù)觀(guān)點(diǎn)等多重因素。Gartner高級(jí)分析師Mike Fang在接受DoNews采訪(fǎng)時(shí)則表示,在人工智能大模型領(lǐng)域,開(kāi)源和閉源的路線(xiàn)持續(xù)并存。

“如果閉源模型的性能不及開(kāi)源模型,則其商業(yè)價(jià)值將受到質(zhì)疑。然而,對(duì)于高性能的閉源模型,其商業(yè)路徑仍然具備優(yōu)勢(shì)。未來(lái)AI大模型可能進(jìn)入低算力、低成本時(shí)期,但高端模型仍會(huì)保持一定溢價(jià)?!?/p>

至于瘋狂開(kāi)源的DeepSeek,其發(fā)展模式是否會(huì)調(diào)整?未來(lái)盈利前景又將如何?在Mike Fang看來(lái),這家公司短期不以盈利為目的,能夠從研究角度鼓勵(lì)工程師更高效運(yùn)營(yíng),而沒(méi)有特別多的財(cái)務(wù)變化或者業(yè)務(wù)變化的壓力。未來(lái)如何能夠保持初心,讓發(fā)展模式或者技術(shù)創(chuàng)新能夠持續(xù)下去,才是主要考慮的方向。

換個(gè)角度想,對(duì)于日活用戶(hù)數(shù)量達(dá)數(shù)千萬(wàn)的DeepSeek來(lái)說(shuō),找到盈利模式并不困難,開(kāi)源的價(jià)值要比想象中大得多。從某種層面來(lái)講,DeepSeek的影響力是以往的技術(shù)突破無(wú)法比擬的——我們不應(yīng)該只考慮它作為單個(gè)公司的科技價(jià)值、商業(yè)價(jià)值,而應(yīng)該思考它對(duì)推動(dòng)新質(zhì)生產(chǎn)力發(fā)展的巨大價(jià)值。

03、面對(duì)DeepSeek的普及,企業(yè)要怎么做?

DeepSeek所代表的資源消耗更小、算法效率更高、推理更精確的技術(shù)路徑,正在進(jìn)一步助推AI應(yīng)用成本下降。

從近期企業(yè)動(dòng)作來(lái)看,不僅包括大語(yǔ)言模型領(lǐng)域積累較弱的手機(jī)、家電、PC、汽車(chē)廠(chǎng)商,就連已經(jīng)開(kāi)發(fā)出AI大模型的騰訊、360、百度等大廠(chǎng),也在為自家的AI工具注入新動(dòng)力。

但這會(huì)產(chǎn)生新的問(wèn)題,所有人都接入了,等于所有人都沒(méi)接。家家戶(hù)戶(hù)都有DeepSeek這把“金鑰匙”,打開(kāi)市場(chǎng)的、或者說(shuō)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的核心差異化能力體現(xiàn)在哪里?在新的環(huán)境下,企業(yè)又該如何競(jìng)爭(zhēng)?

關(guān)于這一點(diǎn),Gartner的Mike Fang告訴我們,企業(yè)若僅滿(mǎn)足于“簡(jiǎn)單接入”,就無(wú)法在競(jìng)爭(zhēng)中脫穎而出。關(guān)鍵是要找到適合自身業(yè)務(wù)場(chǎng)景的AI解決方案,深度挖掘大模型的潛力,將其與行業(yè)特點(diǎn)、客戶(hù)需求和特定場(chǎng)景緊密結(jié)合,并注重工程化落地與治理,從而實(shí)現(xiàn)高效且負(fù)責(zé)任的技術(shù)應(yīng)用。

也就是說(shuō),大模型賦予產(chǎn)品強(qiáng)大的技術(shù)力,但如何將這一能力轉(zhuǎn)化為無(wú)可替代的產(chǎn)品體驗(yàn),讓用戶(hù)發(fā)自?xún)?nèi)心地接受使用,才是競(jìng)爭(zhēng)的最終目標(biāo)。

Mike Fang舉例表示,當(dāng)下,從車(chē)企到券商紛紛宣布接入DeepSeek,但也僅僅是接入,距離真實(shí)大規(guī)模應(yīng)用落地還需要更長(zhǎng)時(shí)間?!斑@其中涉及到模型切換,面對(duì)新的業(yè)務(wù)場(chǎng)景,企業(yè)要通過(guò)不斷的流程測(cè)試以及在真實(shí)業(yè)務(wù)當(dāng)中檢驗(yàn)。 ”

但這里要注意數(shù)據(jù)問(wèn)題,對(duì)于AI來(lái)說(shuō),有三大要素需要分析:大模型、算力和數(shù)據(jù)。在大模型迎來(lái)顛覆式創(chuàng)新之后,對(duì)算力的需求開(kāi)始降低,下一個(gè)重要的瓶頸是數(shù)據(jù)。

通過(guò)Gartner研究表示,海外AI公司應(yīng)用數(shù)據(jù)的能力較高,已經(jīng)支持企業(yè)大模型的落地。反觀(guān)國(guó)內(nèi),數(shù)據(jù)方面的數(shù)值一直徘徊在較低位,只有少部分企業(yè)能夠?qū)嶋H把生成式AI應(yīng)用從實(shí)驗(yàn)到最后的生產(chǎn)落地。

這就要考驗(yàn)企業(yè)是否具備構(gòu)建一個(gè)從技術(shù)到市場(chǎng)的良性循環(huán),不僅僅是關(guān)于產(chǎn)品的迭代與優(yōu)化,更是如何在短期內(nèi)通過(guò)市場(chǎng)數(shù)據(jù)和產(chǎn)品調(diào)整,不斷提升大模型的能力。未來(lái),誰(shuí)能夠獲取專(zhuān)有數(shù)據(jù),并能實(shí)現(xiàn)實(shí)時(shí)更新,將是競(jìng)爭(zhēng)的關(guān)鍵所在。

單個(gè)企業(yè)是如此,而對(duì)于整個(gè)中國(guó)的AI產(chǎn)業(yè)來(lái)講,DeepSeek還可以帶動(dòng)很多開(kāi)發(fā)、推理,甚至是芯片方面的額外的機(jī)會(huì),這將進(jìn)一步加速企業(yè)“出?!薄4送?,AI接下來(lái)的治理也會(huì)變得更為重要,“如果把DeepSeek的能力比作高速行駛的一輛車(chē),企業(yè)就需要自建或者管控出一個(gè)原生的剎車(chē)系統(tǒng),這樣才會(huì)使得大模型更健壯,‘車(chē)’能夠開(kāi)得更快?!盡ike Fang表示。

可以說(shuō),DeepSeek攪動(dòng)起的,早已不是AI大模型競(jìng)技規(guī)則變化的風(fēng)云,而是影響多個(gè)產(chǎn)業(yè)迭代的深層變革浪潮。我們都站在了時(shí)代潮頭,更需要以開(kāi)放的心態(tài)擁抱變化。

標(biāo)簽: DeepSeek Grok3 ChatGpt
講真,馬斯克的Grok-3,“碰瓷”不了DeepSeek
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號(hào)-1