精品一区二区无码毛片|中日无码av中文字幕久久|先锋影音中文字幕一区|国产乱码久久久久久高潮视频|手机AV每日更新在线观看|国产原创剧情一区二区三区

月之暗面 Kimi K2.6 發(fā)布并開(kāi)源:代碼能力對(duì)標(biāo) GPT-5.4

DoNews4月21日消息,月之暗面20日晚間發(fā)布并開(kāi)源了其最新模型 Kimi K2.6,該模型在代碼編寫、長(zhǎng)程任務(wù)執(zhí)行及 Agent 集群能力方面實(shí)現(xiàn)了全面升級(jí)。即日起,所有用戶均可通過(guò)官網(wǎng)(kimi.com)、最新版 Kimi 應(yīng)用、Kimi API 以及 Kimi Code 編程助手使用該模型。

據(jù)官方披露,Kimi K2.6 在博士級(jí)難度的完整版“終極人類考試”(Humanity's Last Exam)、評(píng)估真實(shí)軟件工程能力的 SWE-Bench Pro 以及 Agent 深度檢索基準(zhǔn) DeepSearchQA 等測(cè)試中,均取得了行業(yè)領(lǐng)先的成績(jī),表現(xiàn)持平或優(yōu)于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等閉源模型。

作為月之暗面迄今最強(qiáng)的代碼模型,Kimi K2.6 的長(zhǎng)程編碼能力顯著提升。在測(cè)試中,該模型可以不間斷編碼長(zhǎng)達(dá) 13 小時(shí),編寫或修改超過(guò) 4000 行代碼,完成復(fù)雜系統(tǒng)的開(kāi)發(fā)與優(yōu)化。

通過(guò)將代碼與視覺(jué)能力深度融合,K2.6 能夠交付具有設(shè)計(jì)創(chuàng)意的專業(yè)級(jí) Web 應(yīng)用。在 Kimi 內(nèi)部的嚴(yán)格代碼評(píng)測(cè)基準(zhǔn) Kimi Code Bench 中,K2.6 的成績(jī)相比上一代 K2.5 提升了約 20%。

實(shí)測(cè)案例顯示,該模型成功在 Mac 本地下載并部署了 Qwen3.5-0.8B 模型,使用小眾的 Zig 語(yǔ)言實(shí)現(xiàn)并優(yōu)化模型推理,經(jīng)過(guò) 4000 多次工具調(diào)用、超過(guò) 12 小時(shí)的不間斷運(yùn)行,共迭代 14 輪,將吞吐量從約 15 tokens/s 提升至約 193 tokens/s,最終推理速度比 LM Studio 快 20%。

在另一個(gè)案例中,Kimi K2.6 自主完成了對(duì)擁有 8 年歷史、接近性能極限的開(kāi)源金融撮合引擎 exchange-core 的深度重構(gòu),歷經(jīng) 13 小時(shí)連續(xù)作業(yè),迭代 12 套優(yōu)化策略,通過(guò) 1000 余次工具調(diào)用,精準(zhǔn)修改了 4000 多行代碼,最終實(shí)現(xiàn)中位吞吐量從 0.43 MT/s 躍升至 1.24 MT/s(增幅 185%),峰值吞吐量從 1.23 MT/s 飆升至 2.86 MT/s(增幅 133%)。

在代碼驅(qū)動(dòng)設(shè)計(jì)方面,K2.6 的 Agent 模式能夠制作具有設(shè)計(jì)感和視覺(jué)沖擊力的網(wǎng)站。憑借對(duì)圖像和視頻生成工具的熟練調(diào)用,該 Agent 可以生成視覺(jué)風(fēng)格高度統(tǒng)一的素材,構(gòu)建視覺(jué)焦點(diǎn)突出的首屏區(qū),并實(shí)現(xiàn)交互元素和滾動(dòng)觸發(fā)動(dòng)效。

月之暗面表示,它不局限于前端頁(yè)面編寫,也支持基礎(chǔ)的后端數(shù)據(jù)庫(kù)模塊,例如在網(wǎng)頁(yè)中嵌入表單信息收集功能。

另外,月之暗面還創(chuàng)建了一套專門的前端開(kāi)發(fā)設(shè)計(jì)評(píng)測(cè)基準(zhǔn) Kimi Design Bench,涵蓋視覺(jué)輸入、落地頁(yè)構(gòu)建、全棧應(yīng)用開(kāi)發(fā)及通用 Web 開(kāi)發(fā)四個(gè)維度,對(duì)比 Google AI Studio 中的 Gemini 3 模型,基于 Kimi K2.6 的 Agent 展現(xiàn)出了明顯領(lǐng)先優(yōu)勢(shì)。

同時(shí),其 Agent 集群能力迎來(lái)全面升級(jí)。K2.6 支持動(dòng)態(tài)拆解復(fù)雜任務(wù),自主生成專項(xiàng) Agent 并行處理,現(xiàn)在最多可調(diào)度 300 個(gè)子 Agent 并行完成 4000 個(gè)協(xié)作步驟,實(shí)現(xiàn)更大規(guī)模的并行化,任務(wù)完成度和交付質(zhì)量相比 K2.5 顯著提升。Agent 集群能夠?qū)⑺阉?、深度研究、文檔分析和長(zhǎng)文創(chuàng)作等能力進(jìn)行組合,在單次運(yùn)行中獨(dú)立完成從文檔到網(wǎng)頁(yè)、再到 PPT 和表格的多產(chǎn)物端到端交付。

例如,該集群針對(duì)全球 100 個(gè)半導(dǎo)體標(biāo)的設(shè)計(jì)并執(zhí)行了 5 套量化策略,將麥肯錫風(fēng)格的 PPT 邏輯沉淀為可復(fù)用技能,最終交付了詳盡的建模表格和整套匯報(bào)演示文檔。

在另一個(gè)案例中,Agent 集群將一篇包含大量視覺(jué)數(shù)據(jù)的天體物理論文轉(zhuǎn)化為可復(fù)用學(xué)術(shù)技能,提取論文的推理流程和可視化方法,產(chǎn)出了 40 頁(yè)、7000 字的研究論文,以及包含 2 萬(wàn)多條數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)集和 14 張?zhí)煳募?jí)圖表。

K2.6 顯著增強(qiáng)了 Agent 的自主化執(zhí)行能力,尤其在與 OpenClaw、Hermes Agent 等主動(dòng)式 Agent 框架協(xié)同工作時(shí)表現(xiàn)突出。這類場(chǎng)景要求 AI 能夠跨應(yīng)用實(shí)現(xiàn) 24/7 不間斷運(yùn)行。

月之暗面的 RL 基礎(chǔ)設(shè)施團(tuán)隊(duì)使用基于 K2.6 的 Agent 實(shí)現(xiàn)了連續(xù) 5 天自主運(yùn)行,該 Agent 負(fù)責(zé)監(jiān)控、故障響應(yīng)和系統(tǒng)運(yùn)維,展現(xiàn)了持久的上下文維持能力、多線程任務(wù)處理能力以及從接收告警到徹底解決的全流程執(zhí)行能力。

Kimi 內(nèi)部的 Claw Bench 測(cè)試結(jié)果顯示,K2.6 相比 K2.5 綜合性能提升了 10%,涵蓋編程任務(wù)、即時(shí)通訊生態(tài)集成、信息檢索與分析、定時(shí)任務(wù)管理及記憶調(diào)用五大維度,在需要長(zhǎng)時(shí)間自主運(yùn)行且無(wú)需人工干預(yù)的工作流中優(yōu)勢(shì)尤為顯著。

借助 K2.6 更強(qiáng)的代碼和視覺(jué)理解能力,Kimi Agent 模式現(xiàn)在支持創(chuàng)建和調(diào)用技能(Skill)。系統(tǒng)已內(nèi)置上百個(gè)官方推薦技能,包括投研技能包,可一鍵生成專業(yè)排版的 A 股、港股、美股公司一頁(yè)紙或深度投資研報(bào)。

用戶在 Kimi Agent 模式下輸入斜杠“/”即可開(kāi)始創(chuàng)建和調(diào)用技能。此外,Kimi Agent 已支持“Office 文檔轉(zhuǎn)技能”功能,上傳高質(zhì)量 Office 文檔后,模型會(huì)嘗試?yán)斫庠臋n的結(jié)構(gòu)與風(fēng)格基因,生成專屬的可復(fù)用文檔創(chuàng)建技能。

月之暗面同時(shí)宣布開(kāi)啟“Claw 群組”小范圍內(nèi)測(cè)。該群組的目標(biāo)是讓多個(gè) Agent 與人類作為真正的協(xié)作者共同運(yùn)行,用戶可以接入來(lái)自任何設(shè)備、任何供應(yīng)商、運(yùn)行任何模型的全天候 Agent(首批支持 OpenClaw,后續(xù)將加入對(duì) Hermes Agent 等框架的支持),每個(gè) Agent 可攜帶各自的專業(yè)工具包、技能和持久化記憶上下文。

在 Claw 群組中,K2.6 擔(dān)任協(xié)調(diào)者,根據(jù) Agent 的技能畫像和可用工具動(dòng)態(tài)匹配任務(wù),當(dāng)某個(gè) Agent 遇到故障或停滯時(shí),協(xié)調(diào)者會(huì)檢測(cè)到中斷并自動(dòng)重新分配任務(wù)或生成子任務(wù)。Kimi Claw 用戶將陸續(xù)收到內(nèi)測(cè)邀請(qǐng)。

Kimi K2.6 現(xiàn)已面向所有免費(fèi)用戶、付費(fèi)訂閱用戶、Kimi Code 和企業(yè) API 用戶開(kāi)放。企業(yè)和開(kāi)發(fā)者在 Kimi API 中指定模型為 kimi-k2.6 即可開(kāi)始使用。

為慶祝 K2.6 模型 API 上線,Kimi 開(kāi)放平臺(tái)同步開(kāi)啟了最高 30% 的限時(shí)充贈(zèng)活動(dòng)。同時(shí),Kimi K2.6 官方 API 已經(jīng)首發(fā)登陸騰訊云 TokenHub 等平臺(tái)。月之暗面推薦直接調(diào)用官方 API 復(fù)現(xiàn)基準(zhǔn)評(píng)測(cè)成績(jī),如需使用第三方 API 服務(wù),可通過(guò) Kimi 模型供應(yīng)商驗(yàn)證服務(wù)(Kimi Vendor Verifier, KVV)挑選精度更高的服務(wù)商。

Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號(hào)-1