精品一区二区无码毛片|中日无码av中文字幕久久|先锋影音中文字幕一区|国产乱码久久久久久高潮视频|手机AV每日更新在线观看|国产原创剧情一区二区三区

智譜技術(shù)團(tuán)隊(duì)開源CogAgent-9B-20241220模型,推動智能體任務(wù)發(fā)展

智譜技術(shù)團(tuán)隊(duì)于12月26日通過其公眾號宣布,開源了CogAgent-9B-20241220模型。這一模型基于GLM-4V-9B訓(xùn)練,專為智能體(Agent)任務(wù)設(shè)計(jì),僅需屏幕截圖作為輸入,無需HTML等文本表征,便能根據(jù)用戶指定的任務(wù),結(jié)合歷史操作,預(yù)測下一步的GUI操作。

CogAgent-9B-20241220模型的普適性使其可廣泛應(yīng)用于個人電腦、手機(jī)、車機(jī)設(shè)備等基于GUI交互的場景。相較于2023年12月開源的第一版CogAgent模型,新版本在GUI感知、推理預(yù)測準(zhǔn)確性、動作空間完善性、任務(wù)普適性和泛化性等方面均實(shí)現(xiàn)了顯著提升,并支持中英文雙語的屏幕截圖和語言交互。

該模型的輸入僅包含用戶的自然語言指令、已執(zhí)行歷史動作記錄和GUI截圖,無需任何文本形式表征的布局信息或附加元素標(biāo)簽信息。其輸出涵蓋思考過程、下一步動作的自然語言描述、下一步動作的結(jié)構(gòu)化描述以及下一步動作的敏感性判斷四個方面。

CogAgent-9B-20241220在多個數(shù)據(jù)集上進(jìn)行了測試,并與GPT-4o-20240806、Claude-3.5-Sonnet等模型進(jìn)行了比較,結(jié)果顯示其在多個數(shù)據(jù)集上取得了領(lǐng)先的結(jié)果,證明了其在GUI Agent領(lǐng)域強(qiáng)大的性能。

最新文章
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號-1