精品一区二区无码毛片|中日无码av中文字幕久久|先锋影音中文字幕一区|国产乱码久久久久久高潮视频|手机AV每日更新在线观看|国产原创剧情一区二区三区

聲網(wǎng)新版對(duì)話式 AI 引擎亮相 WAIC 解鎖聲紋識(shí)別、數(shù)字人與視覺(jué)理解

DoNews7月26日消息,7月26日,聲網(wǎng)亮相2025世界人工智能大會(huì)(WAIC),正式發(fā)布新版對(duì)話式 AI 引擎,該版本新增聲紋識(shí)別、數(shù)字人與視覺(jué)理解三項(xiàng)功能,實(shí)現(xiàn)對(duì)話式 AI 音視頻交互體驗(yàn)的全新升級(jí)。同時(shí),口袋 AI 毛絨寵物—芙崽 Fuzozo、家庭陪伴機(jī)器人—賦之 EBO Air 2 Plus 等一系列搭載對(duì)話式 AI 引擎的人氣AI 硬件也亮相聲網(wǎng)展臺(tái)。

全新對(duì)話式 AI 引擎 三大功能實(shí)現(xiàn)多模態(tài)融合交互

1、聲紋識(shí)別:?選擇性注意力鎖定新增聲紋識(shí)別功能,該功能賦予 AI 精準(zhǔn)識(shí)別用戶聲紋特征的能力,有效區(qū)分不同說(shuō)話者。用戶只需在對(duì)話初期大聲、清晰地說(shuō)話,即可提升 AI 對(duì)聲音的鎖定效果。聲紋識(shí)別不僅可以智能屏蔽95%的環(huán)境人聲、噪聲,對(duì) AI對(duì)話更準(zhǔn)確、高效,同時(shí)也適用于多人與 AI 對(duì)話的場(chǎng)景,實(shí)現(xiàn)更加多元化的對(duì)話式 AI 響應(yīng)與服務(wù)。

2、數(shù)字人交互:支持商湯等市場(chǎng)主流的數(shù)字人方案,通過(guò)集成高度擬真、表情動(dòng)作自然的數(shù)字人,用戶可與屏幕中的高度擬人化的數(shù)字形象進(jìn)行實(shí)時(shí)、生動(dòng)的對(duì)話互動(dòng),增強(qiáng)交互的臨場(chǎng)感與情感連接,且有多個(gè)數(shù)字人形象供選擇,適用于虛擬客服、教育陪伴、娛樂(lè)社交等多種場(chǎng)景。

3、視覺(jué)理解:新增的視覺(jué)理解能力為 AI 加上“眼睛”,一方面支持實(shí)時(shí)視頻,能夠解析攝像頭捕捉的畫面信息,結(jié)合語(yǔ)音指令,AI能“看懂”用戶手勢(shì)、環(huán)境物體或特定視覺(jué)線索,實(shí)現(xiàn)“所見(jiàn)即所言”的智能反饋;

另一方面,支持拍照與圖片上傳識(shí)別,AI 會(huì)解答圖片中的關(guān)鍵信息,可適用于教育場(chǎng)景的拍照識(shí)題與作業(yè)批改,智能助手場(chǎng)景的識(shí)物、翻譯、分析等。在對(duì)話式 AI 中加入視覺(jué)理解,將為人機(jī)對(duì)話協(xié)作開(kāi)辟更廣闊的空間。

對(duì)話式 AI 正從基礎(chǔ)的互動(dòng)問(wèn)答向深度理解、情感共鳴和情境感知演進(jìn)。聲網(wǎng)對(duì)話式 AI 引擎集成的聲紋識(shí)別、數(shù)字人和視覺(jué)理解等能力,是構(gòu)建下一代自然、沉浸式人機(jī)交互基礎(chǔ)設(shè)施的重要一步。

從會(huì)說(shuō)話到會(huì)共情 多元 AI 硬件亮相展臺(tái)

此次聲網(wǎng)展臺(tái)設(shè)置了多個(gè)對(duì)話式 AI 的體驗(yàn)展區(qū),其中人氣最高的當(dāng)屬 AI 硬件展區(qū),多款搭載對(duì)話式 AI 功能的 AI 硬件集中亮相,包括:對(duì)話式 AI 開(kāi)發(fā)套件以及搭載了開(kāi)發(fā)套件的卡皮巴拉 AI 玩偶與數(shù)字人全息倉(cāng);具備 AI 陪伴功能的 AI 毛絨寵物—芙崽、家庭陪伴機(jī)器人—賦之 EBO Air 2 Plus、將 AI 玩具與角色手辦結(jié)合的賽博大舞臺(tái)、具備翻譯與識(shí)圖功能的AI 眼鏡等,讓現(xiàn)場(chǎng)的觀眾體驗(yàn)到既會(huì)說(shuō)話,又能共情的各類 AI 硬件。

對(duì)話式 AI 開(kāi)發(fā)套件讓智能硬件設(shè)備實(shí)現(xiàn)自然流暢的實(shí)時(shí)語(yǔ)音對(duì)話、智能停頓及打斷處理、以及超低延時(shí)響應(yīng),為開(kāi)發(fā)者提供“對(duì)話式 AI + 智能硬件開(kāi)發(fā)”一站式解決方案。此次 WAIC 展出的雙屏與單屏兩類開(kāi)發(fā)套件,可適用于AI 玩具、AI 教育硬件、AI 陪伴設(shè)備、智能家居等各類智能硬件場(chǎng)景。

此外,現(xiàn)場(chǎng)還展示了對(duì)話式 AI 在 AI 教育、AI 客服等場(chǎng)景的解決方案,包含 AI輔助教學(xué):實(shí)現(xiàn)多個(gè)學(xué)生與 AI 助教進(jìn)行對(duì)話;AI教育硬件:現(xiàn)場(chǎng)展示搭載了對(duì)話式 AI 的學(xué)習(xí)機(jī)、兒童故事機(jī);AI 客服:撥打一通電話即可與 AI 坐席自然、流暢的對(duì)話,精準(zhǔn)解答用戶的各類疑問(wèn),并支持中英文等多種語(yǔ)言。

未來(lái)聲網(wǎng)將持續(xù)完善對(duì)話式 AI 引擎與開(kāi)發(fā)套件,通過(guò)多元化的功能、極致的對(duì)話體驗(yàn),加速智能對(duì)話在各類終端和場(chǎng)景中的普及與深化,推動(dòng)更加自然、智能、安全的人機(jī)共生時(shí)代加速到來(lái)。

聲網(wǎng)新版對(duì)話式 AI 引擎亮相 WAIC 解鎖聲紋識(shí)別、數(shù)字人與視覺(jué)理解
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號(hào)-1