日韩免费在线裸体美女,伊人激情网在线观看

DoNews > 商業(yè) > 谷歌Gemini被曝視頻造假多模態(tài)視頻是剪輯配音

谷歌Gemini被曝視頻造假多模態(tài)視頻是剪輯配音

楊亮 2023-12-08 13:59:16

288167

分享到

DoNews12月8日消息，谷歌7日凌晨終于發(fā)布雙子座 Gemini 大模型，聲稱 MMLU 多任務(wù)語(yǔ)言理解數(shù)據(jù)集測(cè)試，Gemini Ultra 不光超越 GPT-4，甚至超越了人類專家。

然而有眼尖的網(wǎng)友發(fā)現(xiàn)，在谷歌所給的圖片中，MMLU 測(cè)試中，Gemini 結(jié)果下面灰色小字標(biāo)稱 CoT@32，展開(kāi)來(lái)代表使用了思維鏈提示技巧、嘗試了 32 次選最好結(jié)果。

而作為對(duì)比的 GPT-4，卻是無(wú)提示詞技巧給 5 個(gè)示例，這個(gè)標(biāo)準(zhǔn)下 Gemini Ultra 其實(shí)并不如 GPT-4。以及原圖比例尺也有點(diǎn)不厚道了，90.0% 與人類基準(zhǔn) 89.8% 明明只差一點(diǎn)，y 軸上卻拉開(kāi)很遠(yuǎn)。

HuggingFace 技術(shù)主管 Philipp Schmid 用技術(shù)報(bào)告中披露的數(shù)據(jù)修復(fù)了這張圖，這樣展示更公平恰當(dāng)：

不僅如此，Gemini 在發(fā)布時(shí)，谷歌給出的一系列 Demo 中最令人眼花繚亂的部分是偽造的。

名為《Hands-on with Gemini: Interacting with multimodal AI》的視頻現(xiàn)在的播放量已經(jīng)有 140 萬(wàn)次，其中展示了谷歌認(rèn)為自己「最喜歡的與 Gemini 的交互案例」，展示了多模態(tài)模型（即它理解并混合語(yǔ)言和視覺(jué)理解）如何靈活地響應(yīng)各種輸入。

但點(diǎn)擊 YouTube 上的視頻描述，可以發(fā)現(xiàn) Google 有一個(gè)重要的免責(zé)聲明：「為了演示的目的，已經(jīng)減少延遲，為了簡(jiǎn)潔，Gemini 的輸出也縮短了?！?/p>

也就是說(shuō)，該視頻并非原始輸出，而是進(jìn)行了剪輯和優(yōu)化。隨后，谷歌官博也放出了解釋——是的，視頻的確有后期制作和剪輯的成分。

據(jù)新智元報(bào)道，根據(jù)官方發(fā)布的一個(gè)技術(shù)文檔，Gemini所有的這些交互都不是實(shí)時(shí)感知到的，而是通過(guò)提示詞問(wèn)出來(lái)的。但其實(shí)，真實(shí)的過(guò)程是，向Gemini上傳一張手比剪刀的照片，問(wèn)它看到了什么。然后用人聲把它的回復(fù)讀了出來(lái)。