• <samp id="kc0km"></samp>
    <ul id="kc0km"></ul>
    <strike id="kc0km"></strike>
    <strike id="kc0km"></strike>
  • <kbd id="kc0km"><acronym id="kc0km"></acronym></kbd>
    <code id="kc0km"></code>
    <noframes id="kc0km"></noframes>
  • “遙遙領先”GPT-4?谷歌最強AI大模型Gemini發布一天便引質疑!公司承認6分鐘視頻經特殊剪輯處理,非實時畫面

    2023-12-11 12:08:46

    美東時間12月6日,谷歌CEO桑達爾?皮查伊宣布迄今為止規模最大,能力最強的谷歌大模型Gemini 1.0 版正式上線。Gemini是原生多模態大模型,是谷歌大模型新時代的第一步,它包括三種量級:能力最強的 Gemini Ultra,適用于多任務的 Gemini Pro,以及適用于特定任務和端側的 Gemini Nano。

    皮查伊官宣推文發布后,馬斯克也在下面評論稱,“(Gemini)令人印象深刻”。當天,谷歌還發布了一條約6分鐘的延時演示視頻,展示Gemini的多模態功能(例如,口語對話提示與圖像識別相結合)。截至發稿,該視頻在YouTube上已經收獲141萬次觀看。

    然而,Gemini發布才一天,外界已開始有聲音指控谷歌對Gemini的性能“造假”。

    其中,彭博社一篇專欄文章就表示,谷歌在一段演示視頻中歪曲了Gemini的AI性能。專欄作家帕米·奧爾森(Parmy Olson)認為,在谷歌發布的這段視頻中,Gemini似乎非常強大,但有點過于強大了。對此質疑,谷歌回應時承認,這段關于Gemini性能演示的視頻并不是實時的,而是使用了原始鏡頭中的靜止圖像幀,然后編寫了文本提示,以便讓Gemini做出回應。

    6分鐘演示視頻引質疑

     

    奧爾森認為,Gemini的演示視頻確實非常令人印象深刻。Gemini能夠僅憑一些毫無規則的點就可以推斷出繪制內容是一只螃蟹,顯示出谷歌DeepMind人工智能實驗室多年來訓練的大模型推理能力。不過,奧爾森指出,谷歌這段視頻中展示的Gemini所具備的一些功能并不是其獨有的,ChatGPT Plus也具有類似的推理能力。

    在這6分鐘的視頻中,Gemini似乎能夠快速識別圖像,并在幾秒鐘的時間內做出反應。然而,如果用戶點擊發布在YouTube上的這段視頻的描述,谷歌寫了一個重要的“免責聲明”,稱“為了達到Gemini的演示目的,延遲已經被人為減少,Gemini的輸出時長也為了簡潔而被縮短。”這意味著,Gemini實際回答每個問題所花費的時間要比視頻演示中的更長。 

    機器學習講師Santiago Valdarrama在X平臺上發文暗示,谷歌上述視頻的“免責聲明”似乎“展示的是精心挑選的好結果,不是實時錄制而是剪輯的。”他直言,“這就是誤導,任何參與到其中的人都應該感到尷尬。”

    此外,谷歌公布的MMLU多任務語言理解數據集測試顯示,Gemini Ultra不光超越GPT-4,甚至超越了人類專家。然而,不少業內專家發現,在MMLU測試中,Gemini Ultra的結果下面有灰色小字標CoT@32,代表使用了思維鏈提示技巧、嘗試了32次后選取最好結果。而作為對比的GPT-4,卻無提示詞技巧,且只嘗試了5次。

    否認造假,Gemini負責人稱只是為了簡潔縮短了反應時長 

    美國科技媒體The Verge報道中稱,公平地說,這并不是大型科技公司首次對其產品演示視頻進行剪輯處理,除了谷歌外,其他大型科技公司為了避免現場演示帶來任何技術性問題,都會稍微對視頻進行調整,這也非常普遍。 

    但對于視頻“造假”一說,谷歌堅決予以否認。谷歌DeepMind和深度學習副總裁、Gemini聯合負責人奧里奧爾·維亞萊斯(Oriol Vinyals)在一篇博客文章中,解釋了Gemini演示視頻的制作過程:性能演示視頻不是實時的,而是使用了原始鏡頭中的靜止圖像幀,然后編寫了文本提示,并要求它通過預測來做出回應。

    “視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔而縮短了(Gemini的反應時長)。這個視頻展示了使用Gemini構建的多模式用戶體驗,我們制作它是為了激勵開發者。”維亞萊斯強調。 

    奧爾森對此卻并不買賬。她在專欄文章中寫道:“這與谷歌描述的完全不同——谷歌稱,任何人都可以與Gemini進行流暢的語音對話,因為Gemini可以實時觀察周遭世界并做出反應。”

    她同時指出,谷歌官方發布的Gemini各模態性能顯示,Gemini Ultra(下圖中藍色部分)在9項標準基準測試中的7項都優于GPT-4。這些基準測試往往用于測試人工智能模型在高中物理、專業法律和道德場景等方面的能力。

    然而,在大多數基準測試中,Gemini Ultra只比OpenAI的GPT-4高出幾個百分點,有些甚至不到1個百分點。奧爾森認為,換句話說,谷歌這個所謂的頂級人工智能模型只對OpenAI一年前完成的工作進行了有限的改進。

    需要指出的是,谷歌的6分鐘Gemini演示視頻并沒有說明演示的模型是Gemini Ultra。

    奧爾森認為,一年前,谷歌這個“笨拙的搜索巨頭”被OpenAI的ChatGPT打了個措手不及,此后便一直希望趕上生成式人工智能這股浪潮。谷歌希望通過強大的營銷讓人們記住,它擁有世界上最強大的人工智能研究團隊之一,并且比其他任何人都能獲得更多的數據。但從技術角度來看,在生成式人工智能方面,谷歌仍然落后于OpenAI。 

    不過,在科技行業,誰也不能保證一直一帆風順,屹立不倒。早期的手機霸主諾基亞和黑莓就是例子。在蘋果推出功能更強大、更受歡迎的產品iPhone后,諾基亞和黑莓的市場份額便迅速被搶走。而在軟件領域,市場的成功則來自于擁有最強大性能的系統。

    (稿件來源:每經網)

    責任編輯:陳科辰

    掃一掃分享本頁
    免费看国产精品麻豆| 色欲国产麻豆一精品一AV一免费| 97精品久久天干天天蜜| 日本国产精品久久| 亚洲国产精品无码观看久久| 亚洲精品少妇30p| 亚洲精品影院久久久久久| 亚洲精品无码激情AV| 无码人妻精品一区二区三区久久| 国产亚洲蜜芽精品久久| 国产福利在线观看精品| 国产精品美女视视频专区| 精品日产卡一卡二卡国色天香| 中文字幕无码精品亚洲资源网 | 久久精品99无色码中文字幕 | 精品国产乱码一区二区三区| 久久久久国产成人精品亚洲午夜 | 久久精品香蕉视频| 亚洲精品天堂成人片?V在线播放 | 国产亚洲综合精品一区二区三区| 精品久久久无码21p发布| 国产精品兄妹在线观看麻豆| mm1313亚洲国产精品美女| 国产精品久久久久久久小说| 久久AV无码精品人妻糸列| 久久国产乱子精品免费女| 久久精品女人天堂AV麻| 国产精品不卡高清在线观看| 亚洲国产精品无码观看久久| 精品久久久久久中文字幕人妻最新 | 精品永久久福利一区二区| 久久99热狠狠色精品一区| 热久久美女精品天天吊色| 在线精品视频播放| 无码国产69精品久久久久网站| 99视频在线观看精品| 国产麻豆精品一区二区三区| 国产福利91精品一区二区| 亚洲精品在线免费观看| 久久精品www人人爽人人| 国产精品99久久免费观看|