網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
被OpenAI CEO取關(guān)后Yann LeCun再次抨擊:ChatGPT對(duì)現(xiàn)實(shí)的把握非常膚淺
時(shí)間:2023-02-02 16:17:32

機(jī)器之心報(bào)道


【資料圖】

編輯:蛋醬、杜偉

大佬之間的關(guān)系,有時(shí)真是撲朔迷離。

昨天,有人發(fā)現(xiàn),OpenAI CEO Sam Altman 已經(jīng)在推特上取關(guān)了 Meta 首席人工智能科學(xué)家 Yann LeCun。

我們很難確定這次取關(guān)發(fā)生的具體時(shí)間點(diǎn),但基本能夠確定事件原因 —— 幾天前,Yann LeCun 在前段時(shí)間的一次小型媒體和高管在線聚會(huì)上發(fā)表了自己對(duì) ChatGPT 的看法:

‘就底層技術(shù)而言,ChatGPT 并沒有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開展同樣的工作。’

在 ZDNet 的‘ChatGPT is ‘not particularly innovative,’ and ‘nothing revolutionary’, says Meta‘s chief AI scientist’報(bào)道中,LeCun 演講的一些細(xì)節(jié)被披露出來(lái)。其中有一些很驚人的評(píng)價(jià):

‘與其他實(shí)驗(yàn)室相比,OpenAI 并沒有什么特別的進(jìn)步?!?/p>

‘ChatGPT 使用的 Transformer 架構(gòu)是以這種自監(jiān)督的方式預(yù)訓(xùn)練的。自監(jiān)督學(xué)習(xí)是我很長(zhǎng)一段時(shí)間以來(lái)一直倡導(dǎo)的,甚至可以追溯到 OpenAI 出現(xiàn)之前?!?/p>

‘Transformer 是谷歌的發(fā)明,這類語(yǔ)言項(xiàng)目的工作可以追溯到幾十年前。’

……

如此,Sam Altman 的取關(guān)行動(dòng)也是情有可原。

在‘取關(guān)’被人發(fā)現(xiàn)的四個(gè)小時(shí)后,Yann LeCun 更新了動(dòng)態(tài),再次轉(zhuǎn)發(fā)了一篇‘陰陽(yáng)’ChatGPT 的文章:

為什么像 ChatGPT 這樣的大型語(yǔ)言模型可以滔滔不絕地胡說(shuō)八道?它們對(duì)現(xiàn)實(shí)的把握是非常膚淺的

有人就不同意了:‘ChatGPT 是廣泛知識(shí)和巨大創(chuàng)造力的源泉,已經(jīng)在大量書籍和其他信息源上接受過訓(xùn)練?!?/p>

對(duì)此,LeCun 也表明了自己觀點(diǎn):‘沒人說(shuō) LLM 沒用。FAIR 的 Galactica 短暫發(fā)布期間,我自己也曾這么說(shuō)過。人們把它釘在十字架上,因?yàn)樗鼤?huì)產(chǎn)生胡說(shuō)八道。ChatGPT 做了同樣的事情。但同樣,這并不意味著它們沒有用。

實(shí)際上,這篇《大西洋報(bào)》的文章是對(duì)麻省理工學(xué)院認(rèn)知科學(xué)小組的一篇論文進(jìn)行了評(píng)論。讓我們看一下具體的研究?jī)?nèi)容。

這篇論文說(shuō)了啥?

這篇論文的標(biāo)題為《Dissociating Language and Thought in Large Language Models: a Cognitive Perspective》,作者分別來(lái)自得克薩斯大學(xué)奧斯汀分校、MIT 和 UCLA。

我們知道,如今的大型語(yǔ)言模型(LLM)通常能夠生成連貫、合乎語(yǔ)法且看起來(lái)有意義的文本段落。這一成就引發(fā)了人們的猜測(cè),即這些網(wǎng)絡(luò)已經(jīng)是或者很快將成為‘思維機(jī)器’,從而執(zhí)行需要抽象知識(shí)和推理的任務(wù)。

在本文中,作者考慮了兩個(gè)不同方面的語(yǔ)言使用表現(xiàn)來(lái)觀察 LLM 的能力,分別如下:

形式語(yǔ)言能力,包括給定語(yǔ)言的規(guī)則和模式知識(shí);

功能語(yǔ)言能力,現(xiàn)實(shí)世界中語(yǔ)言理解和使用所需的一系列感知能力。

借鑒認(rèn)知神經(jīng)科學(xué)的證據(jù),作者表明人類的形式能力依賴特定的語(yǔ)言處理機(jī)制,而功能能力需要語(yǔ)言之外的多種能力,它們構(gòu)成了形式推理、世界知識(shí)、情境建模和社會(huì)認(rèn)知等思維能力。與人類的兩種能力區(qū)別相似,LLM 在需要形式語(yǔ)言能力的任務(wù)上表現(xiàn)出色(盡管還不完美),但在很多需要功能能力的測(cè)試中卻往往失敗。

基于這一證據(jù),作者認(rèn)為,其一現(xiàn)代 LLM 應(yīng)該被認(rèn)真地作為具備形式語(yǔ)言技能的模型,其二玩轉(zhuǎn)現(xiàn)實(shí)生活語(yǔ)言使用的模型需要合并或開發(fā)核心語(yǔ)言模塊以及建模思維所需的多種非特定語(yǔ)言的認(rèn)知能力。

總之,他們認(rèn)為,形式語(yǔ)言能力和功能語(yǔ)言能力之間的區(qū)別有助于理清圍繞 LLM 潛力的討論,并為構(gòu)建以類人方式理解和使用語(yǔ)言的模型提供了途徑。LLM 在很多非語(yǔ)言任務(wù)上的失敗并沒有削弱它們作為語(yǔ)言處理的良好模型,如果以人類的思維和大腦作為類比,未來(lái) AGI 的進(jìn)步可能取決于將語(yǔ)言模型以及代表抽象知識(shí)和支持復(fù)雜推理的模型相結(jié)合。

ChatGPT 數(shù)學(xué)水平仍需要提升

LLM 在語(yǔ)言之外的功能能力(如推理等)方面有所欠缺,OpenAI 的 ChatGPT 正是一個(gè)例子。雖然此前官宣數(shù)學(xué)能力再升級(jí),但被網(wǎng)友吐槽只能精通十以內(nèi)的加減法。

近日在一篇論文《Mathematical Capabilities of ChatGPT》中,牛津大學(xué)、劍橋大學(xué)等機(jī)構(gòu)的研究者在公開可用和手工制作的數(shù)據(jù)集上測(cè)試 ChatGPT 的數(shù)學(xué)能力,并衡量了它與在 Minerva 等數(shù)學(xué)語(yǔ)料庫(kù)上訓(xùn)練的其他模型的性能。同時(shí)通過模擬數(shù)學(xué)家日常專業(yè)活動(dòng)(問答、定理搜索)中出現(xiàn)的各種用例,來(lái)測(cè)試 ChatGPT 是否可以稱為專業(yè)數(shù)學(xué)家的有用助手。

研究者引入并公開了一個(gè)全新數(shù)據(jù)集 —— GHOSTS,它是首個(gè)由數(shù)學(xué)研究人員制作和管理的自然語(yǔ)言數(shù)據(jù)集,涵蓋了研究生水平的數(shù)學(xué),并全面概述語(yǔ)言模型的數(shù)學(xué)能力。他們?cè)?GHOSTS 上對(duì) ChatGPT 進(jìn)行了基準(zhǔn)測(cè)試,并根據(jù)細(xì)粒度標(biāo)準(zhǔn)評(píng)估性能。

測(cè)試結(jié)果顯示,ChatGPT 的數(shù)學(xué)能力明顯低于普通數(shù)學(xué)研究生,它通常可以理解問題但無(wú)法給出正確答案。

每月 20 美元,ChatGPT Plus 大會(huì)員上線

不管怎么說(shuō),ChatGPT 在商業(yè)上的成功是有目共睹的。

剛剛,OpenAI 宣布了‘ChatGPT Plus’,一項(xiàng)每月 20 美元的新付費(fèi)會(huì)員服務(wù)。

訂閱者將獲得一些好處:

可以普遍使用 ChatGPT,即使在高峰期也是如此;

更快的響應(yīng)時(shí)間;

優(yōu)先獲得新功能和改進(jìn)。

OpenAI 表示,它將在‘未來(lái)幾周內(nèi)’向在美國(guó)和在其候補(bǔ)名單上的人發(fā)出該服務(wù)的邀請(qǐng),并表示會(huì)將該服務(wù)推廣到其他國(guó)家和地區(qū)。

一個(gè)多星期前,有消息稱 OpenAI 要以每月 42 美元的價(jià)格推出 ChatGPT 服務(wù)的 plus 版或 pro 版,但最終定下的每月 20 美元,顯然讓更廣泛的人群有能力使用該服務(wù),包括學(xué)生和企業(yè)。

某種程度上,這將為市場(chǎng)上任何想要推出的 AI 聊天機(jī)器人設(shè)定付費(fèi)標(biāo)準(zhǔn)。鑒于 OpenAI 是該領(lǐng)域的先行者,如果其他公司試圖發(fā)布每月付費(fèi)超過 20 美元的機(jī)器人,都必須先解釋明白一件事 —— 自己的聊天機(jī)器人憑什么比 ChatGPT Plus 更值錢?

關(guān)鍵詞: chatgpt 形式語(yǔ)言

版權(quán)聲明:
    凡注明來(lái)網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來(lái)源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來(lái)源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 www.netfop.cn All Rights Reserved.
 

中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號(hào):京ICP備2022016840號(hào)-15

營(yíng)業(yè)執(zhí)照公示信息