網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
環(huán)球頭條:實(shí)測文心一言 百度可以再自信一點(diǎn)
時間:2023-03-17 23:22:36

撰文| 吳先之 文燁豪

編輯| 王 潘

不到一年時間,AI完成了從“袪魅”,到重回主流、再度引發(fā)“恐慌”的逆襲。


(資料圖片僅供參考)

隨著AIGC應(yīng)用愈發(fā)成熟,不僅科技語境涌起新一輪浪潮,一直同AI略顯疏離的C端用戶亦被不斷刷新著認(rèn)知。當(dāng)下,不論是投資圈,還是學(xué)術(shù)界,抑或是普通用戶,幾乎所有人的目光都聚焦在了生成式AI產(chǎn)品身上。

顯然,2023年,屬于AIGC的時代已然到來。但縱觀行業(yè),大眾討論的核心始終沒有脫離那幾款明星產(chǎn)品,國內(nèi)部分企業(yè)雖表示正在布局,大多停留于概念層面,鮮有真正拿出成果的玩家——直至百度下場,局面有所逆轉(zhuǎn)。

3月16日下午,百度發(fā)布廳內(nèi),李彥宏親自上臺,將外界期待許久的文心一言端上了臺面。從發(fā)布會現(xiàn)場演示來看,文心一言在面對五個典型的使用場景時表現(xiàn)得不錯,回答的準(zhǔn)確性、邏輯性、流暢性均接近人類水平。耕耘AI多年的百度,或許即將迎來屬于自己的時刻。

文心一言:百度AI十幾年荊棘闖出的結(jié)果

細(xì)數(shù)國內(nèi)互聯(lián)網(wǎng)語境,百度無疑是在AI領(lǐng)域扎根最深的玩家之一。早在十年前,百度便已將未來的飛輪押注在了AI上面。

2010年,當(dāng)玩家們還在思索如何通過互聯(lián)網(wǎng)思維改造傳統(tǒng)行業(yè)時,百度便已成立了自然語言處理部,開始了對自然語言處理NLP的探索。而過去十多年間,在視覺識別、自動駕駛等AI更為廣闊的落地領(lǐng)域,幾乎也都遍布著百度的身影。

只是,科技發(fā)展需要跨越裂谷,正如千禧年的互聯(lián)網(wǎng)的崩潰,以及后來云計(jì)算遭冷落等,前沿技術(shù)研發(fā)及落地過程中往往充滿著痛苦,即便是OpenAI,也難逃多年苦坐“冷板凳”,百度AI亦曾陷入過單邊投入的長周期之中。

而文心一言,正是百度這十多年AI路,踩著“荊棘”所闖出的結(jié)果。

2019年3月,文心一言背后的文心大模型ERNIE1.0首次亮相,并登頂了全球權(quán)威數(shù)據(jù)集GLUE榜單。此后,其不斷升級迭代,從自然語言延伸至視覺、語音等多模態(tài),直到最新的ERNIE3.0 Zeus模型,已然具備了千億級參數(shù)。換言之,百度能夠搶跑國內(nèi)AIGC賽道,絕非偶然。

而切入正題,文心一言實(shí)際表現(xiàn)到底如何?發(fā)布會上,李彥宏通過文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個場景下的Demo,向外界秀了一把肌肉。

以數(shù)理邏輯推算為例,其向文心一言拋出了經(jīng)典的雞兔同籠問題,并在提問中埋下了彩蛋——即誤導(dǎo)性的提問。而經(jīng)過演算,文心一言非但沒有踩坑,反倒指出了題目出現(xiàn)了錯誤,且在面對正確的題目時,給出了正確結(jié)果及解題步驟。

如果說,頂級廠商大模型均具備的數(shù)理邏輯推算能力,尚不足以證明文心一言的能力,那么其關(guān)于“洛陽紙貴”的表達(dá),則令人眼前一亮。畢竟中文語境較為復(fù)雜,漢字?jǐn)?shù)量較多,即便是ChatGPT,面對中文時偶爾也會出現(xiàn)詞不達(dá)意,言不由衷的情況。

以“用洛陽紙貴四個字寫一首藏頭詩”為例,文心一言稍加思索,寫下了“洛陽城里春光好,陽艷無雙不負(fù)賞。紙貴漫天詩詞賦,貴比黃金樂未央?!?/p>

這首詩雖談不上有多少文學(xué)、審美價值,但至少兢兢業(yè)業(yè)地按照要求完成了創(chuàng)作。相比之下,ChatGPT似乎并沒有很好地理解“藏頭詩”的含義。

從中不難窺見文心一言的中文理解能力。顯然,在中文語境里,具備搜索優(yōu)勢的百度擁有“主場優(yōu)勢”,有著更多的中文語料數(shù)據(jù)參與訓(xùn)練,自然也有著更為成熟的結(jié)果。

總之,就發(fā)布會來看,文心一言的表現(xiàn)優(yōu)秀。

實(shí)測文心一言:優(yōu)勢非虛

或許是早已習(xí)慣了國內(nèi)玩家的PPT發(fā)布會,外界對發(fā)布會上文心一言的表現(xiàn)褒貶不一,甚至有一種聲音認(rèn)為“Demo并非實(shí)時提問,其中有一定的‘修飾’空間”。

對此,光子星球拿到了文心一言的內(nèi)測資格,并第一時間測試了其實(shí)際表現(xiàn)。先說結(jié)論,就當(dāng)前版本的文心一言而言,仍有提升的空間,但整體表現(xiàn)超出了我們此前的預(yù)期。

首先是百度重點(diǎn)展現(xiàn)的中文理解領(lǐng)域,從燒烤店老板的視角分別向文心一言和ChatGPT提出相同的問題。

提問是東北燒烤,但ChatGPT的回答似乎有些驢頭不對馬嘴,將串串香、烤鴨等五湖四海的美食匯聚一堂。相比之下,文心一言的回答不僅到位許多,甚至還呈現(xiàn)出了不同答案的取名邏輯。

同樣的邏輯,在貼合本地文化的網(wǎng)吧取名中同樣有所體現(xiàn)。文心一言的回答,顯然比ChatGPT毫無邏輯的回答要精準(zhǔn)。

此外,在發(fā)布會展現(xiàn)的藏頭詩創(chuàng)作方面,文心一言對內(nèi)容的理解亦優(yōu)于ChatGPT。

由此可見,文心一言對于自己“更理解中國文化,更適合中文語境和中國市場”的表述,不是一句空談。

相對復(fù)雜的數(shù)理邏輯推算場景,我們亦向兩款產(chǎn)品提出了比發(fā)布會“雞兔同籠”更繞的問題——“如果3個人3天能做3個燈籠,那么9個人9天,能做多少個燈籠?(正確答案是27個)”

或許是該問題涉及到更多中文理解,強(qiáng)如ChatGPT也給出了錯誤的回答,直到多番糾錯才勉強(qiáng)回答正確。文心一言的表現(xiàn)雖與之類似,但其在5次提問里,直接回答正確了2次。

而在發(fā)布會并未透露的編程領(lǐng)域,面對編寫“俄羅斯方塊”代碼的要求,文心一言在Python里洋洋灑灑地寫下了88行代碼。在交由一位程序員朋友檢查后,其稱文心一言所寫的代碼整體并沒有太大的毛病。

圖片創(chuàng)作領(lǐng)域,文心一言所生成的圖片基本符合描述。

此外,我們還測試了其撰寫商業(yè)稿件、提煉內(nèi)容等能力,受限于篇幅無法全然呈現(xiàn)。

總而言之,文心一言在面對前述場景時,具備一定的準(zhǔn)確性、邏輯性,中文理解部分優(yōu)于ChatGPT。

雖然只是內(nèi)測版本,但文心一言的表現(xiàn)相當(dāng)成熟。而隨著后續(xù)迭代更新,這一款寄托著外界“國產(chǎn)ChatGPT”期許產(chǎn)品很可能將迎來光明的未來。

百度AI的新征程

現(xiàn)階段,無論是OpenAI的GPT“家族”,還是百度的文心一言,抑或是更為廣闊的AIGC賽道,仍處于前期的技術(shù)沉淀階段。正如李彥宏發(fā)布會所說,大語言模型還遠(yuǎn)未到發(fā)展完善的階段,有賴于通過真實(shí)的用戶反饋而逐步迭代。

在這一輪博弈里,只有盡早地?fù)屨忌砦?,才能積攢起更多用戶,從而收集更多數(shù)據(jù),推動產(chǎn)品迭代升級。

只是,不同于一夜迸發(fā)的“商業(yè)靈感”,技術(shù)領(lǐng)域的演進(jìn)從始至終都需要堆砌金錢與時間。

一位業(yè)內(nèi)人士指出,像ChatGPT、文心一言這樣的產(chǎn)品,需要大量頂尖人才,特別燒錢,而且還需要時間沉淀,初創(chuàng)企業(yè)想要分羹極為艱難,盲目進(jìn)場極有可能陷入“重復(fù)制造輪子”的窘境。

也因如此,李彥宏才會在發(fā)布會上表示:“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型?!?/p>

另一方面, AIGC賽道的玩家在打磨產(chǎn)品的同時,亦需思考如何跑通商業(yè)化之路,畢竟諸如語音識別、視覺系A(chǔ)I等“前輩”們,或多或少都經(jīng)歷過商業(yè)化長夜。

究其所因,任何新興技術(shù)想要突破“商業(yè)化瓶頸”,關(guān)鍵點(diǎn)均在于“應(yīng)用”,即滿足用戶、公司乃至行業(yè)的實(shí)際需求。這既是GPT-4接入Office的原因,亦是百度向百度智能云企業(yè)客戶開放文心一言API接口調(diào)用服務(wù)的原因。

而從當(dāng)下的局面來看,強(qiáng)調(diào)中文語境的文心一言,似乎已經(jīng)得到了國內(nèi)市場B端用戶的認(rèn)可。數(shù)據(jù)顯示,自2月份百度官宣“文心一言”以來,已有超過650家企業(yè)宣布接入文心一言生態(tài)。截至3月17日12點(diǎn),申請文心一言API調(diào)用服務(wù)測試的企業(yè)已達(dá)8萬——搶跑的百度,正在試圖建立全新的商業(yè)秩序。

歸根結(jié)底,科技迭代、下潛之路從來不是一帆風(fēng)順,唯有翻越重重大山,才能看到曙光。而在當(dāng)下這個愈發(fā)激烈的競爭語境里,至少在國內(nèi),百度很可能將成為第一批吃到螃蟹的玩家。

關(guān)鍵詞:

版權(quán)聲明:
    凡注明來網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 www.netfop.cn All Rights Reserved.
 

中國網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業(yè)執(zhí)照公示信息