網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
老羅落淚!北大團(tuán)隊(duì)搞出ChatExcel 說(shuō)人話自動(dòng)處理表格 免費(fèi)且不限次使用
時(shí)間:2023-03-05 14:24:30

做Excel表,真就動(dòng)動(dòng)嘴就夠了!

看,輸入想要干的事:給學(xué)生成績(jī)排個(gè)名吧。


【資料圖】

簡(jiǎn)單敲個(gè)回車(chē),表格唰一下就列好了!

檢查一遍也沒(méi)錯(cuò)。

還能跨表格處理。

比如標(biāo)記出兩張不同表格中排名都在前十的學(xué)校。

哦豁,還有點(diǎn)超越ChatGPT?

畢竟給ChatGPT提出類(lèi)似的要求,它只能幫我寫(xiě)出對(duì)應(yīng)的代碼,操作還得自己手動(dòng)來(lái)。

這就是最近在知乎上引起關(guān)注的AI工具ChatExcel,一發(fā)布就登上了熱榜。

它主打用對(duì)話的形式實(shí)現(xiàn)Excel復(fù)雜操作(Chat-to-Excel),告別記函數(shù)、手動(dòng)設(shè)置公式。

做好的成品,支持一鍵導(dǎo)出成標(biāo)準(zhǔn)Excel表格,連復(fù)制粘貼這道工序都省了。

而且不用注冊(cè)、網(wǎng)頁(yè)上就能用不限使用次數(shù),相當(dāng)利好懶人和Excel小白。

甚至懂Excel技能的人都感慨,自己會(huì)的這些是不是要沒(méi)用了。

這就是由北京大學(xué)深圳研究生院/信息工程學(xué)院3位碩博生,獨(dú)立開(kāi)發(fā)的項(xiàng)目。

目前已開(kāi)放Demo供大家試玩。

看到這可能很多人都以為,“這又是一個(gè)受到ChatGPT影響開(kāi)發(fā)的項(xiàng)目嘛”。

還真不是。

GitHub項(xiàng)目上的第一個(gè)commit是在22年3月就提交了。

而背后真正的契機(jī)——

其實(shí)是團(tuán)隊(duì)中一位小哥,想用技術(shù)幫女票解決點(diǎn)工作中的小煩惱啦。

這到底咋回事?量子位聯(lián)系了主創(chuàng)團(tuán)隊(duì),來(lái)一一給大家揭秘~

ChatExcel表現(xiàn)如何?

咳咳,別人女票的事稍后再談,咱們先來(lái)看看ChatExcel的表現(xiàn)到底咋樣。

總體來(lái)說(shuō),它想做的事就是跳過(guò)學(xué)習(xí)Excel、跳過(guò)寫(xiě)函數(shù)公式,直接把腦子里的需求變成表格里的內(nèi)容。

團(tuán)隊(duì)在知乎首發(fā)產(chǎn)品時(shí),用了一張圖做解釋?zhuān)?/p>

老規(guī)矩,我們來(lái)上手體驗(yàn)下。

進(jìn)入主頁(yè)面后,網(wǎng)站默認(rèn)展示demo,點(diǎn)擊UPLOAD就能上傳自己的表格。格式需要是標(biāo)準(zhǔn)Excel文件。

我們找隔壁ChatGPT生成了一份學(xué)生成績(jī)單,讓ChatExcel進(jìn)行計(jì)算操作。

主要測(cè)試了需要插入函數(shù)的Excel操作。比如:

給總分在255以上的人標(biāo)記為A,總分在240-255的人標(biāo)記為A-,總分在210-240的人標(biāo)記為B。

打完內(nèi)容,敲一下回車(chē),它就開(kāi)始處理了。

假如老師想知道誰(shuí)是單科第一呢?輸入:

找到表格中數(shù)學(xué)成績(jī)最高分的人。

然后,它就生成了一個(gè)新的界面,里面只有最高分童鞋。

如果還想對(duì)表格進(jìn)行其他操作,點(diǎn)一下頁(yè)面中的“UNDO”,它就能返回到操作前的表格了。

我們還讓它對(duì)表格中的學(xué)生進(jìn)行成績(jī)排名、并列出名次,ChatExcel都沒(méi)有出錯(cuò)。

除此之外,它還能連續(xù)完成任務(wù)。

比如想在表格里增加一欄平均分,可以先要求它增加一列:

再進(jìn)一步輸入需求,讓它把計(jì)算好的結(jié)果填進(jìn)去:

最后得到的表格,點(diǎn)擊“DOWNLOAD”,即可導(dǎo)出為普通的Excel表格。

體驗(yàn)下來(lái),感覺(jué)ChatExcel主要有兩大特點(diǎn):

連貫性

準(zhǔn)確性

比如之前也有幫人生成Excel公式的工具,excelformulabot能實(shí)現(xiàn)這一功能,但它是獨(dú)立在表格外的,需要自己把單元格帶入到給出的公式了。

如果是具體一些的描述,還會(huì)出現(xiàn)給不出公式的情況。

而對(duì)比ChatGPT來(lái)說(shuō),ChatExcel計(jì)算的準(zhǔn)確性更突出。

比如計(jì)算同一個(gè)表格的平均數(shù),ChatGPT不是弄錯(cuò)到底有多少個(gè)人,就是計(jì)算的時(shí)候帶錯(cuò)數(shù)字,反復(fù)糾正都救不回來(lái)……

所以,ChatExcel是怎么做到的?背后原理到底如何?

把“乙方思想”貫徹到底

ChatExcel的原理一言以蔽之,就是直接把“大白話指令”轉(zhuǎn)換成類(lèi)似于VBA這樣的程序語(yǔ)言,然后再執(zhí)行程序。

底層基于Transformer架構(gòu),基本技術(shù)路線就是無(wú)監(jiān)督訓(xùn)練+具體場(chǎng)景微調(diào)。

但NLP模型搞數(shù)學(xué),一直都很容易出錯(cuò),強(qiáng)大如ChatGPT都很難避免。

為此,團(tuán)隊(duì)在訓(xùn)練模型的過(guò)程中,將重點(diǎn)放在了符號(hào)邏輯上,期間還有意引入了一些邏輯符號(hào)的新知識(shí)。

由此我們也看到,它在計(jì)算上出錯(cuò)的概率并不高。

除了數(shù)學(xué)能力出眾之外,ChatExcel最大的一個(gè)特點(diǎn)就是持續(xù)交互。

這是因?yàn)镃hatExcel每次的生成結(jié)果,都是基于用戶提出的新需求+上一輪生成的表格。對(duì)模型的理解力及運(yùn)算其實(shí)提出了更高的要求。

為什么要實(shí)現(xiàn)這一功能?

團(tuán)隊(duì)介紹說(shuō),如Dall·E、ChatBCG等AI工具,完成任務(wù)的方式都是單次不持續(xù)的。但在人們的實(shí)際使用過(guò)程中,想法是一步步推進(jìn)的。

舉例來(lái)說(shuō),用戶和ChatExcel之間的關(guān)系就好比甲乙雙方,ChatExcel是乙方,用它處理表格的我們就相當(dāng)于甲方:

要求只管提,改到滿意為止。(Doge)

同樣,這個(gè)乙方思維也體現(xiàn)在開(kāi)發(fā)團(tuán)隊(duì)自己身上。

Demo發(fā)布后,很多人跑來(lái)圍觀、試用和提建議。最常出現(xiàn)的反饋是,ChatExcel有點(diǎn)理解不了提出的要求,需要重新措辭調(diào)整。

對(duì)于這些情況,團(tuán)隊(duì)先闡明態(tài)度:建議我們?nèi)P(pán)接收。

同時(shí)也進(jìn)一步解釋了原因,目前開(kāi)放的demo還不是很完善。

這一方面是為了看看大家的反饋?zhàn)鲞M(jìn)一步優(yōu)化;另一方面,也是希望收集更多的語(yǔ)料,讓模型之后能更聰明一些。

比如,有人就提出:

既然都已經(jīng)有“undo”(撤銷(xiāo))操作,什么時(shí)候可以把它處理表格的過(guò)程顯示出來(lái)。

還有人附議,表格數(shù)據(jù)太多就很難檢查它是否處理正確

提高ChatExcel執(zhí)行任務(wù)的透明度,方便檢查錯(cuò)誤。

對(duì)于這些建議,團(tuán)隊(duì)和我們說(shuō),他們已經(jīng)在開(kāi)始著手調(diào)整了。

比如很多人反饋的語(yǔ)言理解問(wèn)題,他們打算之后在對(duì)話框下根據(jù)用戶的輸入,推薦一些標(biāo)準(zhǔn)操作語(yǔ)句,大家直接選擇就可以了,不用自己研究措辭,有點(diǎn)現(xiàn)在AI客服那味兒。

除此之外,還有這些功能也在開(kāi)發(fā)的路上了:

表格上傳格式更加兼容

展示ChatExcel處理表格的具體過(guò)程,更加透明化

……

以及ChatExcel更加具體的原理介紹,之后也會(huì)在官網(wǎng)以博客的形式發(fā)布。

甚至包括代碼,也會(huì)進(jìn)行開(kāi)源。

受到女票啟發(fā),把業(yè)余項(xiàng)目做成正式課題

說(shuō)來(lái)ChatExcel的誕生,也是相當(dāng)因吹斯聽(tīng)了。

它受啟發(fā)于團(tuán)隊(duì)成員的女票、導(dǎo)師立刻拍板認(rèn)可、把業(yè)余項(xiàng)目做成正式課題……

這還要從KidCY拉起小團(tuán)隊(duì)說(shuō)起。

他們都來(lái)自北京大學(xué)深圳研究生院信息工程學(xué)院袁粒老師的課題組,已經(jīng)是準(zhǔn)博了,還有一位成員正在讀碩士。

作為機(jī)器學(xué)習(xí)的基礎(chǔ)理論研究者,他們?nèi)粘:驼撐拇蚪坏栏唷?/p>

為啥突然從理論研究轉(zhuǎn)向應(yīng)用?

這還得從Kid的女票說(shuō)起。

他說(shuō)自己的女朋友是一位中學(xué)信息老師,日常工作中經(jīng)常需要幫年紀(jì)大的老師處理Excel表格問(wèn)題。

為了幫女朋友多分擔(dān)一點(diǎn)工作(bushi) ,當(dāng)然也看到確實(shí)有很多人深受Excel復(fù)雜操作困擾,Kid就萌生了試試看的想法。

我覺(jué)得Excel公式的使用,多少還是需要編程思維的,這對(duì)于很多人、尤其是不擅長(zhǎng)電腦操作的人來(lái)說(shuō),很不友好。而拿著工具書(shū)從頭啃,也確實(shí)比較麻煩。

當(dāng)時(shí)正值OpenAI的Copilot大火,看到AI在提升生產(chǎn)力上大有可為,他就拉著CY一起,打算仔細(xì)研究研究這事兒。

但事情前期,并沒(méi)有想象中順利。

一方面,它剛開(kāi)始只是個(gè)業(yè)余項(xiàng)目,大家都是抽空來(lái)做。

另一方面,團(tuán)隊(duì)在技術(shù)路線上也做過(guò)重大調(diào)整。

最初,他們覺(jué)得ChatExcel應(yīng)該是往判別式模型那塊兒走的,于是就順著這一思路推進(jìn),但沒(méi)想到:

前期處理工作量太大,需要引入非常非常多的符號(hào)邏輯,數(shù)據(jù)要求很高。

這對(duì)于小團(tuán)隊(duì)來(lái)說(shuō)基本上是致命的,因?yàn)閿?shù)據(jù)量意味著人力物力時(shí)間成本都會(huì)飆高。

沒(méi)有辦法,Kid和CY就坐下來(lái)重新復(fù)盤(pán)這件事:

我們想到李沐老師發(fā)過(guò)一個(gè)視頻,講“BERT和GPT之爭(zhēng)”,我們最初都覺(jué)得BERT各種指標(biāo)表現(xiàn)更好。GPT呢,有點(diǎn)摸不清它想干啥。

但仔細(xì)一想,從任務(wù)本身的需求來(lái)看,生成式才是我們真正想要的東西。

加之去年OpenAI一系列生成式工作開(kāi)始大火(如Copilot、Dall·E),兩個(gè)人最后決定,推翻原有思路,重新從生成式模型做起。

明確了技術(shù)路線,后續(xù)推進(jìn)也就更順了。

加上這項(xiàng)工作還得到了導(dǎo)師袁粒的認(rèn)可和支持,團(tuán)隊(duì)在資源和經(jīng)費(fèi)上也更充裕了一些。

(p.s.但團(tuán)隊(duì)也和我們解釋說(shuō),目前其實(shí)還不能負(fù)擔(dān)太多成本,運(yùn)行速度會(huì)受到影響、一些命令行識(shí)別也還存在問(wèn)題

不管怎樣,歷經(jīng)1年時(shí)間,ChatExcel終于發(fā)布demo。

但這只是計(jì)劃的第一步

團(tuán)隊(duì)表示,接下來(lái)還將對(duì)產(chǎn)品做更多迭代升級(jí),并會(huì)開(kāi)源代碼、揭秘背后技術(shù)。

對(duì)于ChatExcel的定位,他們堅(jiān)持“小而美”。

Kid介紹說(shuō),大模型的確是當(dāng)下的趨勢(shì),如OpenAI、百度等都在通用大模型領(lǐng)域不斷推進(jìn)成果。但他們認(rèn)為,在一些子任務(wù)領(lǐng)域上,模型的能力還有待提升,這可能會(huì)是未來(lái)的一個(gè)趨勢(shì)。

由此,他們目前會(huì)更加專(zhuān)注于模型特定場(chǎng)景下的能力提升。

至于長(zhǎng)遠(yuǎn)目標(biāo),團(tuán)隊(duì)希望打造一個(gè)“Chat生態(tài)”交互式AIGC。

終極“Chat生態(tài)”(幻想版)大概會(huì)長(zhǎng)這樣:

而回到ChatExcel本身,團(tuán)隊(duì)表示的確有商業(yè)化的考慮,但會(huì)是To B層面的。

(聽(tīng)說(shuō)demo一發(fā)布就已經(jīng)有不少公司聯(lián)系他們了)

在To C這邊,會(huì)堅(jiān)持公益開(kāi)放的形式,人人都能用。

而回看整個(gè)開(kāi)發(fā)過(guò)程,Kid和CY的很多感受都記憶猶新。

比如看到ChatGPT做表格大火后,他們又驚又喜。

“驚”,是因?yàn)殚_(kāi)始擔(dān)憂會(huì)不會(huì)有很多同類(lèi)產(chǎn)品出來(lái)?自己的項(xiàng)目沒(méi)有生存余地了?

Kid說(shuō)自己看到這些新項(xiàng)目不斷涌出后,晚上都要睡不著覺(jué)了。

“喜”,則是因?yàn)橛X(jué)得自己的想法和趨勢(shì)發(fā)展一致,這也是一種肯定。

至于項(xiàng)目本身,他們的態(tài)度非常坦然,問(wèn)題全盤(pán)接受,但對(duì)自己的成果也很有自信。

我們現(xiàn)在依舊覺(jué)得自己的方案很“優(yōu)雅”。

感覺(jué)做理論的人轉(zhuǎn)來(lái)做應(yīng)用,總是能想到一些奇怪的思路hhh。

(應(yīng)受訪者要求文中Kid、CY為化名)

關(guān)鍵詞: chatexcel excel chatgpt aigc

版權(quán)聲明:
    凡注明來(lái)網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來(lái)源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來(lái)源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 www.netfop.cn All Rights Reserved.
 

中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書(shū)面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號(hào):京ICP備2022016840號(hào)-15

營(yíng)業(yè)執(zhí)照公示信息