“你是懂TNT的”
(資料圖)
編者按:本文來自微信公眾號 量子位(ID:QbitAI),作者:明敏,創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布,頭圖來源攝圖網(wǎng)。
看,輸入想要干的事:給學(xué)生成績排個名吧。
簡單敲個回車,表格唰一下就列好了!
檢查一遍也沒錯。
還能跨表格處理。
比如標(biāo)記出兩張不同表格中排名都在前十的學(xué)校。
哦豁,還有點超越ChatGPT?
畢竟給ChatGPT提出類似的要求,它只能幫我寫出對應(yīng)的代碼,操作還得自己手動來。
這就是最近在知乎上引起關(guān)注的AI工具ChatExcel,一發(fā)布就登上了熱榜。
它主打用對話的形式實現(xiàn)Excel復(fù)雜操作(Chat-to-Excel),告別記函數(shù)、手動設(shè)置公式。
做好的成品,支持一鍵導(dǎo)出成標(biāo)準(zhǔn)Excel表格,連復(fù)制粘貼這道工序都省了。
而且不用注冊、網(wǎng)頁上就能用、不限使用次數(shù),相當(dāng)利好懶人和Excel小白。
甚至懂Excel技能的人都感慨,自己會的這些是不是要沒用了。
這就是由北京大學(xué)深圳研究生院/信息工程學(xué)院3位碩博生,獨立開發(fā)的項目。
目前已開放Demo供大家試玩。
看到這可能很多人都以為,“這又是一個受到ChatGPT影響開發(fā)的項目嘛”。
還真不是。
GitHub項目上的第一個commit是在22年3月就提交了。
而背后真正的契機——
其實是團隊中一位小哥,想用技術(shù)幫女票解決點工作中的小煩惱啦。
這到底咋回事?量子位聯(lián)系了主創(chuàng)團隊,來一一給大家揭秘~
ChatExcel表現(xiàn)如何?咳咳,別人女票的事稍后再談,咱們先來看看ChatExcel的表現(xiàn)到底咋樣。
總體來說,它想做的事就是跳過學(xué)習(xí)Excel、跳過寫函數(shù)公式,直接把腦子里的需求變成表格里的內(nèi)容。
團隊在知乎首發(fā)產(chǎn)品時,用了一張圖做解釋:
老規(guī)矩,我們來上手體驗下。
進入主頁面后,網(wǎng)站默認(rèn)展示demo,點擊UPLOAD就能上傳自己的表格。格式需要是標(biāo)準(zhǔn)Excel文件。
我們找隔壁ChatGPT生成了一份學(xué)生成績單,讓ChatExcel進行計算操作。
主要測試了需要插入函數(shù)的Excel操作。比如:
打完內(nèi)容,敲一下回車,它就開始處理了。
假如老師想知道誰是單科第一呢?輸入:
然后,它就生成了一個新的界面,里面只有最高分童鞋。
如果還想對表格進行其他操作,點一下頁面中的“UNDO”,它就能返回到操作前的表格了。
我們還讓它對表格中的學(xué)生進行成績排名、并列出名次,ChatExcel都沒有出錯。
除此之外,它還能連續(xù)完成任務(wù)。
比如想在表格里增加一欄平均分,可以先要求它增加一列:
再進一步輸入需求,讓它把計算好的結(jié)果填進去:
最后得到的表格,點擊“DOWNLOAD”,即可導(dǎo)出為普通的Excel表格。
體驗下來,感覺ChatExcel主要有兩大特點:
連貫性
準(zhǔn)確性
比如之前也有幫人生成Excel公式的工具,excelformulabot能實現(xiàn)這一功能,但它是獨立在表格外的,需要自己把單元格帶入到給出的公式了。
如果是具體一些的描述,還會出現(xiàn)給不出公式的情況。
而對比ChatGPT來說,ChatExcel計算的準(zhǔn)確性更突出。
比如計算同一個表格的平均數(shù),ChatGPT不是弄錯到底有多少個人,就是計算的時候帶錯數(shù)字,反復(fù)糾正都救不回來……
所以,ChatExcel是怎么做到的?背后原理到底如何?
把“乙方思想”貫徹到底ChatExcel的原理一言以蔽之,就是直接把“大白話指令”轉(zhuǎn)換成類似于VBA這樣的程序語言,然后再執(zhí)行程序。
底層基于Transformer架構(gòu),基本技術(shù)路線就是無監(jiān)督訓(xùn)練+具體場景微調(diào)。
但NLP模型搞數(shù)學(xué),一直都很容易出錯,強大如ChatGPT都很難避免。
為此,團隊在訓(xùn)練模型的過程中,將重點放在了符號邏輯上,期間還有意引入了一些邏輯符號的新知識。
由此我們也看到,它在計算上出錯的概率并不高。
除了數(shù)學(xué)能力出眾之外,ChatExcel最大的一個特點就是持續(xù)交互。
這是因為ChatExcel每次的生成結(jié)果,都是基于用戶提出的新需求+上一輪生成的表格。對模型的理解力及運算其實提出了更高的要求。
為什么要實現(xiàn)這一功能?
團隊介紹說,如Dall·E、ChatBCG等AI工具,完成任務(wù)的方式都是單次不持續(xù)的。但在人們的實際使用過程中,想法是一步步推進的。
舉例來說,用戶和ChatExcel之間的關(guān)系就好比甲乙雙方,ChatExcel是乙方,用它處理表格的我們就相當(dāng)于甲方:
同樣,這個乙方思維也體現(xiàn)在開發(fā)團隊自己身上。
Demo發(fā)布后,很多人跑來圍觀、試用和提建議。最常出現(xiàn)的反饋是,ChatExcel有點理解不了提出的要求,需要重新措辭調(diào)整。
對于這些情況,團隊先闡明態(tài)度:建議我們?nèi)P接收。
同時也進一步解釋了原因,目前開放的demo還不是很完善。
這一方面是為了看看大家的反饋做進一步優(yōu)化;另一方面,也是希望收集更多的語料,讓模型之后能更聰明一些。
比如,有人就提出:
還有人附議,表格數(shù)據(jù)太多就很難檢查它是否處理正確:
對于這些建議,團隊和我們說,他們已經(jīng)在開始著手調(diào)整了。
比如很多人反饋的語言理解問題,他們打算之后在對話框下根據(jù)用戶的輸入,推薦一些標(biāo)準(zhǔn)操作語句,大家直接選擇就可以了,不用自己研究措辭,有點現(xiàn)在AI客服那味兒。
除此之外,還有這些功能也在開發(fā)的路上了:
表格上傳格式更加兼容
展示ChatExcel處理表格的具體過程,更加透明化……
以及ChatExcel更加具體的原理介紹,之后也會在官網(wǎng)以博客的形式發(fā)布。
甚至包括代碼,也會進行開源。
受到女票啟發(fā),把業(yè)余項目做成正式課題說來ChatExcel的誕生,也是相當(dāng)因吹斯聽了。
它受啟發(fā)于團隊成員的女票、導(dǎo)師立刻拍板認(rèn)可、把業(yè)余項目做成正式課題……
這還要從Kid和CY拉起小團隊說起。
他們都來自北京大學(xué)深圳研究生院信息工程學(xué)院袁粒老師的課題組,已經(jīng)是準(zhǔn)博了,還有一位成員正在讀碩士。
作為機器學(xué)習(xí)的基礎(chǔ)理論研究者,他們?nèi)粘:驼撐拇蚪坏栏唷?/p>
為啥突然從理論研究轉(zhuǎn)向應(yīng)用?
這還得從Kid的女票說起。
他說自己的女朋友是一位中學(xué)信息老師,日常工作中經(jīng)常需要幫年紀(jì)大的老師處理Excel表格問題。
為了幫女朋友多分擔(dān)一點工作(bushi) ,當(dāng)然也看到確實有很多人深受Excel復(fù)雜操作困擾,Kid就萌生了試試看的想法。
當(dāng)時正值OpenAI的Copilot大火,看到AI在提升生產(chǎn)力上大有可為,他就拉著CY一起,打算仔細(xì)研究研究這事兒。
但事情前期,并沒有想象中順利。
一方面,它剛開始只是個業(yè)余項目,大家都是抽空來做。
另一方面,團隊在技術(shù)路線上也做過重大調(diào)整。
最初,他們覺得ChatExcel應(yīng)該是往判別式模型那塊兒走的,于是就順著這一思路推進,但沒想到:
這對于小團隊來說基本上是致命的,因為數(shù)據(jù)量意味著人力物力時間成本都會飆高。
沒有辦法,Kid和CY就坐下來重新復(fù)盤這件事:
加之去年OpenAI一系列生成式工作開始大火(如Copilot、Dall·E),兩個人最后決定,推翻原有思路,重新從生成式模型做起。
明確了技術(shù)路線,后續(xù)推進也就更順了。
加上這項工作還得到了導(dǎo)師袁粒的認(rèn)可和支持,團隊在資源和經(jīng)費上也更充裕了一些。
(p.s.但團隊也和我們解釋說,目前其實還不能負(fù)擔(dān)太多成本,運行速度會受到影響、一些命令行識別也還存在問題)
不管怎樣,歷經(jīng)1年時間,ChatExcel終于發(fā)布demo。
但這只是計劃的第一步。
團隊表示,接下來還將對產(chǎn)品做更多迭代升級,并會開源代碼、揭秘背后技術(shù)。
對于ChatExcel的定位,他們堅持“小而美”。
Kid介紹說,大模型的確是當(dāng)下的趨勢,如OpenAI、百度等都在通用大模型領(lǐng)域不斷推進成果。但他們認(rèn)為,在一些子任務(wù)領(lǐng)域上,模型的能力還有待提升,這可能會是未來的一個趨勢。
由此,他們目前會更加專注于模型特定場景下的能力提升。
至于長遠(yuǎn)目標(biāo),團隊希望打造一個“Chat生態(tài)”、交互式AIGC。
終極“Chat生態(tài)”(幻想版)大概會長這樣:
而回到ChatExcel本身,團隊表示的確有商業(yè)化的考慮,但會是To B層面的。
(聽說demo一發(fā)布就已經(jīng)有不少公司聯(lián)系他們了)
在To C這邊,會堅持公益開放的形式,人人都能用。
而回看整個開發(fā)過程,Kid和CY的很多感受都記憶猶新。
比如看到ChatGPT做表格大火后,他們又驚又喜。
“驚”,是因為開始擔(dān)憂會不會有很多同類產(chǎn)品出來?自己的項目沒有生存余地了?
Kid說自己看到這些新項目不斷涌出后,晚上都要睡不著覺了。
“喜”,則是因為覺得自己的想法和趨勢發(fā)展一致,這也是一種肯定。
至于項目本身,他們的態(tài)度非常坦然,問題全盤接受,但對自己的成果也很有自信。
(應(yīng)受訪者要求文中Kid、CY為化名)
傳送門:https://chatexcel.com/
參考鏈接:
[1] https://www.zhihu.com/question/586673687
[2] https://zhuanlan.zhihu.com/p/607997627