夢(mèng)想很美好。
(資料圖)
編者按:本文來(lái)自微信公眾號(hào)全天候科技(ID:iawtmt),作者:于惠如,編輯:羅麗娟 ,創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布。
“認(rèn)知大模型成為通用人工智能的曙光,科大訊飛有信心實(shí)現(xiàn)‘智能涌現(xiàn)’?!?/p>
5月6日,科大訊飛星火認(rèn)知大模型揭開神秘面紗。發(fā)布會(huì)上,科大訊飛董事長(zhǎng)劉慶峰、科大訊飛研究院院長(zhǎng)劉聰在現(xiàn)場(chǎng)實(shí)測(cè)了訊飛星火在七大維度上的核心能力,包括多風(fēng)格多任務(wù)長(zhǎng)文本生成、語(yǔ)言理解、泛領(lǐng)域開放式知識(shí)問(wèn)答、情境式思維鏈邏輯推理、多題型可解析數(shù)學(xué)、多功能多語(yǔ)言代碼,以及多模態(tài)輸入和表達(dá)等。
訊飛星火認(rèn)知大模型發(fā)布的同時(shí),科大訊飛也發(fā)布了基于該大模型的教育、辦公、汽車和數(shù)字員工等多個(gè)領(lǐng)域相關(guān)產(chǎn)品。
星火認(rèn)知大模型始于2022年12月。彼時(shí),科大訊飛啟動(dòng)“1+N”大模型技術(shù)攻關(guān),其中,“1”代表通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練方案底座平臺(tái),“N”代表大模型在教育、辦公、汽車、人機(jī)交互等各個(gè)領(lǐng)域的落地。
“當(dāng)前,在文本生成、知識(shí)問(wèn)答、數(shù)學(xué)能力三大能力上,訊飛星火認(rèn)知大模型已超ChatGPT?!眲c峰在發(fā)布會(huì)上表示。
與此同時(shí),劉慶峰還給出了訊飛星火的迭代時(shí)間表及每階段目標(biāo):第一階段,在6月9日,突破開放性問(wèn)答,如實(shí)時(shí)問(wèn)答;多輪對(duì)話能力再次升級(jí);數(shù)學(xué)能力再上臺(tái)階。第二階段,在8月15日,突破代碼能力;多模態(tài)交互能力正式開放給客戶。 第三階段:10月24日,在通用大模型領(lǐng)域?qū)?biāo)ChatGPT,其中中文能力超越后者,英文能力與后者相當(dāng)。
此外,據(jù)劉慶峰透露,科大訊飛還將在今年推出醫(yī)療行業(yè)大模型。
發(fā)布會(huì)現(xiàn)場(chǎng),劉慶峰用“最強(qiáng)”、“已超ChatGPT”、“遙遙領(lǐng)先”等詞形容訊飛星火認(rèn)知大模型的部分能力,但他同時(shí)也承認(rèn)訊飛星火仍然存在一些問(wèn)題。比如:對(duì)新知識(shí)難以及時(shí)更新;事實(shí)類問(wèn)答容易出現(xiàn)“張冠李戴”;史實(shí)、傳統(tǒng)典籍等容易“編造情節(jié)”等。
目前,星火認(rèn)知大模型已對(duì)外開放測(cè)試。
01 現(xiàn)場(chǎng)實(shí)測(cè)七大核心能力與百度文心一言、阿里通議千問(wèn)不同,訊飛星火沒有在發(fā)布會(huì)上使用提前錄好的demo版本,而是在現(xiàn)場(chǎng)實(shí)測(cè)了其七大核心能力。
從現(xiàn)場(chǎng)演示效果來(lái)看,星火認(rèn)知大模型基本能夠流暢完成交付的各項(xiàng)任務(wù)。另外,訊飛星火體現(xiàn)了科大訊飛的一貫強(qiáng)項(xiàng)——語(yǔ)音能力,它可以通過(guò)語(yǔ)音轉(zhuǎn)文字進(jìn)行問(wèn)答,這也是其優(yōu)勢(shì)所在。
演示中,劉聰讓星火認(rèn)知大模型寫郵件、做方案、寫新聞通稿、生成英文宣傳文案等文本生成功能,訊飛星火均流暢地完成了任務(wù)。
現(xiàn)場(chǎng)演示的訊飛星火的語(yǔ)言理解能力也在線,它理解了特定的句子和場(chǎng)景含義,隨著問(wèn)題的變化,也調(diào)整了自己的答案
在數(shù)學(xué)能力中,除了常規(guī)計(jì)算、幾何、情景應(yīng)用等,訊飛星火解答了復(fù)雜的計(jì)算題答案。在劉慶峰看來(lái),數(shù)理能力一定程度代表了一個(gè)大模型的聰明程度?!坝嶏w星火大模型不僅在國(guó)內(nèi)系統(tǒng)中遙遙領(lǐng)先,也超過(guò)了ChatGPT。”
此外,劉聰還展示了大模型面向泛領(lǐng)域開放式知識(shí)問(wèn)答能力、邏輯推理能力與代碼能力。在多模態(tài)能力方面,星火大模型能夠根據(jù)關(guān)鍵詞句生成語(yǔ)音、圖片、視頻等素材,并可生成虛擬人進(jìn)行視頻展示。
不過(guò),據(jù)官方介紹,訊飛星火的多模態(tài)能力目前還在測(cè)試中,最遲8月會(huì)提供給VIP客戶使用。
02 打通“大模型+產(chǎn)品”閉環(huán)生態(tài)訊飛星火認(rèn)知大模型發(fā)布的當(dāng)天,科大訊飛還同時(shí)發(fā)布了基于該大模型的教育、辦公、汽車和數(shù)字員工等多個(gè)領(lǐng)域相關(guān)產(chǎn)品。
以汽車為例,訊飛火星認(rèn)知大模型與智慧座艙的結(jié)合,可以實(shí)現(xiàn)車內(nèi)跨業(yè)務(wù)、跨場(chǎng)景人車自由交流?;诖竽P偷闹悄茏搶⒏杂伞M人化、更懂汽車、更開放。
在學(xué)習(xí)機(jī)中,新增talktalk功能,實(shí)現(xiàn)中英文對(duì)話,存量學(xué)習(xí)機(jī)可更新迭代。辦公本和錄音筆中,新增語(yǔ)篇規(guī)整、要點(diǎn)總結(jié)、一鍵成稿,存量產(chǎn)品也可更新使用。
基于自然語(yǔ)言生成業(yè)務(wù)流程和RPA,在“大模型+數(shù)字員工”應(yīng)用場(chǎng)景,可以幫助企業(yè)員工完成大量重復(fù)性工作。
現(xiàn)場(chǎng)以公司招聘事項(xiàng)為例,輸入指令后,系統(tǒng)即可自動(dòng)按照事先設(shè)計(jì)的RPA腳本,操作計(jì)算機(jī)中的相應(yīng)軟件,實(shí)現(xiàn)業(yè)務(wù)流程的自動(dòng)化操作并輸出結(jié)果,并進(jìn)行數(shù)據(jù)分析。
劉慶峰透露,上述領(lǐng)域外,訊飛星火認(rèn)知大模型還將賦能包括醫(yī)療、城市、政法、工業(yè)等在內(nèi)的更多行業(yè),滿足更多專業(yè)領(lǐng)域的需求,向更廣闊的產(chǎn)業(yè)領(lǐng)域延伸。
據(jù)了解,首批來(lái)自36個(gè)行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型。
03 測(cè)試體驗(yàn)星火大模型“成色”究竟如何?全天候科技親測(cè)了多個(gè)場(chǎng)景下的問(wèn)題,不妨一起來(lái)看一看它回答的如何。
我們先讓星火大模型介紹了自己和競(jìng)品。
很明顯,簡(jiǎn)單介紹沒有問(wèn)題,但當(dāng)主語(yǔ)更復(fù)雜,需要理解時(shí),它的理解能力“不在線”。
我們又讓訊飛星火展現(xiàn)了文字創(chuàng)作能力——根據(jù)要求寫一首詩(shī)。
這首詩(shī)基本涵蓋了端午節(jié)的要素:糯米、龍舟、艾草,還拓展了龍舟、艾草等元素的使用場(chǎng)景,也表達(dá)了對(duì)生活的美好祝愿。但整體而言,與其說(shuō)是一首詩(shī),它更像是一首缺少押韻、對(duì)仗、與美感的順口溜。
隨后,全天候科技針對(duì)一些時(shí)下正流行的網(wǎng)絡(luò)“熱?!边M(jìn)行提問(wèn),看其是否有緊跟熱點(diǎn)的能力。
然而,對(duì)于“特種兵”式旅游這個(gè)網(wǎng)絡(luò)熱梗,訊飛星火知道一點(diǎn),但知道的不多。不過(guò),它的“態(tài)度”很好,當(dāng)我們提出錯(cuò)誤,它能認(rèn)識(shí)到自己的錯(cuò)誤,并且道歉。
在測(cè)試過(guò)程中,全天候科技發(fā)現(xiàn),訊飛星火的部分語(yǔ)料庫(kù)并未更新至最新事件,對(duì)一些實(shí)事仍然給出錯(cuò)誤答案。比如,當(dāng)我們問(wèn)“北京冬奧會(huì)自由式滑雪女子U型場(chǎng)地冠軍是誰(shuí)”時(shí),它給出的答案是:法國(guó)選手特蘭斯·勒貝克 (TraceLeBerque)。不過(guò),當(dāng)我們給出正確答案后,它又立馬承認(rèn)自己的錯(cuò)誤并道歉。
在數(shù)學(xué)推理能力方面,我們請(qǐng)訊飛星火做了幾道數(shù)學(xué)題。對(duì)于第一個(gè)題,訊飛星火不僅給出了正確答案,還做了延伸。而對(duì)于第二個(gè)題,它給出了詳細(xì)的解題步驟及正確答案??梢钥闯觯暮?jiǎn)單數(shù)學(xué)推理能力過(guò)關(guān)。
在多模態(tài)生成方面,訊飛星火的表現(xiàn)也不夠完美。
此前已經(jīng)推出的百度文心一言、阿里通義千問(wèn)等大模型均具備圖片生成的能力。當(dāng)我們輸入“科大訊飛要開大模型發(fā)布會(huì),請(qǐng)生成一張海報(bào)”時(shí), 訊飛星火認(rèn)知大模型告訴我們自己無(wú)法生成圖片,但是它還是給我們提供了一些信息和建議。
除了文字,訊飛星火具備在答案中融入emoji表情包能力,當(dāng)我們讓它用emoji表情包介紹大模型發(fā)布會(huì)時(shí),它給出了以下答案。
最后,訊飛火星究竟如何看待自己的能力?
我們拋出了劉慶峰對(duì)其已“超越ChatGPT”的夸贊,并讓它證明自己。它沒有承認(rèn),并已學(xué)會(huì)了“打太極”。