夢想很美好。
(資料圖)
編者按:本文來自微信公眾號全天候科技(ID:iawtmt),作者:于惠如,編輯:羅麗娟 ,創(chuàng)業(yè)邦經(jīng)授權發(fā)布。
“認知大模型成為通用人工智能的曙光,科大訊飛有信心實現(xiàn)‘智能涌現(xiàn)’。”
5月6日,科大訊飛星火認知大模型揭開神秘面紗。發(fā)布會上,科大訊飛董事長劉慶峰、科大訊飛研究院院長劉聰在現(xiàn)場實測了訊飛星火在七大維度上的核心能力,包括多風格多任務長文本生成、語言理解、泛領域開放式知識問答、情境式思維鏈邏輯推理、多題型可解析數(shù)學、多功能多語言代碼,以及多模態(tài)輸入和表達等。
訊飛星火認知大模型發(fā)布的同時,科大訊飛也發(fā)布了基于該大模型的教育、辦公、汽車和數(shù)字員工等多個領域相關產(chǎn)品。
星火認知大模型始于2022年12月。彼時,科大訊飛啟動“1+N”大模型技術攻關,其中,“1”代表通用認知智能大模型算法研發(fā)及高效訓練方案底座平臺,“N”代表大模型在教育、辦公、汽車、人機交互等各個領域的落地。
“當前,在文本生成、知識問答、數(shù)學能力三大能力上,訊飛星火認知大模型已超ChatGPT?!眲c峰在發(fā)布會上表示。
與此同時,劉慶峰還給出了訊飛星火的迭代時間表及每階段目標:第一階段,在6月9日,突破開放性問答,如實時問答;多輪對話能力再次升級;數(shù)學能力再上臺階。第二階段,在8月15日,突破代碼能力;多模態(tài)交互能力正式開放給客戶。 第三階段:10月24日,在通用大模型領域對標ChatGPT,其中中文能力超越后者,英文能力與后者相當。
此外,據(jù)劉慶峰透露,科大訊飛還將在今年推出醫(yī)療行業(yè)大模型。
發(fā)布會現(xiàn)場,劉慶峰用“最強”、“已超ChatGPT”、“遙遙領先”等詞形容訊飛星火認知大模型的部分能力,但他同時也承認訊飛星火仍然存在一些問題。比如:對新知識難以及時更新;事實類問答容易出現(xiàn)“張冠李戴”;史實、傳統(tǒng)典籍等容易“編造情節(jié)”等。
目前,星火認知大模型已對外開放測試。
01 現(xiàn)場實測七大核心能力與百度文心一言、阿里通議千問不同,訊飛星火沒有在發(fā)布會上使用提前錄好的demo版本,而是在現(xiàn)場實測了其七大核心能力。
從現(xiàn)場演示效果來看,星火認知大模型基本能夠流暢完成交付的各項任務。另外,訊飛星火體現(xiàn)了科大訊飛的一貫強項——語音能力,它可以通過語音轉文字進行問答,這也是其優(yōu)勢所在。
演示中,劉聰讓星火認知大模型寫郵件、做方案、寫新聞通稿、生成英文宣傳文案等文本生成功能,訊飛星火均流暢地完成了任務。
現(xiàn)場演示的訊飛星火的語言理解能力也在線,它理解了特定的句子和場景含義,隨著問題的變化,也調整了自己的答案
在數(shù)學能力中,除了常規(guī)計算、幾何、情景應用等,訊飛星火解答了復雜的計算題答案。在劉慶峰看來,數(shù)理能力一定程度代表了一個大模型的聰明程度?!坝嶏w星火大模型不僅在國內系統(tǒng)中遙遙領先,也超過了ChatGPT?!?/p>
此外,劉聰還展示了大模型面向泛領域開放式知識問答能力、邏輯推理能力與代碼能力。在多模態(tài)能力方面,星火大模型能夠根據(jù)關鍵詞句生成語音、圖片、視頻等素材,并可生成虛擬人進行視頻展示。
不過,據(jù)官方介紹,訊飛星火的多模態(tài)能力目前還在測試中,最遲8月會提供給VIP客戶使用。
02 打通“大模型+產(chǎn)品”閉環(huán)生態(tài)訊飛星火認知大模型發(fā)布的當天,科大訊飛還同時發(fā)布了基于該大模型的教育、辦公、汽車和數(shù)字員工等多個領域相關產(chǎn)品。
以汽車為例,訊飛火星認知大模型與智慧座艙的結合,可以實現(xiàn)車內跨業(yè)務、跨場景人車自由交流?;诖竽P偷闹悄茏搶⒏杂?、擬人化、更懂汽車、更開放。
在學習機中,新增talktalk功能,實現(xiàn)中英文對話,存量學習機可更新迭代。辦公本和錄音筆中,新增語篇規(guī)整、要點總結、一鍵成稿,存量產(chǎn)品也可更新使用。
基于自然語言生成業(yè)務流程和RPA,在“大模型+數(shù)字員工”應用場景,可以幫助企業(yè)員工完成大量重復性工作。
現(xiàn)場以公司招聘事項為例,輸入指令后,系統(tǒng)即可自動按照事先設計的RPA腳本,操作計算機中的相應軟件,實現(xiàn)業(yè)務流程的自動化操作并輸出結果,并進行數(shù)據(jù)分析。
劉慶峰透露,上述領域外,訊飛星火認知大模型還將賦能包括醫(yī)療、城市、政法、工業(yè)等在內的更多行業(yè),滿足更多專業(yè)領域的需求,向更廣闊的產(chǎn)業(yè)領域延伸。
據(jù)了解,首批來自36個行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型。
03 測試體驗星火大模型“成色”究竟如何?全天候科技親測了多個場景下的問題,不妨一起來看一看它回答的如何。
我們先讓星火大模型介紹了自己和競品。
很明顯,簡單介紹沒有問題,但當主語更復雜,需要理解時,它的理解能力“不在線”。
我們又讓訊飛星火展現(xiàn)了文字創(chuàng)作能力——根據(jù)要求寫一首詩。
這首詩基本涵蓋了端午節(jié)的要素:糯米、龍舟、艾草,還拓展了龍舟、艾草等元素的使用場景,也表達了對生活的美好祝愿。但整體而言,與其說是一首詩,它更像是一首缺少押韻、對仗、與美感的順口溜。
隨后,全天候科技針對一些時下正流行的網(wǎng)絡“熱?!边M行提問,看其是否有緊跟熱點的能力。
然而,對于“特種兵”式旅游這個網(wǎng)絡熱梗,訊飛星火知道一點,但知道的不多。不過,它的“態(tài)度”很好,當我們提出錯誤,它能認識到自己的錯誤,并且道歉。
在測試過程中,全天候科技發(fā)現(xiàn),訊飛星火的部分語料庫并未更新至最新事件,對一些實事仍然給出錯誤答案。比如,當我們問“北京冬奧會自由式滑雪女子U型場地冠軍是誰”時,它給出的答案是:法國選手特蘭斯·勒貝克 (TraceLeBerque)。不過,當我們給出正確答案后,它又立馬承認自己的錯誤并道歉。
在數(shù)學推理能力方面,我們請訊飛星火做了幾道數(shù)學題。對于第一個題,訊飛星火不僅給出了正確答案,還做了延伸。而對于第二個題,它給出了詳細的解題步驟及正確答案??梢钥闯?,它的簡單數(shù)學推理能力過關。
在多模態(tài)生成方面,訊飛星火的表現(xiàn)也不夠完美。
此前已經(jīng)推出的百度文心一言、阿里通義千問等大模型均具備圖片生成的能力。當我們輸入“科大訊飛要開大模型發(fā)布會,請生成一張海報”時, 訊飛星火認知大模型告訴我們自己無法生成圖片,但是它還是給我們提供了一些信息和建議。
除了文字,訊飛星火具備在答案中融入emoji表情包能力,當我們讓它用emoji表情包介紹大模型發(fā)布會時,它給出了以下答案。
最后,訊飛火星究竟如何看待自己的能力?
我們拋出了劉慶峰對其已“超越ChatGPT”的夸贊,并讓它證明自己。它沒有承認,并已學會了“打太極”。