小13箩利洗澡无码视频免费网站-亚洲熟妇无码av另类vr影视-国产精品久久久久乳精品爆-宅女午夜福利免费视频

對(duì)話開(kāi)源中國(guó)董事長(zhǎng)馬越:AI大模型關(guān)鍵要有人用,追趕者不開(kāi)源很難坐上牌桌
時(shí)間:2023-08-11 22:04:03  來(lái)源:搜狐科技  
1
聽(tīng)新聞

開(kāi)源中國(guó)董事長(zhǎng)馬越


(相關(guān)資料圖)

出品 | 搜狐科技

作者 | 梁昌均

“谷歌在人工智能方面并沒(méi)有護(hù)城河,OpenAI也沒(méi)有?!边@是不久前谷歌內(nèi)部一份研究給出的判斷,理由則是開(kāi)源的AI模型正在與它們有力競(jìng)爭(zhēng)。

開(kāi)源的力量終于在激烈的百模大戰(zhàn)中涌現(xiàn),并越發(fā)不可忽視。Meta開(kāi)源的LLaMA 2引起轟動(dòng),智源、智譜、百川等先后開(kāi)源,阿里也在上周打響國(guó)內(nèi)大廠大模型開(kāi)源的第一槍。

在頭部AI開(kāi)源社區(qū)HuggingFace中,已有超過(guò)27萬(wàn)個(gè)開(kāi)源模型,其中對(duì)話和文本生成模型接近2萬(wàn)個(gè),不少都是今年新增的大模型。

在開(kāi)源中國(guó)董事長(zhǎng)馬越看來(lái),開(kāi)源本身是一種研發(fā)模式,也是一種競(jìng)爭(zhēng)策略,是否開(kāi)源跟產(chǎn)品研發(fā)能力有關(guān),也是一件特別市場(chǎng)化的事。因此Meta、阿里云等開(kāi)源模型,更多是市場(chǎng)競(jìng)爭(zhēng)策略的選擇。

不過(guò),馬越對(duì)搜狐科技強(qiáng)調(diào),絕對(duì)領(lǐng)先的技術(shù)不太可能會(huì)開(kāi)源,因?yàn)殚]源的商業(yè)變現(xiàn)反射弧相對(duì)更短、更直接。“OpenAI從GPT-3絕對(duì)領(lǐng)先后不再開(kāi)源,如果持續(xù)一騎絕塵大概率今后還是不會(huì)開(kāi)源?!?/p>

馬越認(rèn)為,國(guó)內(nèi)先天性投入較差,說(shuō)幾個(gè)月、半年追上OpenAI不太可能,反倒可能是半年之后它把我們拋得更遠(yuǎn)。但幸虧有開(kāi)源,為很多追趕者提供了超越的可能,且從中也一定會(huì)誕生類似ChatGPT的殺手級(jí)應(yīng)用。

在他看來(lái),AI大模型的關(guān)鍵是要有人用,沒(méi)需求、沒(méi)反饋,就無(wú)法迭代,不能閉門(mén)造車?!安灰獮榱四P投P?,不要去追逐富人的游戲,要從現(xiàn)在的用戶去倒推,從能夠創(chuàng)造的商業(yè)價(jià)值去倒逼技術(shù)選擇?!?/p>

同時(shí),馬越認(rèn)為,國(guó)內(nèi)巨頭在大模型上不可能齊頭并進(jìn),只會(huì)有一兩個(gè)領(lǐng)先,且會(huì)選擇掙錢更快的方式?!叭绻]源能讓大家以很低的成本用起來(lái),就沒(méi)必要去開(kāi)源?!?/p>

但開(kāi)源也存在風(fēng)險(xiǎn),如果是好的模型開(kāi)源,能夠推動(dòng)AI普惠,降低個(gè)人和組織去賦能千行百業(yè)的成本。如果技術(shù)和產(chǎn)品本身沒(méi)有競(jìng)爭(zhēng)力,開(kāi)源也不是靈丹妙藥,反倒會(huì)更快“見(jiàn)光死”。

“開(kāi)源本身也會(huì)形成競(jìng)爭(zhēng),如果用戶都不下載使用,那也沒(méi)意義。開(kāi)源模型好不好絕不是靠權(quán)威來(lái)背書(shū),而是要靠大眾點(diǎn)評(píng),關(guān)鍵是看可持續(xù)增長(zhǎng)的用戶量和使用量?!瘪R越表示。

在互聯(lián)網(wǎng)時(shí)代,開(kāi)源的力量不容小覷,相關(guān)的開(kāi)源軟件都是服務(wù)器和移動(dòng)端操作系統(tǒng)的市場(chǎng)主力。馬越就此給出論斷:未來(lái)AI大模型開(kāi)源的市場(chǎng)份額會(huì)更大,閉源只會(huì)為少量用戶服務(wù),但因它的商業(yè)反射弧快,變現(xiàn)效率高,會(huì)吃掉大部分利潤(rùn)。

面對(duì)當(dāng)前正酣的百模大戰(zhàn),馬越認(rèn)為這是熱度剛開(kāi)始時(shí)的正常競(jìng)爭(zhēng),就像當(dāng)年的“百團(tuán)大戰(zhàn)”。“但通用大模型最后會(huì)是贏者通吃,只有少量幾家能夠勝出。”

對(duì)垂直模型來(lái)說(shuō),則需要類似HuggingFace的分發(fā)平臺(tái)?!按竽P烷_(kāi)源是為愛(ài)發(fā)電,通過(guò)開(kāi)源相當(dāng)于節(jié)約了90%的成本,這是成本最低的方式?!?/p>

馬越還認(rèn)為,AI和開(kāi)源是相互成就的乘法關(guān)系,會(huì)讓對(duì)方加速發(fā)展?!安豢块_(kāi)源,大模型沒(méi)法傳播落地;沒(méi)有大模型,開(kāi)源也不能在互聯(lián)網(wǎng)時(shí)代的未來(lái)實(shí)現(xiàn)新高峰的增長(zhǎng)?!?/p>

談及這些年國(guó)內(nèi)開(kāi)源生態(tài)的發(fā)展,馬越則用“超出預(yù)期”來(lái)形容。十六年前,他回國(guó)成立了國(guó)內(nèi)第一家開(kāi)源技術(shù)服務(wù)公司,打造了國(guó)內(nèi)最早的開(kāi)源社區(qū),并帶領(lǐng)Gitee成為全球第二大代碼托管平臺(tái)。

馬越回憶到,2007年剛回國(guó)時(shí),沒(méi)多少人理解開(kāi)源的概念,但現(xiàn)在中國(guó)已是全球第二大開(kāi)源生態(tài)貢獻(xiàn)國(guó),有了開(kāi)源基金會(huì)和國(guó)際通用的開(kāi)源協(xié)議,開(kāi)源還被寫(xiě)入十四五規(guī)劃。他認(rèn)為,開(kāi)源能夠驅(qū)動(dòng)自主創(chuàng)新、提高創(chuàng)新速度。

開(kāi)源中國(guó)最近也完成一輪7.75億元的融資,20多家股東中有一半是國(guó)資,百度、華為、聯(lián)想也有投資。馬越表示,開(kāi)源中國(guó)重組為中立平臺(tái)后,新使命是打造中國(guó)版的HuggingFace,希望借此早點(diǎn)結(jié)束百模大戰(zhàn),讓千行百業(yè)都能用上大模型。

以下是對(duì)話實(shí)錄(經(jīng)編輯整理)

搜狐科技:AI涉及很多要素,AI開(kāi)源開(kāi)的到底是什么?這塊誰(shuí)做得比較領(lǐng)先?

馬越:當(dāng)前需要多關(guān)注HuggingFace,這是AI領(lǐng)域的GitHub。開(kāi)源除了代碼,還有模型、數(shù)據(jù)集等,每家企業(yè)可能不一樣。好的開(kāi)源模型能夠推動(dòng)AI普惠,極大降低個(gè)人和組織去賦能千行百業(yè)的成本。

搜狐科技:阿里、智譜、百川等先后開(kāi)源自己的模型,怎么看這些企業(yè)開(kāi)源的行為?

馬越:OpenAI遙遙領(lǐng)先,其它企業(yè)不開(kāi)源的話其實(shí)很難有建樹(shù),拿著模型也沒(méi)多大意義,還不如開(kāi)源。通過(guò)開(kāi)源免費(fèi)先把用戶獲取過(guò)來(lái)是個(gè)極好的做法,也十分重要,否則很難在百模大戰(zhàn)中上桌。如果靠開(kāi)源靠免費(fèi),還是吸引不來(lái)用戶,只能說(shuō)明產(chǎn)品競(jìng)爭(zhēng)力實(shí)在不行,被淘汰了也能更早地發(fā)現(xiàn)問(wèn)題,反過(guò)來(lái)也能印證開(kāi)源行為的價(jià)值。

企業(yè)開(kāi)源也會(huì)面臨商業(yè)回報(bào)的問(wèn)題,反射弧長(zhǎng),變現(xiàn)效率低,前期研發(fā)成本打水漂。但換個(gè)思路來(lái)看,開(kāi)源的目的是更好地獲得用戶,塑造口碑和品牌,獲得用戶反饋,也可以看作是市場(chǎng)營(yíng)銷的行為。

搜狐科技:阿里打響國(guó)內(nèi)大廠大模型開(kāi)源第一槍,未來(lái)會(huì)有更多大廠開(kāi)源嗎?

馬越:國(guó)內(nèi)這幾家巨頭不可能齊頭并進(jìn),以后只會(huì)有一兩個(gè)遙遙領(lǐng)先,且一定會(huì)選擇掙錢更快的方式。如果閉源就能讓大家以很低的成本就用起來(lái),何必開(kāi)源?但如果閉源沒(méi)有好的商業(yè)回報(bào),自身也沒(méi)那么強(qiáng),不開(kāi)源的話很難坐上牌桌。

大模型關(guān)鍵是要有人用,沒(méi)需求,沒(méi)反饋,就無(wú)法迭代,閉門(mén)造車有什么用?ChatGPT沒(méi)有開(kāi)源,但短短幾個(gè)月就有上億人用,它何必開(kāi)源呢?這是個(gè)市場(chǎng)博弈問(wèn)題,市場(chǎng)競(jìng)爭(zhēng)、用戶受益壓倒一切,不是為了開(kāi)源而開(kāi)源,它只是手段。

搜狐科技:OpenAI最初開(kāi)源,但在GPT-3之后不再開(kāi)源,又有消息稱在開(kāi)發(fā)開(kāi)源模型,怎么看這種搖擺?

馬越:開(kāi)源本身是一種研發(fā)模式,也是個(gè)競(jìng)爭(zhēng)策略,本質(zhì)上是個(gè)方法論。是否開(kāi)源跟產(chǎn)品研發(fā)的能力進(jìn)度有關(guān),也是一件特別市場(chǎng)化的事。GPT-3之后的版本非常厲害,不需要開(kāi)源,后面很多追趕者卻需要用開(kāi)源的方式去追趕。所以絕對(duì)領(lǐng)先的技術(shù)不太可能會(huì)開(kāi)源,因?yàn)殚]源的商業(yè)變現(xiàn)反射弧相對(duì)更短、更直接。

搜狐科技:開(kāi)源的大模型能追上Open AI嗎?從中會(huì)誕生出類似ChatGPT的殺手級(jí)應(yīng)用?

馬越:開(kāi)源模型一定會(huì)誕生類似ChatGPT這樣的應(yīng)用。垂直場(chǎng)景商機(jī)無(wú)限,就看誰(shuí)能應(yīng)用。不要為了模型而模型,不要去追逐富人的游戲,要從現(xiàn)在的用戶去倒推,從能夠創(chuàng)造的商業(yè)價(jià)值去倒逼技術(shù)選擇。

OpenAI做了好幾年,燒了很多錢,相比之下國(guó)內(nèi)先天性的投入較差,幾個(gè)月、半年追上不太可能,更大可能是半年之后它把我們拋得更遠(yuǎn)。我甚至覺(jué)得可能永遠(yuǎn)跟不上它的腳步,因?yàn)樗鼪](méi)有算力卡脖子等問(wèn)題,還在加速度成長(zhǎng)。但幸虧有開(kāi)源,提供了競(jìng)爭(zhēng)的可能。

搜狐科技:楊立昆認(rèn)為,Meta開(kāi)源LLaMA2會(huì)改變大模型行業(yè)的競(jìng)爭(zhēng)格局,您怎么看?

馬越:看看歷史就很清楚。開(kāi)源的安卓能占有移動(dòng)操作系統(tǒng)80%的市場(chǎng)份額,但利潤(rùn)可能只有百分之二三十,大頭讓份額只有20%左右的iOS拿走。開(kāi)源也差不多,它在策略上是讓閉源無(wú)法通吃,未來(lái)大多數(shù)人和企業(yè)會(huì)使用開(kāi)源模型,市場(chǎng)份額會(huì)更大。閉源只為少量用戶服務(wù),但反射弧快,變現(xiàn)效率高,會(huì)吃掉大部分利潤(rùn)。

搜狐科技:國(guó)內(nèi)已進(jìn)入百模大戰(zhàn),您怎么看這股熱潮?這些大模型都能活下去嗎?

馬越:很多人起哄、追熱點(diǎn),反正人口多、場(chǎng)景多、不缺錢,這是無(wú)序盲目的競(jìng)爭(zhēng),很多投資人哪怕知道只會(huì)贏一兩家,也不敢錯(cuò)過(guò),有些創(chuàng)業(yè)者可能也抱著投機(jī)心態(tài)。它會(huì)持續(xù)一段時(shí)間,如同當(dāng)年的“百團(tuán)大戰(zhàn)”。

但通用模型是大廠的游戲,最后只有少數(shù)幾家巨頭能勝出,其它家可能都會(huì)消失,我不太相信會(huì)有多少純創(chuàng)業(yè)公司能做出殺手級(jí)的通用模型。垂直模型則需要類似HuggingFace的分發(fā)平臺(tái),市場(chǎng)化自由競(jìng)爭(zhēng)。

目前看,大模型開(kāi)源就是為愛(ài)發(fā)電,通過(guò)在已經(jīng)用數(shù)據(jù)集訓(xùn)練過(guò)的開(kāi)源模型上推理和調(diào)優(yōu)比從頭訓(xùn)練一個(gè)模型可以節(jié)約90%的成本,這是使用門(mén)檻最低的方式。

搜狐科技:開(kāi)源對(duì)AI的落地應(yīng)用會(huì)有什么樣的作用?怎么看兩者之間的關(guān)系?

馬越:開(kāi)源第一波浪潮是從互聯(lián)網(wǎng)開(kāi)始,開(kāi)源的操作系統(tǒng)、數(shù)據(jù)庫(kù)等基礎(chǔ)設(shè)施給了互聯(lián)網(wǎng)公司野蠻生長(zhǎng)的機(jī)會(huì),互聯(lián)網(wǎng)使得獲取開(kāi)源項(xiàng)目更加容易,它們是相輔相成的乘法關(guān)系。

AI類似互聯(lián)網(wǎng),跟開(kāi)源也是相互成就的乘法關(guān)系,會(huì)讓對(duì)方加速發(fā)展。不靠開(kāi)源,大模型沒(méi)法很好地傳播落地;沒(méi)有大模型,開(kāi)源也不能在互聯(lián)網(wǎng)時(shí)代的未來(lái)實(shí)現(xiàn)新高峰的增長(zhǎng)。

搜狐科技:過(guò)去國(guó)內(nèi)比較依賴國(guó)外開(kāi)源軟件,現(xiàn)在強(qiáng)調(diào)自主創(chuàng)新,開(kāi)源如何推動(dòng)創(chuàng)新?

馬越:開(kāi)源可以讓我們站在巨人的肩膀上,是驅(qū)動(dòng)生產(chǎn)力發(fā)展的一個(gè)不可避免的方式,也能驅(qū)動(dòng)自主創(chuàng)新,提高創(chuàng)新的速度?,F(xiàn)在有人指出我們應(yīng)該在什么地方上投入,我覺(jué)得那就利用好開(kāi)源的方法論。但現(xiàn)在想要薅羊毛的太多了,最大問(wèn)題是不敬畏專業(yè),開(kāi)源是個(gè)專業(yè)的事,代碼托管平臺(tái)技術(shù)含量很高,不是誰(shuí)都能干,也不是一蹴而就。

搜狐科技:開(kāi)源越來(lái)越受重視,開(kāi)源中國(guó)希望起到什么樣的作用或達(dá)成什么目標(biāo)?

馬越:新使命是要把軟件產(chǎn)品研發(fā)平臺(tái)升級(jí)為AI工程平臺(tái),幫助軟件工程師升級(jí)為AI工程師,打造中國(guó)版的HuggingFace。我們是中立第三方,以開(kāi)發(fā)者利益出發(fā),做這件事比大廠合適。我們希望借此讓百模大戰(zhàn)早點(diǎn)結(jié)束,讓每家企業(yè)、每個(gè)人都能用上大模型,未來(lái)將是千模甚至是萬(wàn)模大戰(zhàn)。我們目前引進(jìn)的7000多個(gè)模型會(huì)在今年底隨著新平臺(tái)上線,但要先解決算力問(wèn)題。

搜狐科技:開(kāi)源中國(guó)如何商業(yè)化?在獲得融資后,接下來(lái)的重點(diǎn)規(guī)劃是什么?

搜狐科技:開(kāi)源中國(guó)現(xiàn)在是徹底商業(yè)化的軟件工具廠商,已經(jīng)實(shí)現(xiàn)盈虧平衡。接下來(lái)會(huì)加大信創(chuàng)產(chǎn)品線的開(kāi)發(fā),并擁抱人工智能。未來(lái)我們希望作為一家高科技公司在科創(chuàng)板上市,成為國(guó)內(nèi)軟件工程和AI工程的第一股。

關(guān)鍵詞: