?撰文 | 龍 曦
題圖 | 騰訊音樂
在這個AIGC技術群“模”亂舞的時代,有人提出,所有的互聯(lián)網(wǎng)業(yè)務,都可以再基于新技術重做一遍。
(資料圖片)
話雖如此,但新技術真正能落地的要素,卻相當難以具備。如果說傳統(tǒng)意義上的“算法、算力和數(shù)據(jù)”是AI的基本要素,那么“高質(zhì)量數(shù)據(jù)+高層次人才+高頻場景”的“三高要素”,才是技術能落地并推動行業(yè)解放生產(chǎn)力的關鍵。
從這個角度去看,騰訊音樂娛樂集團(下稱“騰訊音樂”)正在構建和完善自己的“三高要素”。事實上,這家領先的中國在線音樂與音頻娛樂平臺已經(jīng)廣泛的在業(yè)務中使用AI技術,這次財報披露的信息也顯示,在較短時間內(nèi),騰訊音樂已基于數(shù)據(jù)和場景方面的優(yōu)勢,在AIGC(人工智能原創(chuàng)內(nèi)容)的產(chǎn)業(yè)化應用方面探索出了一條有差異化競爭力的新路。
一、音樂擁抱新技術:騰訊音樂的產(chǎn)業(yè)AIGC落地探索
ChatGPT引發(fā)的全球群“?!眮y舞,使得AIGC備受關注。
事實上,除了強大的文本能力之外,圖像、音樂乃至一切可以用數(shù)字形式承載的“內(nèi)容”,都可以用AIGC技術進行生成,所以在當下,該技術的應用也成為一個備受關注的方向。
由于世界上已經(jīng)有很多開源數(shù)據(jù)集作為基礎,所以,僅僅就做出AIGC探索這件事本身而言,只要具有足夠的資金和人才資源,想要達到一定的參數(shù)量,并不是多么困難。這也是很多新創(chuàng)團隊在很短的時間內(nèi)就宣布自己推出AIGC功能或產(chǎn)品的深層原因。
但用錢解決不了的問題是,如果不能具備實際的落地場景和商業(yè)價值,技術本身并不能產(chǎn)生價值,只能成為成本。
所以,要判斷技術應用能否落地,先要看看這一領域內(nèi)是否已經(jīng)有足夠的AI實踐。
從這個角度看過去,騰訊音樂在AIGC方面,已經(jīng)有了諸多方面的領先嘗試。例如其最新一季財報中,就提到了其正在持續(xù)落地的多元應用,推出的一站式音樂服務平臺“騰訊音樂啟明星”與“音色制作人”不僅協(xié)助音樂人在作詞、作曲、音樂內(nèi)容分析與剪輯等制作環(huán)節(jié)的效率提升,還可將用戶原聲與不同歌曲無縫融合,促進高質(zhì)量內(nèi)容的創(chuàng)作。甚至其財報視頻中的音樂,也由騰訊音樂領先的AIGC音頻技術協(xié)助創(chuàng)作完成。
有實踐就更容易用好相關技術,如果一個企業(yè)以前一點使用AI的積累都沒有,憑空宣布自己要深度切入前沿領域,大概率是為了講故事和畫餅充饑。
而騰訊音樂,在有諸多AI實踐經(jīng)驗和場景、數(shù)據(jù)積累方面,都有充分的準備,這意味它的技術創(chuàng)新探索之路,已然會平坦許多。
二、騰訊音樂投入AIGC領域:基于行業(yè)需求的生產(chǎn)力布局
目前AIGC的通用玩法有兩種,第一是自建能力,另一個是利用已有的通用能力,做產(chǎn)業(yè)向的應用升級。
但是,無論如何,都有三個痛點不能忽視。
首先,需要有清晰的應用落點,而且要和技術的能力匹配。
騰訊音樂的業(yè)務焦點就是音樂等內(nèi)容和音效、直播等音視頻技術,再加上其在用戶側的應用、互動、參與,這是突出且明確的剛需。所以從這個角度說,需求足夠明確,就有清晰的應用落點。
其次,是有足夠規(guī)模的預訓練數(shù)據(jù)集。
即使有了深度學習技術的加持,但經(jīng)過人工精標的大規(guī)模訓練數(shù)據(jù)集,仍然是AIGC技術產(chǎn)業(yè)化應用的關鍵。
而騰訊音樂的其中一個核心優(yōu)勢在于,其本身就具有大量的數(shù)字化內(nèi)容。
例如,隨著多元化音效成為用戶音樂消費的“剛需”。第一季度,騰訊音樂將高品質(zhì)音質(zhì)進一步覆蓋至車載場景,其旗下QQ音樂的銀河音效可實現(xiàn)車載音響的最佳效果??峁芬魳返尿裆咭粜б苍跐M足方便使用、好聽好玩的基礎功能之上,持續(xù)深耕,讓音效服務在聽感提升的同時,不斷更新各類玩法,以開放平臺打造UGC音效社區(qū),成為國內(nèi)首屈一指的音效品牌。
這里的重點是“UGC”。我們可以理解為,12萬條以上的音效中有相當部分,是用戶參與構建或打磨的,而這種“打磨”某種程度上就可以視為一種“數(shù)據(jù)標注”,這都是騰訊音樂可以復用的優(yōu)質(zhì)數(shù)據(jù)資源。
而隨著“騰訊音樂啟明星”不斷推出更多智能化輔助創(chuàng)作工具,使得大批音樂人加入、使用,驅(qū)使這部分數(shù)據(jù)的質(zhì)量也在不斷提升,使得騰訊音樂的AIGC技術創(chuàng)新有了充足的數(shù)據(jù)燃料。
最后,技術的產(chǎn)業(yè)化落地還需要企業(yè)有足夠的垂直領域的數(shù)字化能力,很多傳統(tǒng)產(chǎn)業(yè)要邁過這一關并不容易。但這對于數(shù)字原生的騰訊音樂來說是一個天然利好,其不需要從底座就開始做,而是可以在已有深度積累的技術研發(fā)基礎上做私有化部署,并且結合垂直領域的數(shù)據(jù)和知識進行“微調(diào)”。這其中的道理,就像用電一樣,雖然家家都需要,但不需要家家都有發(fā)電廠。
因為,騰訊音樂的AI落地場景很多,對AIGC工具有切實的需求,所以很快就能用起來并產(chǎn)生商業(yè)和社會價值。對于騰訊音樂而言,AIGC不是噱頭、不是妝點,而是實實在在的生產(chǎn)力。
三、產(chǎn)業(yè)未來應用落地:技術即內(nèi)容生產(chǎn)力
據(jù)了解,在ChatGPT出來之前,騰訊音樂就已經(jīng)在AI領域投入了大量研發(fā)精力。從結果上看,確實落地也很快,這些嘗試也讓騰訊音樂頗具行業(yè)前瞻性地在AIGC技術的產(chǎn)業(yè)化落地方面積累了豐富的經(jīng)驗。
那么,AIGC在騰訊音樂體系內(nèi)的應用,結合其現(xiàn)有業(yè)務來看會如何落地和輸出價值呢?
在內(nèi)容創(chuàng)作方向,在前文提到的“騰訊音樂啟明星”平臺,除了集合了QQ音樂銀河音效、MUSE引擎、TME天琴實驗室等各方面的技術外,騰訊AI Lab作為廣泛的騰訊生態(tài)中最重要的AI團隊,也為其提供了音樂分離聯(lián)合開發(fā)的音頻技術支持。
而旗下酷狗的“音色制作人”,其技術本質(zhì),是通過深度學習原理,可以通過學習人的聲音,經(jīng)過AI智能化處理后生成專屬的音色音效,并以此來制作歌曲。
這些工具都極大的降低了音樂創(chuàng)作的門檻,其中,“騰訊音樂啟明星”新推出了可分離提取歌曲中的人聲和樂器的“音樂分離”、基于音樂內(nèi)容理解識別各式歌曲要素的“MIR計算”等功能;以及音色制作人中的全新上線AI封面、AI寫真、AI幫唱、AI詞曲評估以及AI覓詞等五大功能,都實現(xiàn)了以科技來改變過去音樂制作存在的“不可能三角”——質(zhì)量、速度、成本,令其能夠同時實現(xiàn)。
它們的價值體現(xiàn)在,對C端來說,從單純的音樂欣賞(單向傳播)變成了UGC、PUGC參與的可共創(chuàng)、可交互的系統(tǒng),使得各種體驗和玩法得到極大的提升;從B端來說,由于用戶的廣泛參與,和未來生成能力的增強,將從根本上改變音樂行業(yè)的成本機構,而成本結構的改變是一切深層次產(chǎn)業(yè)變革的基礎。
“目前,中國已躍升成為全球第五大音樂市場。這意味著產(chǎn)業(yè)從業(yè)者們通過長期耕耘,正在持續(xù)推動著中華文化影響力的持續(xù)提升。而技術的進步,則能為音樂產(chǎn)業(yè)在數(shù)字化時代的發(fā)展提供更加夯實的基礎和更高的生產(chǎn)效率。”對于AIGC等前沿技術在音樂產(chǎn)業(yè)內(nèi)的應用和發(fā)展趨勢,騰訊音樂娛樂集團QQ音樂技術副總裁、天琴實驗室負責人周文江表示,基于對行業(yè)發(fā)展痛點和用戶體驗需求的深度洞察,TME在前幾年已率先組建天琴實驗室等業(yè)內(nèi)頂尖的技術研究團隊,各團隊技術人才結構和部分研究成果已達到行業(yè)領先水平,目前也正在持續(xù)推動文本、圖像、音視頻等多個維度的AIGC創(chuàng)新成果落地,“在為行業(yè)提供更全面的數(shù)據(jù)支撐的同時,也希望能為音樂產(chǎn)業(yè)的數(shù)字化升級和高質(zhì)量發(fā)展注入新的活力?!?/p>
當音樂遇上AIGC,用技術為文化創(chuàng)造更多價值的未來已經(jīng)近在眼前。騰訊音樂把技術轉(zhuǎn)化為實實在在的生產(chǎn)力,能夠為行業(yè)提供更多服務、為用戶提供革命性體驗,最終雙向奔赴,進而為行業(yè)創(chuàng)造更多增量,推動自身和行業(yè)的高質(zhì)量增長,也為我們的精神生活增添更多的樂趣。