一切都是基于經(jīng)濟(jì)上的考慮
編者按:本文來自微信公眾號 星船知造(ID:xingchuanzhizao),作者:清波,編輯:唐曉園,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載
(資料圖)
人形機(jī)器人產(chǎn)業(yè)存在一個反直覺現(xiàn)象:
目前人形機(jī)器人本體玩家中,竟然既不包括遠(yuǎn)近聞名的工業(yè)機(jī)器人四大家族(發(fā)那科、ABB、安川、庫卡),也少見國內(nèi)排名靠前的幾大機(jī)器人巨頭(埃斯頓、埃夫特、廣數(shù)、新松、匯川、新時達(dá)、錢江)的身影。
當(dāng)下人形機(jī)器人本體處于領(lǐng)跑位置的玩家,是汽車行業(yè)大佬,如特斯拉、本田、豐田。或是科技企業(yè),如小米、谷歌、亞馬遜。
庫卡等傳統(tǒng)工業(yè)機(jī)器人巨頭反而鮮有入局。
但另一方面,當(dāng)人形機(jī)器人概念股迎來井噴時,率先引爆的卻還是工業(yè)機(jī)器人老三樣——控制器、伺服電機(jī)、精密減速機(jī)。比如生產(chǎn)線性關(guān)節(jié)的拓普集團(tuán);旋轉(zhuǎn)關(guān)節(jié)的三花智控;空心杯電機(jī)的鳴志電器;滑動絲杠、行星滾柱絲杠、空心杯電機(jī)的江蘇雷利;伺服電機(jī)的匯川科技;諧波減速機(jī)的綠的諧波等等,均在人形機(jī)器人概念的助力下,有不俗表現(xiàn)。
要解答這個反直覺現(xiàn)象,星船知造還得從人形機(jī)器人既傳統(tǒng)硬核(工業(yè)機(jī)器人老三樣)、又酷炫前沿(人工智能)的產(chǎn)業(yè)鏈角度進(jìn)行分析——
1, 為什么說人形機(jī)器人是屬于明天的產(chǎn)業(yè),如何理解其巨大潛力?
2, 人形機(jī)器人iPhone時刻還遠(yuǎn)未到來,是卡在了哪些領(lǐng)域?
3, 人形機(jī)器人產(chǎn)業(yè)鏈各環(huán)節(jié)當(dāng)下情況
4, GPT技術(shù)在人形機(jī)器人中的場景應(yīng)用和人形機(jī)器人終極猜想
01 人形機(jī)器人和具身智能阿西莫夫的《鋼穴》里有這樣一段對話,大意是:
如果你要管理一座農(nóng)場,你有兩個選擇。一是在拖拉機(jī)、收割機(jī)、翻土機(jī)、汽車、擠奶器這些機(jī)械上都裝上一部“電子腦”,讓它們成為智能機(jī)械。二是讓收割機(jī)、翻土機(jī)、汽車、擠奶器都維持原樣,但使用一個擁有“電子腦”的機(jī)器人去操作它們。聰明人會怎么選?
我們認(rèn)為上述這段文字形象的表明了人形機(jī)器人的意義和優(yōu)勢:
與其把所有工具全部重新設(shè)計,不如生產(chǎn)出能模仿人類外形和行為方式的機(jī)器人。TA完美接入人類現(xiàn)有生活、進(jìn)入所有人類已經(jīng)存在的場景、使用所有人類正在使用的工具。
一句話,我們一切的生活和生產(chǎn)都不需要為了這種機(jī)器人做任何多余、額外的改變。
source:giphy
作為一門集機(jī)、電、材料、計算機(jī)、傳感器、控制技術(shù)等多門學(xué)科于一體的產(chǎn)業(yè),人形機(jī)器人是國家高科技實力和發(fā)展水平的重要標(biāo)志。全球發(fā)達(dá)國家都不惜投入巨資進(jìn)行開發(fā)研究。
日、美、韓、英等國都在研制仿人形機(jī)器人方面進(jìn)行了大量投入?
今年5月的特斯拉股東大會上,馬斯克通過視頻向全世界的投資者展示了Tesla人形機(jī)器人的最新進(jìn)展:
Optimus(擎天柱)已經(jīng)可以完成分類物品的復(fù)雜任務(wù),如撿起物品、環(huán)境發(fā)現(xiàn)和記憶等。較之去年9月底的亮相,其運動控制能力持續(xù)進(jìn)化,AI能力提升。馬斯克認(rèn)為特斯拉的未來長期價值可能都是Optimus給予的。
馬斯克總財富已超越法國奢侈品巨頭LVMH總裁,重新奪回世界首富頭銜
日本本田公司最新開發(fā)的新型機(jī)器人ASIMO(阿西莫),身高120厘米,體重43公斤,它的走路方式更加接近于人。
source:本田
韓國KAIST 代表產(chǎn)品 HUBO+身高 1.7m,體重 80kg,具有 32 個自由度。
source:KAIST
美國波士頓動力研發(fā)的代表產(chǎn)品 Atlas 身高 1.8m,體重 80kg,具有 28 個關(guān)節(jié),可完成原地起跳轉(zhuǎn)身一周等高難度動作。
硬件結(jié)構(gòu)上,Atlas 擁有輕量級結(jié)構(gòu)件皮膚和足部力控傳感器,雷達(dá)與深度相機(jī)形成視覺感知,28 個液壓關(guān)節(jié)驅(qū)動完成一系列敏捷動作,本體搭載 3 臺 NUC/工控機(jī)負(fù)責(zé)整體控制系統(tǒng)的運算。
軟件方面,波士頓動力運用行為庫、實時感知和模型預(yù)測控制(MPC)技術(shù)將相機(jī)、雷達(dá)等傳感器接收的數(shù)據(jù)進(jìn)行分析并對決策制定和動作規(guī)劃提供支持。
source:波士頓動力 不得不說,波士頓動力的就是酷
我國人形機(jī)器人在科研領(lǐng)域,有國科大研發(fā)的“先行者”機(jī)器人,可完成靜態(tài)和動態(tài)步行動作;哈工大推出的“HIT-III”機(jī)器人能完成上、下斜坡等動作;清華大學(xué)開發(fā)的“THBIP-II”具有 24 個自由度等。
在產(chǎn)業(yè)領(lǐng)域,深圳優(yōu)必選推出的“Walker”機(jī)器人能完成上、下臺階等動作;小米于 2022 年 8 月公布的人形機(jī)器人 Cyber One(鐵大),升級后的運動控制算法支配這機(jī)器人全身 13 個關(guān)節(jié)和 21 個自由度,實現(xiàn)雙足運動姿態(tài)平衡;電機(jī)性能增強(qiáng)10 倍,髖關(guān)節(jié)主要電機(jī)的動力扭矩峰值可達(dá) 300Nm,峰值扭矩密度 96Nm/kg;之江實驗室展示的人形機(jī)器人能借助高精度視覺感知系統(tǒng),定位琴鍵進(jìn)行高精度手指運動。
深圳優(yōu)必選“Walker”機(jī)器人
點擊圖片可放大
馬斯克對于機(jī)器人市場的判斷并非“空穴來風(fēng)”。IFR數(shù)據(jù),2022年全球機(jī)器人市場規(guī)模已經(jīng)達(dá)到了513億元的高點,2017-2022 年CAGR 達(dá) 14%。
其中工業(yè)機(jī)器人市場規(guī)模195億美元,服務(wù)機(jī)器人市場規(guī)模達(dá)217億美元,特種機(jī)器人市場規(guī)模超100億美元。到2024年,全球機(jī)器人市場規(guī)模有望超650億美元。
另據(jù)Markets and markets預(yù)測,全球人形機(jī)器人市場規(guī)模(僅考慮單機(jī))將從2022年15億美元提升至2027年的173億美元(約合人民幣1038億元),千億市場的容量指日可待。
從零售端的價格來看,此前美國波士頓動力推出的四足機(jī)器人Spot Mini定價約為74500美元,上線一年賣出了大約400臺,人形機(jī)器人Atlas并未上市。面對高昂的價格,馬斯克曾公開表示,他的人形機(jī)器人將以低于2萬美元的價格銷售,并實現(xiàn)大規(guī)模生產(chǎn)。
做一個最為簡單的推算:即使未來Optimus的銷量只有馬斯克所說100億臺的1/100,那么其市場規(guī)模就有2萬*1億=2萬億(美元),這是何其壯觀的數(shù)字。
source:特斯拉
目前人形機(jī)器人的iPhone時刻還遠(yuǎn)未到來。
從廣義范疇來看,人形機(jī)器人在本質(zhì)上并沒有脫離機(jī)器的束縛,即便擁有了人體的形狀,但仍然是機(jī)器人的一種。只不過,在裝備了感知系統(tǒng)、驅(qū)動系統(tǒng)、末端執(zhí)行系統(tǒng)、能源供應(yīng)系統(tǒng),運算系統(tǒng)及軟件這五大系統(tǒng)之后,在人工智能度上,人形機(jī)器人較之我們更為熟悉的工業(yè)機(jī)器人有了長足的進(jìn)步。
傳統(tǒng)工業(yè)機(jī)器人更像一臺機(jī)器而并非“人”。由于其所運行的軌跡都是被事先編程好,只可以在固定區(qū)域,特定場所,做規(guī)定而重復(fù)的動作,不具備獨立處置突發(fā)(非程序內(nèi))問題的能力,只能被歸類為非智能機(jī)器人。
需要與環(huán)境(包括人)發(fā)生交互,做出反應(yīng),就要求人形機(jī)器人擁有相當(dāng)程度的人工智能。用更為規(guī)范的學(xué)術(shù)語言描述,這樣一種人工智能就叫做具身智能。
具身智能(Embodied Intelligence),指的是智能體通過與環(huán)境產(chǎn)生交互后,通過自身的學(xué)習(xí),產(chǎn)生對于客觀世界的理解和改造能力。
能夠產(chǎn)生具身智能的假設(shè)前提是:智能行為可以被具有對應(yīng)形態(tài)的智能體,通過適應(yīng)環(huán)境的方式學(xué)習(xí)到。有鑒于此,地球上所有的生物,都可以說是具身智能。
黃仁勛在2023年ITF世界大會上說:“人工智能和加速計算正在共同改變技術(shù)行業(yè)。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理并與物理世界互動的智能系統(tǒng),即具身智能?!?/p>
具身智能是能夠提升當(dāng)前“弱人工智能”認(rèn)知能力的重要方式。亦是產(chǎn)生超級人工智能的一條可能路徑。
具身智能可以理解為人工智能發(fā)展的高階形態(tài),也有可能成為AI的終極形態(tài)。說得更加透徹一點,人形機(jī)器人的未來,就是賦能了具身智能的真正智能機(jī)器人。
如此智能的人形機(jī)器人會是如何接受指令,完成任務(wù)的呢?
首先,機(jī)器人的感知系統(tǒng)把機(jī)器人的各種“內(nèi)部狀態(tài)信息”和“環(huán)境信息”從“信號”轉(zhuǎn)變?yōu)闄C(jī)器人自身或者機(jī)器人之間能夠理解和應(yīng)用的“數(shù)據(jù)”和“信息”。也即是說,讓機(jī)器人理解周圍的環(huán)境。
科學(xué)家(廠家)在機(jī)器人身上安裝各類傳感器,包括光、聲音、溫度、距離、壓力、定位、接觸等等,讓機(jī)器人能通過“五官”來接近人類,收集感知外界的信息。
各類傳感器應(yīng)用技術(shù)的突飛猛進(jìn),保證了人形機(jī)器人得以發(fā)展。
傳感器精度和可靠性的不斷提高是當(dāng)前亟待解決的難題之一。舉例來說,在進(jìn)水,進(jìn)到粉塵或者顛簸之后,相機(jī)的校準(zhǔn)就容易失效,長期使用之后像素點就容易壞死等硬件問題都會直接導(dǎo)致機(jī)器識別率在準(zhǔn)確性上的丟失。
其次,機(jī)器人的驅(qū)動系統(tǒng)和末端執(zhí)行系統(tǒng)需要協(xié)同工作,各司其職,就如同人類依靠身體各部位上的78個關(guān)節(jié)來行動。
用在機(jī)器人上的每一個關(guān)節(jié)的技術(shù)門檻和成本都很高,不僅要求體積小、精度高、重量輕,還同時要求抗摔耐撞。當(dāng)機(jī)器人快速運動時,驅(qū)動力輸出功率很高,要保證不會因為發(fā)熱問題而燒壞,同時具備緩沖能力,保護(hù)“機(jī)器人關(guān)節(jié)”不怕撞擊。
末端執(zhí)行系統(tǒng)中的“手”,是技術(shù)難度非常高的部分。在實際抓、舉、拿、捏等動作的操作過程中,機(jī)器人手指柔軟度與抓握力度的協(xié)同性非常重要:抓輕了東西容易掉,抓得重了則直接破碎。
舉例來說,特斯拉發(fā)布的Optimus展示出了與人手非常相似的機(jī)械手:
Optimus擁有11個精細(xì)的自由度,結(jié)合控制軟件,能完成像人手一樣復(fù)雜的操作,承擔(dān)約9公斤負(fù)重。最新的demo視頻中,我們也能看到特斯拉機(jī)器人在硬件上的一定優(yōu)勢,包括能控制力度的抓握很多物品,并且不會打碎雞蛋。
source:特斯拉
再次,機(jī)器人的驅(qū)動系統(tǒng)和能源供應(yīng)系統(tǒng)用于保障其動作的完成。按照波士頓動力官網(wǎng)的描述:Atlas機(jī)器人,雖然各種炫技動作很酷,但必須配置功率很大的液壓驅(qū)動。實際上,Atlas配置了28個液壓驅(qū)動器才能讓機(jī)器人完成各種爆發(fā)力超強(qiáng)的動作,而這樣的代價也是波士頓動力的老問題了——
制造成本居高不下,難以走出實驗室完成商業(yè)化。
馬斯克在Optimus身上選用了穩(wěn)定性、性價比更高的電機(jī)驅(qū)動方案,就是出于成本考慮。也正是因為這樣,才有底氣把Optimus的目標(biāo)售價定在2萬美元,以此來滿足巨大的潛在市場需求。
最后,用機(jī)器人的運算系統(tǒng)及軟件來進(jìn)行分析思考和對應(yīng)指令的下達(dá)。
第一,理解需求和環(huán)境。機(jī)器人會通過傳感器了解周圍環(huán)境,搞清楚要做什么。
這一層的難點在于:視覺等環(huán)境識別和理解,包括識別未知物體以及識別物體的未知姿態(tài)。
第二,拆解任務(wù)和進(jìn)行路徑規(guī)劃。
這一層的難點在于:人工智能輸出時的不穩(wěn)定性。因為在人工智能拆解任務(wù)的時候,每一次的解法可能都不相同,可能導(dǎo)致任務(wù)拆解的不一致,產(chǎn)生意想不到的結(jié)果。
第三,命令驅(qū)動硬件執(zhí)行任務(wù)。需要把運動規(guī)劃轉(zhuǎn)變成機(jī)械指令發(fā)到機(jī)器人的驅(qū)動系統(tǒng)上,確定能量、動量、速度等合適后,開始執(zhí)行任務(wù)。
這一層的難度在于:目前的人工智能還做不到100%的準(zhǔn)確率,同時速度較慢,耗時耗力,但是硬件執(zhí)行任務(wù)的驅(qū)動需要精準(zhǔn)控制,要以100%的準(zhǔn)確率作為基礎(chǔ),因此業(yè)內(nèi)還是會采用傳統(tǒng)的控制論方式來發(fā)號施令,執(zhí)行任務(wù)。
由此可知,要讓人形機(jī)器人身上的這四大硬件,一大軟件系統(tǒng)有機(jī)地整合在一起,協(xié)同工作,相互配合,同時還要讓合適的部位有合適的力量、速度和準(zhǔn)確性來完成所需的任務(wù),絕非易事。
仍以特斯拉的Optimus來說。2021 年 8 月,馬斯克在特斯拉年度 AI 開放日上首次公開展示了Optimus的想法。僅過一年時間,“擎天柱”原型機(jī)就于 9 月30 日特斯拉 AI Day 發(fā)布,硬件方面,“擎天柱”身高 172CM,整體重量 73KG;行走功率500W,坐下功率 100W,整體參數(shù)與 2021 年概念機(jī)略有出入(概念機(jī)參數(shù):身高172CM,體重 57KG,負(fù)載 20KG,行走速度最高可達(dá)每小時 8 公里)。
電機(jī)驅(qū)動上,Optimus擁有 2.3KWH、52V 電壓的電池組,內(nèi)置電子電器元件的一體單位,支持人形機(jī)器人工作一整天;選用 28 個定制關(guān)節(jié)驅(qū)動器,復(fù)用汽車動力總成設(shè)計經(jīng)驗,設(shè)計 6 種關(guān)節(jié)驅(qū)動器,包括 3 種不同規(guī)格的舵機(jī)(采用諧波減速器)和 3 種不同規(guī)格的直線執(zhí)行器(采用永磁電機(jī),可抬動 1.5 噸三角鋼琴的),找到成本與效率的最佳組合。
目前特斯拉已把汽車的一些技術(shù)運用到了Optimus上,例如電池組、冷卻系統(tǒng)等,還使用與汽車測試類似的技術(shù)來進(jìn)行機(jī)器人的運動和對外部碰撞模擬。
特斯拉的全自動駕駛系統(tǒng)FSD也直接被應(yīng)用在Optimus上,機(jī)器人采用了與汽車一樣的視覺感知,使用攝像頭輸入數(shù)據(jù),以神經(jīng)網(wǎng)絡(luò)進(jìn)行計算。
未來對特斯拉人形機(jī)器人或許還有以下驚喜:
特斯拉在新材料、電子技術(shù)上的研發(fā)能力較強(qiáng),可能會用到特斯拉在火箭上的技術(shù)積累;給特斯拉帶來持續(xù)爆款話題等。
02 人形機(jī)器人的產(chǎn)業(yè)鏈各環(huán)節(jié)分析先說結(jié)論。未來人形機(jī)器人產(chǎn)品之間的競爭,歸根到底是一場各個本體廠家在人工智能(AI)賽道上的競爭。
首先比的是人工智能水平的高低:能否像人一樣,理解外部環(huán)境和內(nèi)部中樞發(fā)出的信息和指令,理解,判斷并做出正確反應(yīng)。
其次比的是各個軟硬件之間的協(xié)同工作能力:哪怕每一個部件都是同類中最好的,但總成不好,搭配不當(dāng),同樣發(fā)揮不了最佳實用效果。
再次就是量產(chǎn)后的成本比拼了:人形機(jī)器人終究是一種商品,如果其最終成本達(dá)不到市場能接受的程度,那做的再好充其量也只是一種沒有商用價值的實驗室產(chǎn)品。
人形機(jī)器人,作為機(jī)器人領(lǐng)域里新崛起的一個重要分支,其產(chǎn)業(yè)鏈也是由上中下游三個部分組成。
上游為核心軟硬件,硬件包括伺服電機(jī)、減速器、控制器、傳感器等;軟件方面主要包括機(jī)器視覺、人機(jī)交互、機(jī)器學(xué)習(xí)、系統(tǒng)控制等。
中游則是人形機(jī)器人本體制造商,也就是能把上游的核心軟硬件組合在一起,生產(chǎn)出能走、蹲、跑、跳、能撿東西、能抓物體的人形機(jī)器人的廠家。國內(nèi)主要有優(yōu)必選、北京鋼鐵科技、小米等,國外的則包括波士頓動力、美國敏捷機(jī)器人、特斯拉、日本豐田、本田等;
下游目前還未有特別成熟的商業(yè)應(yīng)用?
制圖:星船知造 點擊圖片可放大
從人形機(jī)器人當(dāng)前的產(chǎn)業(yè)鏈狀況來看,雖說馬斯克推出的Optimus早已給期盼它正式上市的人們注入了一劑超級強(qiáng)心劑,然而在現(xiàn)實市場中,其上游產(chǎn)業(yè)鏈走的依然是常規(guī)工業(yè)機(jī)器人的路線。
主要硬件部分除了傳感器之外,其他三樣就是工業(yè)機(jī)器人的三大核心零部件(控制器、伺服電機(jī)和減速機(jī))。由此,也就能發(fā)現(xiàn)即便當(dāng)下人形機(jī)器人的熱度再大,風(fēng)頭再勁,“人”味再濃,最終采用的卻還是工業(yè)機(jī)器人的那套基本架構(gòu)。
機(jī)器人能夠靈活工作的核心之一在于運動的精確控制,其技術(shù)難度最高的三大核心零部件分別是控制器、伺服電機(jī)和精密減速器,這三者成本的占比分別約為15%、20%、35%。
以2022年9月特斯拉發(fā)布的首款人形機(jī)器人Optimus為例:
它擁有28個關(guān)節(jié)驅(qū)動器,使全身能夠產(chǎn)生200個以上不同角度的動作。
手部有五個手指,配備6個驅(qū)動器,擁有人類的靈巧性。
要實現(xiàn)這些功能,上述三大產(chǎn)業(yè)鏈核心零部件的性能必須要達(dá)到相當(dāng)高的要求。
從成本上分析,人形機(jī)器人的成本大致可拆分為動力總成系統(tǒng)(占總成本比重的60%)、智能感應(yīng)系統(tǒng)(占20%)、結(jié)構(gòu)件及其他(占20%)三個部分。
其中,動力總成系統(tǒng)包括電池系統(tǒng)、電驅(qū)系統(tǒng)(這里的動力總成定義類似電動車上的“三電系統(tǒng)”),預(yù)計這兩者分別占到總成本的10%、50%。
綜合技術(shù)與成本兩個方面來看,核心零部件的重要性尤為突出。
一方面,人形機(jī)器人技術(shù)的本質(zhì)是3D空間中高維度的感知與運動,高性能的核心零部件是實現(xiàn)感知與運動的基礎(chǔ)。
另一方面,控制器、交流伺服電機(jī)和精密減速機(jī)這三個最重要的核心零部件在成本中所占的比例還是相當(dāng)之高。
控制器是工業(yè)機(jī)器人的大腦,對機(jī)器人的性能起著決定性的影響。工業(yè)機(jī)器人控制器主要控制機(jī)器人在工作空間中的運動位置、姿態(tài)和軌跡,操作順序及動作的時間等;
伺服電機(jī)在自動控制系統(tǒng)中,用作執(zhí)行元件,把所收到的電信號轉(zhuǎn)換成電動機(jī)軸上的角位移或角速度輸出。機(jī)器人每個關(guān)節(jié)運動均需靠伺服電機(jī)驅(qū)動,以實現(xiàn)多自由度的運動;
精密減速器則是連接動力源和執(zhí)行機(jī)構(gòu)的中間機(jī)構(gòu),具有匹配轉(zhuǎn)速和傳遞轉(zhuǎn)矩的作用,也是機(jī)器人生產(chǎn)中壁壘最高的零部件,主要包括諧波減速器與RV減速器,但其工作原理和應(yīng)用場景存在較大區(qū)別:
諧波減速器:由波發(fā)生器、柔輪和剛輪組成。當(dāng)波發(fā)生器被放入柔輪內(nèi)圓時,柔輪產(chǎn)生彈性變形彎曲成橢圓狀。由于柔輪外側(cè)的剛輪比其多2個齒,導(dǎo)致柔輪長軸部分正好可以與剛輪的齒輪嚙合,而短軸部分與剛輪的齒輪呈脫離狀態(tài)。
RV減速器:由兩個減速部構(gòu)成,在第一減速部中,輸入軸的旋轉(zhuǎn)從輸入齒輪傳遞到直齒輪,按齒數(shù)比進(jìn)行減速;在第二減速部中,有一個曲柄軸與直齒輪相連接,在曲柄軸的偏心部分,通過滾動軸承安裝RV齒輪,曲柄軸會帶動RV減速機(jī)做偏心運動。
六軸工業(yè)機(jī)器人 source:遨博機(jī)器人
除了以上的三大核心部件外,傳感器在人形機(jī)器人身上的作用也極其重要。
人形機(jī)器人要具備對外界環(huán)境的識別能力,實現(xiàn)導(dǎo)航、避障、交互等功能,就需要使用傳感器識別物體、測距等。
識別外部環(huán)境主要使用攝像頭、激光雷達(dá)等傳感器,其傳感器方案和需求場景與自動駕駛存在類似之處,因此價值量較高的自動駕駛類傳感器存在新的機(jī)遇。
自動駕駛傳感器廠商、機(jī)器視覺廠商都是人形機(jī)器人傳感器的參與者。
以三大核心零部件來分類的方式通常更適用于相對粗獷的工業(yè)機(jī)器人,要想更好地解析人形機(jī)器人,五大系統(tǒng)的分法其實更為科學(xué)。
感知系統(tǒng),也即是傳感器,如攝像頭、麥克風(fēng)、激光雷達(dá)、距離感應(yīng)器等等,負(fù)責(zé)收集、傳遞信息,相當(dāng)于人的眼、鼻、耳,即人的“五官”;
驅(qū)動系統(tǒng),比如驅(qū)動輪子的馬達(dá),機(jī)械臂上液壓動力系統(tǒng)或氣動系統(tǒng),相當(dāng)于人的“肌肉”;
末端執(zhí)行系統(tǒng),既可以是機(jī)械手,也可以是機(jī)械臂上的一把螺絲刀或者噴槍,用以與外界環(huán)境進(jìn)行物理交互,相當(dāng)于人的“雙手”或“四肢”;
能源供應(yīng)系統(tǒng),如電源或電池,是機(jī)器人的能量供應(yīng)中心;
運算系統(tǒng)及軟件,將上面所有的系統(tǒng)整合起來,完成指定任務(wù),是機(jī)器人的“大腦”。
之所以需要用相當(dāng)大的篇幅來介紹上游產(chǎn)業(yè)鏈中的核心零部件、軟件及系統(tǒng)部分,就是因為它們是人形機(jī)器人能夠身輕如燕地跑跳蹲立,靈活自如地抓取捧舉,聰明伶俐地辨物識人,言聽計從地信手拈來的關(guān)鍵所在。
沒有這些部件的縝密配合,外觀再逼真的人形機(jī)器人也只能算作是繡花枕頭,中看不中用。
相對于種類繁多的上游產(chǎn)業(yè)鏈,人形機(jī)器人的中游產(chǎn)業(yè)鏈顯得簡單明了:就是那些能夠把這些核心零部件及軟件組合在一起,使機(jī)器人能夠發(fā)揮出最大仿人效能的本體制造商。
如本文開頭所說,目前人形機(jī)器人本體上處于領(lǐng)跑位置的玩家,要么是像特斯拉這樣的汽車行業(yè)大佬,要么是小米這樣的科技企業(yè)。工業(yè)機(jī)器人大佬反而鮮有入局。
以筆者的判斷來看,雖然人形機(jī)器人脫胎于工業(yè)機(jī)器人而來,但由于前者在AI領(lǐng)域方面的要求遠(yuǎn)高于后者,所以反而是高科技企業(yè)(尤其是在AI領(lǐng)域有較高建樹的)有后發(fā)優(yōu)勢。
當(dāng)然,把特斯拉、豐田、本田歸類為汽車企業(yè)未免太過片面,這幾家都是具備了極強(qiáng)科研開發(fā)能力的高科技企業(yè)(尤其是特斯拉在全自動駕駛技術(shù)FSD上的超強(qiáng)實力,已經(jīng)讓人形機(jī)器人和汽車擁有了一樣視覺感知:以攝像頭輸入數(shù)據(jù),通過神經(jīng)網(wǎng)絡(luò)進(jìn)行計算)。
03 ChatGPT實體化和機(jī)器人終極猜想最近舉辦的一場人形機(jī)器人比賽中,由OpenAI支持的實體機(jī)器人公司1x出品的EVE,擊敗了特斯拉的Optimus機(jī)器人。
EVE機(jī)器人的部分軟件功能由ChatGPT提供支持,也就是說將ChatGPT實體化,應(yīng)用在現(xiàn)實場景中。
GPT技術(shù)在人形機(jī)器人中的場景應(yīng)用打開了新的想象空間,引發(fā)了國內(nèi)資本市場對機(jī)器人產(chǎn)業(yè)的高度關(guān)注。
從業(yè)內(nèi)人士的角度來看,GPT大模型技術(shù)應(yīng)用到人形機(jī)器人上,可以為機(jī)器人提供“常識”,使其具備理解與推理能力。
在邊緣端布局面向機(jī)器人作業(yè)的中模型,能夠較為快速處理機(jī)器人的傳感信息,結(jié)合機(jī)器人端部署的運動規(guī)劃與控制小模型,這樣才能構(gòu)建出“云邊端”一體化的智能機(jī)器人系統(tǒng),完成人形機(jī)器人的智能閉環(huán)。
由此再次鞏固了我們的判斷——人形機(jī)器人產(chǎn)品之間的競爭,歸根到底就是一場各個本體廠家在人工智能(AI)賽道上的競爭。
先拼AI研發(fā)能力,再比各軟硬件之間的協(xié)同工作能力,最后大家一起拼成本。
以筆者之見,人形機(jī)器人在不久的將來會有三個發(fā)展趨勢:
一是成本越來越低,進(jìn)到千家萬戶是大勢所趨。
有鑒于當(dāng)前人形機(jī)器人高昂的零售價格(未量產(chǎn)狀態(tài)),即便其下游的產(chǎn)業(yè)鏈前景被資本市場長期看好,但至少在當(dāng)下,能夠?qū)崿F(xiàn)商業(yè)化的場景還是屈指可數(shù)。
波士頓動力的Atlas單臺價值為200萬美金,本田Asimo的單臺價值250萬美元,小米Cyber One單臺造價也高達(dá)60-70萬人民幣?;径沤^了普通人的購買奢望。
不過,假如Optimus在3-5年后通過量產(chǎn),售價做到2萬美元一臺,且替代人類完成瑣碎復(fù)雜的工作(非簡單重復(fù)型),這樣的下游產(chǎn)業(yè)鏈場景無疑會是相當(dāng)廣泛且極具商業(yè)價值的。
如馬斯克所描繪的,在量產(chǎn)規(guī)模達(dá)到特斯拉汽車的水平(幾百萬臺),各種更加經(jīng)濟(jì)實用的替代品被投放到原來昂貴易損的零部件位置之后,2萬美金一臺的價格將只是初級目標(biāo)。畢竟,卡爾·弗里德里?!け敬模↘arl Friedrich Benz)發(fā)明的世界上第一臺內(nèi)燃機(jī)汽車并不足以讓它走入到千家萬戶,量產(chǎn)后的福特T型車才是。
二是智能越來越高,替代復(fù)雜繁瑣的工作是民心所向。
與工業(yè)機(jī)器人主要用于取代工廠里簡單、重復(fù)、危險的勞動定位不同,人形機(jī)器人更加適合用作替換與人類有直接接觸,相對更為智能、繁瑣、貼身的工作,如導(dǎo)購、接待、看護(hù)、喂養(yǎng)寵物等。(更多機(jī)器人進(jìn)入下游應(yīng)用領(lǐng)域,請點擊閱讀星船知造文章:《萬億級機(jī)器人賽道里:為什么它最卷?》)
隨著人工智能水平提升,越來越多AI技術(shù)被運用到人形機(jī)器人身上,機(jī)器人越來越“人性化”,與人類的緊密度和契合度也會越來越高。
三是人工智超越人類的智能會是未來的大概率事件。
無論爆火的ChatGPT還是曾擊敗李世石的AlphaGo都屬于弱人工智能。
強(qiáng)人工智能至今尚未出現(xiàn)。但綜合來看,人工智能在與人腦的對抗中有以下三條優(yōu)勢:
首先是能耗,人工智能思考和解答問題比人腦消耗的能量低得多。大腦是人體能耗最大的一個器官,為什么人類總是討厭學(xué)習(xí)和思考,這是求生本能決定的,為了避免過度思考帶來的身體能量過度的消耗。
其次是存儲,人會遺忘。但人工智能只要信息輸入,就會存儲下來。強(qiáng)人工智能還能通過學(xué)習(xí)關(guān)聯(lián)更多知識和信息。
最后也是最致命的優(yōu)勢就是人工智能的時間效率。這里的效率有兩個方面的理解,一是學(xué)習(xí)效率,相比人類需要娛樂、社交、睡覺等,AI24小時不眠不休的學(xué)習(xí)和進(jìn)化,昨天還是嬰兒明天就是成人后天就是最強(qiáng)大腦。二是解決問題的效率,人工智能全天候處理問題和工作,未來人工智能會比人類更熟練的使用各類工具,可能你一輩子才精通的操作精密機(jī)床的手藝,AI一晚上就學(xué)會了。
最后,讓我們回到阿西莫夫的機(jī)器人三部曲。
《鋼穴》里,中年便衣刑警貝萊問機(jī)器人丹尼爾,為什么人類那么執(zhí)著要造出有手有腳有腦袋的機(jī)器人?為什么他們多多少少總要做得像個人?
丹尼爾的回答很簡單。至今為止一切為人類發(fā)明的東西,人型機(jī)器人直接就能用。
所以,是的,一切都是基于經(jīng)濟(jì)上的考慮。
本文基于訪談及公開資料寫作,不構(gòu)成任何投資建議