用什么詞語能形容本屆北京世界機器人大會(WRC)?第一個詞可能是“翻番”。
2024年WRC上,人形機器人合計的展出數(shù)量已經(jīng)達到了27款。而今年,參展WRC的廠商數(shù)量超過200家,光人形機器人廠家數(shù)量就超過了50家。各類展品則合計達到1500件,高出去年900件;新品發(fā)布100余件,數(shù)量較去年翻倍。
第二個詞可能就是“瘋狂”。
50000平方米的北人亦創(chuàng)中心,三天之中日日人潮涌動。合計130萬報名參觀者,不僅有從業(yè)者、愛好者、甚至還有耄耋老者,垂髫孩提等等。人流最多之時,熱門展區(qū)之前,幾乎人人接踵,寸步難行。
然而,若要問此次WRC的意義,記者觀察后卻發(fā)現(xiàn),喧囂背后,參展的從業(yè)者們,卻又意外地頭腦清晰。
儼然已經(jīng)是“明星”的宇樹科技CEO王興興,本次大會上罕見地進行了一次媒體會。在“長槍短炮”的圍攻下,王興興透露:宇樹科技的目標(biāo),不光是讓機器人成為“演員”和“運動員”,而是真正成為“打工人”,成為“生產(chǎn)力”。
不僅是王興興,許多參展者,都表達了類似的觀點。
毫無疑問,機器人在WRC演出行將謝幕。接下來,它們會紛紛選擇拿起“錘子”。
“演”出新高度
每年WRC都有幾個“主演”。今年WRC“演出”的主角,依然是幾家頭部人形機器人企業(yè)。
宇樹科技的展臺——不,是拳臺旁,里三層外三層擁擠得水泄不通。拳臺中間的宇樹G1無疑是“拳擊王”:在呼喊中,兩臺G1機器人出拳,掃腿,嘲諷對手,甚至被絆倒,重新起身,動作嫻熟流暢。為了讓更多觀眾看到,宇樹還吸取了此前世界人工智能大會(WAIC)的經(jīng)驗,在展臺上方掛起直播屏幕進行實況轉(zhuǎn)播。
而與此前轉(zhuǎn)播拳擊大賽時不同,記者注意到,宇樹G1機器人動作更流暢,由算法小腦控制的機器人身體平衡在失衡時的表現(xiàn)相比一個多月前更加卓越,導(dǎo)致卡死和人工干預(yù)顯著減少。
另一個明星,則是此前已經(jīng)在北京踢過一輪“足球熱身賽”的加速進化。在WRC展會上,加速進化機器人表演了多機足球比賽以及人機互動等。記者也注意到,與前期頻頻“腳下拌蒜”相比,加速進化機器人的端到端運控能力已經(jīng)有所提高;點球人機互動中,機器人上演了數(shù)個勢大力沉的射門,互動者也不再能不費吹灰之力地?fù)涑錾溟T。
眾擎機器人的小“鋼鐵俠”則替代了宇樹成舞者出道機器人中的扛把子,與年初和全球大網(wǎng)紅“Speed”齊舞時相比,眾擎機器人EngineAI數(shù)個復(fù)雜動作已經(jīng)初步具備人類動作的細(xì)膩與靈動感;而如逐際動力則仍然以展示其雙足機器人運控能力為核心,其雙足機器人數(shù)次被蹬出數(shù)米外不倒——即便倒下也會自動起身。
除了一些國內(nèi)頭部人形機器人企業(yè)外,展會上的另一位明星是揮著雙翼的無人機。由德國展商Festo帶來的仿生蜜蜂機器人BionicBee,只有34克重,22厘米長,卻能實現(xiàn)自主編隊飛行;而其中的振翅機構(gòu)、通信模塊、電池等全套系統(tǒng)均突破了許多從業(yè)者對微型機器人能力極限的認(rèn)知。
從2024年春晚機器人大火,到2025年年中WRC、WAIC兩次AI與機器人盛會,人們看到的最大變化其實是:機器人們終于從不斷重拍的視頻里,走到了“Liveshow(現(xiàn)場表演)”的舞臺上和人群中。
雖然此前同在北京亦莊舉行的機器人馬拉松,一度將人們對人形機器人不切實際的期待拉回了現(xiàn)實,但當(dāng)人形機器人在大小腦不斷優(yōu)化、進化后,人形機器人的運動能力姿態(tài)已經(jīng)開始逐漸快速接近人類動態(tài),并擁有更好的穩(wěn)定性。而這意味著,純粹的機器人的運動能力,正在快速接近臨界點。
從演出到進廠打工
當(dāng)然,在各家機器人企業(yè)通過表演展現(xiàn)運動能力之際,在此次WRC上,展示機器人打工潛力的廠家開始顯著增加。
為首的便是優(yōu)必選,該公司展臺一口氣展示了包括WalkerS2、Cruzr S2、WalkerS1、WalkerC等多款機器人。其中11臺WalkerS1集中展示了群體隨機分揀工作,WalkerC展現(xiàn)了觀眾導(dǎo)覽,WalkerS2還在現(xiàn)場展示了熱插拔自主換電技術(shù),以配合工廠場景下7*24小時不間斷工作的需求。
值得關(guān)注的是,優(yōu)必選相關(guān)人士向記者透露,為應(yīng)展,此次展出的機器人,部分還是從客戶實訓(xùn)場地“借回來”展出。
無獨有偶,包括如千尋智能的墨子機器人(Moz1)在多個展臺演示了從滾筒洗衣機中拿出衣服并疊衣,以及串起糖葫蘆的能力等;深圳越疆科技展示了機器人同時進行精密零件組裝(左手將軸承旋緊至0.1毫米公差)和零件分揀(右手同步操作),還能在生活區(qū)制作爆米花、檸檬茶和煲仔飯等;魔法原子“小麥”MagicBot G還原了工業(yè)流水線上的“點膠場景”,等等。
另外,記者還注意到,與人形機器人在此前強調(diào)雙足運動不同,此次WRC中多家機器人企業(yè)展示了其輪式底座或AGV(自動導(dǎo)航車)作為機器人本體移動模塊的人形機器人品類。而這些機器人又大量被展示其“打工”能力。
一位頭部機器人廠商人士在WRC期間告訴記者,這些改動主要出現(xiàn)在工廠應(yīng)用的機器人種類中。因為輪式機器人運動穩(wěn)定性更高,技術(shù)難度更小,負(fù)載也更大,因此能夠適應(yīng)許多既要搬運,又需要操作的場景。
但該人士也告訴記者,雙足人形機器人之所以仍有較好的應(yīng)用前景,主要是因為當(dāng)下許多工廠仍然是以“人類工作”進行適配的,因此工位大小、操作方式、空間布局、動線等都與適配人類有關(guān)。而仿生人類機器人能夠無縫對接當(dāng)前人類工廠,并處理復(fù)合型復(fù)雜度較高的工作種類,其為當(dāng)下人形機器人企業(yè)的重點關(guān)注方向。
王興興在WRC的演講與采訪也印證了這一點。
他表示,現(xiàn)階段每家機器人企業(yè)都有各自的技術(shù)路線和特點。對于宇樹科技來說,終極目標(biāo)是讓人形機器人進廠干活,包括在家務(wù)場景中能夠端茶倒水或洗衣做飯。當(dāng)然,現(xiàn)階段讓機器人去家里干活還不太現(xiàn)實,在終極目標(biāo)還未實現(xiàn)之前,現(xiàn)階段宇樹的機器人去跳舞、格斗,是希望通過AI技術(shù)讓機器人,尤其是人形機器人做各種全身動作,展示運動能力。
智能化的期盼
除進入傳統(tǒng)工廠之外,人形機器人商業(yè)化場景的應(yīng)用也呈現(xiàn)多點開花的情況。
如去年WRC展會上已經(jīng)展出的攤煎餅機器人,今年仍然排起了長隊,“一餅”難求盛況空前。
而以部分服務(wù)機器人為代表的企業(yè),實際已經(jīng)完成了商業(yè)化閉環(huán),并開始積極拓展海外業(yè)務(wù)。
作為頭部服務(wù)機器人廠商,云跡機器人、擎郎機器人均參展了此次WRC。其中云跡科技此次展示了其在酒店服務(wù)領(lǐng)域的成果,如智慧酒店、智能洗衣、“美式”成真、抓娃娃機器人等服務(wù)機器人體驗設(shè)備,并展示了公司機器人從單一功能向多功能和群體協(xié)作功能的迭代。
該公司還向記者透露,云跡科技已經(jīng)在歐洲多個地區(qū)實現(xiàn)業(yè)務(wù)落地,并明確為當(dāng)?shù)鼐频陰砹颂豳|(zhì)增效的效益。
擎郎機器人則在WRC上展示了爆米花機器人、酒保小哥機器人等。在人形機器人服務(wù)生背后,公司在全球超過10萬臺服務(wù)機器人龐大落地量,并累積了足量的商業(yè)化能力。
然而,在輕量化、崗位化級別商業(yè)服務(wù)已然走通,部分甚至開始大舉涉足海外市場的同時,記者發(fā)現(xiàn),WRC展會中的人形機器人,普遍存在單機匹配單一場景,并且通用性不足的問題。真正復(fù)雜的、復(fù)合的人形機器人應(yīng)用,至少在本次展會中還難以看到。
至于個中原因,王興興的解釋是:當(dāng)前的具身智能在執(zhí)行簡單的運動指令,如跑、跳,簡單的抓握時已經(jīng)能較好地處理動作和平衡。但在具體工作面臨復(fù)雜情況時,能力還達不到。
在主旨演講部分,王興興還提到,目前以VLA(視覺語言動作等多模態(tài))為目標(biāo)的人工智能大模型,并沒有體現(xiàn)出明確的RL-Scalinglaw(規(guī)模化法則),即數(shù)據(jù)量越大,機器人性能越好的傾向。機器人大小腦的短板還普遍存在。
部分頭部參展商,具身智能研發(fā)企業(yè)也告訴記者,當(dāng)下人形機器人企業(yè)的共同難題是具身智能存在較大的短板。而其背后的問題在于,目前具身智能企業(yè)在資本投入上相比大語言模型并無優(yōu)勢,因此大部分企業(yè)只能通過專攻單一場景的方式實現(xiàn)商業(yè)化,徐徐圖之。
加之,由于人形機器人完整生態(tài)與行業(yè)標(biāo)準(zhǔn)化進程尚未啟動,因此導(dǎo)致人形機器人數(shù)據(jù)無法互通,仿真訓(xùn)練與實際演繹差距極大,規(guī)?;▌t無法從真正意義上實現(xiàn)。
當(dāng)然,本次WRC上,各家企業(yè)也紛紛嘗試通過展示VLA能力,秀出自己在具身智能大小腦上的進取之心。
如銀河通用重點展示了面向零售行業(yè)的端到端具身大模型——GroceryVLA。面對密集陳列、多樣SKU(庫存單位)及多變包裝形態(tài)的商超環(huán)境,Galbot展現(xiàn)出卓越的識別與抓取能力。星海圖帶來了他們“真端到端+真全身控制”的VLA模型G0,并用視頻展示了從自然語言理解到執(zhí)行任務(wù)的一個演示視頻。
當(dāng)然,“機”別三日,當(dāng)刮目相看。一年以后的今天,當(dāng)我們再看到這些廠商們展出它們的產(chǎn)品時,會得到什么樣的沖擊?無疑將令人期待。