DoNews8月11日消息,據42號電波報道,8 月 9 日,宇樹科技創(chuàng)始人兼 CEO、CTO 王興興在 2025 世界機器人大會上發(fā)表演講,演講中,王興興接連拋出炸裂觀點,包括自己對于時下熱門的 VLA 模型的看法。
王興興認為,在政策和市場需求的不斷促進下,人形機器人整機與零部件廠商平均實現了 50%-100% 的大幅增長。并且人形機器人行業(yè)已經走到「ChatGPT 時刻」的前夜,最快 1-2 年就能迎來這一時刻。
但王興興表示,行業(yè)發(fā)展仍然存在幾大誤區(qū),主要包括以下幾個方面。
具身智能完全跟不上
王興興認為,機器人目前沒有大規(guī)模應用的原因,不是因為硬件不行。目前的機器人硬件,不管是整機還是靈巧手,完全是夠用的。
現在最大的問題在于具身智能的發(fā)展完全跟不上,這是限制當前機器人,尤其是人形機器人大規(guī)模的應用的關鍵。
不過現在整個行業(yè)處于 ChatGPT 誕生前的 1-3 年左右,業(yè)界已經發(fā)現了類似的方向以及技術路線,但是沒人把它做出來。
在機器人 AI 技術上,他認為臨界點應該是:當人形機器人能夠做到進入完全陌生的環(huán)境后,可以順暢自主地完成類似「把這瓶水帶給某位觀眾,或是整理一下這個房間」的指令任務時,那就真正迎來了人形機器人的 ChatGPT 時刻。
對此王興興表示,如果進展順利,未來的 1-2 年或者 2-3 年就能實現這一目標,最慢的話 3-5 年也有很大概率可以實現。
數據被過分關注,對 VLA 保持懷疑
在整個機器人行業(yè)多數團隊都在為數據發(fā)愁的情況下,王興興表示,機器人數據被過分關注了,現在最大的問題是模型,并不是數據問題。對于具身智能和機器人來說,模型架構都還不夠好,也不夠統(tǒng)一。
很多團隊認為只要有了足夠多和足夠好的數據,就可以把模型訓練的越來越好,實則不然,一些情況下即便有了數據,數據也是用不起來的。
所以,王興興表示:「我個人對 VLA 模型還是保持一個比較懷疑的態(tài)度?!?/p>
他認為,現在的 VLA 模型是一個相對比較傻瓜式的架構,在和真實世界交互時,它的數據質量、能采集的數據是不太夠用的。宇樹在嘗試 VLA 模型加 RL 訓練后,還是不夠,所以,模型架構需要再升級和優(yōu)化。