专访宇树科技王兴兴:在人形机器人的剧变前夜,做一个敏锐的慎重派

09-02 368阅读 0评论
专访宇树科技王兴兴:在人形机器人的剧变前夜,做一个敏锐的慎重派摘要

坚持做好硬件和产品、等候 AI 呈现。

文 | 黎诗韵

修改 | 靖宇

 

在现在大热的人形机器人、具身智能赛道,宇树科技是最受重视的公司之一。这家公司最大的标签是硬件实力强——一方面是功用,上一年其首款通用人形机器人 H1 能奔驰、原地空翻、踹不到,具有全球简直规范最高的动力功用;一方面是本钱操控,本年其第二款人形机器人 G1 价格仅 9.9 万元,而同行遍及在数十万、乃至百万元。

这背面建立在堆集多年的四足机器狗技能上。四足机器狗和双足机器人的底层技能相通,宇树只用 3 个职工、不到 6 个月时刻,就做出了上述人形机器人产品。谈及硬件实力强的原因,宇树科技创始人王兴兴对极客公园表明,首要是做了十几年、在软硬件上堆集了许多的认知和阅历。

2013 年,还在读研的王兴兴,自己规划电机、操控算法等,用不到两万块研制出了榜首台四足机器狗 XDog,这简直是全球首个四足机器狗的技能计划;2016 年,当 XDog 在海外展现出商场需求,王兴兴离任创建宇树科技,不久后极客公园旗下的变量本钱,留意到了王兴兴,并于次年领投了其天使轮融资。

现在,宇树的机器人本体(硬件)被全球各大科研机构、科技公司购买,用作研讨。而其四足机器狗现在在全球出货量榜首,包含万元的消费级机器狗 Go2 及最其新轮足版别 Go2-W,用于工业级场景的 B2、B2-W。年头,宇树披露了最新一轮近 10 亿元的 B2 轮融资,这也让它成为现在机器人赛道估值较高的公司之一。

不过,AI 为机器人这个赛道带来了新的变量。

在王兴兴看来,AI、而不是硬件,才是现在人形机器人工作最大的掣肘。两年前 ChatGPT 的呈现,让人形机器人有时机进化出实在智能的大脑,变成有自主感知、决议计划、履行才干的智能体。它将在工业、家庭等场景构成通用服务才干,然后作为全新的出产力供应,带来万亿规划的商场时机。

在王兴兴看来,硬件未来或许会处于隶属方位,比方当一个超级强壮的机器人 AI 模型呈现、哪怕用垃圾堆里捡的一堆机器人零件也精干活。不过,他并不计划改动公司的方针和重心,宇树的方针仍然是「做好产品」,AI 仅仅少数投入、且是为了更好地服务客户。

宇树代表了现在人形机器人公司的一种慎重、务实挑选。在王兴兴看来,现在人形机器人 AI 的进程还十分前期、乃至不到「GPT-1」水平,表现为机器人没有很好的通用性和泛化性,商业价值不大。而技能进化的道路又没有明晰、数据也十分缺少,因而全球各大公司对人形机器人的投入还远远不行,包含特斯拉、英伟达。

他说,技能的推动将由「全球共创」,并且很快就会有打破——由于,AI 技能呈现出阶跃性骤变的特色,前进总是忽然发生。而关于宇树来说,重要的工作是坚持学习、跟进新技能,这能让公司存活下来、乃至继续抢先。

以下是极客公园与王兴兴的对话,与现场共享进行了交融后收拾:

 

AI 技能不老练,工业场景的落地还未到时分

极客公园:最近不少人形机器人公司都在提工业场景的落地商业化,包含前不久 OpenAI协作的 Figure 02 也宣告进入宝马工厂。你怎样看本年人形机器人工作的改变?工业场景的落地是否在加快?

王兴兴:我个人感觉其实没有太显着的改变,仅仅说会有前进,以及会有一些测验性落地。但现在咱们基本上仍是处于试点阶段,觉得工业方向有价值,先测验下落地布置。

极客公园:有人说本年会是 POC(Proof of Concept,概念验证)之年,你怎样看?

王兴兴:只能说在一些相对简略落地的小场景、工业的部分环节能做点工作。但大部分仍是针对特定环节进行定向练习,成功率也未必特别高,离通用场景还比较远。

极客公园:关于使用场景,好像你们之前说会垂青介于工厂和家庭之间的动力场景?

王兴兴:咱们公司仍是偏工业一点,现在许多工厂对劳动力的需求是比较大的。但动力工作大部分满是主动化设备,它对人力的需求我感觉没有那么多。

极客公园:你们现在在工业范畴有哪些落地?

王兴兴:比方咱们曩昔几个月有跟蔚来的轿车工厂协作,现场布置了咱们的人形机器人做转移,有激光雷达定位、机器人操作、AI 辨认等,整个进程是全自主的。

尽管咱们也在推动落地,但或许推动的速度和功率没有那么快。咱们公司仍是比较有耐性的,不是说必定要本年或许阐下一年在工厂里布置多少台,其实没有把自己强逼那么紧。由于我觉得现在技能开展水平还不行,没有到达实在商业闭环,比方让机器人能到达一个工人的价值。

所以咱们仍是尊重整个商场的反响,比及技能和产品老练到必定程度了、现已有一些更好的商业推行的气势了,咱们再大规划地推行。

极客公园:咱们都在提人形机器人进入轿车总装场景,你觉得什么时分能完结?

王兴兴:轿车总装很难,由于轿车总装最大的一个问题是轿车的零部件太大了,一般小的人形机器底子搬不动。并且车辆又特别杂乱,要把机器人伸进去装,难度太大。现在进入轿车厂商的上游供货商或许还更简略一些。极客公园:上游供货商指的是?

王兴兴:出产一些外表、线缆或许什么,这或许简略一点。总装厂的难度其实有点大,单个总装厂里部分工序仍是能做的。

极客公园:在机器人底层AI技能还没有实在打破时,怎样看咱们钻到细分场景去做落地的含义?现在针对细分场景打补丁,会不会难以跟上底层 AI 的技能开展?

王兴兴:其实每个工作必定要先尝鲜、先推动一些工作,不或许等一切的技能或一切的条件都满意了,再去做一些商业化或许落地的工作。假如有能做的,咱们或许都会开端测验,这是毋庸置疑的趋势。

极客公园:你之前说到,下一年年末前全球至少会有一家人形机器人公司完结工业场景的商业闭环,这个判别是怎样做出的?

王兴兴:原因也比较简略,现在全球整个的机器人 AI 技能的前进仍是十分快的。技能一旦变得更好,那有些简略工业场景的落地就能够做了,一旦比方一个工厂的一台人形机器人设备,能够发生正向商业价值,其实许多的工厂都会买,这是不行阻挠的一件工作。

我觉得到下一年末和后年,人形机器人真的能够大规划地在工厂里铺起来。这个是十分快的,所以燃眉之急仍是要把 AI 做得更好一点。

专访宇树科技王兴兴:在人形机器人的剧变前夜,做一个敏锐的慎重派

宇树机器狗被用于工业场景 | 图片来历:宇树科技

 

人形机器人 AI 不到 GPT-1 水平,原因是数据和技能道路不明晰

极客公园:假如把现在具身智能的智能水平跟大言语模型做比照,你觉得现在是相当于 GPT 几的阶段?

王兴兴:我觉得还没到 GPT-1 的水平。具身智能整个的模型开展是有点慢的,还没有打破一个临界点。现在就有点像 ChatGPT 出来前一两年,机器人 AI 仍是有点蠢笨,只能做一些十分简略的工序、并且履行的成功率有点低。极客公园:这是不是失望了点?

王兴兴:没有,这基本上是现实。我觉得现在至少揭露的、咱们看到的技能,还没有到。极客公园:你觉得到达 GPT-1 的规范会是什么?

王兴兴:必定的通用性和必定的使用价值。现在许多场景都是固定工位、工序的练习,能做点工作,但泛化比较差,你练习了什么就只能做什么。

你能够看到前些天,特斯拉才刚开端招数据收集的人。你说数据都没有到位,这个模型怎样出来呢?所以就 GPT-1 都没有。极客公园:之前看到特斯拉有经过摇操的方法获取数据?

王兴兴:现已做了一点点,可是很小的、固定的一部分功用,比方把一个电池从这儿拿到这儿。这当然是能够的,但它跟咱们幻想中的通用机器人模型彻底两码事,跟通用的底层模型还差挺远。极客公园:所以AI技能没打破首要是数据的问题?

王兴兴:数据是一方面。现在许多机器人数据都很杂、不太洁净,乃至也不是给机器人专用的,就不是实在精干活那种等级的数据。所以只能做些简略的工作,成功率不是特别高。极客公园:应该怎样处理数据问题?特斯拉、谷歌比较着重遥操、英伟达着重仿真,你怎样看?

王兴兴:遥操、仿真都有需求的,各有优缺点。

比方虚拟数据能大约让机器人知道要往前走、或许拿个什么东西,可是实在要到达十分精细的操作,差错会比较大。你能够用虚拟数据做机器人的练习,但终究要让操作准确度到达 100%,仍是需求实在的数据。我觉得假如有实力的公司,像特斯拉,多弄点人搞实在数据会比较好。

不过我个人感觉,机器人的数据量没有咱们想得那么夸大。现在最大的问题是。现在每家搭的模型都不太相同,每家的主意也不相同,没人知道哪个模型是好的、也没人知道哪个什么技能道路是实在终究能跑出来,都比较含糊。

 

专访宇树科技王兴兴:在人形机器人的剧变前夜,做一个敏锐的慎重派

机器人仿真数据 | 图片来历:宇树科技

 

极客公园:工作首要分为怎样的技能道路?

王兴兴:现在市面上比较常见的有两种。一种是把大言语多模态模型直接给机器人用,然后再加一部分机器人底层的操作运动集等,让大言语模型去调用一下、完结一些工作,这是现在最常用的一个架构。

有些公司或许期望更端到端一点,像特斯拉现在要搞的便是这个方向。它直接用仿照学习,让人收集许多的动作数据去练习机器人。它的确堆数据是有作用的,比方今日干这个活堆一部分数据,干一个活堆其他一部分数据,终究这两个活都精干,但更大的验证不太确认。

极客公园:为什么技能道路还没有构成一致?

王兴兴:首要是模型和终究作用都没有看起来说,哪个技能道路特别特别好。

光硬件都没有方法构成一致,比方一个摄像头详细应该装什么方位、装几个,传感器数据应该怎样采、要不要触觉传感器,有的不想要灵敏手、有的需求许多手指……每个人的主意都不太相同。这就导致了其实很难点评哪种正确、哪种过错。

其实在 ChatGPT 之前大言语模型也有十分多的架构,仅仅后来发现这种架构更有价值,就把其他架构筛选了。现在人形机器人有点像 ChatGPT 出来的前一两年,实际上没有哪家敢保票,说自己的方向是必定正确的。

极客公园:那你自己更信任哪一种道路?

王兴兴:我感觉或许跟他们主意都不太相同。咱们其完结在不是特别急,一方面是看能不能做一些新的模型,另一方面这些常用的咱们也会用。咱们就玩玩吧。

极客公园:咱们说智能轿车是机器人的一个子集,现在许多车企在入局人形机器人工作,车企从主动驾驶的端到端来做机器人会更有优势吗?

王兴兴:由于马斯克在搞人形机器人,所以车企对这块必定是比较重视的。咱们期望在机器人上用到像 FSD 相同端到端的主动导航技能,但许多传统的主动驾驶仍是偏传统的技能,比方机器狗在一些园区做巡查的这种技能。

把 FSD 主动驾驶用在人形机器人上面,咱们做得不行好。包含特斯拉,由于特斯拉许多的人力都放在 FSD 去了,人形机器人相对投入没那么多。当然也有一些创业公司在做,但现在仍是不多。

极客公园:你以为机器人AI什么时分能完结 GPT-1 的水平?

王兴兴:下一年年末差不多,全球至少有一家公司应该能够搞出来。或许比这个时刻还更快。极客公园:尽管技能道路还不明晰,但为什么信任能这么快完结?

王兴兴:比较简略,AI 技能都是阶跃性的。现在有点处于一个途径期的感觉,但技能前进自身十分快,或许今日没做出来,忽然明日就做出来了,它便是骤变性的。

比方咱们在研制的时分,常常发现十分惊喜的工作:有搭档调了(机器狗)许多天都调欠好,它彻底地上打滚啥都干不了。但忽然一个晚上,你给它练习一个新的模型放上去,第二天早上作用就十分好。这种状况在 AI 里边很常见,一开端或许真的是很烂,忽然间变得十分智能。

其他,这个工作越来越热了,有更多的聪明人、更多的钱在重视这个工作,那整个速度就会变快。假如仍是按曩昔那种机器人 AI 研制的发展,或许等个十几年或二十年都等不到。所以现在,我仍是比较达观。

 

全球人形机器人公司对 AI 的投入都很少,处在张望、共创阶段

极客公园:现在你们在AI 上的投入怎样样?

王兴兴:说实在的,咱们在国内涵机器 AI 里投入算是比较少的,跟别家比起来。极客公园:但你之前说期望能更信任、更投入 AI?

王兴兴:对,可是究竟财力和精力有限嘛。AI 太烧钱了,光 GPU 算力都烧不起。假如投入太大,简略盈亏不平衡。所以咱们仍是抑制一点。

极客公园:从这个角度上来说,有更多资金的大公司会比创业公司更有优势吗?

王兴兴:我觉得还好。中心原因是,在现在技能道路不是特别明晰的状况下,你哪怕有许多钱和资源,也使不上太多劲。在这个阶段,你能够看到尽管大公司都挺重视的,但投入其实不多,其实都很保存。

特斯拉的人略微多一点,至少有几百人,其他公司大约或许有几十人。投入远远不算大。国内其实咱们投入也都挺抑制,没有说哪家张狂投入啊。

说实在的,它不是说一家公司有多少钱、有多少人就能必定能把它做出来。由于在这种前沿的、全球都没有人做出来的状况下,某种程度上你能够以为看运气、或许看某个天才人物,把这个工作推动了。

极客公园:这看起来很反差,外界都觉得人形机器人工作很热,但实际上咱们投入不多。

王兴兴:这跟大言语模型比起来真的是沧海一粟。

由于大言语模型的技能道路相对确认了,假如你去看一下 OpenAI 的前期开展阅历,它做的工作其实很杂,包含机器人、AI 模型等等。后来它们是发现 GPT 的方向比较正确,经过投入算力和资源、能够大力出奇观,才重注这个方向。它们并不是在道路还不太清楚的时分乱投入。

极客公园:那人形机器人比较主动驾驶,哪个更远?

王兴兴:FSD 更快,基本上特斯拉在这个技能道路上就跑通了,商业价值现在都彻底看得到。所以它们现在投了许多的资金和人力去做 FSD。

我觉得这也是为什么它们人形机器人的 AI 开展没有那么快,由于现在的技能道路没有特别明晰,所以投入跟 FSD 比起来真的是少许多。极客公园:一方面是技能随时会有打破,另一方面咱们又不敢投入,那怎样跟上技能进程?

王兴兴:这个不太好估量吧,就看详细的技能开展。假如忽然觉得技能好了,你就多投点钱。假如技能不太好,那就少投点钱。这其实是很动态的一件事。

极客公园:技能打破首要是靠学术界仍是科技公司?

王兴兴:现在仍是全球共创的阶段,很难说是某个实验室、某家大公司。就像 OpenAI 能做出 GPT,也用到了谷歌的 Transformer 技能和其他公司的一些作用。

很难说某家大公司是技能最抢先或许产品最抢先的,国内国外都有或许,大公司或许时机更大一点,但都欠好说。AI 这个范畴便是这样,今日你抢先,过了没几天他人更抢先了、你本来老的东西都不能用了,它的改变性和风险系数还挺高的。

咱们公司仍是期望全球共创、和咱们一同尽力,之后再依据整个工业的意向做相应的调整。

极客公园:为什么你之前说,这次技能的打破大约率是由其他公司完结?

王兴兴:这其实是彻底不行估计的一件事。不过我觉得美国的概率会更大一点,由于它们 AI 人才更多一点、算力也更多。

专访宇树科技王兴兴:在人形机器人的剧变前夜,做一个敏锐的慎重派

宇树的人形机器人 G1 具有逾越常人的灵敏性 | 图片来历:宇树科技

 

现在的大言语模型无法通往 AGI,但具身智能能够

极客公园:你说到比较于大言语模型,具身智能是完结 AGI 的最有效途径。这种物理国际的 AGI 和虚拟国际的 AGI 是相同的吗?

王兴兴:我觉得是一致的。我以为实在的 AGI 需求有物理肉体,纯虚拟环境的 AI 或许没方法诞生 AGI,终究它必定要和身体做整合。

我之前说到过大言语模型有「错觉」问题,「错觉」便是虚拟环境导致的。就像大脑在做梦,你没方法判别这个虚拟环境的实在性,就会迷失。就像把你的大脑被连接到互联网上,看到各种图片、视频,没准过一段时刻你就现已彻底没方法区别什么是真的、什么是假的。所以要完结 AGI,仍是要结合具身智能和机器人。

极客公园:像 Sora 这种模仿实在国际的物理模型,能处理这个问题吗?

王兴兴:我觉得这是个很好的技能方向。它现在现已能做一部分工作了,比方生成一个跳舞的小人,但离质的腾跃还有点难度。

极客公园:具身大模型跟大言语模型,终究会构成一个怎样的联系?

王兴兴:言语模型未必是给具身模型的必选项,它仅仅其间一部分。举个最直观的比方,比方在工厂里干事的一个机器人,他彻底能够不说话,比方说我给它一个使命,给它看一张相片、或许给它敲一个数字进去,他只需精干活就行了。具身模型最中心的是干活。

极客公园:从具身智能来看,完结 AGI 的标志是什么?

王兴兴:我觉得仍是机器人能实在到达自我学习、自我干活,或许至少大部分活都能自己干。比方你随意找一个场景,家里、工厂,只需把人形机器人拉过来,直接跟它说要做什么工作,它一下就能学会做,至少要到达这种等级。

极客公园:终究便是开箱即用?

王兴兴:差不多。乃至假如再高档一点,需求机器人能继续性地自我学习。

由于现在的 AI 都是靠人发生的数据驱动的,但未来是不是能够不要人为数据、让它自己出产数据,自我驱动、自我学习和进化。乃至你啥都不必管了,它连芯片都能自己造。

极客公园:当实在的 AGI 时刻降临,它会带来怎样颠覆性的影响?

王兴兴:我觉得整个社会的改变会十分十分大。普通人或许不需求上班,出产力将由机器人承当。我觉得这会实在解放人类,让每个人都能够吃喝玩乐,每个人都很高兴,每个人都有大的房子住,每个人想去哪里玩去哪玩,每个人都很自在。

并且我觉得这个进程挺快的,5 年内有或许完结,最多不会逾越 10 年。AGI 的未来其实并不悠远。

 

专访宇树科技王兴兴:在人形机器人的剧变前夜,做一个敏锐的慎重派

消费级机器狗 Go2 及最其新轮足版别 Go2-W | 图片来历:宇树科技

 

宇树的方针仍是做好产品,并学习和跟进新技能

极客公园:外界都知道宇树的硬件做得好,国内外的高校、科研机构都买你们的机器人本体做研讨,为什么你们能做好这件事?

王兴兴:对咱们公司来说,最大的一个优势便是,咱们在这个工作做了许多年了。我自己差不多从 2010 年就开端做小的人形机器人,2013 年就正式开端做电驱动的四足组机器人,现已有十几年了。

所以,我和团队,在机器人硬件和软件方面堆集了许多的认知和阅历。不管是硬件的出产制作、降低本钱、前进可靠性,仍是出售途径,仍是技能的研制等等。现在咱们整个公司规划在全球来说也是比较大的,这些多方面的要素让咱们相对许多其他机器人公司有更多优势。

我一向深信一点,其实国际上的聪明人许多,但你实在要把这个工作做得很好,其实首要仍是坚持满意长期的学习与前进。只要这样,才干实在把这个工作做好。

极客公园:坚持研讨机器人十几年,这背面是源自什么?

王兴兴:我的确比较喜爱机器人,但其实我从小对一切的科技都比较喜爱,就从几岁的时分开端,科学、物理、化学、生物这些学科我都很喜爱。

09 年读本科的时分,机器人变成了我的一个工作倾向。不管是机械结构规划、电器电机操控、包含 AI 算法等等,我都比较喜爱。假如有些人觉得一个方向做久了有点厌,对我来说或许反而还好。比方说今日或许玩玩机械玩腻了,明日换一换玩 AI,再玩腻了就回头玩玩电路板。

所以我的爱好点仍是十分十分多的,并且跟着每次有新的立异呈现,对我来说是十分十分满意的一件工作。

极客公园:你说现在AI 才是整个机器人工作最重要的变量,这会带来哪些时机和应战?

王兴兴:我一向以为机器人工作现阶段最大的约束,仍是 AI 不太够——AI 模型、AI 的练习数据集、AI 的场景的落地布置,都彻底远远不行。当然硬件现在也不行,可是它没有理论上的门槛,仅仅工程上的问题,比方把本钱做得更低,功用做得更好、外观做得愈加极致、功用愈加丰厚等,时刻是能够预估的。

跟着 AI 技能越来越老练,咱们对硬件的需求会越来越低,包含硬件的自在度、数量、外观灵敏度等等。乃至我一向感觉,当未来人形机器人的 AI 实在打破之后,你从垃圾堆里找几个关节电机,把它像个人那样搭出来,它就自己能走路乃至精干点活,这都是十分有或许的工作。

咱们的立身之本必定是机器人本体,不过咱们在 AI 方面也做了不少的工作,但比不上朴实的 AI 公司。咱们之所以要做 AI,也是为了让客户知道咱们机器人的 AI 作用怎样样,你需求一个初始的软件系统。咱们的中心仍是期望有更多客户来用我的机器人,他哪怕买了硬件把软件(AI)全给删了,这也没问题。

所以咱们现在也积极地跟各种大模型公司协作,咱们十分乐意直接在咱们产品上标配它的大模型。能够这么说,假如哪一天有人把 AI 机器人的模型做出来,我能够确保年末之前直接给他做 10 万个人形机器人。

极客公园:你怎样界说公司的方针?假如说OpenAI方针是成为最顶尖的技能公司,但这好像不是你们的方针。

王兴兴:仍是期望把产品做得更好一点吧,比方硬件本钱、外观功用、客户友好性、包含功用等等。咱们仍是期望咱们能承受咱们的产品,终究让产品在工厂、服务业、家用等场景实在发生价值。其实不管客户对咱们的印象是硬件仍是软件,我觉得都无所谓。咱们会投入 AI,但咱们不会是搞专门搞根底 AI 的公司。

极客公园:现在有越来越多人形机器人公司呈现,有一些也拿到了不错的融资,你怎样看待竞赛?

王兴兴:我觉得由于工作的确十分热,所以许多人进来,这是不行避免的一件工作。可是关于咱们公司来,包含对我自己来说,咱们一向深信便是咱们要逾越的,首要仍是咱们自己。

由于咱们现在不管是技能层面、包含公司规划,都比市面上大部分公司都仍是要好许多。所以假如咱们盯着对方,其实也没有太大协助。我自己,包含咱们公司,首要是期望每天、每个月、每年有更好的产品技能,或许在商业化战略上有更好的前进。坚持前进是最首要的一件工作。

极客公园:你自己花多少精力在探究新的东西上?

王兴兴:时刻不太好说,不是特别确认和固定。

极客公园:身处AI大变革的年代,一方面技能还看不真切、但另一方面技能又会随时呈现,这是一种怎样的心境?

王兴兴:我觉得仍是十分激动人心的,你只能坚持探究的、学习的状况。比方说有什么新东西了,要尽早发现预兆,尽早掌握时机。这一点,咱们或许比大公司更有优势,由于大公司内部的流程系统有一些约束、团队会面对更剧烈的资源竞赛等等。

中小公司更能坚持满意的前沿技能的敏感度,你得看到未来,你得满意灵敏。假如你能预估未来 1 年、2 年、乃至是 5 年今后的整个技能道路,包含整个产品格式,整个国际格式是怎样的,你提早做布局去做,你必定死不了。你能不能做榜首不太清楚,但至少做到前几名,仍是十分有或许的。

 

发表评论

快捷回复: 表情:
评论列表 (暂无评论,368人围观)

还没有评论,来说两句吧...

目录[+]