一个“上天”,一个“要脸”:他们正颠覆你对机器人的想象
日期:2025-12-24 22:47:29 / 人气:2

如果每个人都有宿命,高飞的宿命可能写在他的名字里——“飞”。他是浙江大学控制学院长聘副教授、博士生导师,是《Science Robotics》、TRO等顶刊常客,也是2023-2024全球前2%顶尖科学家入选者。但比起“博士生导师”或“优青”这些耀眼的头衔,高飞现在的身份更像是一位重塑天空的极客。他创立微分智飞,目标明确且深远:要为飞行终端造一颗通用的“具身大脑”。
首形科技的创始人胡宇航也许是机器人领域最懂流量的科学家——他是哥伦比亚大学机器人学博士,《Nature Machine Intelligence》《Science Robotics》等顶刊常客;他也是短视频账号“U航”的创作者,粉丝超过200万,累计播放量1.5亿次。在流量实验背后,是他极其冷静的路径选择:给机器人一张能传递55%情感的脸。他试图绕过复杂的物理接触深坑,用高保真的面部交互,率先跑通实体机器人的Scaling Law。
这一期内容是五源合伙人孟醒与微分智飞创始人高飞、首形科技创始人胡宇航的对话,聊了聊那些关于选择、关于流量、以及关于重新定义机器人的野心。
无论是飞向高空的“大脑”,还是传递情感的“脸面”,在人形机器人赛道烈火烹油的当下,他们没在主流赛道复制成功,而是选择了两条少有人走的路。这不仅是两位顶尖科学家的创业故事,更是让机器人从工业品进化为新物种的一次尝试。
本期嘉宾:
高飞微分智飞创始人
胡宇航首形科技创始人
主持人:
孟醒五源合伙人
“人脸机器人不需要物理接触,它的交互维度完全可以通过纯数字信息训练。这意味着我们更容易跑通Scaling Law,培育出实体机器人的‘GPT时刻’。”
“我们不是在Reinvent(重新发明)机器人,而是在Redefine(重新定义)机器人。对于这个机会我们等太久了。”
“如果因为一座山很高,我从第一天就害怕,那我就完全放弃了登山的希望。‘山高万仞,只登一步’,我只走眼下这一步。”
以下为访谈内容精选:
孟醒:两位都是今年机器人赛道中最受关注的创业者,但你们选择的方向都不是当前最主流的赛道。当行业讨论机器人时,第一反应往往是人形机器人,这个赛道非常热,也涌现了不少优秀公司。但你们选择了与它有一定关联、却带有强烈独特性的方向。能否先请两位分别介绍一下自己的方向?
高飞:我是微分智飞的创始人高飞,我们聚焦于飞行具身智能。通俗地说,我们希望打造一个能够赋能各类飞行终端的,包括大脑、小脑和群脑的一体化基础模型。我的愿景是希望智能飞行走进千家万户,服务千行百业。
胡宇航:我是首形科技创始人胡宇航,我们专注于人脸机器人和人机交互对话系统。我们认为,今天的AI智能体在交互策略上,已经越来越逼近真实人类的情感表达和理解形态了。我们希望它能突破现有的物理载体,不再局限于屏幕和手机,而是真正具象化到一个实体人物上。
这样做有两个核心价值,第一,心理学研究表明,人类交流中55%的情感和态度来源于面部表情,这能极大地解放交互的维度。第二,它可以IP化,比如把钢筋铁甲的机器人附上仿生皮肤,它就能变成各种各样的角色,游戏角色、电影人物,或是你喜欢的虚拟伴侣。虽然此前高校有很多相关研究,但一直未能进行合理的工程化。我相信依托中国先进的制造能力和供应链,我们一定能把这件事做成。
人形赛道太挤?
他们选择“上天”或者“脸”
孟醒:二位都是学霸,也是《Science Robotics》的常客,发表过很多文章。其实如果选择做更主流的方向,对你们来说并非难事,为什么会选择这样一条看起来跟主流行业“反共识”的道路?你们是如何考量的?
高飞:首先,关于为什么做飞行这个方向,简单一句话就是,我就想做。如果每个人都有宿命(Destiny)的话,这就是我的宿命。大家看我的名字,高飞,我就该做这个。我从小的愿望就是开飞机、当飞行员,虽然很遗憾没当成,但在浙大读本科时我就开始研究四旋翼,当时四旋翼才刚刚兴起。后来读博、在浙大当教授,我也一直在攻克从单体自主到群体自主飞行的课题,因为我真的很想做这件事。
当然,创业前也有人劝我做人形机器人,毕竟我在圈内还算小有名气。但我还是决定坚持初心。此外,在具身智能的时代机遇面前,我认为可以用新的、向下结合实体的AI技术,把以前的机器人全部重做一遍。其本质是让机器人变得通用,从Machine(机械)到Automatic Machine(自动化机器),再到Autonomous Machine(自主机器),最后进化到我们这一代的Intelligent/Smart Machine(智能机器)。这是一个巨大的机会,对于无人机和飞行机器人同样如此。既然既是机会又是梦想,选择就很简单了。
孟醒:我多问一句,在这个方向上不可避免会被问到一个问题,就是跟大疆的区别是什么,我相信你被问过很多次,能不能给大家解释一下,你是怎么看待跟大疆的对比的?
高飞:首先,我不认为我们和大疆是竞争对手,或者说现阶段我们也还“不配”对吧。从本质上来说,我们做的是“飞行具身脑”,包括大脑、小脑和群脑,目标是成为一家更平台化、横向赋能的公司。这和大疆面向航拍、摄影,以影像为主业的飞行器有很大不同。我们希望给各行各业赋能,而不是在具体的影像垂类里和大疆竞争。
从另一个角度看,即便未来面临竞争,我觉得坦然面对就好。如果因为一座山很高,我从第一天就害怕,那我就完全放弃了登山的希望。我很喜欢王阳明的一句话:“山高万仞,只登一步。”大疆确实是一座万丈高山,但我只需走好眼下的这一步,把技术做好,把产品做出来,去打开属于我们的市场。
孟醒:宇航呢?
胡宇航:我今年6月刚博士毕业。读博期间我尝试了各种AI与机器人结合的课题,做过足式机器人、机械臂,还有现在的人脸机器人(唯一没做的是无人机,因为纽约禁飞)。我每尝试一个课题,都会思考它的商业化路径,并去构建一个MVP(最小可行性产品),人脸机器人这个品类是我认为在商业化上有很大想象空间的一件事。
在不同尝试过程中我发现,数据是最大的瓶颈,虽然模型参数可以无限堆叠,但数据才是Scaling Law生效的必要条件。机器人领域避不开与真实世界的交互,这就导致Sim-to-Real(仿真到现实)存在巨大的鸿沟,仿真数据很难直接在现实中部署。
回顾机器人的不同品类,足式机器人相对可控,它只跟地面交互,只要做好地面建模和身体动力学(Dynamics)适应即可。Manipulation(机械臂操作)就很困难,因为它需要接触各种未知的物体,可能是液体、柔性织物,或者是视觉上具有欺骗性的物品。这种复杂的物理交互(Physical Interaction)导致训练数据极难获取,作为商业化的起步点其实非常艰难。
但人脸机器人完全不同。它几乎不需要物理接触(Collision),也不涉及复杂的摩擦力或接触动力学。它的交互维度——眼神、视觉、听觉、语言内容乃至表情,完全可以通过纯数字信息(Digital Information)来训练。这与当下大模型所能处理的模态是高度一致的。因此,我认为在人脸机器人这个方向上,我们更容易获取海量数据,从而跑通Scaling Law,培育出实体机器人的“GPT时刻”。
这也是我选择此领域的原因,我的导师一直教导我们不要做“短平快”的工作,要去探索蓝海。人脸场景在强化学习、深度学习及多模态领域曾是一片空白。去年我们在《Science Robotics》发表成果时这还是个小众赛道,但现在已成为新的科研热点。就像当年的Locomotion或无人机一样,这是一个全新的学术生态。
孟醒:最大化数据迭代的优势,最小化物理障碍带来的影响。
记得今年3月我去美国时,正好有机会去宇航的实验室,看到了这个机器人,当时非常震撼,睁眼的一刹那让我感觉极具科幻感。但在我们决定投资后,初期很多人的反应大多是困惑,只有一个头没有身体,它能干什么?到了六七月份,风向完全变了。大家开始疯狂出主意:做IP、做游戏、做电影、做虚拟歌星等等。我想知道,你自己是否也经历了这样一个过程,从不被理解到想象力爆发?
胡宇航:确实,最开始大家都质疑这东西难以商业化,不知道能用来做什么。后来当我们发布了一些很酷的视频后,各种方向都涌上来了。当时老股东跟我说了一句话,说你现在面临的最大挑战,是在这么多选项中,做出最正确的那个选择。
给AI“卷王”们造硬件
孟醒:跟两位在早期交流中,关于“做什么”这个问题,我觉得都不约而同地提到了宇树。宇树早期做了相当长一段时间的科研市场,积累技术能力,服务于研发需求最高的群体,然后再拓展商业化场景。回过头看,半年前的这个思考,在今天是否有迭代?是否发现了新的场景?
高飞:我们创业之初就确定了技术路线:在无人机这个相对成熟的本体上,用大模型展现推理决策能力,用端到端的小脑展现极限运动能力,用分布式群脑实现多体协作。除了小脑能让它飞得很快之外,其他两点在当时确实没想清楚具体的商业应用。
所以我当时和醒哥交流,提议是否可以参考宇树的路径:先做科研教育市场,搭建生态。我们提供基础能力和部分开源模型,让高校院所的用户去发挥想象力,帮我们做Demo、做场景验证。现在回过头看,我非常感谢醒哥当时的提醒:“不要做着做着变成一家教育公司。”我觉得很对,科研教育对我们而言是一个阶段,或者说一种手段,而不是最终目标。我们的核心还是要注重平台性,利用科研市场繁荣生态,但不能止步于此。
胡宇航:我可以从两个点来讲,一个是对于客户,还有一个对是公司。
对客户而言,我们发现这是一个痛点。我是高校研究背景出身,学院派做Robotics离不开EE(电子工程)、ME(机械工程)和CS(计算机科学)。现在做AI算法的主要是CS学院,但让CS的人搞定Hardware(硬件)是非常痛苦的。宇树的切入点很精准:当RL(强化学习)兴起时,CS领域的人需要验证Policy,宇树把四足机器人的本体做到了极致,让CS研究员可以直接进入底层控制训练模型。
我们在思考,下一个科研“卷”的方向在哪里?做AI的人都是“卷王”,每年要发大量顶会Paper。我自己也是审稿人,我发现HRI(人机交互)领域的论文,大部分硬件能力很糟糕,导致缺乏标准的Evaluation(评估)或Benchmark(基准)。首形科技可以提供一个非常稳定的硬件平台,解决这个问题。而且,人脸机器人的模态(视觉、听觉、语音输出、眼球运动)与今天主流的多模态AI完美匹配,非常适合数字人相关的研究任务。
对公司而言,我们需要一个开放的生态来吸纳人才。今天在市场上,你根本招不到一个“做过10年人脸机器人”的工程师,因为这个工种以前不存在。通过进入高校科研市场,我们可以培养未来的开发者。当学生在PhD期间使用我们的产品发了论文,他们毕业找工作时就会优先选择首形,这样我们就可以建立了公司核心人才的正向循环,越多的产品进入高校,就有越多经过验证的人才进入公司。
百万粉丝博主
孟醒:对于创业公司而言,讲好故事也是一项重要能力。这方面宇航也很特别,全网拥有200万粉丝,而且大部分是在读博期间积累起来的。恰好你做的产品非常前沿,它需要一个平台来展示,而这个展示的过程又反过来赋予了你平台机会。能否分享一下,你是如何思考自媒体与传播这件事的?
胡宇航:对,我觉得新媒体时代,包括抖音等流媒体给了我们渗透各行各业的新机会,就像AI技术本身的渗透一样。当时流量最大的平台是抖音,它的逻辑与传统媒体不同,更在意前三秒的注意力机制。它也不再单纯依赖热点榜单或好友推荐,而是基于算法,如果你前三秒没抓住观众,他们就会划走。我在读博的课余时间研究,逐渐摸索出了这套自媒体逻辑。
这对我们而言也极大地降低了宣传成本,我们最火的一条视频播放量超过6000万,现在可能已达7000万,直接冲上热榜第一,而且流量也带来了一些上下游合作以及人才招聘等机会,很多人是看了视频后主动找到我们想要加入的。
这也改变了我对“社交”的理解。以前觉得朋友多路好走,要多参加Social,但进入学术界后发现,真正同行的人很少,大量社交是无效的,社交属性变了,不应该是主动去Pitch别人,而应该主动曝光,吸引到一些连接。对你的内容感兴趣、对你创业方向认可的人自然会靠近,而不感兴趣的人自动离开。对我来说,自媒体是一个很好的社交工具。
孟醒:把人吸进来让他们自己寻找,比主动外联更有效,当然前提是要做一个足够好的产品。
我也想问问高飞关于招人的问题。可以说你不仅是在跟无人机公司竞争,更是在跟所有机器人公司、甚至科技巨头争夺人才。做强化学习或机器人算法的人才,能力是通用的,竞争对手往往钱更多、名气更大,作为一个初创公司,你是怎么搞定这些核心人才的?
高飞:我们在招人上确实面临激烈的跨界竞争,我也在招人这个事情上投入了比较多精力。我觉得在团队早期,寻找自己能力拼图之外的人非常重要。
我有两个核心策略:第一,真诚是永远的必杀技。我曾经为了招一个强化学习的人才,去了三趟上海,虽然最后他没来,我很伤心,但这个过程必须要有。第二就是寻找拥有共同梦想的人,举个例子,今年10月我亲自去几所高校做校招宣讲。反响最热烈的不是我的主场浙大,而是西工大和北航。因为这两所学校的学生天然喜欢飞行,是因为喜欢飞机才选择了这所学校。
虽然很多对手比我们资源多、名气大,但我相信全世界有很多孩子和我一样,有一个飞上蓝天的梦想。我只要找到那些技能达标,且目标与我们高度吻合的人就够了。这部分人其实并不少,关键在于我们要努力挖掘。
孟醒:你刚才提到了西工大和北航的学生对飞行天然有热情。在你招人的优先级排序中,这种热情或愿力,相对于能力和经验,你会怎么排优先级?
高飞:这跟公司阶段和行业阶段也有关。比如今年所有机器人公司都在招强化学习和具身智能的人才,但大家发现非常难招。因为这是一个太新的方向,几乎没有“科班出身”的人,大家本质上都是Freshman。我们不是做传统的无人机本体,而是做里面的AI,这在近两年才刚刚起步。所以这个阶段我会适当降低对经验权重的考量,更看重自我迭代能力和独立思考能力,另外就是愿景的契合度。我希望团队是“小而精”的。只有当大家的梦想和目标高度一致时,战斗力才是最强的。
“弹药”远超预期时的克制与扩张
孟醒:两位在过去这一年里,你们融资的速度都远超预期。我记得最初和高飞聊时,我们觉得融一笔启动资金就足以把事跑通了,但实际规模远超当初的规划,面对这种巨大变化,你会如何调整产品节奏和公司战略?
高飞:首先融资确实带来了底气,更带来了挑战,如何高效地分配资源。我现在体会到“多多益善”这句话其实不是每个人都能轻易说出口的,真要驾驭庞大的资源其实并不容易。
有了更充足的容错空间,我们的打法自然也会发生了变化。具体来说,我们加大了对基础模型、数据采集及训练设施等“基础设施”的投入。这让我们能打得更加“高举高打”:如果资源有限,我们只能精打细算,死磕单一场景的PMF(产品市场匹配),然后再一点点推广,但在具身智能这个高速发展的赛道,为了抢占技术身位,我们需要利用资金优势,赋予产品更强的普适性,从而覆盖更多场景。
胡宇航:我很认同高老师的观点。另外我认为融资优势还体现在战略壁垒的构建上。
国内市场的竞争非常激烈,模仿者的嗅觉也很灵敏。往往我们的新内容刚发布到网上,连拍摄手法和配乐都会被迅速复制。在这样的环境下,充足的资金能让我们快速展示“肌肉”和调性,确立行业引领者的位置,以及也可以吸人更多人进来。
孟醒:资本既是资源,有时也是一种干扰,可能会扰乱我们的节奏,或者在资源过剩时,让我们因为“能做”而去做很多本不该做的事,这在历史上屡见不鲜。你们是否有过这种因为资源充裕而动作变形的时刻?或者说在面对巨大资源时,你们有什么机制来确保决策的纪律性?
高飞:我们团队在做大的决策时,我会让反对的声音先出来。我觉得可能在团队里,因为我是创始人,如果我先开口,我的观点往往权重过大,容易带偏大家。所以我通常会刻意后撤,先不表态,让那些喜欢“唱反调”的同事先发言。等所有批评意见都充分表达后,我再进行平衡。这套方法能有效中和我不自觉的激进想法,到目前为止这套方法的效果还行。
胡宇航:虽然融资顺利,但其实我们拿的钱并不算多,策略始终是“小步快跑”。我们依然按部就班地推进MVP(最小可行性产品)和技术攻关,绝不会因为账上有钱了,就去换大办公室或盲目升级设备。我们的原则很明确,每一分钱都要花在刀刃上。
具身智能是泡沫还是前夜?
孟醒:最后想问一下两位,如果具身智能不是泡沫,你的理由是什么?
胡宇航:作为理想主义,我肯定觉得应该不会是泡沫,大家都应该有机会。但现实看来,技术上确实还有很多未收敛的难点,数据标准未统一、传感器存在瓶颈,甚至连最基础的实时语音交互和高精度的任务控制都还没完全解决。
但我认为,泡沫退去后会有真正的价值沉淀。现阶段我们利用资本热度攻克核心技术,如果未来泡沫破裂,我们会寻找更落地的“沿途下蛋”的场景,保证现金流的健康。
高飞:我并不认为这是一个泡沫,作为机器人行业的从业者,我觉得这是一个巨大的时代机遇。机器人行业发展了几十年,起起落落。从2000年的机械臂,到2010年的扫地机,再到2015年的无人机和自动驾驶,虽然它们都能Work,但离我们梦想中能与人共存的“通用智能机器人”还相去甚远。
具身智能的本质,就是给机器加上AI,让它从“专用的自动化设备”进化为“通用的智能Agent”,往大了说,我们不是在Reinvent(重新发明)机器人,而是在Redefine(重新定义)机器人。核心在于“通用泛化”,这在技术愿景上是完全可落地的。对于像我这样从传统机器人转做AI的人来说,这个机会我们等太久了。所以我觉得这不仅不是泡沫,目前的投入和关注度反而还不够。"
作者:恒盛娱乐
新闻资讯 News
- 羊毛入衣橱:设计如何让天然纤维...12-24
- 美国无人机禁令:以安全之名,封...12-24
- 地方国企做市场化业务:必须坚持...12-24
- “集体降智”的本质:信息茧房里...12-24

