对话顾嘉唯:售出千万台,卖爆618,他却说“只想做下一代AI终端”
对话顾嘉唯:售出千万台,卖爆618,他却说“只想做下一代AI终端”
618期间,一款刚推出不到两周的儿童AI硬件登顶了京东婴幼童玩具618累计竞速榜首。同样在榜的,是频繁刷屏的 Haivivi ,以及朱啸虎投的Fuzozo。
这款卖爆了的产品叫“小方机”,是顾嘉唯最新的AI硬件终端,刚刚在六一儿童节期间推出。产品开售前一天,我和他的一位同事聊天,她告诉我,今天太忙了,首发全售罄,忙着备货,每天被骂。
这并不是顾嘉唯的第一个爆品。在圈内,他职业生涯最早的标签是 “技术天才”。
微软研究院、百度人工智能研究院,28岁入选百度“少帅计划”,深度参与 Windows8、Xbox Kinect 、百度无人车、图像搜索等重大创新项目,主导过BaiduEye 智能眼镜、DuBike 智能单车、DuLight、FaceU 脸优等前沿产品研发。
2016年,他离开百度,带着一款“会读绘本的猫头鹰”阅读机器人 Luka 卢卡,用深度学习打造的无屏触控技术,在桌面上构建起孩子与图书知识之间的互动。
在“大模型”这个词还没有火的时候,打开了 AI 走入儿童家庭教育的可能性。目前,Luka 卢卡已卖出近千万台,遍布18个国家。2023年,顾嘉唯重新创业,创办灵宇宙,并快速完成三轮融资。“小方机”,依旧面向孩子,也依旧不靠屏幕。用顾嘉唯的话来说——这是一款 AI Native, Voice First 的智能终端。
他认为,这一轮 AI 涌现出主动意识、拟人感和长短期记忆的智能体之后,就不再需要人去适应技术,不再以设备为中心,转而以世界为中心。随即将 AI 从“屏幕后的服务”,变成了“现实世界的共生体”。一句话概括:AGI 正在从数字世界通往物理世界。
如果说,过去他所打造的Luka卢卡是陪众多家庭的孩子“读万卷书”,那Ling灵宇宙的”小方机“则是带更多孩子“行万里路”。
图说:左边为 Luka 卢卡,右边为 Ling 灵宇宙 AI 小方机
从产品形态上看,“小方机”尺寸不大,挂在脖子上,拥有达尔文、爱因斯坦、马斯克、苏东坡、曹文教授、狮子老爸等众多角色,成为孩子身边的“超级学伴”。核心亮点是其facetime功能:AI学伴可以实时接收视频流,像打视频电话一样”看见“现实世界,随时回答孩子们“这是什么”、“为什么是这样”。但并非爽文。从微软、百度到灵宇宙,这并不是顾嘉唯故事的全部。
微软研究院时期,顾嘉唯的研究领域叫做 Tangbile & Embodied Interaction “可触摸实体和具身交互”,为的是打通虚实世界做可触摸有实体的人机交互,包括 Haptics 触觉、手势体感等。但那时他所做的大多技术原型都比时代早了好几步,也因此在当时多半没能走入主流市场。二次创业创办灵宇宙前,他又经历了背后上市公司出事,背上几亿连带债务,房子抵押,MBO管理层回购自救。那时候他们的办公室现在是泡泡玛特总部,当时光办公室装修就花了2000万。
但在他眼中,这些都是宝贵的“认知财富”。
他挺过来了,也变了。
而从“读万卷书”的Luka卢卡到“行万里路”的小方机,看似产品延续路径背后,也实则是一套思维模型的逐步落地。顾嘉唯认为,硬件不是目的,技术也不是卖点,人工智能真正稀缺的是交互方式和数据闭环,是“世界模型的入口”。他并不想造一个“更好用的早教机或是学习机”,而是要成为“孩子们的第一个AI伙伴”,打造“面向下一代的AI终端”,“一个类似电影《Her》中展示的产品”。而这条路,他从十多年前在百度尝试 BaiduEye 这个项目就已经开始。
因此,与其说他在做儿童产品,不如说他在以孩子为起点,去试图定义下一代的交互范式。他说,产品不是终点,终端才是。Luka 卢卡、小方机,对他来说,都是这个终端生态的一部分,是他构建“物理世界 AI-OS 智能操作系统”的起点。他提供了一个简单的比喻:想象一下,如果每个人都拥有一台能说会道的超级 AI 智能终端——一台比每个人类知道得更多、计算得更快、无所不知、无所不能、无所不在的新型 AI 计算机,在身边作为“第二大脑”,我们的生活和工作会是什么样子?顾嘉唯清楚地知道:他要的不只是一个爆款产品,而是一个能承载未来的智能人机交互底座。
图说:顾嘉唯正在演示灵宇宙 AI 小方机
和顾嘉唯见面时,已经是晚上8点。谈话开始前,他刚结束和一个客户的视频会议,手里还拿着一台用来演示的小方机。顾嘉唯正在演示灵宇宙 AI 小方机他说,“你真上手体验后,就会显而易见地发现 ta 和别的不一样。”谈话后半段,临近9点,他才吃上晚饭,一边吃,一边讲着他的逻辑。他投入,或许不是因为对风口的迫切,而是他知道,这次,他离想要的答案,还差一点。他必须再试一次。
以下为网易科技《态度AGI》栏目与顾嘉唯的交流,经不改变原意的编辑
我经历过房子抵押、MBO自救的阶段
网易科技:我看你们以前叫“物灵科技”,现在叫“灵宇宙”,是改名了吗?
顾嘉唯:不是改名,是进入重新创业的新阶段。十年前我们最初的理念是“万物有灵,人机共生”,你们看到柜上的那行书法字,还是当年一位我很尊敬的长者写的。这块牌子曾经就挂在我们在浦项中心顶楼的办公室里,那里曾有望京最高的“万物有灵”咖啡厅在我们的“共生广场”,如今那个地儿变成了泡泡玛特的全球总部。
过去几年波折,我们也换过好几个地儿,今天你看到它在这儿静静地杵着,就像一个信物,默默见证了我们涅槃重生的全过程。我们从做Luka 卢卡开始,一路走来,已经实现了千万台设备,进入了大约400多万个家庭。你也看到办公室放着各式各样的家庭机器人的探索,我们是家庭陪伴机器人真正从早期就定义品类的玩家。
在 Luka 卢卡出来之前,都是语音交互的屏幕和娃娃身子的产品。现在市面上的产品,带摄像头扫描桌面可以搜题可以查词的各类学习机早教机,其实都在跟进我们的思路,是我们所定义产品,被拆解、复制的组合体。
我一直强调,我们做的是定义下一代 AI 终端的工作,从不做追随者。无论是在微软还是百度,我一直在做的是面向未来五到十五年的事。创业后,我任务就是带着“望远镜”的远景和“显微镜”的执行。
网易科技:“小方机”这个产品是从什么时候开始做的?
顾嘉唯:从“Luka 卢卡”之后我们就开始做了,其实已经做了好几年。这期间背后上市公司出现问题,也对我们有比较大的影响。但今天的产品定义,跟当年早期版本比还是有挺大的变化,毕竟今天 AI native 智能原生的底层大模型时代是最大的新契机。
当年 Luka 卢卡得益于 AI 计算机视觉的技术红利,从一众语音对话机器人之列脱颖而出,今天各式各样的陪伴机器人都是让手办潮玩、毛绒玩具开口说话,其实马上这个市场就会经历一个恶性竞争阶段和残酷的洗牌过程。
而我认为,所有模态都会达到类似的“低垂果实”程度,之后就进步缓慢,逐步拉齐,目前视频追上了文字,后续具身智能机器人也会追上。
所以我的思路是,在技术逐步收敛期,要做长在技术延长线上的容器属性的智能终端,而不是一个一个容易被技术迭代淹没的产品。
网易科技:背后上市公司出现问题,当时是什么情况?
顾嘉唯:说白了就是我们背后的上市公司资金杠杆出问题了,老板进去了,我自己都有几个亿的无限连带。那段时间我把房子抵押出去,团队能一起扛过来,是最大的福分,用朋友的钱一起做 MBO,就是为了救出公司。还好当时还有“Luka 卢卡”这个产品在撑,保证了公司基本盘运转。那几年我算是“消失”了,其实都在救公司、做重组。如果当时公司没出事,我可能早就把上面说的事做起来了。
但也不是坏事。今天到了更好的 timing。况且,年轻时候踩坑,总比晚踩强。
网易科技:当时16年你从百度出来创业没有从一级市场拿钱吗?
顾嘉唯:对,第一次创业没拿一级市场的钱,我们是直接跟上市公司一起起盘的。
为了创办物灵科技这家机器人 OS 公司, 2016年那时候我们从二级市场定增中拿出3个多亿投美国机器人本体公司,为了做机器人操作系统。
因为当时国内没有好的机器人本体,我跑去大洋彼岸看遍了当年北美高校各家 DARPA 资助的人形机器人16家研究机构,最后投了包括现代机器人之父 Rodney Brooks 的公司 Rethink Robotics 在内的三家机器人本体, 4个多亿投入做人工智能深度学习和机器人相关的研发投入。
我们那时候的办公室现在是泡泡玛特总部,当时光办公室装修就花了2000万。
但这也是为什么我现在做事谨慎务实,因为我经历过资本膨胀的年代,也经历过暴雷、兜底、重启的一整个周期。
网易科技:为什么重新创业会选择做“小方机”?是因为有大模型的出现吗?
顾嘉唯:首先我一直在坚持这个方向,大模型的成熟只是让这件事变得有更高的天花板了。
其次我们的产品不仅是做给小孩或者年轻人的,我们原来也做过针对各种人群的家庭陪伴机器人。初心从我创办物灵科技开始就没变过, 只是选择了一条“南坡”路径,跟大多数直接干人形机器人的公司,长得很不一样。
这次我们做“小方机”,核心是为了打造一个家庭机器人所必须的家庭场景和人机活动场景的数据闭环,通过第一视角的智能体,把用户在真实场景下操作动作的过程记录下来。
因为当前我们真正缺的,不只是末梢抓取和运控的通用泛化能力,更重要的是人类在现实情境中如何行动,空间、物体、动作、行为的数据。
特别是类似大语言文本模型中“predict next token”,接下去在真实世界中如何推理“下一步”行为任务的通用能力的数据还远远不够。
“Luka卢卡”“小方机”都只是这阶段落地的最佳形态,目标一直是数据
网易科技:收集数据?这是一个怎样的逻辑?
顾嘉唯:这个逻辑其实就像特斯拉造车一样,造电动车只是中间过程,打造 FSD 终极目标是自动驾驶。
而小孩就是唯一真正会在物理世界中自由探索的个体,他们不只会和各种人发生互动,智能体可以引导孩子同世界持续交互。
有篇论文尝试让小孩头上戴一个GoPro头盔去记录3到8岁的所有行为过程,让这些数据涌现智能,出现了出奇的效果。
但这样的实验环境很难搭建,现实中你不可能让孩子一直戴着GoPro。所以我们需要一个真正能让孩子愿意使用的产品。
我一直在做的就是这件事。十年前在百度的时候就已经在做相关工作了。这只是一个用来收集数据的价值终端,我们一直没有偏离这个方向。
网易科技:那为什么不做AI眼镜呢?如果要采集数据的话,眼镜不是一个很好的终端吗?
顾嘉唯:从微软研究院到百度研究院,智能眼镜我也做过挺多代,无论是带光机显示的 AR 眼镜 HoloLens,还是只有摄像头的 AI 眼睛 BaiduEye,而在大模型时代它其实作为主要载体,数据的价值刚刚开始,也是为了采集人在物理世界里是怎么操作事物完成空间的过程。
“具身智能大脑”真正缺的是这种数据,不是别的。你靠互联网视教远程操控或者仿真模拟,是无法获取到真实有效的数据的。
关于家庭机器人的技术发展,我们其实是在沿着两条主线持续推进:
第一条主线,“第一视角人生数据闭环”的采集路径。这条路径我从过去做到现在从未变过。
以前Luka卢卡收集的是桌面上的交互数据,现在我们收的是整个真实世界(物理场景)中,孩子和环境空间交互的数据——孩子每天怎么跟世界交互、在什么情境下产生了什么行为,我们都能收集。
你可以理解为我们在构建一种全场景、全交互的“世界输入层”。未来世界的交互入口,不再是APP,而是你和世界本身的连接方式,我们就是在定义这个连接。
第二条主线,“第三视角数据”的采集路径。比如现在的 Luka卢卡,它不仅能跟用户进行 桌面级的互动,还可以加装手脚、轮足、机械臂,实现写字、画画、抓取道具等能力。用户可以与之进行更深度的物理互动。
小方机也在做这件事,它是以AI角色的方式陪伴孩子,用具备“主动意识”和“长短期记忆”的“拟人化”角色,作为观察者,在一天的日常生活 lifelogging持续采集孩子的行为轨迹和成长过程。
首先,下一个 AI 终端一定是新的交互形式。
因为人机交互的发展路径已经很清晰——从客厅里的大屏幕,到桌面屏幕,再到口袋里的手机屏幕,最终一定走向“invisible 无形”。
当屏幕消失之后,下一代计算终端只有两条路:一是比特交互为主的极致随身化、小型化个人计算设备;二是原子交互为主的具身智能,能操纵真实世界的机器人。
所以你要么走可穿戴终端的方向,把 AI 能力越来越贴近人;要么直接走到“机器人”的路径,让机器替人去物理世界。这两个方向,也是我始终围绕在做的核心。
网易科技:为什么要沿着这两条路径走?底层逻辑是什么?
顾嘉唯:其实这两条路径的目的,都是为了解决当下最大的问题:物理世界里的空间交互数据非常稀缺。
现在,文本、图像类数据,其实已经相对完善了,但物理世界里的行为数据还没有被系统性地采集,这正是通向 Physical AI 具身智能大脑最大的不确定性所在。
人类也好,人形机器人也罢,要实现通用泛化的动作、习惯、任务的调度与预判,全靠这些空间交互行为数据。
没数据就没智能。所以我们这两个路径,本质上都是在为AI构建下一代的行为世界模型——你怎么行动、接下来会怎么行动,这些都是靠真实设备在最有价值的场景中收上来的。
这两种维度的数据,一个是观察人怎么操作物理世界,一个是作为“人”的延伸去感知世界。它们是建立世界模型最需要的数据,最重要的是,这里需要的数据量级。现在没有哪家公司能像我们这样,通过大规模实打实铺设备、收数据的方式,走出闭环路径。
我认为,当下我们的思路是在构建具身大脑路径中拿入场券、拿门票。因为具身项目目前都需要一步步的迭代且落地周期都相当长,短期要找场景能闭环商业化的“家庭陪伴”是一条路径,有机会从产品失效成本低的简单场景搜集数据,逐步迭代到复杂场景。
当时我们物灵科技做各类服务机器人,有商业用途的也有家用的,除了桌面机器人,还有能在屋子里跑,也能在室外活动,是为了补全视角与交互的类型——但那时候技术条件还不到。现在不同了,时代到了。
外界总以为我在做的是“Luka卢卡”那类C端产品,实际上,C端只是落地的形态,背后的目标一直是数据,构建世界模型的终极数据闭环。
网易科技:你刚提到,要做定义下一代的产品,“小方机”如何定义下一代?从 Luka卢卡到小方机,这其中的思路是什么?
顾嘉唯:其实从桌面交互延伸出来的路径,我们做了很多年,也经历了不少波折。
现在我们重新定义好 AI 终端,服务好这个我们熟悉的人群和产品形态,我们的优势在于交互和软件操作系统,我们其实并不是一个设备公司,软件交互定义硬件设备,这是我们在这个 AI 时代的定义。因为我一直相信我在做的业务,硬件只是手段,软件才是目的。通过硬件守住用户场景,软件积累价值数据。
硬件形态上,你看过电影《Her》吗?我们的理念就是那个形态,核心不是耳机,而是一个具备实时互动能力的智能体。
下一代的手机形态,可以手持,也可以在胸前摄像头看得见眼前的实时场景,这是2013年电影设定的2025年人类跟 AI 操作系统 OS1如何共生的剧情。
就像你刚才看到的 demo,我在物理世界中向你展示的那些互动场景,那就是我们所定义的随身角色,一个在你身边、实时与你交互的智能助手。
网易科技:所以这也是我们挂脖设计的出发点吗?第一视角的交互方式,就像《Her》里的体验一样。
顾嘉唯:对,这就是我常说的,AI 发展的路径里,只有在目前从智能体 Agentic AI 往物理世界 Physical AI进化的结构性节点上,才有可能诞生“原生设备( AI native device)”的新机会。
以前我们只是把AI叠加在手机、电脑等已有设备上,做一些效率提升的事情。但只有当AI成为一个独立的交互介质,才能诞生新的品类。
现在去正面跟手机、眼镜竞争其实很难短期成就独立计算终端,比如电池续航、场景限制等问题。而我想要做的就是下一代 AI 独立计算终端,可以插 SIM 卡,可以独立运行,那我就要找对细分市场,垂直人群的应用场景。
我的观点是,手机为中心的个人计算范式还会有一长段时间,眼镜耳机这些品类本质上属于手机应该去做的配件,一旦你证明有PMF(Product-Market Fit,产品市场匹配),大厂自然会快速跟进。
但正因为如此,这块领域不是一个对创业公司友好的地带,门槛高、窗口期短,很难有持续优势。所以这条路我们没有选择。
更大的背景是,这一轮的大模型智能体就是“人”,传统由人来做的事,被“人”替代了——也就是由Agent来替代真人服务。
这使得重运营成本的服务转变成产品解决方案,毛利结构也迅速变化。
以前的服务构建需要大量人力,成本高,毛利低。而Agent的加入,让成本下降,毛利提升,同时商业模式也发生了进化。现在越来越多的人是买产品来获得服务,而不是单独为服务付费,最典型的例子还有疫情双减后的教培行业跟学习机的关系。
“交互方式的变革”只能从新一代开始,小方机是孩子的第一个AI朋友
网易科技:这就涉及一个“卖给谁”的问题。“小方机”的用户人群是怎么样的?
顾嘉唯:是的。我们这代人小时候是穿鞋套进机房的,我们当时用的 IT 产品,是微软这些老品牌服务我们的产物。
可今天主流的应用,已经不是我们用的那些东西了。你看看00后,甚至10后、20后在用的产品,你可能一个都没听过。
而现在,我们的用户人群结构已经变了,事实上每一代信息产品到智能产品,回顾 snapchat、insgram、tikok 等,都是从更年轻的人群开始渗透,且年龄越来越低。
因为“交互方式的变革”只能从新一代开始。新的交互方式,比如像Her(电影《她》)里的那种与AI情感交互,必须从智能时代的原住民那里开始。所以我们选择儿童,是因为他们才是真正会使用、习惯并期待新交互方式的一代。
人口学中把00-10后称为“阿尔法世代”(“Generation Alpha”)。
所谓“阿尔法世代”用户,指的就是智能时代的原住民,我们的产品就是为这拨人设计的。另外像95后这代年轻家长,他们作为客户,天然接受新形态产品, 期待孩子有个哆啦 A 梦陪伴成长。
我们会持续深耕这一人群,先从0-15岁儿童到青少年阶段入手,这部分我们已经建立了一个足够大的用户基本盘——接近千万的设备,积累了大量的用户数据。
此外,我们发现,美国60岁以上的老人也在玩我们的产品,所以用户的年龄结构其实也会不断拓展。 “交互方式的变革”只能从新一代开始,小方机是孩子的第一个AI朋友。
向上的话,我们将从儿童成长延伸到15-30岁的年轻人、宠物经济,以及30-50岁父母的育儿家庭带娃场景。再往下我们会覆盖到老年用户的养老场景。
另外,从数据的角度来看,如果你没法伴随一个人的成长,那就不可能数据化这个人。而新一代的 AI-OS 原生的消费科技公司肯定是完全长在人类的全生命周期的数据之上的。
当年是像LG这样的财阀型公司,它们能做一整条产业链,从一个纸杯到一艘航母,产品覆盖全年龄段全产业链。
但今天的智能时代不是这样。今天能不能占住用户的心智、能不能获取跨代际人群的数据,要靠你从“第一天”开始就拥有数据闭环的能力。
这是我给今天的AI时代公司下的定义:拥有数据起点,才能构建真正的用户价值。
网易科技:聊回“小方机”本身,它的市场定位是早教机这样的产品吗?
顾嘉唯:传统上最大的两个品类,一个是早教机,主要面向学龄前的小朋友,另一个是学习机,偏向6岁以上孩子的刷题和考试准备。
我们现在的小方机,其实是一个全新物种,它的定位是“孩子的 AI 手机”——每个孩子都应该有一个属于自己的“ AI 手机”,只是过去没有合适的设备来承担这个角色。
要知道今天的孩子身边一堆设备,桌上的学习机、故事机,口袋里的听力机、单词机,手腕上的电话手表,孩子太累了,今天是最好的时间可以实现 all-in-one 集合了多种功能于一体的 iphone moment 出现了。
儿童手表也可以算是上一个周期的“孩子手机”,它的底层逻辑是通信,是家长“找孩子”。定位、电话、短信这些功能是刚需,后来才长出了孩子之间的社交网络。
但那是通信时代的产物,而不是智能时代的。而在今天,智能时代的终端应该有新的形态,小方机就是为这个时代设计的。
网易科技:那小方机起的作用是“陪伴”还是“教育”呢?
顾嘉唯:问题的核心是你怎么理解教育和陪伴。抖音本质上也是“陪伴”,孩子的安抚毯也是“陪伴”,共性是高频场景找的很准。
我们的小方机选择的高频场景,是“教育”,但我们不是传统意义上的 K12教育产品。
教育在我看来,是一个灵魂唤醒另一个灵魂的过程。我们现在用Agent(AI 智能体)去重构新的学习方式。
从 Luka 卢卡帮助孩子培养阅读习惯,到 Ling 灵宇宙激发探索世界的主动性,逐渐进阶到学习习惯,从 “知识灌输” 到 “动机唤醒” 的进化,这才是我们的目标。我们不是用来刷题、提分的学习机,那是上一代的教育逻辑。
很多人对“教育”的理解还停留在“刷题”“应试”,但 AI 的真正价值在于重构 “学什么” 和 “怎么学” 的底层逻辑。
因为大模型 AI 带来了无论从供给侧还是需求侧,最大的产业变革一定会发生在传统教育行业,所以“教育”这个词未来一定会发生变化,我们可能会参与其中的变革,但此刻我并不愿意用“教育”来定义自己。
比如你说“Luka卢卡”是不是教育?你说它是,它又不像传统意义上的学习机。它是在陪你读书,帮你养成一个好的阅读习惯。阅读能力的培养那算不算教育?
我认为小方机也是一样,是用“陪伴”的方式落地 AI 教育,在孩子的日常生活中建立起正向的学习路径,核心是焕活每个人的学习动机。
如果你把教育理解为“刷题”、“提分”,那小方机肯定不是;但如果你理解为“陪伴你更好地学”,那我们就是教育的一部分,而且是一种新的教育形态,新的学习方式。
举个例子,我们的小方机会看到一个风景水土然后启发孩子一起吟诗作诗。这不是填鸭式教学,而是文化熏陶与科学启蒙的自然发生,是 “一朵云推动另一朵云” 的唤醒过程。
我希望孩子可以在操场暮色下,用这台小方机穿越时空,与笛卡尔、霍金一起共同探索宇宙的奥秘。
灵宇宙AI小方机产品的核心价值是“世界是教室,万物是教材”,我们希望通过这次物理世界的大模型技术变革让孩子更多地探索世界,用大模型技术让孩子的每一次好奇心都不掉在地上。通过孩子与 AI 共生解决问题的过程,让普通家庭的孩子都能拥有改变世界的能力。
网易科技:要做到这些功能,需要很强大的长文本记忆能力,这部分“小方机”大概能支持到什么程度呢?
顾嘉唯:底层大模型已具备较强长文本处理能力,我们的核心是通过「知识库挂载」实现长短期记忆的有机结合。
我们一个很大的优势,就是历史积累。Luka卢卡时期我们就已经收集了大量的儿童语音、阅读行为、对话记录和成长轨迹数据,这些都通过统一账号体系无缝迁移当用户登录小方机,设备会自动加载其8岁前的成长记忆。
这就是“灵魂AI”的连续性体验——灵性不是抽象概念,而是通过 LingOS 操作系统,在不同设备与多智能体间还原出一个连续性的人机交互体验——我们叫“Ling!”,这也是我们定义的点物赋灵的一层实践的价值。
网易科技:用Luka卢卡的那些孩子,为什么需要再有一台“小方机”?
顾嘉唯:很简单,“毕业”了,核心在于“成长适配性”。
孩子年龄增长后,桌面端的电子萌宠式陪伴已无法满足探索需求,就像从绘本阅读进阶到户外实践。
我们用“读万卷书,行万里路”概括这种升级。
这两个场景,Luka 卢卡解决了知识输入场景,而 Ling 灵宇宙 AI 小方机通过语音交互与物理世界建模,承接孩子感知世界的需求。
从桌面阅读到户外探索,我们的双 AI 终端战略,恰好覆盖孩子成长阶段的两大核心诉求。因此,成长阶段到了,就该有一个新的品类来承接。这就是家长换产品的动因。
网易科技:从产品推广角度看,使用者是孩子,但买单的是家长,为什么家长需要一个小方机?
顾嘉唯:很简单,焦虑。家长焦虑的是:AI 时代来了,我的孩子接下来要学什么?怎么学?我有没有能力、没有时间陪他一起学怎么办?
而且很多家长已经意识到了问题,但他没有办法自己解决——那就需要新工具和新方法。
他解决不了孩子随时随地的“十万个为什么”,也无法每天抽出时间做知识筛选和陪伴,所以一旦你能提供一个真正好用的工具,他当然愿意买单。逻辑其实很简单:让孩子自主学习、解放家长时间,最终带来学以所得的效果,这就是我们提供的价值。
小方机给出的解决方案是:你什么都不用管,这个 AI 终端里已经装好了最好用的AI工具,实时的、异步的、能对话、能生成内容、能讲故事、能写诗、能答疑,等等全都整合在里面。
你给孩子一个普通手机,他可能刷短视频、玩游戏;但你给他小方机,里面装的都是为学习、成长、交流而定制的 AI 工具,而且用伙伴式交互的方式给出来的,孩子用了会爱上。
它不是一个简单的“教育工具”,而是一个成长陪伴的“智能体”,是孩子的第一个 AI 朋友。
你可以理解为,它是孩子的“Her”,但是从小伴随孩子成长、积累数据、建立信任的版本。既安全,又能成长,又能学习,还能陪伴。比Pad更聪明,比传统学习机更生动,也比手机更安心,最主要的不是以屏幕为中心,而是以真实世界为中心。
显而易见,ta 并不只是一个聊天问答机,而是一个具身认知 embodied 物理世界的陪伴。
网易科技:但是会不会有人疑惑,你刚刚提到的这些功能,现有的大模型工具,比如说“豆包”不是也能实现吗?
顾嘉唯:但你敢把豆包直接给孩子用吗?这是问题核心。
你去问每个家长,他们会说“我当然知道豆包能用”,但没人敢让孩子单独去用豆包。因为刷着刷着就可能跳到抖音了(笑),现在很多家长给孩子玩大人的手机,本质是无可奈何的“临时托管时间”,在家别烦我,出门别烦别人,只求换半小时清净,绝不会长期放心让孩子用。
我们希望国内孩子也能像北美家庭那样,没那么在意屏幕,主要是出门户外的时间多,跳出一平米书桌的苦读书。
实际上盯着书本久了一样伤眼,看书看多了也会导致近视,而小方机的核心优势,在于构建了 “安全边界 + 适龄内容 + 启发式交互” 的闭环 —— 它不只是通用大模型的儿童版,而是专为孩子设计的 AI 学伴。
除了我们精心打造的给孩子的 AI 工具箱,让孩子赢在 AI 的起跑线上,内容的管控和内容的价值是最核心的,还比如我们联合北外曹文教授和尚方舟一起共同倾力打造的沉浸式英文教学内容体系。
核心在于:豆包不是为孩子设计的,它没有安全边界和适龄内容筛选,更没有能够启发式思考链创造的循循善诱。
小方机就是要解决这个“信任”问题——它是一个专为孩子定制的、内容精良、安全可控的AI工具。
网易科技:在产品的安全性层面,小方机是怎么保证的?
顾嘉唯:我们做儿童类的产品已经很多年了,在这方面有非常深的积累。
在大模型的内容安全上,我们有三层防护:
第一层,是我们自己积累的技术栈做了大量的内容审查和过滤机制,从源头过滤敏感信息;
第二层,是接入了主流大模型厂商本身的合规备案机制,确保底层模型安全;
第三层,我们还调用了多家互联网巨头提供的儿童防护API,实时识别风险内容。
这三道防线已经能非常好地防止风险发生。
媒体喜欢渲染“AI风险”,这没问题,是他们的职责。但要分清现实发展阶段。像我在2014、2015年做AI时,那时候大家已经在讲《终结者》了,对吧?这些过度的负面想象,其实没必要放大。
隐私和信息安全当然重要,但不是不能解决的问题,只要方法到位,机制到位,就没有必要被负面情绪引导。我们不是在做虚无缥缈的未来产品,我们是做落地的、有用户、有使用场景、有实际反馈的东西。
这套体系经历过 Luka 卢卡千万级用户的验证,如果这个产品真的有问题,市场早就反馈给我们不断提升优化过好多轮了,我们也不是刚入行的新公司,经得起时间和规模的检验。
网易科技:我们的产品会在海外卖吗?
顾嘉唯:我们Luka卢卡一直有在海外卖,未来新一代的产品也会出海。
AI公司的价值,不能只是做个张嘴说话的玩具
网易科技:那进一步延申问,今天一个AI公司的价值应该是什么呢?
顾嘉唯:今天决定一家AI公司价值的,不是你能不能做毛绒玩具“活过来”,不是你能不能做个玩具张个嘴说话——能做这种的公司和个人开发者太多了。
真正有价值的,是那些既能打穿供应链,把产品落地铺出去;又有技术经验,能构建高质量数据集;还能基于这些数据,训练出自己的世界模型的公司。这样的公司极少数,非常稀缺。
所以,这事不是说你会大模型套壳、能做个demo就行的。你要把品牌市场、营销渠道、产品体验、内容 IP、供应链、后台架构、前端应用、数据回流、AI 建模等等,这一整套体系打穿,体验做完整,才逐步建立真正的价值。
我们团队的优势就是:每一个核心关键环节我们都能自己做,而且能做到完整可控。既要懂得 AI 技术发展的路径和边界,又要懂得 IP 文化内容和教育电子,还有对孩子成长陪伴有成功经验,这样的团队稀缺得很。
网易科技:其实在您准备创业那段时间,自动驾驶也很火。当时像您同期的余凯,就去做了地平线。您当时为什么没有选择做自动驾驶?
顾嘉唯:是凯哥拉我去的百度,推动Robin给了我“百度少帅”这个称号,带我进入了深度学习领域,也给了我很大的自由度,支持我做自己想做的事情,我一直很感恩他。
但其实我理解地平线做的是整个机器人产业的芯片。
做自动驾驶的公司也很多,像我身边以前的很多人现在都在 MOMENTA、文远知行、小马智行、驭势科技这些公司里。但我现在立志做的,是下一个“扫地机”这样的公司。
网易科技:那您当时为什么不做扫地机器人呢?
顾嘉唯:当时我确实面临一个现实问题。我们在做机器人生态的时候,我背后的出资方是一家 A 股超级白马股的上市公司。而当时董事长认为扫地机器人业务是“做回去了”的。
什么意思?那时候公司在二级市场上的市盈率是260倍,但扫地机行业的市盈率只有10倍。从资本市场的视角来看,扫地机器人被视为“回去了”。
所以那时候其实是有约束的。核心原因当年上市公司是大股东,公司的经营掌控权是有问题的。这些都是认知积累的宝贵财富。
但是,我说的“扫地机器人”,其实是一种类比,代表的是一种能自我造血、能卖出量、能真正商业化的产品路径。
我想做的是这件事,而不是那种长线投入、看上去融资很热闹的科研技术项目。因为融资只是短期热闹,最终你得用经营业绩兑现。现在你看整个具身智能行业,很多公司也是类似的情况,看着很火,但能否走通商业化还是未知数。
网易科技:那我们现在做的这件事,大厂不会下场来做吗?
顾嘉唯:你看看现在有哪些大厂在做?又有哪些做成功了?百度那强大为什么还会有小红书和抖音呢?
比如针对孩子这块,或者年轻人这块,有哪个硬件产品他们做成过?如果有的话,当年也不会有步步高、不会有段永平的商业传奇故事了,早就被大厂干掉了。
网易科技:那像学而思这类的在线教育企业呢?
顾嘉唯:学而思是做“严肃教育”的定位很清楚,就是K12赛道,是“正统教育体系”内的东西。
但我们做的不是K12教育提分应试,也不是纯粹意义上1平米书桌上的学习机。孩子的未来,不该交给书桌上的学习机。
我们灵宇宙创造的 AI 小方机,是让孩子走出去,行万里路,培养探索世界的主动性,独立思考和坚持判断。
我们真正要培养的,是孩子的好奇心和探索精神,而不是凡事都依赖 AI 的顺从者。未来我们的整个教育体系会怎样?我们将如何抚养我们的孩子?这些都是值得思考的问题。
我认为我们每个人现在都应该意识到,如何与 AI 共存,快速适应尝鲜新技术,如何向 AI 学习,保持自我谦虚,不耻于提问,让它们教我们更多的知识和能力。我觉得如果你有孩子,今天就可以开始改变他们的一些学习内容,让他们成为 AI 原生代。让他们大胆使用 AI 完成任何他们想做的工作,而不仅仅是与 AI 闲聊或完成家庭作业。
应该让他们做我们以前从未想象过的事情,让他们从毕业的那一刻起成为最熟悉 AI 的人,而不会因为读书的时候只学习教科书知识,导致毕业后就失业的。
过去很多教培机构,在家庭心目中都是“苦读书,励志刷题赢在起跑线”的印象。相对比而言,从 Luka 卢卡阅读伙伴到 Ling 灵宇宙 AI 学习伙伴,我们一直是一个轻松快乐陪伴的品牌,科技伴(陪伴)成长,设计创(创造)想象。
说到底,灵宇宙是一家陪伴机器人公司,从工具到伙伴的 AI 进化过程,到底孩子是需要更多的学习工具,还是一个哆啦A梦?
而我们认为陪伴是第二步,场景是第一步,教育是场景,阅读是场景,第一步先要找对高频刚需的场景。
就好像 Microsoft 微软是生产效率办公软件,而 Apple 苹果是娱乐消费生活方式一样,每个公司的产品存在,都有其边界和定位。学而思也好、我们也好,大家专注的方向不一样,他们是属于那个板块的,我们是另一个逻辑。
网易科技:我们现在的资金状况怎么样?
顾嘉唯:接下来我们的主要目标是先把“小方机”铺开,渗透更多家庭用户。与此同时,我们也会同步推进其他软件服务,逐步完善 LingOS 空间交互操作系统,通往家庭机器人的路还很长。
但好在资金方面,我其实并不焦虑。原因在于我有自己的基本盘。而且这次新项目运行时,大家还是比较相信我在做的这件事的大趋势,以及我们团队禀赋跟这件事的匹配性,融资也进行得比较顺利,我现在账上还有上百个月的资金储备,完全可以从容推进。
要在技术延长线上做产品,过去没做成,是因为时代没到
网易科技:你觉得未来智能终端的迭代路径是怎样的?
顾嘉唯:终端一定会不断出新的。你看iPhone、iPod、Mac,就是靠每年出新品维持品牌和功能的生命周期。你说有些产品做出来就固化在那儿——没有技术演进就没有迭代需求,它就是那一代东西了。
但我们的战略是踩在 AI 技术延长线上做具有容器属性的 AI 终端。简单理解就是模型越来越好,数据越来越多,产品体验就会越来越强,价值会不断增长。我们会有更多新品出来,不同形态的、不同场景的终端,每年都会有新一代。
渠道铺开后,我们本身就是一个面向全球的产品。未来的消费电子没有语言边界,跟 AI 互动,就好比Facebook 上加好友互动、你也可以加一个非洲的朋友,或者来自世界任何角落的用户都能无障碍对话。AI的语言能力决定了它天然是全球化的。
网易科技:做硬件产品的过程中,很多时候必须做出取舍。同样一个想法,最终因为体验层面的决策不同,可能就会长出完全不同的产品。那你在这次定义这个产品的过程中,有哪些关键的取舍?
顾嘉唯:其实灵宇宙这个终端的底层逻辑,十二年前我在百度做 BaiduEye 智能眼镜时就埋下了伏笔——之所以叫 “Eye” 而非 “Glass” ,是因为想成为人的“第三只眼”、“第二个大脑”,而非显示的 AR 眼镜。
一个贴身的“Her”,致力于打造下一代个人计算终端 new computer 实现“属于每个人的智能助理” 的命题始终未变,对我而言,这次不是重新定义,而是延续当年未竟的探索。
具体到产品体验,其实大家到时候用起来就会知道。我们最关键的,是给自己拉出一个足够长的“窗口期”——能在这个窗口期里做深体验,积累数据,拉开差距。
在人机交互上,我们真正做得最深的,是两件事:一是怎么创建世界模型让终端设备跟物理世界交互(如博物馆惊奇夜);二是怎么让 AI 智能体主动跟虚拟内容交互服务好用户(如达尔文讲解生物)。
这两个“连接”的能力,才是产品体验的关键点。很多产品你拿在手里能玩一下,但它跟现实世界是割裂的,跟虚拟世界又对不上,数据也不回流,那其实就是一锤子买卖,没生命力。
网易科技:有没有什么是你现在特别想做,但阶段还没到、暂时无法落地的?
顾嘉唯:有的,家庭机器人。真正“什么都能干”的家庭机器人,能处理多场景多任务的通用型机器人,现在还不是时候。
要做这个,第一步不是堆硬件,而是收数据。就像特斯拉做自动驾驶,不是靠一套车机堆叠从无到有或突变完成的,而是靠千万辆车的路测数据闭环体系长期积累演进的结果。家庭机器人的核心壁垒也在数据,尤其是空间交互大行为模型的价值数据。
这个依赖学术前沿的迭代周期之外,还依赖在家庭内真实有效能率先铺量的终端,恰恰这一点我认为相当关键,你得先有能量去铺量设备、铺场景,把海量对物理世界模型涌现智能有效的数据闭环建起来,然后才有机会拼出一个真正智能的家庭机器人。
因此为了实现我在“万物有灵,人机共生”对终局消费级家庭机器人的梦想,我会分步走,先让 AI 小方机成为下一代年轻人的“个人计算终端”,通过铺量,积累孩子探索世界的空间交互大行为数据(基于摄像头的全天候交互和提问回答的轨迹),打造 AGI 进入真实世界的世界模型。
再基于这些高质量数据训练用于具身智能大脑的多任务处理和动作行为推理能力,逐步拼出家庭机器人的雏形,这就像是“点物赋灵”的终极图景,正在一步步展开。
网易科技:你回头看,有没有什么是你觉得如果当年早点做,今天会不一样的?
顾嘉唯:我们都知道往往前沿科技投入,都是从早期缓慢增长到快速突破,再进入成熟期。商业化拐点往往出现在曲线的中后期,即技术平庸期,此时技术已足够成熟且成本可控。
Bill Buxton 有句话让我印象深刻“look back into the future(回望未来)”,他是微软研究院我的 mentor,因为技术拐点与商业化拐点的关系并非线性对应,但往往是螺旋式上升的,周期规律本质上是科学原理验证、工程化突破、市场需求匹配的动态博弈。
如今带“机器人”标签的产品仍有巨大迭代空间。比如已成标品的扫地机器人,本质是小家电逻辑;而教育机器人则属于“教育服务 SaaS”模式,通过 AI 技术破解师资稀缺与个性化教学难题,以多模态 AI 交互终端结合内容云服务实现效能升级。
扫地机器人率先以轮式形态进入家庭,将主妇从家务劳动中解放出来;而陪伴机器人有望通过 AgentOS 驱动的人机交互能力,让家长告别“带娃费妈”的困境,真正实现「be a lady」的生活状态。
其实当年我们做服务机器人时,就意识到不能局限于扫地功能,而应聚焦环境交互与人机对话,但受限于行业技术成熟度未能实现。如今多模态大模型技术的突破,让人机交互迎来范式转移 —— 从过去的“智障对话”升级为“万物有常识、万物可交互”。
同时 AIGC 技术重塑了内容生产关系,中腰部内容生成的技术门槛降低,让技术型公司获得与传统内容公司平权的机会。特别是在儿童教育领域,生成式 AIGC 能激发孩子的「增强想象力」,通过互动创作替代单向灌输,这种内容交互模式的拐点已经到来。
人机交互,是我们积累最厚的能力。今天多模态大模型技术的溢出红利,让我做好这件事的时机到来了,right time,right people 很关键,但今天显然不一样了,人机交互范式转移了。
回头看,整个行业曾错失 AI 机器人的核心价值 —— 人机交互。
扫地机器人虽出货量大,但作为“非人机交互型设备”,仅在无人时工作,无法积累高质量交互数据。而真正的智能机器人,必须以自然交互为核心,这正是我们通过多年技术积累与当下大模型红利所抓住的机遇。
网易科技:那你觉得,现在AI陪伴设备的机会真的到了吗?
顾嘉唯:是的。这个行业现在终于有红利了,市场关注度也在起来。家长真的期待新的AI设备出现,但不是那种随便搞搞的毛绒玩具加语音问答。
你看最近市面上那些“AI玩具”,都太粗糙了,没体验、没数据闭环、没交互逻辑,最后沦为红海之卷,没差异化,没毛利空间,退货率奇高,说白了大都是“大模型套壳”也就算了,关键问题是对技术发展没有认知,对用户市场没有洞察。
而我们,其实一开始就看清了两条路:一个是AI进入虚拟世界的交互系统,一个是AI进入物理世界的代理系统。
这两条路径没变,只不过今天的大模型能力终于让它们变得可实现了。
网易科技:你觉得未来的人机关系会是什么样子?
顾嘉唯:未来,人类生活中大量的任务都会由机器完成。养老看护、带娃陪伴、情感交互,甚至性,都可能是由机器来承接和解决的。
繁衍生育是刻在DNA里的,是动物性的,不婚单身带娃,孩子更需要陪伴成长“学伴”的带娃机器人;另外,生老病死规律,养老看护需要端茶倒水陪护照料,老人需要互动情感陪伴“老伴”的康养机器人,这些都有巨大的市场。
通过 AI 机器伙伴地加入,我们可以让人类的人际关系变得更简单。让人类腾出精力,向内探求精神世界身心灵,向外探索宇宙的奥秘,灵宇宙的使命就是推动新一轮的人机关系,在精神世界和物质世界实现双重陪伴。
现实中,一个家庭可能有六七口人,上有老下有小,各种复杂关系堆叠,婆媳矛盾、育儿分歧、养老压力…… 而机器可以承接处理这些最复杂、最容易引发冲突的部分。
AI 真正有价值的地方,就是在于让人际关系“减负”,回归本真的情感连接,而不是被琐事消耗。人生一回,短短百年,愿我们都能遇见有趣的灵魂陪伴每个人,有用的机器人服务每个家。让陪伴更美好。这是我们的愿景。
换句话说,人机关系的建立,其实是在为简化原本人和人之间的人际关系。这既是回应“人类生来对抗孤独”的问题,也是在推动人际关系回归简单。
从人机交互的学术研究,到人机关系的探索实践,这正是过去十多年我从技术到产品的浓缩总结。
AI beings 数量将超越人类,将成为人类的助手、学习导师、玩伴、亲人等多样性角色,并将适应所处环境而形成无穷多样的具身个体。AI beings具备“灵智和身体”、“身份和角色”、“社交关系”,将成为人类社会重要组成部分。
机器智能会主动服务你,会帮你解决各种现实问题——像是你的佣人、管家、司机,帮你订票、做饭、采购等等。
过去,我们学会了使用计算机和互联网,开拓了世界,提升了认知;未来,世界是我们的,也是AI机器人的,但归根到底是会使用 AI 机器人的人的。
不要感叹,生娃太早,生命科学发展很好,活得更久,很多工作不需要我们去做了,用好家庭服务机器人,带娃保姆机器人,机器人育儿嫂,让我们活得更好。
这个过程中,不一定是一个单体通用人形机器人来解决所有问题,而可能是家庭中分布着形态各异的机器人,各自解决不同的问题。这就是我们对未来人机关系的设想。
网易科技:如果要实现你说的这些愿景,现在最关键要解决什么问题?是数据的问题吗?
顾嘉唯:大模型之所以在这几年起来,是有其必然性的。早期是数据量不够,到了一定阶段,模型能力又跟不上。如今数据、模型和算力基本上都到位了,所以这才进入了快速发展的阶段。
而在 AI 走入物理世界的过程中,我们目前还处在“第一次采数据”的阶段。数据依然不够,算力也还不够,所以我们还需要时间。
你可以看到,有些公司如果能在当下阶段真正掌握住关键的数据资产的采集路径,未来是有很大空间的。而我自己,也算是在牌桌上活到了今天,还能继续高质量地活着。
网易科技:你觉得现在“活着”最重要的是什么?
顾嘉唯:仰天立地,不忘初心。既要仰望星空,又要脚踏实地,三步拆五步地执行,经营能力和商业能力健全,做务实的理想主义者。
得能把产品卖出去,能把公司的现金流做起来。不能总是依赖资本输血,得让技术梦想落地生根,这才是长久之道。
避开 “通用大模型”和“具身人形” 的喧嚣,聚焦儿童场景做垂直领域优化,用硬件载体智能终端让 AI 从虚拟走向具身。务实不是 “妥协底线”,而是 “拆解理想为可执行的阶梯”。
从大厂创新时 BaiduEye 智能眼镜到二次创业后的 Ling 灵宇宙 AI 小方机,从 “无屏触控交互” 到 “物理世界大模型” 的进化,我希望理想在技术迭代中自我更新。而这条路的实现,必须以理想为精神锚点,将务实视为 “抵达理想的方法论”,路径必须步步为营。
可以说,从 Luka 卢卡到 Ling 灵宇宙,每一步都是我在务实中按计划推进理想的拼图。
来源:网易科技