来源:真格基金
作为百度凤巢的核心负责人和跟谁学/高途的联合创始人,怀亭可能是中国最适合回答 「AI + 教育」这一命题的创业者。我们很荣幸从天使轮开始持续投资与爱为舞,与怀亭同行。
自古以来,教育的终极目标可以总结为「因材施教,有教无类」,也就是让所有的学生都能得到最个性化的教育。随着 AI 应用的能力快速提升,成本快速降低,以与爱为舞为代表的教育科技创新者正引领我们快速接近这一终极目标。
真格基金管理合伙人戴雨森
2025 世界人工智能大会(WAIC)于 7 月 28 日在上海世博中心蓝厅圆满举办。
在本次论坛上,与爱为舞创始人兼首席执行官张怀亭以《关于 AI 应用创业的思考与实践》为题发表了演讲。
张怀亭在演讲中表示,AI 应用的创业机会在于利用生成式 AI 技术,将服务业做成制造业,打破「大规模(个性化)、高品质、低成本」的不可能三角。
他认为,目前尚未出现 AI 应用的爆发式商业化落地,核心原因在于大模型仍存在幻觉、推理不够准确、结果不够稳定。这就要求从事 AI 应用的团队既要懂业务,又要懂 AI 技术,能够在模型不确定性与业务容错度之间找到平衡。团队应先跑通业务闭环,用业务牵引 AI 能力逐步落地,并在此过程中找到契合自身场景的数据飞轮。
在智能时代,他强调,跨界融合的人才密度与务实创新的企业文化是组织建设的核心,而人机协同的工作范式将成为企业运营的基础。
本文转自 IPO 早知道,经真格编辑整理,以下为张怀亭演讲原文:
通过生成式 AI,把服务业做成制造业
今天在这里,想和大家汇报一下,我们一家成立仅两年多的初创企业,在 AI 应用领域这两年的创业实践、总结与认知。
十几年前,我和当时的团队在互联网大厂,第一次使用深度机器学习算法,做出了大概率是全中国第一个大规模广告推荐系统,取得了不错的效果,也帮助我们沉淀了对 AI 的初步认知。
后来,我和一群志同道合的伙伴在教育领域开启了第一次创业,并有幸在纽交所上市,对教育行业也形成了更深的认知。当生成式 AI 出现时,我们看到它为「科技向善」与教育普惠带来了更大的空间。于是 2023 年,我和小伙伴们开启了第二次创业。
我们认为,教育最重要的是有好老师,要做到有教无类。也就是说不管是男生还是女生,城市还是乡村,贫穷还是富有,孩子还是成人,每个人都能有一位很好的 AI 老师终身陪伴。它能够根据个体的兴趣、阶段、效率、潜力、状态、性格等,提供个性化的传道、授业与解惑。然而,现实中优质教育资源依然稀缺,成本依旧高昂。
基于我们对科技与教育的理解,生成式 AI 的出现让我们判断服务个体的教育资源在边际成本上一定是越来越低的。理论上应该接近于实时推理的成本,在现有基础上可能削减 90%。
随着技术演进,成本下降的幅度也会越来越大。我们相信,这样的 AI 老师应当随时随地可用,且随着智能系统的增强,知识储备将不断拓展,为每个人在各领域提供最适配的个性化指导。
今天我并不打算介绍过多产品或算法,这几天已有很多相关展示,相信大家都看到了。所以我想换一个视角,作为一个连续创业团队,谈谈我们从创业角度的一些浅见。
我们认为,AI 应用领域的比较大的机会之一,是把服务业做成制造业。大量服务业是人力密集型行业,往往面临「不可能三角」,也就是希望用低成本提供高质量服务,还要大规模覆盖。
这基本上是一个悖论。比如医生,现实中我们常有这样的体验:在医院排两个小时的队,最后只能和医生聊十分钟。或者医生给你开了单子,还要去排检测队,有时排上,有时排不上,可能又得约下一次。对于大量个体来说,高质量服务既难以获得,成本又极高。生成式 AI 让我们看到了这样的机会,能够规模化地提供个性化服务,让量与质兼得。
在虚拟的数字世界里,我们经常会听到一个词叫「千人千面」,「千人」是规模,「千面」是个性。推荐系统已经在内容分发等领域解决了规模化与个性化的并存问题,但在服务行业尚未实现,受制于推荐系统能力的边界。
用生成式 AI 改造人力密集型行业,首要是用算力成本替代人力成本。趋势上,算力成本会持续下降,而人力成本不断上升。其次,人力密集型企业在选、用、育人上极其复杂,优秀人才的流失也让管理成本居高不下,且难以完全标准化。而生成式 AI 则有可能实现标准化服务。一旦将服务业转化为制造业,未来或许我们每个人身边都会有专属的 AI 老师、AI 律师、AI 家庭医生。
对于 AI 应用,现在还没有看到大规模的落地与爆发,为什么呢?作为对比,我们来回顾一下十多年前,移动应用爆发的前提是什么?
当时,5G 网络已基本成形,智能手机普及,硬件基础成熟。手机有定位功能、相机功能、还有支付能力,给移动应用提供了基础保障。高德地图、滴滴、美团依赖定位;快手、小红书依靠相机记录生活;在线教育公司高途用音视频直播,让学习随时随地发生。有了支付,商业化能力也得以承接,否则大量机会会流失。这些基础设施到位后,移动互联网公司只需专注应用层的创新,而不需要考虑更底层的体系构建。
而今天,我们会发现,模型有很多幻觉,推理能力依然不够准确,相同上下文下输出结果也不稳定。多模态方面,数字人的实时交互、大幅遮挡下的面部稳定性、实时生成的表情与语音语调,以及互动延迟等,都还比较弱。
我们相信很多企业到今天还没有遇到这种情况:同一时间几百、几千,甚至几万的推理并发,这就需要优化很多底层的架构能力,对如今的一个创业团队而言要求比较高。
一方面,需要判断 AI 的发展趋势与迭代速度。过去一年,它的演进速度已超越当年的摩尔定律。
另一方面,要明确当前模型的能力与应用边界。比如文生图也许可直接应用,但文生视频在短剧中可能还达不到预期。应用中还要平衡模型的不确定性与业务的容错度,这一点很关键。
推荐系统推送的短视频不喜欢可以划走,广告不想看可以略过。但如果 AI 医生要给你做手术,你能不能允许它犯错误?所以模型的不确定性与业务的容错度息息相关,如何去平衡好什么时候用模型能力,什么时候用系统能力,就是一个「真问题」。
对于 AI 应用创业的路径,我们的理解是:先建立一个业务闭环,通过闭环验证应用场景的有效性,再用模型逐步辅助或替换闭环中的某些环节,最终实现业务的 AI 化变革。这或许是一条相对务实、渐进的路径。
在这一过程中,核心的问题是整个闭环数据能不能上到云端?系统能否采集所有交互数据与静态特征,并将其沉淀为高质量的特征集合?之后才能用这些有效数据去训练模型,推动 AI 应用的最终变革。
之所以会有这样的想法,得益于我们对互联网创业史的经验总结。很多颠覆性技术的应用往往源于成熟业务的倒逼。比如阿里云与亚马逊云,起点都是因为自身电商业务面临集中、爆发式的使用压力,才推动了云服务的诞生。云服务首先支撑了内部业务,随后能力溢出,再服务于更多的外部客户。
碳基生命的有限性,硅基生命的无限性
对于 AI 应用,还有一个底层思考,到底是用 AI 来赋能,还是用 AI 来替换?我们判断,这两种情况都会存在,只是体现在不同的业务或环节上。
如果是 AI 赋能,大概率是把人变成「钢铁侠」,实现路径是智能辅助、人工决策。很明显,人的顶线更高,因为今天的 AI 和最靠谱的人相比,还没有达到顶级人类的水平。但在 AI 的助力下,实现了部分标准化,大概率可以缩小人的工作方差。
既然最终决策仍由人来做,可以想象,一个人即便一秒钟做一次决策,一天的上限也就是 86400 次。受制于此,业务的增长只能是线性的。当然,通过 AI 辅助,成本会有所下降,最终团队的组织能力依旧建立在管理与系统之上。
而如果一个工作可以完全由 AI 替代,即无人化,大概率路径是用智能系统来驱动。但由于今天的 AI 不是 100% 准确,仍需要人工兜底。
显然,长期来看,不受人力限制,通过算力扩展,就有可能实现指数级增长。从目前 AI 的水平来看,顶线一定不及人类,但均线会被显著提升,方差理论上可以接近于零,成本也会出现数量级的下降。这种体系下,组织能力只需建立在全智能系统之上,效率更高、成本更低、迭代速度更快。
大家也经常会问一个问题,AI 应用到底有没有数据飞轮?最近谷歌也好,OpenAI 也罢,都宣布在奥林匹克数学竞赛的难题解答上,模型已经能做得非常好。对于这类有确定性答案的任务,今天的模型能力已远超绝大多数人类,这时它与人在交互中获得的信息已经不足以再提升它的智能。
比如你问模型:「英伟达的股票还能买吗?」 如果信息足够充分,理论上存在一个标准答案,这时它不再需要通过与人的交互获得更优解。再比如,一个具备完整约束条件的任务:「帮我买北京到上海早上 7 点的高铁二等座」,Agent 照做就行,没有其他选择,也不存在迭代优化的数据飞轮。
那什么才是数据飞轮?比如你现在要求「中午给订一份好吃的外卖」,这个任务需要 Agent 了解你是谁,大概率要知道你每天中午的用餐时间,并算好外卖送达的时间。你喜欢吃什么菜?口味是什么?地点在哪里?你是喜欢平价一点的,还是更注重生活品质?价格区间是多少?以及最近点过的外卖是不是不能重复?
这些信息大量依赖在持续使用过程中沉淀下来的个性化交互记录,就能形成数据飞轮。
再复杂一些,比如「我要提高英语能力」。这里的英语能力,是指听、说、读、写的哪一项?应当如何提升?当前水平怎样?个人学习习惯与效率如何?这些都是通过与用户的持续交互沉淀下来的静态特征与动态行为。结合长短期上下文,产生相应的个性化交互,才能逐步形成真正的数据飞轮。
AI 产品一出生就是全球化的企业
今天,AI 应用的组织到底应该是什么样的?
首先,我们认为最重要的还是人才。人才密度要大于业务复杂度。尤其在今天,既要有深耕行业的领域人才,又要有懂技术的 AI 人才。而把这两类人真正融合在一起难度非常大。我们公司原来出现过,AI 人才说这件事做得不够 AI,没有都用模型去做;领域人才则说,现在的模型根本做不到,要沿用原来的方法。如何让两类人才融合,形成合力,这非常关键。
第二,要有「务实 + 创新」的企业文化。也就是前面提到的,先有业务闭环,再用 AI 去升级或变革。既要有扎实的业务能力,务实地创造商业价值,又要时刻关注全球技术的发展,懂得如何把 AI 能力应用到业务上。
第三,我们已经能看到,硅基生命正在成为组织的必要成员。比如代码研发,很多环节需要 Cursor 等 AI 工具来帮忙;销售环节中,也有大量具体任务由 AI 来承担。所以人机协同将成为智能时代公司的基础运营范式。
拥有多年经验的员工可能一时转不过来,那怎么办?一方面,我们会给机会、给时间,推动他们改变;另一方面,我们也会敦促员工:站在未来看现在,不换脑子就换人。
以上就是我的分享。总结我们在做 AI 应用时遵循的 16 个字:「业务牵引、智能驱动、人机协同、务实创新」。公司提倡延迟满足,引导大家不高估短期收益,也不低估长期积累。