当一个"无名之辈"决定挑战OpenAI：一个关于勇气与选择的故事

小男孩想给去世的奶奶烧一部"纸手机"。这个简单到近乎笨拙的愿望，让无数人在AI生成的内容里，第一次看见了"人世间"。

这部播放量破亿的短片背后，是快手可灵AI从"无名之辈"到全球视频生成赛道头部玩家的突围故事。听完负责人盖坤的讲述，我一直在想：在这个巨头林立的时代，一个没有资源优势的小团队，凭什么能够突围？

答案出乎意料：不是技术，不是资源，而是"敢不敢"。

那个让团队"炸锅"的决定

2024年初，OpenAI发布SoraDemo，行业沸腾。但产品迟迟不落地，巨头们都在观望。

此时的可灵，在内部几乎没有资源优势，训练甚至依赖"非主流"算力。换作任何一个理性的决策者，大概都会选择继续蛰伏，等待时机。

但盖坤做了一个让团队"炸锅"的决定：做全球第一个用户可用的视频生成模型，而且要超越Sora。

你能想象那种压力吗？一个"Nobody"，要去挑战全球最顶尖的AI公司。团队内部有分歧，有人质疑，有人担忧。

盖坤后来回忆说："如果不搏这一把，很可能陷入'平庸—无资源—被淘汰'的负循环。我们本来就是Nobody，博输了还是Nobody，博赢了就彻底改变命运。"

这句话让我沉默了很久。有时候，承认自己一无所有，反而是最好的起跑线。

2024年6月6日，可灵1.0上线，成为全球第一个用户可用的DiT视频生成模型。而Sora直到年底才正式发布。

成功了。然后呢？

2.0阶段，团队面临两条路：一是继续提升清晰度和稳定性，沿着既定路线"精细打磨"；二是转向多模态，把图像、视频甚至动作都变成AI的"语言"，重构交互方式。

前者确定性高，风险低；后者几乎没有先例，一切都要从头摸索。

盖坤打了个比方："OpenAI就像一个高冷的女神，做出了惊人的东西大家只远观；但可灵作为'邻居'干成了，大家才惊醒——原来这事真能落地。"

于是他选择了更难的那条路。

随后推出的动作控制功能(MotionControl)，让用户上传一段参考视频，就能让角色复刻动作。这个功能几乎没做任何推广，却在海外市场迅速走红。

有时候，做对了选择，市场会替你说话。

回顾这些年的互联网发展，我们经历了两个阶段：从产品与运营驱动，到算法与AB测试驱动。每一次迭代，都在追求更精准的决策。

但在大模型时代，这套逻辑开始失效。一次尝试的成本往往以千万美元计，创新不是在已知选项里挑最优，而是在未知空间里找方向。

盖坤说："拼肌肉拼不过，就要像'法师'一样，通过判断力打出局部优势。"

这句话让我想到一个词：愿景驱动。在大模型时代，企业不再依赖大规模试错，而是依赖少数关键决策。这对决策者提出了完全不同的要求：不是更勤奋地测试，而是更勇敢地判断。

盖坤判断，随着生成能力和可控性持续提升，AI视频将从工具走向基础设施。"当高质量内容足够多、足够丰富，一个新的内容平台就会诞生。"

技术的意义不只是提升效率，而是释放表达能力——让更多人有机会把脑海中的故事拍出来。

这也是可灵从第一天起就定下的愿景："让每个人都能成为导演，让每个人都能拍出自己心中的好故事。"

听起来很远。但盖坤说，考虑到AI正在加速进化，快则一年，慢则三年，这个愿景或许就会实现。

而2025年的商业化数据似乎在印证这个判断：Q4营收3.4亿元人民币，12月单月收入突破2000万美元，年化收入运行率约2.4亿美元。

一个"纸手机"的故事还在继续。而这个故事告诉我们：在大模型时代，"敢不敢"往往比"能不能"更重要。