当一个"无名之辈"决定挑战OpenAI:一个关于勇气与选择的故事
小男孩想给去世的奶奶烧一部"纸手机"。这个简单到近乎笨拙的愿望,让无数人在AI生成的内容里,第一次看见了"人世间"。
这部播放量破亿的短片背后,是快手可灵AI从"无名之辈"到全球视频生成赛道头部玩家的突围故事。听完负责人盖坤的讲述,我一直在想:在这个巨头林立的时代,一个没有资源优势的小团队,凭什么能够突围?
答案出乎意料:不是技术,不是资源,而是"敢不敢"。
那个让团队"炸锅"的决定
2024年初,OpenAI发布SoraDemo,行业沸腾。但产品迟迟不落地,巨头们都在观望。
此时的可灵,在内部几乎没有资源优势,训练甚至依赖"非主流"算力。换作任何一个理性的决策者,大概都会选择继续蛰伏,等待时机。
但盖坤做了一个让团队"炸锅"的决定:做全球第一个用户可用的视频生成模型,而且要超越Sora。
你能想象那种压力吗?一个"Nobody",要去挑战全球最顶尖的AI公司。团队内部有分歧,有人质疑,有人担忧。
盖坤后来回忆说:"如果不搏这一把,很可能陷入'平庸—无资源—被淘汰'的负循环。我们本来就是Nobody,博输了还是Nobody,博赢了就彻底改变命运。"
这句话让我沉默了很久。有时候,承认自己一无所有,反而是最好的起跑线。
第一次成功之后,更难的选择来了
2024年6月6日,可灵1.0上线,成为全球第一个用户可用的DiT视频生成模型。而Sora直到年底才正式发布。
成功了。然后呢?
2.0阶段,团队面临两条路:一是继续提升清晰度和稳定性,沿着既定路线"精细打磨";二是转向多模态,把图像、视频甚至动作都变成AI的"语言",重构交互方式。
前者确定性高,风险低;后者几乎没有先例,一切都要从头摸索。
盖坤打了个比方:"OpenAI就像一个高冷的女神,做出了惊人的东西大家只远观;但可灵作为'邻居'干成了,大家才惊醒——原来这事真能落地。"
于是他选择了更难的那条路。
随后推出的动作控制功能(MotionControl),让用户上传一段参考视频,就能让角色复刻动作。这个功能几乎没做任何推广,却在海外市场迅速走红。
有时候,做对了选择,市场会替你说话。
大模型时代,我们需要怎样的决策方式?
回顾这些年的互联网发展,我们经历了两个阶段:从产品与运营驱动,到算法与AB测试驱动。每一次迭代,都在追求更精准的决策。
但在大模型时代,这套逻辑开始失效。一次尝试的成本往往以千万美元计,创新不是在已知选项里挑最优,而是在未知空间里找方向。
盖坤说:"拼肌肉拼不过,就要像'法师'一样,通过判断力打出局部优势。"
这句话让我想到一个词:愿景驱动。在大模型时代,企业不再依赖大规模试错,而是依赖少数关键决策。这对决策者提出了完全不同的要求:不是更勤奋地测试,而是更勇敢地判断。
每个人都能成为导演的时代,可能比我们想象的更快到来
盖坤判断,随着生成能力和可控性持续提升,AI视频将从工具走向基础设施。"当高质量内容足够多、足够丰富,一个新的内容平台就会诞生。"
技术的意义不只是提升效率,而是释放表达能力——让更多人有机会把脑海中的故事拍出来。
这也是可灵从第一天起就定下的愿景:"让每个人都能成为导演,让每个人都能拍出自己心中的好故事。"
听起来很远。但盖坤说,考虑到AI正在加速进化,快则一年,慢则三年,这个愿景或许就会实现。
而2025年的商业化数据似乎在印证这个判断:Q4营收3.4亿元人民币,12月单月收入突破2000万美元,年化收入运行率约2.4亿美元。
一个"纸手机"的故事还在继续。而这个故事告诉我们:在大模型时代,"敢不敢"往往比"能不能"更重要。

