春节那会儿,Seedance 2.0 横空出世,凭借炸裂的视频生成能力火遍全网,大家都以为“文生视频”的王者宝座非它莫属了。可谁成想,这屁股还没坐热乎呢,周二晚上,知名 AI 评测平台 Artificial Analysis 上突然杀出个神秘大佬——代号「HappyHorse-1.0」,直接空降榜首,把 Seedance 2.0 给按在地上摩擦了!

说到这平台,那可是全球最有公信力的“盲测”赛场。规则很简单:用户随机看两个视频,只看质量好坏,根本不知道是谁家做的。就在这种“蒙眼打架”的环境下,HappyHorse 登场才一周左右,ELO 积分就飙到了 1347 分,硬生生把第二名的 Seedance 2.0 甩开了整整 74 分!大家看看榜单就会发现,第 2 到第 10 名的比分都咬得很紧,唯独这第一名是断层领先,实力恐怖如斯。

官网介绍,HappyHorse 1.0 是个拥有 150 亿参数的“超级大脑”,不仅能看图说话,还能听音辨位。它最牛的技术叫“统一 Transformer”,听着挺玄乎,其实通俗解释就是:它把文字、图像、视频、音频全扔到一个“大锅”里统一处理,让注意力机制自己去搞定这些信息,效率高得吓人。
它还有个绝活叫“视频音频联合生产”。以前咱们用 AI,得先生成个无声视频,再去找配音,麻烦得很。HappyHorse 倒好,一次前向传播就把视频帧和音轨(对话、环境音、拟音)全生成了。举个例子,你让它生成“一个老外在讲中文”,它不仅能生成画面,连嘴型都能给你对得严丝合缝,支持 7 种语言,画质还是电影级的 1080p。

官方还放了个大招:承诺开源!到时候基础模型、精简的八步模型、超分辨率模块和推理代码全都会公开。这意味着咱们不仅能自己玩,还能在自家的服务器上部署微调。不过截至发稿,这些好东西还没放出来,大家还得再等等。
当然,想跑动这个大家伙,门槛可不低。官方推荐用 NVIDIA H100 或 A100 这种“显卡中的法拉利”,显存至少 48G。不过它用了 DMD-2 八步蒸馏技术和 FP8 量化,能大幅降低显存占用,适合单卡部署,不然普通电脑显卡真得冒烟。

这么牛的东西到底谁做的?目前还是个谜,团队还没认领。不过有网友扒皮说,这极有可能是张迪领衔的淘天集团“未来生活实验室”的手笔。这消息一出,港股阿里股价下午一度涨了近 8%,看来资本市场也觉得阿里这次要搞大事啊!