📰 来源:36氪

作者 | 兰杰 编辑 | 乔芊 4月27日,预热已久的HappyHorse终于开启测试,颇为遗憾的是,它没能像横空出世的Seedance2.0那样掀起巨浪。没有惊喜,对于HappyHorse来讲是一个颇为中肯的评价。 HappyHorse是阿里巴巴ATH事业群旗下创新事业部研发的视频模型,于4月27日开启灰测,并接入千问App。 该视频模型饱受关注的原因有二。 一是因为在开放测试前,HappyHorse在未标注厂商的情况下,登顶了以盲测为主要形式的权威AI评测平台Artificial Analysis AI Video Arena排行榜,以更高的Elo分数(通过比赛输赢和对手强弱来动态计算实力排名的数字),力压字节跳动旗下Seedance 2.0、快手旗下可灵AI、Google Veo 3 Fast等视频模型,一炮而红。 随后关于其出处、能力的热议不断,甚至有数个假官网冒名顶替,吸引了无数不知情的围观群众。 二是因为该视频模型背靠阿里。登顶测评榜后三天,4月10日,阿里ATH创新事业部正式认领。 HappyHorse和其所在的ATH事业群都很年轻,后者是由阿里巴巴CEO吴泳铭于3月成立并亲自挂帅的,整合了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部五大板块。在官方的叙事中,ATH创新事业部已启动一个AI时代的全新交互方式探索计划,HappyHorse是这个探索方向的一部分,更多的产品会陆续推出。 据接近阿里人士表示,今年3月ATH事业部成立之后,阿里定下了AI业务日均消耗达到百万级的目标,为了弥补自身在多模态大模型上的短板,也为了推动Token的消耗,阿里加速了视频生成大模型的落地,HappyHorse就是这一策略下的产物。 在Seedance2.0一家独大、定价颇高,且排队不断的情况下,行业也十分期待能有一个新的、能力与Seedance2.0相当的视频模型出现。只是当测试开放之后,不少从业者表示了失望。此前在马年春节期间,即梦App的图标将原本的陀螺形象改成了一匹小马,如今也被媒体颇有意味地解读为“拿捏小马”。 图片来源:官方页面截图 没有技术上的飞跃,就只剩追赶 HappyHorse的技术能力究竟如何? 内容科技公司三生清影自研的工具Glowave已经接入了HappyHorse,在深入体验了该大模型之后,创始人姜奕祺对该模型的评价是,表现不错,但略逊于Seedance2.0。 姜奕祺毕业于清华大学计算机视觉专业,曾在阿里达摩院任职,对视频大模型了解颇深。他向36氪表示,相较于Seedance2.0,HappyHorse的影视感与提示词还原上有所不足。具体来讲,前者指的是更接近传统专业影视表现的效果,包括画面的精细度、背景的丰富度等。后者可以简单粗暴的理解为,听懂人话的能力。 36氪也测评了Seedance2.0、可灵3.0和HappyHorse三款产品,用同样的提示词、清晰度生成了同样时长的视频。在观看了可灵3.0和HappyHorse生成的两段视频后,姜奕祺认为后者审美有些逊色,但在关键词的还原,以及物理真实性上更胜一筹,“如果给这两个视频打分的话,我会给可灵3.0的打8分,给HappyHorse打9分” 他进一步说明,“HappyHorse1.0毕竟是1.0,这个起步已经很好了,可灵3.0近期表现下降,可能是将算力用在憋大招上了。” Seedance2.0的测评视频未能成功生成,截至发稿,36氪仍需排队十小时。 总的来说,HappyHorse更多是在市面上已有的视频模型能力的基础上缝缝补补,未能有质的突破。 事实上,HappyHorse的硬实力并不差——150亿的参数,几乎是Seedance的三倍,支持15秒多镜头叙事、多画幅适配及1080P超分输出。换言之,HappyHorse同样可以做到一键生成有分镜、音画同步的15s视频。 这些能力如果放在3个月前,或许也会让影视行业重审已有的生产流程和组织架构,但如今已经是市面上视频生成大模型的标配,与Seedance2.0、可灵3.0的重合度很高。 至于为什么在训练参数数倍于Seedance的情况下,其表现力却未能跟上,姜奕祺分析或许与数据质量有关——HappyHorse在短视频数据和影视级视频数据上,与字节、快手都存在一定差距。 如今,国内视频生成大模型已经陷入到了焦灼且同质化的竞争中,做到差强人意远远不够。 一位头部视频模型厂商的员工如此向36氪表示,他们老板说过,衡量大模型能力的核心标准是“智能”,可以将其理解为,大模型的迭代更新是否有改变一个产业的生产结构。例如Seedance2.0的出现,分镜师就不被需要了。 除了质的突破,速度也要跟上。如今行业默认每1-2个月就需要更新一版大模型出来,否则就有可能掉队。在这样的背景下,平庸是不可能突围的。 前


本文转载自 36氪,版权归原作者所有。