📰 来源:36氪
文|周鑫雨 编辑|杨轩 一句话介绍 Buzzy(https://www.buzzy.now/)是AI内容创作公司“感知阶跃”旗下的视频编辑Agent平台,主要面向C端内容创作者和中小型商家。 好比“视频版的PhotoShop”,用户只需下达自然语言指令,就能驱动Agent对视频进行背景去除、光线修正、产品替换、背景/视角更改等编辑操作。 团队介绍 “感知阶跃”创始人兼CEO Ella Zhang(张诗莹),曾在苹果、Oculus VR、Google负责核心产品。 在苹果期间,她曾为AirPods产品线创始团队核心成员,负责产品的系统集成和全周期设计落地,包括音频产品的架构设计、元器件选型、原理图绘制、版图设计、验证以及大规模生产。 此后,张诗莹又在Google担任AR产品的系统架构师,负责Glass、Reflector等产品的算法和架构研发。 “感知阶跃”其余核心成员,来自Adobe、小米、商汤等公司。 融资进展 近期,“感知阶跃”完成了新一轮融资,金额超过2000万美元,领投方为Redpoint(红点创投)。深渡资本担任本轮独家财务顾问。 产品及业务 在张诗莹看来,随着视频生成模型性能的发展,生成类的工具赛道,已经逐渐“红海”。她将市面上的视频创作工具,大致分成了两类: 一类是“画布型”产品,优点在于可以通过手动控制,保证生成结果的质量,但缺点是对大多数用户而言,使用门槛高;另一类则是向用户提供预制的workflow和模板,劣势在于不够灵活,同时,idea不够创新。 “用户更倾向于一次性生成整段视频,并通过不断迭代修改的方法来修到完美方案。所以一个指哪打哪的视频编辑器就变成了刚需。” 当下,由于视频的连贯性以及模型理解能力的局限性,用户很难通过Chat的方式,对视频进行换背景、换人物、消除某元素的“局部精修”。大多AI编辑器会改变整个画面,接近于重新生成。 近期,“感知阶跃”上线的新产品Buzzy,就是一款AI视频编辑器,让用户可以像P图一样便捷地“P视频”。 只需要通过Chat,Buzzy就可以对视频完成去除背景路人、修正光线、替换产品、合拍、更改背景与视角等操作,真正实现局部精修。 △背景路人去除。左:去除后;右:去除前。图源:受访者供图 △改变光线。上:改变前;下:改变后。图源:受访者供图 △拍摄角度改变。左:改变后;右:改变前。图源:受访者供图 做到对视频的局部编辑、维持其余部分,技术门槛并不低。张诗莹告诉我们,局部编辑要求视频模型有更高的视频和语言理解能力,“首先它要识别修改的部分到底是什么、在哪里出现,其次它还要准确理解用户的意图,比如prompt中的梗。” 为此,“感知阶跃”基于RLHF(人类反馈强化学习),训练了一个小模型,来增强Buzzy对视频编辑的理解。 与此同时,Buzzy也被设计为一个能够自主学习用户审美和品味的Agent。 Buzzy上线了一个“类OpenClaw”的Bot。用户可以通过扫码,直接将Bot接入Telegram和WhatsApp中。 通过向Bot分享TikTok、YouTube上的视频链接,Bot会自动分析用户的视频偏好和品味,基于该视频风格24*7自动全网搜索灵感素材,并将该风格沉淀为Skill。 风格沉淀。图源:受访者供图 此前,自2021年成立以来,“感知阶跃”经历了两次内容创作产品迭代: 在Midjourney、Stable Diffusion等文生图产品爆发之前,“感知阶跃”就基于GAN(生成对抗网络),开发出了第一款面向国内B端电商客户的AI模特图生成平台ZMO.ai,并在后续将落地场景扩展到商品图设计、编辑等场景。 ZMO.图源:受访者供图 占据先发优势的ZMO.ai,MAU一度达到了700万。 2024年起,视频生成赛道随着Sora的发布,迎来了一个小爆发。在风口中,“感知阶跃”叫停了ZMO.ai,并在2024年4月上线了涵盖图片、视频的内容创作平台Creati。 相较于聚焦电商、广告图片生成和编辑的ZMO.ai,Creati将内容创作扩展到了视频领域,包括文生视频、基于视频模板二创等功能。 与此同时,它为用户提供了移动端产品。不少非专业内容生产者,就可以直接用手机拍摄素材后,直接在App端完成内容的创作、编辑和发布,而非辗转导入电脑。 “用户对AI生视频的需求,比图片更刚一些。”张诗莹提到,“在传播效果上,无论在社媒端,还是广告端,视频都比图片更能吸引注意力。与此同时,用户拍视频的难度,比做图片高很多。” Creati。图源:受访者供图 同样转变的还有目标用户。ZMO.ai的主要客户,是国内B端的电商、广告商。但很快,张诗莹发现,即便ZMO.ai用户增长很快,但流量并没有转化为实际的付费。 核心原因在于,其一,“大B”客户的结款周期过长;其二,图片的创作成本比视频更低
本文转载自 36氪,版权归原作者所有。