一、Waver是什么?
Waver是由Foundation Vision团队开源的「All-in-One」通用视频生成大模型,官方口号是 “Make your creativity groundbreaking”。它把文本-视频(T2V)、图像-视频(I2V)、多机位叙事、长时长高分辨率生成等能力整合到同一套权重里,无需额外微调即可直接输出5 s / 10 s、720 p / 1080 p的成品视频。
二、模型性能:
Artificial Analysis(2025-08-05 19:00 GMT+8)公开排行榜:Waver 1.0在运动质量、视觉质量、Prompt Following三项均位列*,超越Runway Gen-4、Pika 2.0、Stable Video Diffusion等开源/闭源对手。
自建评测集
Waver-Bench 1.0:覆盖 1200+ 组复杂动作、光影、风格化prompt。
Hermes Motion-Testset:聚焦大规模人体与动物运动,人工盲评显示 Waver *第二名 18 %。
三、核心功能
文本-视频:
亮点:单句prompt 直接出片
示例效果:“雨中玻璃罐里微型*”——雨滴、蘑菇咖啡馆、小人撑伞,细节全部对齐
图像-视频:
亮点:任意静图「活」起来
示例效果:把一张帆船照片变成半水下视角的10 s航行片段
多机位叙事:
亮点:原生支持镜头切换,角色/场景/光场一致
示例效果:老工匠完工:近景手部→特写眼睛→全景工作室→情绪收束,4镜一气呵成
长时长输出:
亮点:最长 10 s 连续片段,情感动作更完整
示例效果:企鹅百米冲刺:起跑、加速、撞线、减速,动作物理合理
高分辨率:
亮点:1080 p 原生,无需后超分
示例效果:城市夜景+烟花航拍,灯牌文字清晰可辨
多艺术风格:
亮点:写实、动漫、黏土、毛绒、赛博朋克、Wes Anderson 等一键切换
示例效果:王家卫复古滤镜+可口可乐机,胶片颗粒与霓虹光斑*还原
运动皇冠:
亮点:人物/动物体育动作
示例效果:大熊猫花样滑冰、老虎高山滑雪、袋鼠拳击,关节轨迹真实
四、需求人群
创意工作室:广告片头、MV、概念 PV 快速预演。
自媒体 & MCN:低成本生成高质感短视频,批量起号。
影视动画:分镜预览、*预合成、风格探索。
教育与培训:医学/体育/军事等需要人体动态演示的场景。
电商 & 零售:商品 360° 动态展示、虚拟试穿。
独立开发者:开源可商用,二次开发门槛低。
五、应用场景
广告创意:24K 金杏坠落慢动作 + 液体飞溅,一条 5 s 片头直接投放 TikTok Ads。
文旅宣传:输入一张古镇照片,生成“晨雾+花瓣雨+游船穿梭”的 10 s 竖屏短片。
动画分镜:导演一句“赛博曼谷飞狗出租车”,30 秒出 4 镜连贯故事板。
体育教学:生成“托马斯全旋”*人称视角,配合骨骼标注用于动作拆解。
虚拟偶像:毛绒风格偶像在黏土*开演唱会,跨次元联动。