作者 | Kino编辑 | 石濑AI视频工具终于迎来一个“好用不贵”的选择。今天,PixVerse的国内版产品“拍我AI”发布了V5模型,据说在动态效果、指令遵循、一致性保持、画质上都有显著提升,尤其是对运动场景进行了深度优化。在全球AI分析机构Artificial Analysis的公开排行榜上,PixVerse V5的图生视频功能一度位列第二,文生视频排在第三。官方发布的宣传片通过一系列快速切换的场景,非常有冲击力地展示了V5模型的惊艳效果,每一帧都堪比电影大片:V5的实际表现究竟如何?我们第一时间进行了全方位测试。先说省流结论:拍我AI V5的综合表现,进一步坐实了它在全球AI视频模型第一梯队的行业地位,而且又向前迈进了一步,堪称“多边形战士”。更重要的是,其在易用性和性价比上也展现出了巨大诚意。
实测拍我AIV5,动态效果和一致性惊艳
根据官方公布的信息,V5的核心升级主要体现在两个层面。一是模型的基础能力,比如在指令遵循的精准度、动态效果的自然感、人物与场景的一致性以及视觉质量的清晰度上,都有了显著改进。其次,这次更新也特别针对一些具体的应用场景进行了优化,比如各类人物运动、二次元角色的还原,以及广告和科幻等风格化场景的表现力。为了弄清V5的真实水平,我们设计了一系列具体的测试,主要从动态效果的自然度、复杂指令遵循的精准度、主体的一致性保持,以及对不同艺术风格的驾驭能力这几个维度, 来看看它的实际生成效果究竟如何。
动态效果
提示词:夜晚,在法国阿尔卑斯山的悬崖小镇阿沃里亚兹,一名滑雪者正顺着被厚厚积雪覆盖的街道滑行。街道两旁是独特的欧式小木屋,建筑的窗户里透出温暖的灯光。复古的暖色路灯在雪地上投下柔和的光晕。远处,月光洒在连绵起伏的雪山山脉上,整个小镇宁静而梦幻。滑雪这个动作对AI视频模型是一个综合性的考验。因为其不仅包含了连贯的人物肢体运动,还涉及到人物和雪地的物理交互,以及在滑雪过程中,周围复杂光影和景物的稳定性。从生成的视频来看,V5的表现可以说相当出色。视频中的滑雪者,身体重心的切换、手臂摆动和雪杖的支撑动作,都表现得非常自然连贯。而且,V5在处理人物动态的同时,很好地维持了光影的整体氛围和一致性。街灯在雪地上的投影、远处雪山的轮廓光,都随着镜头的缓移而保持了合理的透视和稳定性,没有因为人物的运动而产生不合逻辑的闪烁。视频中两旁的木屋建筑细节非常丰富,V5在整个过程中都保持了这些建筑结构的稳定,没有出现扭曲的现象,这一点在目前的AI视频工具中属于相当不错的水平。提示词:在阳光明媚的夏日午后,一个小男孩在公园的草坪上奔跑,脸上挂着灿烂的笑容,阳光透过树叶的缝隙洒在他的脸上,画面稍微过曝,给人一种怀旧梦幻的感觉。跑步这一动作,也能很好地检验模型对人体动态的理解,运动的主体,尤其是人脸,需要在连续的画面中保持稳定。可以看到,视频中的小男孩,小男孩的面部以及那头标志性的卷发,都保持了惊人的一致性,没有出现明显模糊和扭曲。除了作为主角的小男孩,背景中放风筝的成年人虽然模糊,但也保持了形态的稳定和动作的合理性。前景草地上的光影斑驳,也随着镜头的移动而自然变化,整个画面的空间感和真实感都营造得非常出色。前两个case分别测试了单人运动的流畅度和一致性,下面我们将测试难度再次升级,考验一下V5生成多主体动态交互视频的能力。提示词:电影级拳击比赛场景,两名拳击选手在拳台中央激烈对战,汗水与灯光交织,四周观众席在模糊的背景中欢呼,灯光强烈明亮 ,画面张力十足,热血而真实。模型不仅同时保持了两个人物的外形稳定,还准确理解了他们之间的攻防关系,生成了既符合物理逻辑,又充满力量感的对抗场面。一致性保持提示词:一位戴着金丝眼镜、穿着复古格子西装的侦探,在昏暗的书房里踱步,他从书架上抽出一本书,然后转身走向壁炉,面部特征和衣着保持一致。可以看到,在踱步、抽书、转身等一系列动作中,侦探的脸部、眼镜、服装等关键特征均未出现明显变形。再来看一下V5在宠物拟人化一致性场景中的表现:提示词:一只戴着棕色格子贝雷帽,身穿棕色复古马甲的白色博美犬,优雅地坐在咖啡馆的椅子上,面前的桌上摆着冒着热气的咖啡和牛角包,博美端起咖啡喝了一口,窗外是冬天的欧式街景。在小狗端起咖啡杯的动作过程中,它的外形和衣服、桌上的可颂、环境都没有发生扭曲变化,窗外的雪景、建筑和偶有车辆经过的街道也十分真实。这两天,Taylor Swift官宣结婚的消息在全球引起了不小的轰动,我们决定蹭个热点,让两人“原地结婚”,测试一下V5给人物换装换背景,同时保持主体一致性的能力。提示词:给照片中的女人换上白色婚纱,男人则换上黑色西装,两人背后溢出粉色心形气泡,背景换成一座发光的白色喷泉。V5不仅精准地识别出了人物主体,成功地为他们原地换装,而且保持了人物面貌、姿势的高度一致,最终生成的画面非常和谐、浪漫。
复杂指令遵循
提示词:夏日午后,在一扇有着白色窗帘的落地窗前,一只毛茸茸的小橘猫,正在好奇地观望一个温暖发光的鱼缸。鱼缸里,几条色彩鲜艳的小鱼从它面前游过,摆动着轻纱般的尾巴,细小的气泡在鱼缸内缓缓上升,水草在柔和的水流中轻轻摇摆。从结果来看,V5对这段复杂指令的理解能力相当出色,整个画面的光影效果非常梦幻柔和,从窗边透进来的自然光、木地板的反光、猫咪毛发的蓬松感、以及光线穿透水体和玻璃的质感,都处理得非常细腻。提示词:两个女孩分别穿着黄底白花、白底粉花的日式浴衣,优雅的盘发和花簪,在夜晚的海滩上,观看花火大会,背后视角,巨大的烟花在静谧的蓝色星空中绽放,两人相视一笑,电影光效,氛围感。两个女生和服浴衣的颜色和花纹都精准遵循了提示词,相视一笑的动作、面部表情和情绪也很自然真实。我还用V5的智能音效功能给视频添加了“远处烟花绽放的声音”,可以听出音效带有明显的空间感。
多元风格
我们还测试了V5对不同美学风格视频的驾驭能力,包括美漫和黏土风,V5依旧稳定发挥。提示词:一个红发飘逸的女孩,身穿飘逸的白裙,优雅地骑着一辆复古自行车,蜿蜒的道路两旁是盛开的野花,半色调风格。提示词:怀旧美漫风格,在一家港风小店,一个黑发小女孩,发间别着颗星星发卡,正坐在小圆桌旁,专注地吃着拉面。头顶暖黄的灯光,透过隐约的吊灯洒下,墙上贴着插画,挂着复古挂钟,汤碗里的热气袅袅升起。提示词:在霍格沃茨烛光闪烁的图书馆,赫敏身穿格兰芬多的院服,一手拿着一本翻开的魔法书,一手挥舞着手中的小魔杖,面前的羽毛笔漂浮在空中,黏土风。从拍我AI V5模型,看AI视频的普惠之路优秀的模型能力,只是故事的一半。另一半,则在于它被大众和行业应用的广度和深度。而性价比,或许是其中最直接,也最现实的影响因素之一。目前,海内外的AI视频生成工具大都采用会员订阅和积分消耗机制,高昂的成本常常让普通创作者望而却步。我们盘点了市面上主流AI视频工具的定价,做了一个简单的计算。以可灵AI 2.1大师版为例,1000元大约可生成500秒视频;而拍我AI,这个数字是1429秒,时长接近前者的3倍。伴随着V5模型的上线,拍我AI还会为用户额外提供10%-20%的年度订阅限时折扣,这无疑是在本就极具竞争力的价格基础上,又一次加码。这种对高性价比的追求,成果直观地体现在用户的选择上。目前,PixVerse的全球用户总数已突破一亿,这个数字背后藏着两个不言自明的事实:产品的易用性、活跃的创作生态。如果没有足够简洁、直观、易上手的操作体验,一个专业的AIGC工具是很难