您现在的位置是:娱乐 >>正文
Vidu Q2生图功能上线:控制权进一步交给创作者
娱乐654人已围观
简介12月1日消息,Vidu推出升级后的Q2参考生图功能,并同步上线文生图与图像编辑功能,试图解决AI多模态创作中“创意”与“可控性”难以兼顾的长期难题。官方称,此次更新将创作的控制权进一步交还给创作者。 ...
12月1日消息,图功Vidu推出升级后的线控Q2参考生图功能,并同步上线文生图与图像编辑功能,制权石家庄市某某生态科技销售部试图解决AI多模态创作中“创意”与“可控性”难以兼顾的进步交长期难题。官方称,创作此次更新将创作的图功控制权进一步交还给创作者。
新版Q2生图功能在一致性表现、线控生成速度、制权工作流整合等方面均有所提升,进步交可应用于短剧动漫、创作石家庄市某某生态科技销售部广告电商、图功泛娱乐、线控影视制作、制权文旅教育等多个场景。进步交平台同时开放限时免费体验,创作会员可在一个月内使用文生图、参考生图及图像编辑功能,旗舰版会员享受不限量生成。
官方介绍,Vidu在国际AI基准测试机构Artificial Analysis最新公布的图像编辑榜单中首次上榜即进入前四名,并在该指标上超过了GPT-5。这意味着其在图像编辑一致性与模型成熟度上已达到较高水平。
![]()
一致性能力方面。据悉,Q2参考生图在语义理解、风格支持、美学水准和参考要素灵活度方面均较上一版本提升。官方称,模型能够在保持主体一致的前提下给予创作者更多创作自由,生成速度最快可达5秒。
在参考能力方面,Q2主要包括:
• 任意比例生成:可从同一参考图生成不同比例画面,适配广告、电商、短剧动漫等多种素材需求,支持4K输出。
• 位置、动作、构图复刻:通过升级的空间理解能力,可精准复刻角色站位、动作、布局,即便输入为草图或线稿,也能保持构图一致。
• 分镜切换:可基于同一画面生成不同景别,通过文字指令完成多镜头画面组合,再配合图生视频功能生成完整片段。
图片编辑能力增强方面,全新的Q2图像编辑功能支持局部添加、替换、删减或调整内容,并可进行风格转换及季节、时间变化处理。在编辑过程中,主体一致性与背景结构可保持稳定,不易出现变形或细节缺失。
相比传统修图软件依赖多工具调整的方式,Q2通过文本改图的方式降低了使用门槛,为创作者带来更高效率。
文生图与多风格输出方面,升级后的文生图能力可根据简单提示词直接生成连续分镜,覆盖超过百种主流与非主流美术风格,包括国画、日漫、美漫与复古画风等。无论远景、特写还是近景,均可保持人物外观的一致性。
参考生图功能则可基于固定角色,快速生成不同故事情节下的多张画面,使角色IP构建与多场景延展更加高效,适合漫画、绘本以及短剧类创作的批量生产。
据介绍,此次新增的“主体保存”功能打通了文生图、参考生图与参考生视频的模型链路。创作者可保存任一生图的主体,再在视频生成中调用,实现跨模态一致性。(定西)
延伸阅读 Tags:
相关文章
谷歌凌晨炸场,Pro级智商只卖“白菜价”,OpenAI还怎么玩?
娱乐作者 | 小小出品 | 网易科技推理强、速度快、还省钱,谷歌这次真的“杀疯了”。这对于用户是福音,但对于那些技术壁垒不高、成本控制不力的竞争对手来说,却是灭顶之灾。随着价格战的枪声打响,2026年注定 ...
【娱乐】
阅读更多北京:七大火车站加强返程服务 多条地铁延时运营
娱乐5月5日,北京七大火车站预计到发旅客141万人。北京交通部门制定“一站一策”服务保障措施,多条地铁将延时运营。 5月5日夜间至6日凌晨,北京七大火车站预计到达旅客6.4万人,其中北京南站、北京西 ...
【娱乐】
阅读更多金店遇冷!有店主说从业20年这个五一假期生意最淡
娱乐经历一段时间高涨后,国际金价近日明显回调,当地时间5月3日,美国最新公布的4月非农就业数据远不及预期,使市场对美联储今年降息的预期重新升温。不过,因中东地缘政治风险出现缓和迹象以及部分投资者获利出货, ...
【娱乐】
阅读更多