2026 / 03 / 24
酷游官网-CVPR 2026录取结果揭晓 腾讯混元超二十五篇论文入选

【CNMO科技动静】据腾讯混元官方动静,近日,计较机视觉顶级学术集会CVPR 2026正式宣布登科成果。本届年夜会共收到16092篇有用投稿,终极任命4090篇,接管率为25.42%。于激烈的竞争中,腾讯混元团队体现亮眼,共有跨越25篇论文乐成入选,研究领域深度笼罩视频天生、图象编纂、3D资产创立和多模态交互等焦点范畴。

CVPR 2026录取结果揭晓 腾讯混元超二十五篇论文入选

于视频天生与数字人范畴,腾讯混元提出了多项冲破性结果。SoliReward框架经由过程改良丧失函数与数据计谋,有用减缓了视频天生奖励模子中的“奖励黑客”与标注噪声问题,显著晋升了物理纪律一致性。UniAVGen与Harmony则聚焦音视频结合天生,前者以非对于称跨模态交互机制实现了人像音视频的时空精准同步,后者经由过程跨使命协同范式解决了音画同步漂移痛点。针对于及时交互需求,StreamAvatar模子乐成将高质量扩散模子蒸馏为高效的流式架构,实现了低延迟的720P无穷长数字人视频天生,而ActAvatar则经由过程时序感知机制,仅需50亿参数便可实现高精度的虚拟形象动作节制。

图象编纂与理解方面,Meta-CoT提出元思维链编纂范式,经由过程三元组认知分化与元使命操作分化,统筹了细粒度指令追随与跨使命泛化能力。JarvisEvo构建了编纂器与评估器协同优化的自进化智能体,使用交错式多模态思维链打破纯文本推理的信息壁垒。此外,PromptEnhancer与TAG-MoE别离经由过程细粒度奖励优化提醒重写和使命感知门控机制,年夜幅晋升了文本到图象天生的语义对于齐度与多使命处置惩罚能力。

于3D天生与世界模子构建上,腾讯混元一样结果丰硕。LATTICE框架使用半布局化VoxSet暗示法,弥合了3D与2D天生模子于质量与可扩大性上的差距;NaTex与PoseMaster别离实现了基在潜于颜色扩散的无缝纹理天生和原生3D骨架节制的姿态气势派头化。ArtLLM与X-Part进一步鞭策了枢纽关头式资孕育发生成与高保真外形分化技能的成长。WorldStereo则经由过程几何影象模块,乐成桥接了可控视频天生与3D场景重修。

版权所有,未经许可不患上转载

-酷游官网