你的位置:澳门六彩资料大全2023年资料 > 单机游戏 > 算计机视觉限制再冲突,腾讯 Turing Lab 辩论遵守入选CVPR 2022

算计机视觉限制再冲突,腾讯 Turing Lab 辩论遵守入选CVPR 2022

时间:2023-06-08 08:54 点击:117 次

近期,海外算计机视觉与情势识别会议CVPR 2022在好意思国新奥尔良举行,并同步进行线上会议。由王君乐博士指挥的腾讯Turing Lab践诺室提交的论文《High-resolution Face Swapping via Latent Semantics Disentanglement》(基于隐语义解耦的高分辨率换脸)得胜入选。

论文由腾讯Turing Lab与华南理工大学、卡迪夫大学及中国香港大学合营完成。接下来,咱们将为民众解读论文的中枢遵守,沿途来学习算计机视觉限制的最前沿辩论吧!

基于隐语义解耦的高分辨率换脸

High-resolution Face Swapping via Latent Semantics Disentanglement

在换脸任务中,咱们需要针对给定的源脸和见识脸,将源脸的身份信息迁徙至见识脸上,并同期保握见识脸的属性信息。该技艺频年来获取盛大关怀的,并在互动文娱、广电、安全与阴事保护等限制均展现出较大的应用后劲。

这篇论文忽视了一种新的、基于预侦察GAN模子中内在先验常识的换脸体式,竣事了高分辨率(1024X1024)换脸。该体式除了能保握见识脸的常见属性信息,如颜料、姿态、光照、布景等除外,还不错更好地保握见识脸的妆容信息。

在这个责任中,咱们哄骗生成招架模子隐空间的解耦特点,将不同性质的属性差别迁徙。具体来说,颜料、姿态等是与结构联系的属性,而光照、格调等是与外不雅联系的属性。这两类属性由隐编码的不同层差别戒指:一张图片隐编码的前半部分戒指结构信息,尔后半部分戒指外不雅信息。

咱们先差别将源脸和见识脸回转到StyleGAN的隐空间内。同期将源脸和见识脸要津点的热图送入要津点编码器,得到一个结构属性转念向量,这个向量作用在源脸的隐编码上,即可竣事结构属性的迁徙。

同期,咱们用见识脸隐编码的后半部分代替源脸隐编码的后半部分,这么即可竣事外不雅属性的迁徙。将解决之后的隐编码送入预侦察好的StyleGAN中,即可得到初步的换脸落幕。

此外,为了竣当事者张脸布景的迁徙,咱们将见识脸径直送入见识编码器,得到不同分辨率的特征,并和StyleGAN中间历程中产生的特征在解码器中进行和会。这么咱们就获取了最终的落幕y。践诺落幕标明,咱们的体式在图片和视频换脸任务中,好多方面的效果均卓著了多SOTA体式。

注:图片只用作学术辩论,无用于生意用途。

对于CVPR

CVPR 全称 IEEE 海外算计机视觉与情势识别会议(IEEE Conference on Computer Vision and Pattern Recognition),该会议始于 1983 年,是算计机视觉和情势识别限制的顶级会议。本年大会共收到来自全球各大高校、科研机构与科技公司共8186篇投稿,最终秉承的论文确实齐代表了年度算计机视觉限制最新、最高科研水平以及明天发展趋势。

这次论文入选,亦然对腾讯Turing Lab践诺室现阶段科研及翻新智商的认同。明天,腾讯Turing Lab将无间尽力,为民众在算计机视觉限制带来更多可能。

腾讯Turing Lab践诺室发达东说念主

王君乐博士

腾讯大家辩论员

领有十余年算计机视觉、多媒体、机器学习限制辩论训导,在东说念主体姿态推断与重建、图像质地评价、算计影相学、千里浸式多媒体等限制有较深的了解及实战训导,并在这些限制指挥团队进行探索与落地的责任。

曾主导腾讯CenseoQoE画质评价决策的开拓与社区开源,主导腾讯前卫云游戏云霄虚实互动技艺的研发。此外,在包括CVPR、NeurIPS、TIP、TMM等顶级会议及期刊上发表多篇论文,并为多个会议及期刊担任审稿东说念主及组织者。



公司官网:

www.michellospizzeria.com

关注我们:

公司地址:

Powered by 澳门六彩资料大全2023年资料 RSS地图 HTML地图

Copy right © 2013-2023 版权所有:勇往直前,乐在其中!
澳门六彩资料大全2023年资料