0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

设计非对称式互信息估计器减少音频向视频模态表达的不确定性

牵手一起梦 来源:中科院自动化 作者:佚名 2020-05-09 14:51 次阅读

随着近年来音视频生成威廉希尔官方网站 的不断发展,“虚拟主播”逐渐走入人们视野,并以其在虚拟客服、远程会议、电影剪辑等现实应用场景中的重要作用而获得了社会各界的广泛关注。该威廉希尔官方网站 旨在对输入的音频预测相应口型,从而生成指定或任意人物的自然而准确的面部说话视频。近日,中科院自动化所智能感知与计算研究中心为此提出了一种新颖的音视频协同计算方法,并重点解决了此前难以达成的任意人物协同生成问题。

该方法一方面实现了利用语音驱动任意对象的高清视频生成,另一方面在正脸、侧脸等多种场景下均显著提升了生成视频质量。目前,该成果已被IJCAI 2020大会接收。

由于音视频模态之间差异性等问题,这项威廉希尔官方网站 目前仍然存在着众多挑战。以往的研究方法往往将重点放在了模态内之间,如只关注了视频帧之间的损失约束,却忽略了音视频模态间最重要的问题之一:如何将音频信息高效充分地表达入视频模态?同时由于人物与人物之间的个体差异,将同一模型应用于任意人物视频生成也存在较大的挑战。

为解决上述问题,团队精心设计了一个非对称式互信息估计器(Asymmetric Mutual Information Estimator, AMIE),以构建音视频模态间的约束。如图1示,输入一对音频与人脸图像数据,互信息估计器输出预测的互信息值。在这里,该方法使用Jensen-Shannon表示形式来改善互信息计算方式,使其更好地应用于神经网络。通过这样的互信息估计方式,该方法最大化音频与视频模态之间的互信息,减少音频向视频模态表达的不确定性,并以此获得音频和视频信息之间的跨模态一致性,使得生成视频中人物的口型更加准确自然。

设计非对称式互信息估计器减少音频向视频模态表达的不确定性

该方法在LRW和GRID基础数据集上进行了实验验证。图2中的结果表明该方法生成的口型准确度高,且能够有效适应不同肤色与嘴唇形状差异。表1的量化结果显示该方法在常用的对比指标上的优越性能。

该方法有能力对不存在于数据集中的任意人物进行视频合成,并能够有效处理如姿态表情、性别差异等变化因素(见图3)。例如,输入一段女性语音(图中第二行),该方法分别生成了现实场景的同性别人脸视频(图中第一行),和跨性别人脸视频(图中第三行)。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    29

    文章

    2882

    浏览量

    81626
  • 神经网络
    +关注

    关注

    42

    文章

    4772

    浏览量

    100851
  • 视频
    +关注

    关注

    6

    文章

    1947

    浏览量

    72946
收藏 人收藏

    评论

    相关推荐

    AFE5808A串并变换之后数据错位,输出结果具有不确定性,为什么?

    AFE5808A串并变换之后数据错位,输出结果具有不确定性,求问可能的原因有哪些?
    发表于 01-01 07:23

    “双系统”出炉!瑞芯微RK3562J非对称AMP:Linux+RTOS/裸机

    非对称AMP”双系统的应用领域 随着对嵌入系统要求的不断提高,非对称AMP架构如今已成为一种新选择,主要应用于工业领域,如工业PLC、运动控制、机器人控制
    发表于 11-21 16:44

    科技云报到:数字化转型,从不确定性确定性的关键路径

    科技云报到:数字化转型,从不确定性确定性的关键路径
    的头像 发表于 11-16 16:52 340次阅读
    科技云报到:数字化转型,从<b class='flag-5'>不确定性</b>到<b class='flag-5'>确定性</b>的关键路径

    计及多重不确定性的规模化电动汽车接入配电网调度方法及解决方案

    摘要:规模日益增长的电动汽车和可再生能源带来的不确定性给配电网的安全运营带来了严峻挑战。为综合考虑多重不确定性、平衡运营成本与系统可靠性,首先,提出一种基于分布鲁棒联合机会约束的电动汽车-配电网
    的头像 发表于 09-14 15:26 365次阅读
    计及多重<b class='flag-5'>不确定性</b>的规模化电动汽车接入配电网调度方法及解决方案

    OPA828运放非对称电源供电有什么好处吗?

    看到一些精密仪器的电路运放好像特意设计成非对称电源供电,比如+14v、-17v这种,请问运放非对称电源供电有什么好处吗?信号摆幅不超过正负7v
    发表于 08-01 06:48

     相对于人工的不确定性,机器人码垛有何优势

     在现代工业生产中,码垛是一项至关重要的任务,它涉及到将不同形状、大小和重量的物品进行有序地堆叠,以便于后续的运输和储存。然而,传统的人工码垛方式存在着诸多不确定性,这些不确定性可能源自工人的疲劳
    的头像 发表于 06-19 14:45 273次阅读

    ETAS推出Time-Triggered Scheduling (TTS)的确定性调度解决方案

    在2024年2月26日,ETAS推出了名为“Time-Triggered Scheduling (TTS)”的确定性调度解决方案。
    的头像 发表于 04-25 16:56 2725次阅读
    ETAS推出Time-Triggered Scheduling (TTS)的<b class='flag-5'>确定性</b>调度解决方案

    什么是嵌入实时系统的确定性?简析EDMS中的确定性

    ETAS Deterministic Middleware Solution点击跳转(EDMS,前身为AOS) 确定性中间件解决方案,是一个中间件框架,旨在面向汽车领域内应用程序的独特挑战和需求
    的头像 发表于 04-15 11:22 1221次阅读
    什么是嵌入<b class='flag-5'>式</b>实时系统的<b class='flag-5'>确定性</b>?简析EDMS中的<b class='flag-5'>确定性</b>

    单相降压转换非对称AG评估板数据手册

    电子发烧友网站提供《单相降压转换非对称AG评估板数据手册.rar》资料免费下载
    发表于 04-14 17:02 0次下载
    单相降压转换<b class='flag-5'>器</b>双<b class='flag-5'>非对称</b>AG评估板数据手册

    海信马晓龙:坚定长期主义的战略定力,激发“确定性”增长的内生动力

    近年来,在内外因叠加影响下,智慧交通行业充满了变数。当不确定性成为常态,如何驱散迷雾走向增长?这是每一个智慧交通企业必须解决的难题。 选择用什么答案来面对这个难题,决定了企业迎战风浪的命运,海信智慧
    的头像 发表于 03-21 11:38 324次阅读
    海信马晓龙:坚定长期主义的战略定力,激发“<b class='flag-5'>确定性</b>”增长的内生动力

    华玉通软宣布“海鸥”确定性调度中间件(SEAGULL DS)正式商用

    今天,华玉通软(下称“华玉”)宣布“海鸥”确定性调度中间件(SEAGULL DS)正式商用。
    的头像 发表于 03-17 11:01 697次阅读
    华玉通软宣布“海鸥”<b class='flag-5'>确定性</b>调度中间件(SEAGULL DS)正式商用

    上海交大科研团队使用Moku:pro推进在量子光学实验中的多参数估计

    几乎每个对物理学稍有兴趣的人都听说过海森堡不确定性原理。其最著名的假设同时涉及到粒子动量和位置的基本不确定性,即不确定性的乘积有一个下限:提高对一个值的测量精度通常会降低对另一个值的精度。纵使接近
    的头像 发表于 02-19 14:00 489次阅读
    上海交大科研团队使用Moku:pro推进在量子光学实验中的多参数<b class='flag-5'>估计</b>

    为什么三相短路是对称故障?单相短路是非对称故障呢?

    为什么三相短路是对称故障?单相短路是非对称故障呢? 三相短路是对称故障,而单相短路是非对称故障,其根本原因在于电网中的相量关系和电压分布。 首先,
    的头像 发表于 02-18 11:41 4148次阅读

    确定性网络威廉希尔官方网站 如何提高网络的可靠性?

    确定性网络威廉希尔官方网站 通过采用时钟同步、流同步和时序一致性、带宽保障和流量控制、数据包复制与排除等机制,提高网络的可靠性,适用于工业自动化、车辆网络等对通信质量有严格要求的领域。TSN威廉希尔官方网站 的引入为确定性网络应用的发展注入了强大推动力,为各个领域的智能化和自动化提供了坚实的网络基础
    的头像 发表于 01-12 16:50 1153次阅读
    <b class='flag-5'>确定性</b>网络威廉希尔官方网站
如何提高网络的可靠性?

    智能制造的本质是解决不确定性

    6月底去日本AVEX研学时,这家企业特别关注4M的变化,4M变化是指企业采用了新设备,来了新员工,用了新材料,采用新工艺方法,AVEX认为只要有变化,就一定会影响产品的质量。为了减少变化的影响,AVEX专门制定了4M每日的二维巡检表。
    的头像 发表于 01-08 15:56 590次阅读
    智能制造的本质是解决<b class='flag-5'>不确定性</b>