01
我校计算机学院(软件学院)刘瑞研究员团队最新研究论文在人工智能领域国际权威期刊Information Fusion发表
音频深度伪造检测(ADD)旨在检测由语音合成(TTS),和语音转换(VC)等产生的假音频,近年来成为备受关注的一个新课题。传统工作读取单声道信号并直接分析伪影。最近,基于单耳到双耳转换的ADD方法越来越受到关注,因为双耳音频信号提供了一个独特而全面的语音感知视角。然而,来自两个声道的声学信息表现出差异和相似之处,这在以前的研究中没有被深入研究。
为了解决这个问题,该工作提出了一种新的基于单耳到双耳转换的ADD框架,该框架考虑了多空间声道表示学习,称为“MSCR-ADD”。具体来说,将声道特征表示空间分为“特定表示空间”、“共享表示空间”和“差异表示空间”。最后,来自不同空间的三种表示混合在一起,以最终完成深度伪造检测。在四个基准数据集上的实验结果表明,我们的MSCR-ADD优于现有的最先进方法。
相关论文《Multi-Space Channel Representation Learning for Mono-to-Binaural Conversion based Audio Deepfake Detection》发表在《Information Fusion》学术期刊。《Information Fusion》是国际计算机与人工智能、计算机与理论方法领域著名期刊之一,中科院JCR分区为一区Top期刊,影响因子为18.6。
内蒙古大学为论文唯一完成单位,论文作者包括:刘瑞研究员(第一作者),2022级硕士研究生张锦华,高光来教授。这项研究得到了国家自然科学基金青年基金、内蒙古自治区“草原英才”、自治区留学人员创新创业启动支持计划、广东省数字孪生人重点实验室(华南理工大学)开放课题、内蒙古自治区本级引进高层次人才科研支持、内蒙古大学骏马计划高层次人才引进等项目的支持。
论文链接:https://www.sciencedirect.com/science/article/pii/S1566253524000356
02
我校物理科学与技术学院王舒东副教授课题组在凝聚态物理国际著名期刊Physical Review B发表研究成果
基于过渡金属二硫属化物(TMDs)的范德华(vdW)异质结构通常具有二型能带排列,这有助于在组成单层之间形成层间激子。TMD vdW异质结构中层间激子的操控为开发作为电子集成电路对应物的激子集成电路提供了巨大的前景,它允许光子和激子相互转换,从而在集成电路中桥接光通信和信号处理。因此,深入了解层间激子的物理性质,包括揭示它们的超快形成、长的复合寿命和有趣的自旋谷动力学等行为,将为实现激子凝聚、单光子发射和其它新型量子现象的理想平台提供支撑。
近日,物理科学与技术学院王舒东副教授课题组利用先进的多体微扰方法,研究了双面非对称(Janus)二维过渡金属二硫族化合物WSSe/WS2异质结构中的层间激发态性质。该研究成果以《Spin Character of Interlayer Excitons in Tungsten Dichalcogenide Heterostructures: GW-BSE Calculations》为题发表于凝聚态物理国际著名期刊Physical Review B(自然指数收录)。
文章揭示了Janus层如何通过调节自旋态来影响基于WSSe/WS2的异质结构中的层间激发。研究结果表明,具有S/Se界面的平行排列本征电场结构将更多的自旋单重态混合到自旋三重态中,因此WSSe@WS2异质结中最低能量的层间激子比其它激子具有更短的辐射寿命。研究还发现S/Se界面使能带交错程度增加,因此没有束缚的亮层间激子。对于电场指向远离界面的S/S界面异质结构,强的能带杂化将49%的自旋单重态混合到自旋三重态中,因此最低能量亮层间激子的辐射寿命在0K时短至10-13s。结论表明,本征电场方向影响下的强自旋-轨道耦合,对Janus 异质结构中的自旋单态-三重态混合起着关键作用。
本工作受到国家自然科学基金(12064032,11804173)和高等学校青年科技英才支持计划(NJYT-19-B02)的资助。2021级硕士研究生李亚宁为第一作者,王舒东副教授为唯一通讯作者。
论文全文链接:https://doi.org/10.1103/PhysRevB.109.045422