祝贺团队博士生吴卓嘉一篇文章“HyDiscGAN: A Hybrid Distributed cGAN for Audio-Visual Privacy Preservation in Multimodal Sentiment Analysis”被IJCAI 2024录用
祝贺团队博士生吴卓嘉一篇文章“HyDiscGAN: A Hybrid Distributed cGAN for Audio-Visual Privacy Preservation in Multimodal Sentiment Analysis”被International Joint Conference On Artificial Intelligence(IJCAI 2024)录用。
国际人工智能联合会议(International Joint Conference On Artificial Intelligence,IJCAI)是人工智能(Artificial Intelligence,AI)领域的国际顶级学术会议,是AI领域历史最悠久和最受赞誉的会议之一,每年吸引来自世界各地的研究人员、实践者和AI爱好者,共同展示和讨论他们的最新工作,这些工作涵盖从理论发现到实际应用的各个方面。IJCAI也是中国计算机学会CCF推荐的A类会议。
多模态情感分析(Multimodal Sentiment Analysis,MSA)旨在识别视频内容中说话者的情感倾向,这引起人们对多模态数据(如声纹和面部)相关的隐私风险的关注。分布式协作学习是一种有效的多模态数据隐私保护方法。然而,现有的分布式协作学习方法忽视了不同模态之间的隐私差异,这使得它们在性能和隐私保护之间难以取得平衡。
因此,论文首先提出了一个有趣的问题,即如何在最大限度地利用不同模态的数据提高识别性能的同时,有效保护说话人的隐私。论文首次尝试解决MSA任务中特定模态数据的隐私保护问题,提出了一种混合分布式跨模态cGAN框架(HyDiscGAN),它针对多模态对齐进行建模,从可共享的去识别文本数据中生成伪音频和视觉特征,目的是利用伪特征代替真实的音频和视觉特征进行情感识别,以保证说话人的隐私,同时有效地提高性能。大量的实验表明,与最先进的MSA模型相比,HyDiscGAN可以在保护隐私的同时实现更优的或有竞争力的性能。