学会动态

2025年全国声学大会-大会报告重磅来袭！
2025/10/27
“2025年全国声学大会”将于2025年10月31-11月4日在南昌召开，会议主题为“声驰浩宇，智铸新元”，由中国声学学会主办，南昌航空...
2025年全国语音、听觉与音乐声学大会于深圳成功举办
2025/10/08
2025年9月26日至28日，2025年全国语音、听觉与音乐声学大会在深圳市香港中文大学（深圳）成功举办。本次会议由中国声学学会语...
中国声学学会水声学分会2025年学术会议在珠海成功召开
2025/10/08
2025年9月21日至23日，中国声学学会水声学分会2025年学术会议在广东省珠海市中山大学珠海校区成功召开。本次会议由中国声学学...
2025年全国声学大会——中国声学学会40周年纪念专题论坛
2025/09/21
会议介绍 “2025年全国声学大会”将于2025年10月31-11月4日在南昌召开，会议主题为“声驰浩宇，智铸新元”，由中国声学学会主办，...

人物专栏

毛伟

毛伟，男，1986年11月生，博士，高级工程师，中国建筑学会建筑物理分会理事，中国环境科学学会环境物理分会常务理事，中国建...
宋韧

宋韧，现任重庆清文科技有限公司副总经理。主要研究领域为声场设计、定向发声等。学历与经历： 1992年~1996年首都经贸大学 ...
马晋毅

　马晋毅，男，1971年10月生，汉族，山西晋中市人，中共党员。中国电子科技集团公司第二十六研究所首席专家、正高级工程师。
牟笑静

牟笑静，工学博士，毕业于新加坡国立大学。重庆大学教授，博士生导师，国家“青年千人计划”学者。智能传感器创新联盟副秘书长...

关于召开 2025 年全国语音、听觉与音乐声学大会的通知（第二轮）

发布时间：2025/09/14 学会动态 浏览次数：611

声聚深圳智启未来

尊敬的各相关单位、领域专家：

中国声学学会语音、听觉与音乐声学分会定于 2025 年 9 月 26-28 日在深圳举办 “2025 年全国语音、听觉与音乐声学大会”。本次会议主题为 “智能语音・听觉感知・音乐声学：交叉融合与未来趋势”，将聚焦领域核心科学问题与前沿技术方向，推动跨学科交叉融合。

会议主办单位为中国声学学会语音、听觉与音乐声学分会和中国科学院声学研究所语音与智能信息处理实验室，由香港中文大学（深圳）、深圳大学、南方科技大学、中国科学院深圳先进技术研究院共同承办。会议将围绕语音学、听觉科学、音乐声学及相关交叉领域的基础理论、技术创新、应用发展及前沿动态，为从事本领域科学研究、技术开发、教学实践的高校、科研院所、企事业单位专家学者提供交流平台，促进我国语音、听觉与音乐声学领域的学术发展与成果转化。会议有关事项通知如下：

DeLiang Wang

特邀报告一：AV-CrossNet: An Audiovisual Complex Spectral Mapping Network for Speech Separation

个人介绍

DeLiang Wang received the B.S. degree and the M.S. degree from Peking (Beijing) University and the Ph.D. degree in 1991 from the University of Southern California all in computer science. From 1991 to 2025, he was with the Department of Computer Science & Engineering and the Center for Cognitive and Brain Sciences at The Ohio State University, where he was a Professor and University Distinguished Scholar. He recently joined the School of Data Science, The Chinese University of Hong Kong, Shenzhen. He received the U.S. Office of Naval Research Young Investigator Award in 1996, the 2008 Helmholtz Award from the International Neural Network Society, and the 2025 Neural Networks Pioneer Award from the IEEE Computational Intelligence Society. He also received the 2007 Outstanding Paper Award of the IEEE Computational Intelligence Society and the 2019 Best Paper Award of the IEEE Signal Processing Society. He is a Fellow of IEEE, ISCA, and AAIA, and currently serves as the Editor-in-Chief of Neural Networks.

报告摘要

Audition and vision complement each other for perception. Adding visual cues to audio-based speech separation can improve separation performance. This presentation introduces AV-CrossNet, an audiovisual (AV) system for speech enhancement, target speaker extraction, and multi-talker speaker separation. AV-CrossNet is extended from the TF-CrossNet architecture, which is a recently proposed deep neural network (DNN) that performs complex spectral mapping for speech separation by leveraging global attention and positional encoding. Complex spectral mapping trains a DNN to directly estimate the real and imaginary spectrograms of the target signal from those of a noisy mixture. To effectively utilize visual cues, the proposed system incorporates pre-extracted visual embeddings and employs a visual encoder comprising temporal convolutional layers. Audio and visual features are fused in an early fusion layer before feeding to AV-CrossNet blocks. We evaluate AV-CrossNet on multiple open datasets, including LRS, VoxCeleb, TCD-TIMIT, and COG-MHEAR challenge. Evaluation results demonstrate that AV-CrossNet advances the state-of-the-art performance in all audiovisual tasks, even on untrained and mismatched datasets.

杨军

特邀报告二：智能化趋势下的新电声技术进展与应用

个人介绍

杨军，中国科学院特聘研究员、博士生导师，中科院声学所副所长，兼中国科学院大学电子电气与通信工程学院副院长。曾获2项省部级二等奖、国务院政府特殊津贴、中科院“朱李月华优秀教师”和“优秀导师”等奖项。发表学术论文600余篇(其中SCI/EI和核心期刊收录400余篇)，专著1部，编著1部，国际会议大会特邀报告5次，授权发明专利80余项，制定国家标准6项，一批专利技术已实现产业化。现为中国声学学会副理事长兼秘书长、声频工程分会主任委员，中国乐器协会副理事长，国际噪声控制工程学会副主席，中国声学学会/电子学会/国际声与振动学会会士。

报告摘要

智能化是当今学科和行业的重要发展趋势，在数字信号处理、微处理芯片及智能终端技术的飞速驱动下，声频工程（Audio Engineering）已突破传统声学单一范畴，构建起融合声学、信号处理、人工智能、微电子等多学科的技术体系，在科学研究、生产制造、消费电子及公共服务等领域的战略地位日益凸显。本报告将从声源的产生、分离和定向传播、声事件定位与检测以及声场控制等技术链条的角度，介绍面向应用场景的新电声技术的进展与应用，同时指出其“智能化、个性化、数字化、网络化”的发展趋势，为多学科交叉创新及产业升级提供技术支撑。

王宁宇

特邀报告三：临床 – 基础 – 转化 – 临床（SL 系列产品研发分享）

个人介绍

王宁宇，主任医师、教授、博导，首都医科大学耳鼻喉学院副院长，国际耳内科医师协会中国分会副主席，WHO 防聋合作中心专家，中国老年学和老年医学学会第七届常务理事，北京医学会耳鼻咽喉头颈外科学会副主委。

报告摘要

报告围绕 SL 系列声源定位相关产品研发全过程，展现从临床需求到成果落地的完整科研转化路径。聚焦临床痛点，结合人工耳蜗植入、耳鸣诊疗等实际场景，阐述对精准听觉功能评估（如声源定位能力测试）的迫切需求；分享基础研究阶段的关键突破，包括声源定位生理机制解析、国人听觉数据库构建及相关测试标准制定；详解 SL 系列产品从技术研发到设备定型的转化过程，说明其全年龄段适配、精准度高等核心优势；最后回归临床应用，通过实际案例展示产品在术后康复评估、诊疗方案优化中的价值，并探讨基于临床反馈的产品迭代方向，为听力学领域 “产学研用” 融合提供实践参考。

付晓东

特邀报告四：民族管弦乐队音响特征的定量化研究——“尖、扁、杂、吵”的声学阐释

个人介绍

付晓东，文学博士（音乐声学）。现任中国音乐学院教授，中国音乐学院教务处处长、图书馆馆长，博士生导师。美国佐治亚理工学院音乐科技中心访问学者、北京市长城学者。研究方向为音乐声学与乐器科技，主要关注于乐器博物学学科建设、乐器博物馆建构、音乐人工智能应用等研究领域。

报告摘要

讲座聚焦于民族管弦乐队音响的“尖、扁、杂、吵”的主观感知，通过声学测量与系统对比，揭示其物理成因。内容涵盖中西乐器形制、共鸣与起振方式的差异，阐释民族管弦乐队高频突出、共振峰狭窄、噪波干扰等声学特征。讲座强调乐队音响质量不仅关乎物理声学，更涉及审美与文化语境，旨在推动民族乐队音响的科学认知与艺术提升。

龙长才

特邀报告五：耳蜗信息处理机理揭示电子耳蜗音调感知与助听器语音清晰度增强策略

个人介绍

龙长才, 华中科技大学教授、博士生导师，教育部学科评估专家。从事听觉机制与基于听觉的声与听觉信息处理研究，在听觉传感、音调感知机理、听觉噪声信号处理、听觉主动机制等领域做出原创性研究。据此，针对电子耳蜗、助听器听力康复面临的疑难问题提供新的解决方案，在工程实践上创立了主动声传感器、强噪声中的微弱信号非线性提取、基于噪声信号增强机理的飞米水平分辨的极度灵敏声振动、位移传感与测量技术。

报告摘要

通过激光干涉与心理实验研究揭示音调在耳蜗中的表达机理，据此提供电子耳蜗音调缺失问题的解决方案。通过激光干涉研究揭示听力衰退导致耳蜗听觉信息表达出现畸变，揭示了听力障碍患者，尤其是重度听力损失患者助听器语音清晰度极差的原因，以及在剔除噪声之外提高助听器语音清晰度的策略。

魏建国

特邀报告六：面向个性化语音的发音机理观测与建模研究

个人介绍

魏建国，教授、博导，天津大学智能与计算学部党委书记，国家民委人工智能重点实验室主任，全国优秀教育工作者，中央文明办“中国好人”称号，宝钢优秀教师，青海省杰出教育工作者。

报告摘要

随着语音技术走进千家万户，对于个性化语音技术的需求越来越重要，个性化语音可以应用于声纹识别、个性化情感语音合成、语音转换等各个方面。目前声纹识别、语音识别、语音合成等技术，其主要依靠对语音大数据的统计建模与深度学习技术，对个性化的语音特征形成机理及信号表征方法还缺乏系统性的深入研究。但人的个性化信息是直接由人的发音器官的差异产生，再通过人耳等听觉感知机构来获取与分析。

如何从语音生成角度深入研究人的个性化特征形成机理及声学表征方法，将可以提供更加直接的个性化语音处理途径。因此，我们更关注基于语音产生的特征表征。

本报告将介绍对人的发音机理的观测与建模。研究如何通过对人的感知机理分析与建模从而实现对人的机能的深度认知、理解与再现。如果将个性化的发音机理与声学信号相映射，从而促进对个性化语音分析与表征。及在声纹识别、欺诈语音检测、语音水印等方面的应用研究。

王岚

特邀报告七：基于类脑智能的言语障碍康复

个人介绍

王岚博士，北京大学硕士，英国剑桥大学博士。现任中国科学院深圳先进技术研究院人机言语交流实验室（Ambient Intelligence and Multimodal System Lab）主任，中国科学院人机智能协同系统重点实验室副主任，中国科学院特聘核心研究员，中国科学院深圳先进院集成所所长助理。入选第五批国家万人计划，科技部科技创新领军人才。

王岚博士的研究方向围绕着以语音为中心的多模式智能信息系统开展，包括：海量数据的鲁棒语音识别方法、多模式言语交互系统、言语障碍和康复技术等。主持国家自然科学基金重点项目三项；主持完成科技部重点研发计划主动健康专项项目，国自然重大计划项目等国家、省部级项目。

王岚博士是IEEE会员，担任多个国际杂志的审稿人，担任ISCSLP 2012／2016，InterSpeech 2020 国际会议程序委员会委员。在专业领域上发表国际杂志和国际会议论文100余篇，申请和授权发明专利30余项。

报告摘要

通过借鉴大脑处理语言和信息的方式，结合人工智能技术，研究言语障碍的精准评估和个性化康复训练系统，包括：多模态言语障碍数据库，语音到发生动作的反向重建，障碍语音评估，3D虚拟人语音可视化康复训练系统等内容。

ACCOMMODATION

酒店住宿

本次会议不统一安排住宿，请各位参会代表自行预订。会议协调深圳中海凯骊酒店（9 月26-28日），参会代表可享受协议价，具体如下,预定链接为：https://forms.office.com/r/03KwYH7y4f