当AI成为声乐比赛评委，争议？期待？

发布时间：2026-02-14 10:56:15 浏览量：61

复赛第一名、上海音乐学院学生刘宗奇

文 | 陈茴茴

继2025年11月中德智声国际音乐节复赛（中国区决赛）首次引入人工智能评委引发广泛关注后，这一融合科技与艺术的创新赛制将延续至决赛阶段。

2026年5月，赛事决赛将在德国下萨克森州歌剧院举行。从复赛中脱颖而出的十余位中国选手将赴德参加决赛，与欧洲赛区的参赛者共同在融合传统声乐艺术与前沿人工智能技术的全新赛制下，接受“真人专家评委+AI评委”的专业审视。这些选手分别来自上海音乐学院、华东师范大学、西安音乐学院等国内多所专业音乐院校及综合类高校。

多维考核贴近职业实践

本次赛事作为上海市教委“人工智能促进科研范式改革赋能学科跃升计划”的评优科研项目，以“科技+艺术+美育”为核心理念，由上海理工大学沪江学院、德国下萨克森州立歌剧院与ICC欧洲国际文化交流合作协会联合主办，上海理工大学光电信息与计算机工程学院承办。这也是人工智能深度介入声乐美育、赛事评价与美育普及的一次创新实践。

据主办方介绍，将于5月在德国下萨克森州歌剧院举行的决赛环节，将启用在初赛、复赛过程中不断调参升级的AI数智人，与7位真人专家评审共同参与演唱技巧评审。因此，此次赛事并非传统意义上的单场声乐比拼，而是一套包含多轮比赛与展示环节的综合性评估体系。

评审体系的设置意在更真实地模拟国际职业舞台的选拔逻辑，全面考察选手的综合潜力。真人专家评审重点聚焦四大维度：一是声乐技术的扎实程度与声音控制能力；二是对作品风格、语言及作曲家意图的深入理解；三是音乐结构意识与艺术表达的完整性；四是舞台呈现中的音乐逻辑、情感层次与整体把控能力。

“声乐训练过去高度依赖经验和个体判断，不容易量化，也难以复制。而AI的加入，使许多‘听不见、看不见、难捕捉’的声学细节得以呈现，让学习者和教师都能更直观地理解和改进。这正是科技赋能美育的核心意义。”中国工程院院士、上海理工大学光电信息与计算机工程学院名誉院长庄松林说。

“真人+AI”构建融合评价机制

旅欧女中音歌唱家、上海理工大学特聘教授侯震一介绍，该赛事始终将AI评委定位为一种辅助性评估工具，而非对真人评审的替代。为避免AI评分可能带来的机械化倾向，AI系统在设计之初就确立了“人主导、机协同”的原则。

在初赛与复赛阶段，赛事采用12位来自国内外的声乐专家评审加1个AI评审的联合评分模式，13个分数去掉一个最高分、一个最低分后取平均值。这一机制既保留了传统声乐评审中真人评委不可替代的审美判断与艺术经验，也使AI成为一个可对照、可分析的参照系。一方面，赛事主办方得以观察AI与真人评审在不同技术维度上的一致性与差异；另一方面，这种对照也反过来促使AI研究团队持续修正和提升AI对声乐技巧与演唱质量的认知水平。

据了解，决赛将继续沿用并优化这一机制。真人评委团由来自上海音乐学院、华东师范大学、山东大学艺术学院等国内院校的资深教授，以及德国下萨克森州立歌剧院等国际机构的艺术家共同组成，确保评审的专业性与国际视野。

参与此次赛事全程评分的AI评委“Diva宝贝”由上海理工大学院士团队领衔研发。该系统基于大量专业美声演唱数据构建高精度声学模型，对音高、节奏、音色、共鸣、气息控制及整体音乐表现力等维度进行实时、量化的分析。尤为关键的是，这位“AI评委”的训练基于大量真实声乐演唱样本，使其评分逻辑始终扎根于真实的声乐教学与表演实践。其评分输出结果已与多位专家评委打分进行多轮校准，在多个指标上展现出高度一致性与稳定性。

针对声乐赛事中引入AI评价模型，侯震一认为，这并不是要改变声乐艺术的本质，更不是要替代歌唱家和声乐教授的职业，而是在评估层面引入一种新的观察维度。与传统声乐比赛相比，它使声音中的一些细节（例如技术稳定性、音色使用方式、声音能量分布等）得以被更系统地记录和分析，也促使评审过程在一定程度上变得更具可对照性和可讨论性。这种即时反馈机制不仅可以服务于比赛，也可延伸至日常训练场景。

在AI逐渐深入声乐领域的背景下，她建议选手在练习和备赛中更加重视基础技术的长期稳定性，而不是把希望寄托在一时或某一场比赛的“状态爆发”；同时要更加清晰地理解作品的音乐结构、文本逻辑与声音表达之间的内在关系，让技术真正服务于音乐本身。AI无论是充当教学助手还是评委，并不会要求歌者“像机器一样唱歌”，反而会促使歌者回归更扎实、健康和可持续的声乐训练路径。

在德国下萨克森州立歌剧院院长奥利弗·格拉夫（Oliver Graf）看来，AI不会取代艺术家，而是将成为更科学、更公平的人才培育新工具。中德在声乐传统与AI创新上的合作及互补，可以携手共建一个国际化的青年歌者培养体系。

正视AI，善用AI

当人工智能以评委身份出现在声乐比赛现场，争议与期待几乎同步而生。有人担忧冰冷的算法会消解艺术的灵性，也有人希冀AI能彻底解决评审主观性的问题。

从AI进入声乐教学课堂，到其成为声乐比赛的评委，人工智能正一步步深入声乐艺术领域。这一进程可视为一次次实验性的探索，而非价值立场的对立。

声乐艺术的核心，始终是人的情感表达与文化的传递。AI无法取代一位经验丰富的声乐教授对作品文化历史语境的理解，也无法产生观众被一段咏叹调深深打动时的心灵震颤。但与此同时，人类评委在疲劳、偏好或文化差异影响下的判断偏差，也确实长期存在。AI的介入，并非要重新定义“什么是好的歌唱”，而是在既有艺术标准之上，提供一种新角度观察的技术手段。

长远来看，AI在声乐领域的应用将日益广泛，从比赛评分到日常教学，从嗓音健康监测到个性化训练方案生成。面对这一趋势，盲目抵触或过度神化都是非理性的，关键在于“如何用”。“正视”或许是当下最好的选择：善用AI的工具价值，也承认其能力的边界；坚守艺术的人文内核，同时拥抱技术带来的效率与客观。

正如上述声乐赛事所倡导的“科技+艺术+美育”三位一体理念，未来的声乐生态不应是人与AI的对抗，也不是AI代替人类主宰艺术的内涵，而应是人机协同的共生。正视AI，既不过分依赖，也不无端抵触，这或许是这个时代任何领域、任何行业面对技术浪潮都应持有的姿态。