科学讲座系列：发音机理观测与生理建模研究-医疗机器人与智能系统研究院

科学讲座系列：发音机理观测与生理建模研究

发布日期：2022-08-16

演讲时间： 8月19日（周五）9：30-11：30 参加方式：腾讯会议 495 664 649

演讲摘要：随着语音技术走进千家万户，对于个性化语音技术的需求越来越重要，个性化语音可以应用于声纹识别、个性化情感语音合成、语音转换等各个方面。目前声纹识别、语音识别、语音合成等技术，其主要依靠对语音大数据的统计建模与深度学习技术，对个性化的语音特征形成机理及信号表征方法还缺乏系统性的深入研究。但人的个性化信息是直接由人的发音器官的差异产生，再通过人耳等听觉感知机构来获取与分析。如何从语音生成角度深入研究人的个性化特征形成机理及声学表征方法，将可以提供更加直接的个性化语音处理途径。因此，我们更关注基于语音产生的特征表征。

本报告将介绍对人的发音机理的观测与建模。研究如何通过对人的感知机理分析与建模从而实现对人的机能的深度认知、理解与再现。如果将个性化的发音机理与声学信号相映射，从而促进对个性化语音分析与表征。及在声纹识别、反声纹欺诈、语音水印等方面的应用研究。

演讲者简介：魏建国，教授、博士生导师，青海民族大学校长助理兼智能与计算学部执行主任，天津大学智能与计算学部副主任，教育部网络空间安全类教指委委员，国家民委人工智能重点实验室主任，中宣部中央文明办“中国好人”称号，青海省杰出教育工作者，青海千人计划领军人才，青海昆仑英才教学名师，天津计算机学会常务理事。日本北陆先端科学技术大学院大学博士学位，法国CNRS/Telecom博士后研究员。CCF语音对话与听觉、人机交互、普适计算专委会委员。近年来致力于研究人的发音与听觉感知机理及其在人机交互、安全、医疗等方面的应用研究，以及藏语语音多模态分析等研究。作为项目负责人承担了国家重点专项课题，国家自然科学基金面上项目，联合基金项目、973子课题等。在国际国内重要刊物和学术会议上发表论文100余篇。NCMMSC2015 程序委员会主席，ISCSLP 2016 组委会主席，ISSP2017组委会主席，HMME2018大会主席，NCMMSC2019 大会主席。牵头及参与获得青海省教学成果奖及天津市教学成果奖，获天津市工程专业优秀指导教师奖。天津大学“我心目中的十佳好导师称号”。

演讲者-魏建国教授

合作交流

学术交流

企业合作

研究方向