【环球网科技综合报道】6月9日消息,近期一些国内外的学校和教育机构与微软合作,通过Azure AI的语音评测功能,来提升学生的口语及朗读能力。
在语言学习中,发音和朗读练习能否得到及时准确的反馈是至关重要的一环。在常见的“一对多”教学方式中,教师逐一评估和指导每个学生,需要大量的时间和精力。而AI技术为此提供了一个数字化解决路径。
据悉,微软Azure AI的语音评测功能,可通过上传跟读文本和音频,对发音的准确度、流利度和完整度进行评测,帮助教师和学生及时发现口语和朗读中存在的问题,针对不同学生制定个性化教学和练习方案,使口语及朗读的教与学都更加高效。
语音评测功能作为一项构建于微软Azure云上的能力,可通过API接口和参数开放给微软其它产品以及合作伙伴、独立软件开发商和系统集成商,用于开发适用于不同用途的学习及教辅工具。
在中国,语音评测功能的潜力正得到教育机构关注,并促使他们与微软联合开发使用微软AI语音技术的外语教学产品。以培生为例,培生与微软Azure的语音产品团队合作,为中国学生和教师打造了智能交互式教辅工具。
在《新朗文小学英语》产品中,常规的英语练习配合语音评测,为学生提供了更多的语言练习机会和快速准确的效果反馈。学生在朗读学习内容后,语音评测就会对发音准确度、完整度等几个方面做出评分并生成可视化图表。这既能让学生了解自己的朗读表现,也能帮助教师们一目了然地掌握每个学生的学习进度,无需耗费过多精力也能对每个学生进行高效的分析评估及后续指导。
该产品还使用了Azure认知服务中的“文本转语音(TTS)”技术,利用机器学习和定制化神经语音功能生成媲美真人发声的语音,帮助学生提高听力和理解能力。
事实上,AI语音评测所表现出的快速反馈及高度的拟人一致性,其背后是对数据、算力、算法等综合AI能力的巨大考验。得益于微软在语音识别技术上的坚实储备,使语音评测在专业性、实时性、稳定性、可定制性等四个维度上实现了多点平衡。
在专业性方面,微软语音评测所支持的每种语言都以10万小时以上的当地母语大数据进行训练,以学习到纯正发音。在评估环节,语音评测可对音素、单词的发音准确度,句子和文章的流利度和完整性等进行不同颗粒度的多维评估,详细呈现优缺点并制定针对性的提升计划。经过测试,语音评测与人类专家的皮尔森相关系数达到了0.75(“1”表示完全相关),十分接近母语专家打分水平。
微软Azure遍布全球的数据中心也可支撑大规模计算需求,实现对语音“边朗读边处理”,读完立即反馈评估结果,确保充分的实时性。同时,语音评测基于微软的NLP(自然语言处理)模型构建模糊匹配文本,对于特定领域和场景具有良好的容错率和包容性,漏读、错读、重复读都不影响打分有效性与准确性,并且可适配口音、噪音、年龄层等,实现个性化评分标准。
目前,微软仍在不断优化语音评测的AI表现,并且在过去一段时间里推出了更多可用于纠音反馈的新功能,包括对发音进行音节及音素级别的打分、实际发音与正确发音之间的音素比对、国际音标IPA的输出等。其可支持的语种也不断扩充,目前已直接开放或可申请使用超过40多个国家100多种语言的评测。
据微软方面介绍,随着功能日益丰富完善,微软Azure AI的语音评测功能已能够应用于教育领域解决方案的合作伙伴、APP开发者以及语言学校、培训中心、教育机构、考试中心,用于进行各种语言学习、口语练习和考试等场景的开发。这项技术并非要取代教师的主导作用,而是帮助教师提升教学效率,专注于教学目标的达成。微软希望借助Azure AI的不断发展,为教育领域提供便捷有效的解决方案,在远程教学、定制个性学习方案及优化教师资源方面发挥越来越大的作用。
关键词: Azure