微软与教育机构合作：探索AI辅助口语教学的数字化路径

【环球网科技综合报道】6月9日消息，近期一些国内外的学校和教育机构与微软合作，通过Azure AI的语音评测功能，来提升学生的口语及朗读能力。

在语言学习中，发音和朗读练习能否得到及时准确的反馈是至关重要的一环。在常见的“一对多”教学方式中，教师逐一评估和指导每个学生，需要大量的时间和精力。而AI技术为此提供了一个数字化解决路径。

据悉，微软Azure AI的语音评测功能，可通过上传跟读文本和音频，对发音的准确度、流利度和完整度进行评测，帮助教师和学生及时发现口语和朗读中存在的问题，针对不同学生制定个性化教学和练习方案，使口语及朗读的教与学都更加高效。

语音评测功能作为一项构建于微软Azure云上的能力，可通过API接口和参数开放给微软其它产品以及合作伙伴、独立软件开发商和系统集成商，用于开发适用于不同用途的学习及教辅工具。

在中国，语音评测功能的潜力正得到教育机构关注，并促使他们与微软联合开发使用微软AI语音技术的外语教学产品。以培生为例，培生与微软Azure的语音产品团队合作，为中国学生和教师打造了智能交互式教辅工具。

在《新朗文小学英语》产品中，常规的英语练习配合语音评测，为学生提供了更多的语言练习机会和快速准确的效果反馈。学生在朗读学习内容后，语音评测就会对发音准确度、完整度等几个方面做出评分并生成可视化图表。这既能让学生了解自己的朗读表现，也能帮助教师们一目了然地掌握每个学生的学习进度，无需耗费过多精力也能对每个学生进行高效的分析评估及后续指导。

该产品还使用了Azure认知服务中的“文本转语音(TTS)”技术，利用机器学习和定制化神经语音功能生成媲美真人发声的语音，帮助学生提高听力和理解能力。

事实上，AI语音评测所表现出的快速反馈及高度的拟人一致性，其背后是对数据、算力、算法等综合AI能力的巨大考验。得益于微软在语音识别技术上的坚实储备，使语音评测在专业性、实时性、稳定性、可定制性等四个维度上实现了多点平衡。

在专业性方面，微软语音评测所支持的每种语言都以10万小时以上的当地母语大数据进行训练，以学习到纯正发音。在评估环节，语音评测可对音素、单词的发音准确度，句子和文章的流利度和完整性等进行不同颗粒度的多维评估，详细呈现优缺点并制定针对性的提升计划。经过测试，语音评测与人类专家的皮尔森相关系数达到了0.75（“1”表示完全相关），十分接近母语专家打分水平。

微软Azure遍布全球的数据中心也可支撑大规模计算需求，实现对语音“边朗读边处理”，读完立即反馈评估结果，确保充分的实时性。同时，语音评测基于微软的NLP（自然语言处理）模型构建模糊匹配文本，对于特定领域和场景具有良好的容错率和包容性，漏读、错读、重复读都不影响打分有效性与准确性，并且可适配口音、噪音、年龄层等，实现个性化评分标准。

目前，微软仍在不断优化语音评测的AI表现，并且在过去一段时间里推出了更多可用于纠音反馈的新功能，包括对发音进行音节及音素级别的打分、实际发音与正确发音之间的音素比对、国际音标IPA的输出等。其可支持的语种也不断扩充，目前已直接开放或可申请使用超过40多个国家100多种语言的评测。

据微软方面介绍，随着功能日益丰富完善，微软Azure AI的语音评测功能已能够应用于教育领域解决方案的合作伙伴、APP开发者以及语言学校、培训中心、教育机构、考试中心，用于进行各种语言学习、口语练习和考试等场景的开发。这项技术并非要取代教师的主导作用，而是帮助教师提升教学效率，专注于教学目标的达成。微软希望借助Azure AI的不断发展，为教育领域提供便捷有效的解决方案，在远程教学、定制个性学习方案及优化教师资源方面发挥越来越大的作用。

关键词： Azure