一起教育科技钻研语音评测技术成果显著,致力打破教育地域壁垒

来源:群推手网 2019-04-01 14:00:00  

作为K12领域的独角兽,一起教育科技早早将发力点瞄准到了“AI+教育”上。其将所有用产品、技术手段帮助老师学生更好的完成教学和科研的过程,定义为AI助教工作。对这些进行探索和应用,一方面更好解放老师工作,将重复的机器擅长的工作交给机器,让老师更好地进行教学工作;同时,一起教育科技希望学生能够更多地完成自主学习,希望通过大数据和AI,让学生更有针对性地进行学习。

目前,一起教育科技已经有多项技术在教育领域落地实践,比、如语音识别&评测、图像识别&批改、自然语言处理&语义理解等等。其中通过语音识别自动打分,解决了英语口语评测标准化的问题,在教育层面,将地域、资源的壁垒打破,让每一个学生都有机会接受到良好的口语教育。

抠细节,口语朗读语音评测效果不凡

语音评测在教育领域的两大应用

目前语音评测在教育领域的应用包括两方面:一是口语朗读的语音评测。学生根据一段文本英语内容进行跟读,在发音过程中,音频将通过设备端传送至后台服务器,后台进行相应的口语打分,该过程主要评估学生语音的准确度, 完整度、流利度。在这部分,一起教育科技的后台深入到流利度方面的细节性问题对韵律、重音、语速等皆有所考察。

将机器打分与专业的教研老师的打分进行比较,对口语评测技术效果进行评估, 和老师打分越接近的口语评测引擎, 可认为其表现越好。在小学英语的口语场景中,一起教育科技较其他第三方引擎更集中在零区间附近,具有更好的效果。

业界语音引擎数据对比(单词项)

钻技术,半开放口语评测攻破三大环节

关于语音评测在教育领域的第二方面应用:半开放口语评测,据一起教育科技的负责人透露,就需要用到语音打分技术+自然语言处理技术合成的综合性技术解决方案。“半开放口语相对跟读英语口语评测,前者多出的是语义的相似度判断和语义匹配过程。而半开放口语则是,给出一段文本和相应的问题,学生需根据文本的理解对问题进行语音回答。在语音回答过程中,用户答案并不唯一,后台不仅仅按照发音角度评估用户打分,还需参考用户回答问题的内容本身是否正确、内容本身是否完整、是否回答题干相应的关键词或答案等等。”

半开放语音评测技术解决方案

如何进行相应的针对半开放口语评测?一起教育科技的负责人将其分为三个环节——语义分割、指代消歧、语义相似度判断。

将一句话或一个段落划分成不同的短语,短语中包含一些关键信息,利用短语和答案进行匹配,即短语和短语之间的匹配。同时,针对所有中小学教学过程中,人名或代词使用较多的情况,利用指代消歧技术将一些单词(例如my 、this)与原文中的名词或人名、物体名进行对应。除此之外,一起教育科技会进行语义相似度的判断。针对一句话,用户的描述可能不同:比如doing  sports和doing  exercise 是一个意思。同义词的判断和语义相似度判断可以用传统的自然语言处理技术来实现。

“如果有更多样本,我们则可以使用深度学习的方法来进行更好的分析。”公司负责人还表示,整体来看,语音技术在目前K12领域偏向于监督式学习场景,如果有大量的用户语料在小学、中学里面(包括发音、跟读、开放口语等回答)。这些语料进行标注训练,可很好的提升本身语音技术的识别效果。

成立八年多来,一起教育科技覆盖的学校不只是信息化程度很好的北京、上海,也有信息化程度较差的城镇乡村小学。移动互联网带来相对公平的教学机会,无需通过一个很大的多媒体教室才能完成口语教学过程,所以一起教育科技积极应对此事,同时也希望未来将更多的线下作业场景搬到线上。