四川方言ASR语音识别技术和TTS语音合成技术

2020-04-23 15:29:32
导读 中新网客户端北京4月23日电 阿里巴巴旗下的人工智能助手天猫精灵23日宣布,今天起可以开口说四川话了。用户在使用闹钟、天气、你想我猜等

中新网客户端北京4月23日电 阿里巴巴旗下的人工智能助手天猫精灵23日宣布,今天起可以开口说四川话了。用户在使用闹钟、天气、你想我猜等日常生活及娱乐功能时都可以用四川方言对话。

在这背后,离不开一位95后成都女孩周玥偲的悉心调教。去年,阿里方面曾表示,以700元一小时的高薪,招聘了一位95后成都女孩“教”人工智能产品学说四川话,光是录制声音就花了1个月的时间。最后,周玥偲拿到了1个月10万元的高薪报酬。

据介绍,教会这只“四川猫”并不简单,除了录制声音,研发主要应用了两种技术,四川方言ASR语音识别技术和TTS语音合成技术,前者用于理解方言语言,后者则用于模仿真人口音语调。

天猫精灵团队表示,由于四川方言跨区域大,不同片区之间有口音差异,给模型训练带来高难度,为解决这一问题,研发团队采用了阿里自研的语音建模技术,进行方言口音适配。四川方言博大精深,各地的口音、词汇都略有不同,为了让智能音箱能够听懂不同地区的四川口音,过去一年中,还有数万用户主动参与“教你说四川话”技能,为研发提供了宝贵语料。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章