新闻资讯

您的位置: > 首页 > 新闻资讯 > 阿里公布新语音合成技术 录音10分钟定制AI语音

阿里公布新语音合成技术 录音10分钟定制AI语音

发布时间:2019-07-11 访问次数:468次 来源:新浪科技 分享:

近日,阿里巴巴发布新一代语音合成技术KAN-TTS,称可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。该技术由达摩院机器智能实验室自主研发。

阿里方面称,当前业界商用系统的合成语音与原始音频录音的接近程度通常在85%到90%之间,而基于KAN-TTS技术的合成语音可将该数据提高到97%以上。

据悉,KAN-TTS由达摩院机器智能实验室自主研发,深度融合了目前主流的端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。传统语音合成定制需要10小时以上的数据录制和标注,对录音人和录音环境要求很高。从启动定制到最终交付,项目周期长成本高。

阿里利用Multi-Speaker Model与Speaker-aware Advanced Transfer Learning相结合的方法,将语音合成定制成本降低10倍以上,周期压缩3倍以上。也就是说,用1小时有效录音数据和不到两个月制作周期,就能完成一次标准TTS定制。

此外,这使得普通用户定制“AI声音”的门槛更低。只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。

科创项目库

更多>>
  • 新一代功率器件—联栅功率管

    项目简介:功率器件换代技术,高可靠、低功耗,中高压领域竞争优势显著,替代进口,国际首创,30年科技成果转化,量产工艺平台,专利布局(13项发明专利),IP核

  • 高算力低功耗芯片与系统

    项目简介:公司将会致力于高算力低功耗的芯片设计与系统整体设计,为即将出现的高计算需求的时代提供以算力芯片为核心的包含硬件软件的高效低功耗的计算系统。

  • 柔性电子智能包装解决方案

    项目简介:智能包装涉及保鲜技术、水溶膜包装技术、二维码技术、包装性与结构创新技术、便携包装技术、纹理 防伪技术、磁共振射频防伪识别技术、食品安全溯源方案技术等

  • About.U 无需医生的便捷智能检查设备

    项目简介:1、一款无需任何专业知识的便捷式智能自检设备,设备基于超声原理,全程导航式引导使用,通过云端分析无需任何医生完成智能诊断