作者:嗯哼 | 来源:互联网 | 2024-11-17 19:13
12月2日,微软携手鹿音苑文化传播公司及150余名志愿者,正式向北京市红丹丹视障文化服务中心(以下简称“红丹丹”)的心目图书馆捐赠了一批由人工智能生成的有声内容。这批内容包括鲁迅、老舍、萧红、朱自清等著名作家的经典作品,以及红丹丹文化期刊。这些作品是利用微软Azure云认知服务中的语音合成平台Speech Studio及其先进的人工智能(AI)技术创作的,其中包括艺人周迅授权的定制声音、红丹丹视障人士播音员董丽娜授权的定制声音,以及其他多种微软智能语音合成平台的声音(如晓晓、云野等)。
(从左至右依次为:志愿者代表、微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文、红丹丹创始人郑晓洁、鹿音苑音乐文化传播公司联合创始人曾宇)
自2014年起,微软与红丹丹合作,在微软智能云Azure上搭建了心目图书馆,帮助视障人士通过移动设备随时随地收听有声读物。随着微软AI语音技术的不断进步,2019年,微软利用神经网络语音合成技术打造了自然的人工智能声音,如“晓晓”,并开发了一个能够批量文字转语音的平台,显著降低了有声内容的创作成本,使更多温暖的声音得以融入心目图书馆。
红丹丹创始人郑晓洁表示:“微软的人工智能语音技术声音动听、自然,极大地降低了我们的有声内容创作成本,使心目图书馆的馆藏更加丰富。借助微软的文字转语音技术,红丹丹能够在几百毫秒内合成一本有声书,并实现7*24小时不间断生成。”
2017年,微软宣布将在5年内为AI for Good项目投资1.25亿美元,利用人工智能技术解决社会重大挑战。其中,人工智能无障碍计划(AI for Accessibility)于2018年启动,计划在五年内投入2500万美元,研发能够增强人类能力的人工智能技术,帮助全球残障人士更好地融入职场、现代生活和人际交往。
作为一家全球性公司,微软智能云Azure拥有广泛覆盖的数据中心网络,其基于深度神经网络的文字转语音技术已支持超过50种地区语言。微软的智能语音技术持续迭代升级,目前基于Azure的深度神经网络语音模型几乎达到了真人录音的水平,能够提供多角色、多情感、多风格的声音,适用于各种场景。
微软有声内容创作工具平台: https://speech.microsoft.com/audiocontentcreation