*/
站内搜索:
新闻中心
参政议政
组织建设
社会服务
学习研究
九三风采
市级组织
 
关于公布“小金库”检...
关于举办改革开放40年...
关于下发纪念“五一口...
关于转发社中央课题招...
九三学社浙江省委2018...
 
用户名:
校验码:
密    码:
 
 
 
 科技前沿 

“倾听”1分钟,就能开口模仿人类“讲话”
新款人工智能语音系统高效率复制人声
2017年5月28日    来源:科技日报

       发布时间:2017-05-28 点击数:432

  据《科学美国人》杂志网站报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音系统,其能通过分析讲话录音和对应文本以及两者之间的关联,在1分钟内模仿人类“讲话”,比如,模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。
  让声音听起来更自然,是计算机程序在将文字转换成语音过程中面临的核心挑战,即使目前最好的语音助手,如苹果公司的Siri和亚马逊公司的Alexa,一发声给人的第一感觉仍然是,“哇!这是计算机。”背后原因在于这些语音助手系统的工作原理:根据预录的声音文档整理出词汇,再通过另一个新的音频文档将这些词汇拼凑在一起发声。
  而琴鸟公司的AI使用了一种全新的语音合成系统,能在“倾听”过程中“掌握”每个人说话时字母、音位和单词的发音特点,通过推理并模仿这个人声音中的情感和语调,“说”出全新的语句。
  新系统使用模仿人脑思维的算法创建出一种人工神经网络,能利用深度学习技术将所听到的转换成语音,并仅靠任何人1分钟讲话内容,就能完全模仿这个人说话。其市场前景非常广阔,可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。
  开发该系统的蒙特利尔大学学习算法实验室博士后亚历山大·布瑞比森表示,在学会并模仿了几个人的声音后,再模仿任何一个新对象的语音就会变得更快,因此新语音系统不需太多信息,1分钟足以捕获某个人声音的核心特点。
  但美国卡内基梅隆大学语言技术研究所教授迪莫·鲍曼表示,琴鸟的语音系统和真正的人声之间还有差距。“我仔细听过琴鸟系统的发声,其带有背景噪音,以及微弱的机器人特征。而且,它还不能模仿人们在讲话中的呼吸和唇部运动,因此仍然能听出其计算机语音特征。”鲍曼说。他认为,语音系统真正令人信服地复制人声,还需再等几年。

  总编辑圈点
  人类的嗓音最美妙,天籁之音怎能被机器模仿出来?一呼一吸间的抑扬顿挫,一颦一笑间的情感起伏,才是人之为人的精华所在。虽然机器模仿人声还差强人意,但仍大有用武之地——高德地图林志玲版,不就是机器通过学习特殊语料后,模仿独特人声在给司机指路嘛。但需知,语音合成只是人工智能的一个基础层次,要想达到以假乱真甚至人机交互,估计还得一二十年。
  (记者聂翠蓉)


 
相关新闻:
新“电子纹身”让可穿戴技术更实用       强激光实验首次证明光可阻碍电子      
新型便携装置两秒检测水质       小核糖核酸分子可调控肿瘤血管新生      
隐藏复杂技术 让密码“轻松落地”       美研究揭示大脑如何学习语言      
种子的“选择”可影响地区生物多样性       新疫苗可提高免疫细胞对抗流感能力      
欢迎您:您是第 6861577 位访客
z">