神经退行性疾病、中风和脑损伤等,都有可能使人失去说话能力。现在有一些辅助技术可以识别患者微小的面部运动,从而拼出单词,但准确度和时效性通常很差。
为了给患者提供更好的沟通方式,加州大学旧金山分校的研究人员最近开发了一种脑机接口,可帮助语言障碍患者“说话”。该系统通过监视用户的大脑活动,使用虚拟声道将其转换为自然的发声语音,模拟喉部、舌头、嘴唇和下颌等部位完成表达。
参与这项研究的研究人员Gopala Anumanchipalli表示,语音中心协调声道运动的方式很复杂。他们推断大脑中的语音中心是编码动作而非声音,因此在解码时做出对应动作才更为正确。
研究人员创建了一个虚拟声道,然后使用机器学习来产生正确的声音。研究员在监测大脑活动时大声说出特定短语,机器将神经信号与虚拟声道中的运动做出匹配,使这些运动产生与原始短语紧密匹配的自然声音。
另一位研究员Josh Chartier谈到,若是“sh”和“z”这样较慢的语音,合成难度比较低,可以保持语音的节奏、语调,表现说话者的性别和身份。但如“b”和“p”这样短促又模糊的发音,辨识起来就有些难度。不过,目前的准确度对比以往实时通信已经有了很大的提升。“无法移动手臂和腿的人已经学会用大脑控制机器人肢体,相信在未来,有语言障碍的人能够学会用这种脑控制的人工声道重新获得说话的能力。”Chartier说。