IT之家 6 月 16 日消息,据外媒 New Atlas 14 日报道,脑机接口技术迎来一项重大突破:加州大学戴维斯分校研发的新型植入系统,让一位瘫痪患者不仅能顺畅说话,甚至还能借助电脑“哼唱”旋律,几乎没有任何延迟。
研究团队在一位渐冻症患者身上试验了这项技术。通过在大脑中控制发音的区域植入四组微电极阵列,系统能实时捕捉说话时产生的神经信号,再结合低延迟处理和 AI 解码模型,将这些信号同步转化为语音,在扬声器中播放。
需要强调的是,这项技术并不是在“读心”,而是识别出患者尝试发声时大脑发出的运动指令。系统合成出的声音与患者本人极为相似 —— 这得益于在其发病前录制的语音样本训练出的声音克隆算法。
从信号采集到语音生成,全程只需 10 毫秒,几乎可以实现实时对话。
系统还能识别出患者试图唱歌的动作,判断其想表达的音高,并据此合成旋律。在研究团队发布的视频中,这一功能尚显初级,但对于那些逐渐失去表达能力的人来说,无疑是一种重获声音的希望。
该研究论文的资深作者 Sergey Stavisky 表示,这一进展为脑机语音合成带来了转折点。他说:“借助即时语音输出,神经义体用户能真正参与对话 —— 他们可以打断别人,也更不容易被别人误打断。”
该系统能复现“啊”“喔”“嗯”等语气词,判断句子是疑问还是陈述,甚至辨别出强调词语的位置。研究团队还指出,系统能准确合成此前从未见过的虚构词语。这使得语音表达更自然、更具表现力。
IT之家从报道中获悉,研究人员也指出,目前试验仅在一位患者身上进行,下一步将拓展至其他因不同原因丧失语言能力的人群,以验证技术的普适性。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。