Press "Enter" to skip to content

这篇人工智能论文揭示了DeWave:用一种新的人工智能框架革新了EEG到文本翻译,为开放词汇BCI提供了革命性的方法

悉尼科技大学(UTS)GrapheneX-UTS人本人工智能中心的研究人员已经开发出一种令人瞩目的系统,能够解码无声思维并将其转化为书面文字。这项技术在帮助那些因中风或瘫痪等情况而无法说话的人进行交流,并促进人与机器之间的改进互动方面具有潜在的应用。

在新奥尔良的NeurIPS会议上作为焦点论文展示的研究团队介绍了一种便携式和非侵入性的系统。GrapheneX-UTS HAI中心的团队与悉尼科技大学工程与信息技术学院的成员合作,开发了一种将脑电信号转化为可理解文字内容的方法,而无需进行侵入性手术。

在研究过程中,参与者戴着一顶装有电极的专用帽子,通过脑电图(EEG)记录脑部活动。捕获到的脑电图数据使用名为DeWave的AI模型进行处理,该模型由研究人员开发,将这些脑电信号转化为可理解的单词和句子。

研究人员强调了这种创新在将原始脑电波直接转化为语言上的重要性,突出了离散编码技术在脑到文字翻译过程中的整合。这种方法在神经科学和人工智能领域开辟了新的可能性。

与以往需要侵入性手术如脑植入物或核磁共振成像机使用的技术不同,该团队的系统提供了一种非侵入性和实用的替代方案。重要的是,它不依赖于眼动跟踪,使其在日常使用中更具适应性。

该研究涉及29名参与者,相比过去仅限于一两个个体的研究,确保了更高水平的鲁棒性和适应性。虽然使用帽子收集脑电信号会引入噪声,但研究报告显示在脑电翻译方面表现出色,超过了先前的基准。

团队强调了该模型在匹配动词而非名词方面的熟练程度。然而,在解析名词时,系统显示出倾向于同义词对而不是完全翻译的趋势。研究人员解释说,在处理单词时,语义上相似的词可能会引发类似的脑电波模式。

目前的翻译准确性,以BLEU-1分数衡量,约为40%。研究人员的目标是将这个得分提高到与传统语言翻译或语音识别程序相媲美的水平,这些程序通常可以达到约90%的准确性水平。

这项研究基于UTS在脑机接口技术方面的先前进展,表明它对于改变之前受到身体限制影响的个体的交流途径有着巨大的潜力。

这项研究的发现为将思维无缝转化为文字提供了希望,为面对交流障碍的个体提供了力量,并促进了更好的人机交互。

Leave a Reply

Your email address will not be published. Required fields are marked *