脑2键盘:非侵入式脑-文技术的一大突破
Meta公司的一个研究团队推出了脑2键盘,这是一个开创性的非侵入式脑机接口(BCI)系统,可以直接从大脑活动中解读打出的句子。这项研究与35名健康的志愿者合作进行,使用脑磁图(MEG)和脑电图(EEG)来记录参与者在QWERTY键盘上打出记忆中的句子时的大脑信号。研究人员使用先进的深度学习模型,成功地将这些大脑信号转换成文本,这标志着在为有严重运动障碍的人提供可访问的通信技术方面迈出了重要一步。
虽然需要大脑植入的侵入式BCI已经显示出很高的准确性,但由于信号质量较弱和解码方面的挑战,非侵入式方法一直滞后。脑2键盘旨在通过深度学习创新来弥合这一差距,并在MEG方面显示出很有希望的结果,MEG的表现大大优于脑电图。该研究发现,基于MEG的解码平均达到了32%的字符错误率(CER),最好的情况达到了19%,大大提高了以前的非侵入式文本解码方法。
主要发现
- 非侵入式文本解码突破:脑2键盘在使用深度学习从大脑活动中解码文本方面取得了显著的准确性。
- MEG优于EEG:该系统记录到MEG的CER为32%,而EEG的CER为67%,突出了MEG的卓越信号质量。
- 深度学习整合:该模型结合了卷积神经网络(CNN)、转换器和语言模型,以提高文本的准确性。
- 运动和认知因素起作用:错误分析揭示了键盘布局、词频和语法结构的影响。
- 潜在应用:该技术有望帮助肌萎缩侧索硬化症(ALS)、中风和闭锁综合征患者,以及脑控智能界面。
- 仍然存在挑战:该系统还不是实时的,依赖于昂贵的MEG设备,并且仍然落后于侵入式BCI的性能。
深入分析:脑2键盘的工作原理及其影响
1. 为什么这是一个游戏规则改变者?
虽然传统的BCI依靠侵入式植入物来实现高速文本解码,但脑2键盘采用了一种非侵入式方法,与过去的方法相比,准确性得到了显著提高。对于那些不能接受脑部手术但需要辅助通信工具的人来说,这一发展至关重要。
2. 脑2键盘背后的科学
该系统记录用户打字时的大脑活动,并使用深度学习框架处理这些信号,该框架包括:
- CNN模块:从MEG/EEG信号中提取空间和时间模式。
- 转换器模块:利用句子级别的上下文来完善击键预测。
- 语言模型:根据语言规则和字符频率纠正错误。
这些组件协同工作以提高准确性,使该系统成为迄今为止最先进的非侵入式BCI模型之一。
3. MEG与EEG的作用
MEG在本研究中成为卓越的模式,其准确性几乎是EEG的两倍。MEG的更高信号分辨率可以更好地跟踪打字中涉及的神经过程,但它也有一个缺点——目前的MEG技术非常昂贵,通常需要在受控的实验室环境中进行固定设置。然而,新兴的**可穿戴MEG传感器(光泵磁力计,OPM)**可能会使这项技术在不久的将来更容易获得。
4. 关键性能指标和限制
- CER比较:脑2键盘的32% CER(最佳情况为19%)是对先前**基于EEG的模型(67% CER)和传统字母解码方法(~75%)**的重大改进。
- 错误模式:分析表明,错误通常是由于基于运动的过程(与键盘布局的错位)、认知影响(单词可预测性)和语言建模限制造成的。
- 还不是实时的:当前的系统需要批量处理,这意味着它还不能用于实时对话或实时打字辅助。
- 仅限于健康的志愿者:该研究仅测试了已经可以打字的健康参与者,这引发了关于它对有严重运动障碍的用户的表现如何的问题。
你知道吗?
- MEG vs. EEG:虽然EEG由于其价格实惠和便携性而被更广泛地使用,但MEG通过测量磁场而不是电活动来提供卓越的空间分辨率。然而,MEG系统目前体积庞大且成本高昂,限制了广泛采用。
- 脑-文BCI的开发:Facebook(现在的Meta)和Neuralink一直在研究用于文本解码的脑机接口。然而,他们的重点主要放在侵入式方法上,这使得脑2键盘成为最有希望的非侵入式替代方案之一。
- 可穿戴MEG的未来:研究人员正在使用**光泵磁力计(OPM)**开发便携式MEG系统。如果成功,未来的脑-文系统可能会像现代消费级脑电图耳机一样容易获得。
重大飞跃,但仍需更多努力
脑2键盘代表了非侵入式脑机接口的突破,使我们更接近现实世界的脑-文应用。虽然仍处于早期阶段,但它为未来的辅助技术提供了强大的基础,这些技术可以帮助有严重沟通障碍的人重新获得与世界互动的能力。随着实时解码、可穿戴MEG和人工智能驱动的错误纠正的进步,无需侵入式手术的意念-文通信的梦想正变得比以往任何时候都更加现实。