近日,加州大学洛杉矶分校团队在 《Nature Machine Intelligence》 上报告了一套将人工智能助手与非侵入式 EEG-BCI 结合的工作。
他们提出并实现了一个混合解码器(将 EEGNet 卷积神经网络的隐藏态作为 卡尔曼滤波器的观测——CNN-KF),并在此基础上开发了两类助手:一个用于光标控制(用深度强化学习训练),一个用于机器人臂的抓放(结合计算机视觉,自动识别目标并在接近时执行抓放)。

传统运动型 BCI 仅靠解码神经信号来驱动执行器,但临床可行性要求“收益远大于风险/成本”。许多现实任务是目标驱动的(例如:在网页里输入后点“搜索”、桌上拿杯子喝水、把钥匙放到抽屉里),一旦用户意图被识别,动作往往可被简化或由助手完成,显著降低对解码自由度的需求。
论文正是基于“任务先验、历史轨迹和视觉信息能帮助推断用户目标”的观察,提出共享自治来提升 BCI 实用性。
研究团队要解决的核心问题是:在非侵入式 EEG 条件下,信噪比较低、维度有限,传统的解码器很难提供足够稳定和精准的二维运动控制。如果想进一步让用户完成实际生活任务(例如光标点击、机械臂抓放),就必须找到一种方法,让 AI 帮助用户把“粗糙意图”转化为精确动作。

图1: AI-BCI 框架示意。 展示传统 BCI 与 AI-BCI 的对比:AI 助手如何利用任务先验、历史轨迹与 CV 等信息推断目标并共享控制,从而提高性能与减少参与者代价。
方法层面有三个关键创新。
第一,解码器设计。研究团队提出了CNN-KF混合解码器。具体做法是先用EEGNet(一种轻量化卷积神经网络)对64通道EEG信号进行特征提取,输入为1秒窗口的连续数据,采样率1 kHz,经4–40 Hz带通和Laplacian空间滤波后,每通道归一化,再以100 Hz的时间分辨率输入CNN。
CNN的最后一层隐藏状态被送入卡尔曼滤波器作为观测量。这样的设计既能捕捉EEG中非线性特征,又能保留卡尔曼滤波器在在线自适应中的可解释性和稳定性。CNN在训练后被冻结,闭环实验中只调整卡尔曼参数(包括解码偏置和速度增益),这样能抵消EEG漂移带来的影响。
第二,训练范式。为了避免CNN仅仅学习到眼动伪迹而非真正的运动皮层信号,实验分为两个阶段:首先是开环阶段,参与者根据提示执行或企图执行上、下、左、右的动作;随后是去相关闭环阶段,在这一阶段中,视觉目标位置与动作提示被解耦,使得模型不得不依赖运动相关脑电特征而不是眼动信号。研究团队还使用ReFIT-like卡尔曼策略,通过创新项和充分统计量来迭代更新卡尔曼滤波器参数,使解码器更贴合用户的真实控制。

图2:解码器及训练范式设计
第三,AI助手的引入。这里又分为两类。其一是光标助手,研究人员在模拟环境中用近端策略优化训练深度强化学习模型,输入为CNN-KF输出的速度与位置,输出为每个候选目标的概率分布。助手并不是直接“接管”控制,而是通过势场的方式,把自己的速度贡献与用户解码出的速度向量叠加,从而持续修正光标的运动轨迹。
其二是机器人助手,使用实时计算机视觉算法对场景中的物体进行检测和定位;当机械臂到达预设阈值距离(2.54 cm)时,助手自动执行抓取或放置动作。这大大降低了对用户提供高维连续指令的需求。
结果方面,论文报告了多个量化数据。
在光标任务中,健康被试和脊髓损伤参与者(S2)均表现出显著提升。对健康被试,AI助手使目标获取速率平均提高约2.1倍;对S2,提升幅度更大,约为3.9倍。S2在没有助手时,命中率和成功率都非常有限,而接入助手后,命中率和成功率显著提升(p<<0.01)。
在任务时间分解分析中,助手最显著的作用是缩短了最后阶段的小范围微调时间。健康被试的微调时间中位数下降至0.38秒,而S2在无助手条件下微调时间往往需要数秒,有助手后显著降低,部分试次几乎接近健康水平。路径分析显示,助手条件下的轨迹更直、更高效。

在机器人任务中,设置了一次性和序列性两种形式。一次性任务要求用户抓取后立即放置;序列性任务则要求用户按顺序完成多个抓放。健康被试在助手条件下几乎所有试次都能成功,完成率接近100%。而S2在没有助手状态下完全无法完成成功试次;在助手条件下则能够完成任务,在序列性任务中最终正确放置率达到约93%,平均完成时间也明显缩短(与健康被试相比稍慢,但仍然在可接受范围内)。

图4: AI助手大幅提升机器人任务表现
此外,研究团队还分析了CNN输出的敏感图,发现左右移动激活主要集中在对侧半球的感觉运动区,符合已知的皮层功能定位。这说明CNN-KF的确在利用可靠的运动皮层信息,而不是简单依赖眼动或其他伪迹。
03、重要意义
这项研究让系统能够在用户提供有限、低维度的脑信号时,通过推断和共享自治补全剩余部分,最终实现了健康人和严重运动障碍患者都能完成目标驱动的连续动作任务。为未来工作提供了以下提示:
1. 推广性:研究思路可同样用于侵入式BCI,以进一步提升已有的高性能系统;同时,非侵入式的易获取性使得构建大规模EEG基础模型成为可能(类似语言模型在NLP的作用),这可能显著降低校准时间并提升性能。
2. 信号与模态融合:将眼动、姿态、表面肌电等非侵入信号并入助手推断流程,有望在弱EEG调制或疾病不同阶段保持稳健性。
3. 人–机交互与用户自主性:未来助手需更注重“干预边界”,以避免过度干预造成挫败或控制感丧失;如何平衡性能与用户感受是关键。
文章同时提到了临床转化过程中的现实问题:研究样本量小(本研究仅3名健康+1名脊髓损伤患者),且个体差异与疼痛/感觉状态会影响解码(论文记录一次S2因幻痛导致当天无法训练出高性能解码),因此需要更大样本与病种分层研究来评估稳健性与普适性。
参考材料:
https://www.nature.com/articles/s42256-025-01090-y
美凤力借多年的大动物经验,坚持以“务实求真”为宗旨,累计为4000多家客户提供品质大动物临床前服务,得到了客户的一致好评。如果您有动物试验、临床培训、组织病理、大动物试验、临床试验、产品注册科研课题等...
请立即点击咨询我们或拨打咨询热线: 17312606166 ,我们会详细为你一一解答你心中的疑难。 添加好友