您的位置:中国财经观察网 > 商业 > 正文

意念打字破新纪录,心中想着「说话」,词就蹦跶出来,斯坦福团队出品

2023-02-01 14:10:50     来源:IT之家  阅读量:11838   

思维打字新纪录诞生了!

通过植入该设备,受试者的平均输入速度可以达到每分钟62个单词,是该团队此前记录的3倍。

同时,精度也有了明显的提高对于50个单词的词汇量,识别准确率是之前记录的2.7倍

据研究人员称,这已经开始接近正常人的交流速度。

不相信我然后看现场

受试者逐字输入,点点头,得到一句话,相当丝滑:

相比之下,以前的逐个输入字母的研究更费力:

2021年《自然》封面成果展示

创造纪录的团队来自斯坦福前两天他们刚把相关论文的预印本放到bioRXiv上,引起了很多人的关注

没有参与该项目的加州大学旧金山分校研究员菲利普·萨贝斯称之为重大突破他相信相关技术很快会走出实验室,进入落地阶段

很多网友对这个结果也相当兴奋Reddit喜欢几万,也有人恨自己不能马上给家人一整套

那么这一次,科学家是如何创造思维打字新纪录的呢和以前的方式有什么不同

继续往下看。

识别说话的神经活动。

在过去,心理分型一直是脑科学领域的热门研究方向,也备受大众关注早先的实现方法是让受试者在大脑中书写字母,或者在大脑中读出特定的读音,然后依靠系统识别

这一次,科学家们使用了不同的信息识别方法——让受试者直接说话,哪怕只是在大脑中。

具体来说,他们依靠一个语音脑机接口系统来识别与人类语音相关的口腔和面部神经活动,然后通过解码他们的运动控制信号来输出受试者想要表达的文本。

基于上述想法,科学家们进行了一系列的实验。

这一次,研究对象是一位67岁的女性57岁时,她被确诊为肌萎缩侧索硬化症,这让她长期受到发音不清的困扰她只能发几个元音,辅音几乎很难区分

为了保护隐私,这个课题被团队称为T12在2021年的研究中,他们也用同样的方法呼叫另一名男性受试者T5

2022年3月,在当事人的同意下,科学家在他的大脑中植入了四个微电极阵列,以检测与语言相关的神经活动。

在植入后的实验中,科学家首先要求受试者尝试不同的动作,并观察相关区域的神经活动。

比如让受试者睁眼,闭眼,眨眼来观察和控制眼睑相关神经元的活动,另一个例子是让嘴唇张开,闭合和微笑,以检测相关的大脑活动当然,实验观察部位还包括:额头,下巴,喉咙,舌头等

研究小组发现,不同动作之间的神经活动是高度分离的在特定的检测频率下,他们解码了34个口腔和面部动作,准确率为92.7%,对于39个音素,解码准确率为60%这一面说明原计划是可操作的

下一步是将与语音相关的神经活动与文本联系起来。

研究人员事先准备了一个RNN解码器,以80毫秒的间隔检测和识别神经活动信号其中,神经网络会依靠最大概率来判断输出的单词,错误的发音会被纠正,最终输出文本

为了训练网络,受试者每天需要尝试输出260—280句数据。

在100天后的测试中,无论有没有声音,单词的识别速度都在每分钟50个单词以上,是团队之前2021年记录的3倍左右。

而且无论是面对50个单词还是12500个单词,解码效率差别不大。

识别错误率也有了很大的提高。

对于50个单词的表达,识别错误率为9.1%,即使被试无声表达,错误率也只有11.2%。

对于12500字的数据库,表情识别的错误率为23.8%,无声输出的错误率为24.7%,与之前研究的50字测试的错误率基本相同可以看出,这种方法的精度大大提高了

除了上述测试,科学家们还探索了哪些方向可以进一步优化系统。

他们考虑了三个维度—语言模型的词汇,植入大脑的电极数量和训练数据集的大小。

结果显示,伴随着字数的增加,错误率确实增加,但在1000字的量级上趋于平缓,因此团队认为在未来的研究中压缩字数不一定有效。

但是对于植入电极的数量来说,更多的通道确实会降低错误率如下右图所示,从500到1000,错误率从4%下降到1.9%

另外值得一提的是,即使没有训练,系统对新数据的单词错误率也只有30%而且通过训练,错误率会不断下降

对于后续研究,团队指出,该成果还不是一个完整的,临床适用的系统另外,24%的错误率在日常生活中也不算低,后续的研究也会在各方面努力

头脑打字一直很热。

本文的第一个工作是来自斯坦福大学霍华德休斯医学研究所的弗朗西斯·威莱特主要研究领域为脑机接口和运动神经科学他还涉足人工神经网络模型

他也是2021年《自然》封面上的理念打字研究中的作品像上次一样,这次他说——研究的代码和数据将被公布

他是2021年《自然》论文的撰稿人之一在之前的研究中,他破译了与手写笔记相关的大脑信号,使截瘫患者能够快速准确地打字

这项工作非常关键,因为他们当时使用的方法是让受试者在头脑中写字母。

除了团队之外,还有更多科学家在心灵打字这件事上努力。

例如,2022年11月,加州大学旧金山分校提出了一种不同的方法他们植入了一个128通道的ECoG阵列,并增加了一个经皮连接器来连接植入的设备和外部系统

在识别的方式上,他们想的是——让被试在脑海中背诵字母NATO码,并完成一个字母一个字母的输入平均2秒就能打出一个字母,最终平均字符错误率只有6.13%

此前,量子比特智库也对这一趋势有所期待,认为思维打字乃至其背后的脑机接口技术已经在商业开发中初具规模。

清华李团队,浙江大学瑞金医院,浙大二院神经外科都有积累。

另外值得一提的是,去年年底,马斯克和Neuralink还让猴子搞了思维打字虽然他们用了训练猴子点击屏幕黄色按钮的想法,但也是一波砸

当时马斯克还表示,他和Neuralink已经向FDA提交了许多文件,预计6个月后将开始人体试验。

但不确定是否能等...

毕竟2022年4月他也说过一次同样的话。

参考链接:

版权声明: 本网站部分文章和信息来源互联网,并不意味着赞同其观点或证实其内容的真实性,不构成投资建议。如转载稿涉及版权等问题,请立即联系管理员,我们会予以改正或删除相关文章,保证您的权利!
版权所有: 中国财经观察网 (2012- )  备案号:沪ICP备2022019539号-11