中国残疾人福利基金会为我区捐赠丰田无障碍车 石嘴山市开展七大重点行动 为生活性服务业补短板 数聚宁夏 算领未来|华为数据中心能源助力宁夏中卫打造全球领先绿色算力集群竞争力 “贺兰山东麓”敲开“世界葡萄酒之都”的大门 【地评线】贺兰山网评:过于自信也会导致上当受骗 数聚宁夏 算领未来|第五届云天大会在中卫开幕 遇见中国之美·中卫66号公路 宁夏回族自治区通信管理局 宁夏回族自治区互联网信息办公室关于清退宁夏属地僵尸类APP的通告 中宁一案例入选全国社会治理创新案例 男子轻信网贷被骗1万元 宁夏涉农企业享留抵退税扩围“红利” 36只“迷途羔羊”引来十余名“羊倌”争领 银川市总工会把劳模工匠请进校园激励青年学子 行业头部企业加速布局宁夏算力枢纽 宁夏乡村游订单同比增223% 【黄河安澜】秋意渐浓 黄河两岸景美如画 前8个月宁夏环境空气质量优良天数比例为80.5% 同比上升2.5个百分点 石嘴山市加速解决房屋产权登记历史遗留问题 湖城之秋——打翻了的调色盘 中宁县检察院落实工作机制履行公益诉讼检察职能 宁夏原创音乐剧 《花儿与号手》喜摘文华大奖 首届“西部数谷”算力产业大会主论坛举行 敢做“无人区”的探路者 宁夏中卫:电力护航云计算产业高质量发展 【地评线】贺兰山网评:算力产业驱动经济社会数字化转型 禁毒宣传进校园 提高学生辨别新型毒品能力 贺兰县:直播带货开启残疾人灵活就业新模式 借款人不还钱,担保人被司法拘留15日 宁夏隆德县完成首笔用水权质押贷款 宁夏明确2022年社保缴费基数 小说《微水浮尘》在京首发 同名广播剧上线 宁夏泾源 “电”亮山乡 好山水做出“富民”好文章 专家学者聚首 为创投行业把脉支招 吴忠利通区:石榴花开情更浓 西夏区铲除毒品原植物160余株 中宁县检察院为未成年儿童健康成长撑起“保护伞” 社交平台上的反诈联盟:被骗、救赎与博弈 乘势而上 随“算”而动 首届世界设计之都大会在上海开幕 宁夏线上直播带岗招聘活动帮助残疾人实现精准就业 2022年戏曲百戏(昆山)盛典主体活动闭幕 变“带货”为“带岗”,银川这场招聘会为残疾人提供246个就业岗位! 首届中卫·房车文化节暨消费惠民活动启动 秋季跟风刷酸 小心焕肤不成反“烂脸” 不再“守着黄河缺水喝” 被基础设施网“包裹”的幸福 银川经济技术开发区:在“新赛道”寻求新动能 金凤区法院一审公开宣判一起涉养老诈骗案件 来吧,展示!首届“西部数谷”算力产业大会等你来 宁夏水投集团:三项制度激活企业原动力
你当前位置:首页 >民生关注 >

并非先听见声音后理解语义 大脑语音处理可“多线程”工作

2021-09-09 09:05:07来源:科技日报

并非先听见声音后理解语义 大脑语音处理可“多线程”工作

小电极阵列收集听觉皮层神经信号的方式,通俗来讲就是通过电极直接捕获皮层表面的神经信号,由于外侧颞上回暴露在外侧颞叶,因此可通过皮层脑电图记录方法获取。

——倪广健 天津大学医学部副主任、智能医学工程教育部工程研究中心副主任

◎本报记者 陈 曦

大脑是如何听懂语言的?几十年来,科学家们一直认为听觉皮层中的语音处理就像工厂的流水线一样,按照先后不同处理工序串联在一起,最终转化成有意义的单词。

然而这一理论近日遭到了挑战,一项发表在《细胞》杂志上的研究结果表明,大脑对听觉和语言的处理是并行进行的。

这种语音处理的并行性质推翻了长期以来的相关假设,可能会为医生提供新的思路,以治疗患有阅读障碍等问题的儿童,帮助他们顺利识别语音。

传统假设中大脑如何“听懂”语言

“人脑在听觉环境中处理语音信息时,传统理论认为听觉皮质处理信息的过程是自上而下的。当含有语意的声音传到耳中,耳蜗将其转换成电信号,在初级听觉皮层分析声谱,在次级听觉区域提取音素,在外侧和腹侧颞叶皮层提取单词,顶叶和额叶区域基于语法和语义属性并结合时间信息,进行单词顺序推断并最终理解句子的含义。”天津大学医学部副主任、智能医学工程教育部工程研究中心副主任倪广健介绍。

“语音感知的经典层次模型是假设声音信息首先在初级听觉皮层接收,然后通过与外侧颞上回连接转化为更复杂的表征。”倪广健说,这是因为先前有关听觉机制的研究主要基于解剖模型,认为大脑遵循一种从初级到高级的层次渐进处理模式,高级听觉区域对复杂的语音和音乐有更强的反应。

一直以来,这一理论缺乏直接证据的支持,因为它需要整个听觉皮层在极高时空分辨率的条件下记录详细的神经生理学信息。但是初级听觉皮层位于大脑额叶和颞叶的深处,因此想进行探究并不容易。

此次最新研究对人类初级和次级听觉皮层功能组织的研究结论与先前一致,但在赫氏回和颞上回的起始区发现了早期独立处理的证据,而非传统认为的遵循语音简单串行的皮层处理层次。可以确定的是,皮层前部和中部颞上回,具有明显的并行处理和潜在的长潜伏期串行处理,说明听觉皮层具有分布式的专业处理单元,每个单元代表了语音信号中不同的声学和语音线索,它们的组合创造了丰富的语音理解体验。

非侵入技术探究大脑受限于时空分辨率

目前,已有一些较为成熟的非侵入式技术用于研究大脑处理听觉信息,例如具有较高空间分辨率的近红外光谱NRIS、功能性核磁共振成像fMRI、脑磁图MEG等,以及具有较高时间分辨率的脑电EEG等。

倪广健举例说,比如近红外光谱通过测量血氧含量表征听觉皮层的代谢状况,就可以有效反映外界刺激下听觉皮层的变化情况,具有噪声低、抗环境干扰性强、成本相对较低、安全便携、易于使用等优点。

功能性核磁共振成像可探索大脑处理听觉信息的过程,通过核磁共振造影来测量神经元活动所引发的血液动力的改变,实现对特定大脑活动皮层区域进行定位,具有准确定位某些区域或某些疾病发病区域(如癫痫的病灶)的优势,在脑神经科学领域应用相对较为广泛。

“在静息状态下脑部自发的低频活动的同步化现象广泛存在于听觉系统内,因此功能性核磁共振成像能够提供人类听觉皮层不同功能和解剖区域如何相互作用的更完整的图像,适合用于研究不同脑区之间的功能连接性。”倪广健说。

另一方面,具有高时间分辨率的脑电技术因为与人工耳蜗的兼容性也使得脑电逐渐展现了临床听觉客观评估研究的能力和潜力,使得大规模探索临床人工耳蜗患者听觉处理模式成为可能。

然而,上述非侵入式技术在空间分辨率和时间分辨率上往往无法兼具。倪广健表示,单独采用某一种非侵入性技术探索听觉信息的处理过程时,会受限于有限的时间—空间分辨率,无法更好地探究局部异质神经元间的映射结果,因此无法具体回答语音表征问题。《细胞》杂志发表的新研究通过植入小电极阵列,创新性地突破了这一局限。

植入电极可绘制听觉区域特征编码图

在此次发表的新研究中,小电极阵列被放置在受研究者的整个听觉皮层中收集神经信号。有9名患者参与了实验。因为需要切除脑部肿瘤或定位引发癫痫的病灶,这些患者接受了神经外科手术。与此同时,他们同意让医生在手术过程中将微电极阵列放置在他们的听觉皮层,收集神经信号,用于分析语言功能和定位癫痫,以及研究听觉皮层如何处理语音信息。

“小电极阵列收集听觉皮层神经信号的方式,通俗来讲就是通过电极直接捕获皮层表面的神经信号,由于外侧颞上回暴露在外侧颞叶,因此可通过皮层脑电图记录方法获取。”倪广健认为,植入式电极克服了以往采用功能性核磁共振成像技术研究时不能很好探明腹侧沟回等脑沟的问题。

在这个新研究中,皮层脑电图的高时间分辨率,能够探测赫氏回上的初级听觉皮层到颞上回的层次结构与听语音和音调数据的一致程度。

“其从左颞平面的636个电极部位和颞上回获取颅内记录,与以前的颅内手术方法是不同的。”倪广健解释,以前的颅内手术方法每次仅从这些区域中的一个区域进行零碎取样,而此显微手术进入外侧裂可同时记录人类听觉皮层所有区域对语音的高度异质性反应。

此外,该工作采用的高密度电极网格使得同时记录人类颞叶听觉皮层多个亚区的神经活动成为可能,因此能够确定听觉信息处理的流程,以及发现语音信号中的线索是如何跨听觉皮层进行映射的。

“这种分析需要对自然语音和实验控制的简单声音刺激的神经反应进行采样,同时对所有皮层听觉区域进行采样,在初级和高阶听觉区域绘制一张全面的特征编码图,从而能够对信息流模型和皮层表征转换进行有意义的评估。”倪广健说。

在这项研究中,当为参与者播放短语和句子时,位于颞上回中的某些区域的反应速度与初级听觉皮层一样快,这表明这两个区域同时开始处理声学信息。

倪广健介绍,该工作还进一步评估了每个区域在语音处理中的作用,探索激活的时间和顺序,每个区域中简单和复杂声音表征的性质,以及它们在功能性和外科消融的语音理解中的因果作用。

“植入电极的方式在大脑的其他研究领域中已有不少成功典范,例如脑控打字,准确率已达到90%以上;基于皮层脑电的语音重构,句子的整体准确率已达到60%;脑控机器人,解码运动状态实现机械臂的控制等等。”倪广健表示,植入电极有助于采集到高质量的神经电活动,具有较高的时空分辨率,比较适合机制机理方向的研究,从而探明脑部或者神经性系统疾病的成因及提供治疗手段。而非侵入式技术则由于其无创的特点,具有更加广泛的应用场景。