中国残疾人福利基金会为我区捐赠丰田无障碍车 石嘴山市开展七大重点行动 为生活性服务业补短板 数聚宁夏 算领未来|华为数据中心能源助力宁夏中卫打造全球领先绿色算力集群竞争力 “贺兰山东麓”敲开“世界葡萄酒之都”的大门 【地评线】贺兰山网评:过于自信也会导致上当受骗 数聚宁夏 算领未来|第五届云天大会在中卫开幕 遇见中国之美·中卫66号公路 宁夏回族自治区通信管理局 宁夏回族自治区互联网信息办公室关于清退宁夏属地僵尸类APP的通告 中宁一案例入选全国社会治理创新案例 男子轻信网贷被骗1万元 宁夏涉农企业享留抵退税扩围“红利” 36只“迷途羔羊”引来十余名“羊倌”争领 银川市总工会把劳模工匠请进校园激励青年学子 行业头部企业加速布局宁夏算力枢纽 宁夏乡村游订单同比增223% 【黄河安澜】秋意渐浓 黄河两岸景美如画 前8个月宁夏环境空气质量优良天数比例为80.5% 同比上升2.5个百分点 石嘴山市加速解决房屋产权登记历史遗留问题 湖城之秋——打翻了的调色盘 中宁县检察院落实工作机制履行公益诉讼检察职能 宁夏原创音乐剧 《花儿与号手》喜摘文华大奖 首届“西部数谷”算力产业大会主论坛举行 敢做“无人区”的探路者 宁夏中卫:电力护航云计算产业高质量发展 【地评线】贺兰山网评:算力产业驱动经济社会数字化转型 禁毒宣传进校园 提高学生辨别新型毒品能力 贺兰县:直播带货开启残疾人灵活就业新模式 借款人不还钱,担保人被司法拘留15日 宁夏隆德县完成首笔用水权质押贷款 宁夏明确2022年社保缴费基数 小说《微水浮尘》在京首发 同名广播剧上线 宁夏泾源 “电”亮山乡 好山水做出“富民”好文章 专家学者聚首 为创投行业把脉支招 吴忠利通区:石榴花开情更浓 西夏区铲除毒品原植物160余株 中宁县检察院为未成年儿童健康成长撑起“保护伞” 社交平台上的反诈联盟:被骗、救赎与博弈 乘势而上 随“算”而动 首届世界设计之都大会在上海开幕 宁夏线上直播带岗招聘活动帮助残疾人实现精准就业 2022年戏曲百戏(昆山)盛典主体活动闭幕 变“带货”为“带岗”,银川这场招聘会为残疾人提供246个就业岗位! 首届中卫·房车文化节暨消费惠民活动启动 秋季跟风刷酸 小心焕肤不成反“烂脸” 不再“守着黄河缺水喝” 被基础设施网“包裹”的幸福 银川经济技术开发区:在“新赛道”寻求新动能 金凤区法院一审公开宣判一起涉养老诈骗案件 来吧,展示!首届“西部数谷”算力产业大会等你来 宁夏水投集团:三项制度激活企业原动力
你当前位置:首页 >经济观察 >

清华大学团队研发出新颖唇语解读系统

2022-03-26 09:05:21来源:光明日报

清华大学团队研发出新颖唇语解读系统

【科技前沿】

本报北京3月25日电(记者邓晖)人说话时嘴唇动作跟语音同步,可以通过识别唇动来进行语言交流。对于声带、喉舌损伤的失声人群,唇语是一种不占用双手的、日常无障碍交流的有效方式。但唇语对讲话者友好,对解读唇语的听众来说却并不轻松。为降低唇语解读难度,现有技术手段常采用磁场、视觉图像、超声波等方法。以最流行的非接触式视觉图像方法为例,尽管其唇语识别准确率较高,但依然容易受到面部角度、光强、头动和遮挡等因素的干扰。特别是在新冠肺炎疫情期间,佩戴口罩给基于视觉的唇动解读带来全新挑战。通过直接捕捉面部肌肉细微动作解读唇语技术具有重要的科学研究价值与广阔的应用前景。

近日,清华大学机械工程系智能与生物机械团队与中科院北京纳米能源与系统研究所团队合作,研发出了一种新颖的唇语解读系统。相关研究成果在线发表在《自然·通讯》期刊上。

该系统包含低成本、自供电的柔性摩擦电传感器和基于原型学习的深度学习模型。传感器将唇部肌肉运动产生的电信号传输到解码系统,翻译成可沟通的语言。该研究测试分析了传感器的机械与电气性能,采集并提取了选定元音、单词、短语、无声语音和发声语音的唇动信号特征。通过比较同步采集的唇动和声音信号,证明了无论是否发声,嘴唇运动信号都具有一致性。进一步分析了语速与唇动模式等不同参数对信号特征的影响规律。提出了一种基于原型学习的空洞循环神经网络模型,用于唇动信号的识别,在20个分类(100样本/类)情况下,测试准确率达到94.5%。

值得注意的是,上述自供电传感器由柔性聚合物薄膜与柔性电极组成,可提高人体佩戴的舒适性。研究团队利用该系统进行了多种场景应用展示,如解锁大门的身份识别、移动模型车的方向控制、唇动/语音的实时转换等,展示了该系统在唇动识别领域的可行性和应用潜力。

面向失声人群日常无障碍沟通需求,该工作为特殊场景下唇语翻译应用开拓了创新的研究方向。此外,该工作在机器人控制、个人身份验证、人机界面、残疾辅助、无声语音、情报、反恐任务实施、康复、生物医学工程和虚拟现实等诸多领域中都具有较大的潜在应用价值。

团队相关负责人表示,尽管该工作已展示了该技术的有效性和应用前景,但仍然面临系统可靠性、稳定性等问题。研究团队相信,随着研究的深入,该技术有望切实为失声人群服务,提供无障碍语言交流的科技手段。