中新网重庆5月4日电 题:青年科技专家扎根重庆解锁智能汽车人机交互新模式
中新网记者钟旖
作为全国最大的汽车生产基地,重庆的汽车产业已进入以智能化、网联化等为特征的转型升级期。在每一轮创新发展背后,都离不开科研团队夜以继日的努力。适逢“五四青年节”,记者4日从科大讯飞智能汽车重庆分中心获悉,该中心以“平均年龄27岁”的青春之力,近年在攻克智能汽车人机交互新模式上不断突破,已有10余项自主创新技术在重庆车企落地应用。
智能汽车人机交互如何实现?有何创新亮点?记者对这群扎根重庆的青年科技专家们展开了采访。
“小安你好,帮我查一下北京的天气”“好的。北京天气晴,白天气温20度”“再帮我订一张去那儿的机票”……这样的对话,在人与人交流中再平常不过,但对于人机互动而言,想要和机器持续对话,并让机器理解“那儿”就是指交谈中说到的北京,其背后的技术难点不言而喻。
“在车内一次唤醒多个指令,还要实现上下文理解,这种交互方式是之前没有的,也是用户的痛点。”“90后”团队成员、飞鱼OS研发经理田大武介绍说,对于机器而言,需要记忆和理解当前说话人的意图和场景,就需要覆盖尽可能多的场景和可能问法。这种呈几何级数增长的算法复杂度,使软件的开发和维护充满挑战。为了实现这一智能操作,田大武只能与队友们通过反复测试形成庞大的场景知识库。“通常车内常用指令不超过2000种,但我们在车机上内置了常用指令近6000条,不常用指令近2万条,从而精准实现了用户指令。”田大武说。
图为科大讯飞智能汽车重庆分中心团队展开技术交流。 受访者马鸿鹏供图随着中国智能汽车产业发展,不少国产汽车品牌开始走向国际市场。其中鲜为人知的是,智能汽车在海外使用,必须适用当地的语种,导致外语车载语音识别及合成系统一度被海外企业垄断。
“语音识别系统若一直采用国外技术,安全问题是最大的考量。”科大讯飞智能汽车重庆分中心海外语音项目研发经理赖旭辉也是一名“90后”,2018年起他与队员一道埋头钻研语音识别模型和机器学习方法,立誓打破技术垄断,“首先要做的不仅是去理解其他国家的语言文化习惯,甚至要摸透同一语种不同地区的口音”。
赖旭辉称,车载语音的“识别”分为“语音识别”“语义识别”两个技术层次。“语音识别”相当于人的嘴巴和耳朵,负责表达和获取,“语义识别”则相当于人的大脑,负责思考和信息处理。其队伍开创性地采用实体抽取+动态模板、融合深度学习的框架,将语言和语义技术剥离,构建出云+端多语种语义平台,基于该平台可快速实现多语种的语义理解。令赖旭辉自豪的是,这套国产化自主创新的语音识别系统已在长安汽车2021年向海外发行的车型上采用。
2022年3月,重庆车企欧尚汽车智慧快乐座舱正式发布,车上搭载的全球首发的车外语音交互系统正是科大讯飞智能汽车重庆分中心的“AI+汽车”最新成果。相较于此前汽车语音交互集中在车内,这一研发突破了“一门之隔”的界限,让车主可以在车外唤醒车辆,比如在拥挤的停车场,可以叫它“把车开出来”;购物归来双手不方便开门,也可以说一声“打开后备箱”……
“车外语音交互相较车内语音交互来说,难点在于如何保障车外噪音等复杂环境下,机器能听清楚并执行指令。”科大讯飞智能汽车重庆分中心总经理马鸿鹏说,为实现车外的人车交互,团队独创了神经网络降噪算法和“冷启动”系统两项技术,让车外语音交互系统做到360度语音降噪和无死角识别覆盖,实现稳定高效的车外语音交互。
“目前我们团队有50多名研发人员,平均年龄27岁。”作为一名“80后”团队领头人,马鸿鹏说,要推动人工智能赋能智能汽车发展,研发之路道阻且长。所幸,团队正青春,众人干事创业的初心、热情始终未变。(完)