首页 > 活动线报 > 每日福利 > 这个国家级智能语音创新中心,颠覆你的耳朵

这个国家级智能语音创新中心,颠覆你的耳朵

发布时间:2024-05-20 09:33:14来源: 19333647334

向东,是中国科学技术大学高新校区;向北,是合肥市政府与中国科学院合肥物质科学研究院共同设立的合肥创新院——位于安徽合肥的中国声谷,是全国首个人工智能领域的国家级产业基地,已入驻科大讯飞、华米科技等2000余个企业,年产值超2000亿元。

声谷北门,“国家智能语音创新中心”的牌子格外醒目。依托当地智能语音及人工智能产业集群,创新中心聚焦智能语音领域开展关键共性技术研究,产生了一批科技创新成果。在这里,如何加强科技创新特别是原创性、颠覆性科技创新?怎样及时将创新成果应用于产业?记者实地探访创新中心。

智慧无人实验室——

可24小时不间断智能语音交互检测

智能交互评测机器人

“你好空调,屋里太热了。”“好的,已为您打开制冷模式。”人机对话越来越多出现在家庭中。和冰箱、洗衣机等家电相比,人们对空调的智能语音交互需求更强。然而,保证空调的“耳朵”足够灵敏,并不容易。

“过去只能在密闭房间里,由测试人员播放声音并观察记录空调响应情况。”山东青岛海尔空调器有限总公司测试中心主任高孺说,人工测试方式不仅效率低下,而且很难模拟复杂使用场景。去年3月,高孺偶然听说国家智能语音创新中心在建智能语音交互的智慧无人实验室,便立刻去实地了解情况。

进入智慧无人实验室,宛如置身专业录音棚——四周布满调节混响的吸音扩散板和亚克力半球,各式音箱分布其中。“通过混响调节,能模拟10平方米至300平方米的声场环境,19个音箱能模仿多种场景的背景噪声。50平方米的实验室可以还原95%以上的语音交互使用场景。”国家智能语音创新中心公共检测服务平台开发工程师李孟辉介绍,实验室可实现24小时不间断智能语音交互检测,依托中心数百万条的语料库,各类语音涵盖近200种语音、语言,以及各个年龄段、各类人群的口音。

以空调检测为例,工作人员只需设置好相关参数,智能机器人即可到达指定地点,通过仿生人工嘴播放声音。测试台旁的拾音器,会自动识别空调反馈结果。实验室上方的摄像头,会对空调显示面板进行拍摄。检测任务结束,将自动生成检测报告,对响应成功率、响应时间、失败原因等进行反馈。

通过与中心合作,海尔在青岛“复制”了实验环境。“今年投入使用。按一次测试20秒计算,一天可完成超4000次测试。”高孺说,有智慧无人实验室助力,如今海尔生产的空调,不仅可以进行普通话的语音交互,还可以“听懂”多地方言,部分出口产品掌握了多语种能力。

据介绍,中心采用“公司+联盟”的形式组建,汇聚了国内智能语音领域的龙头企业、科研机构,中心则作为发动机,驱动股东单位以及联盟的协作运转。“这种模式有助于促进中心与企业、企业与企业之间的合作交流,推动科技创新成果在制造业中的应用发展。”国家智能语音创新中心总经理吴江照说。

工业AI方案——

变电站单站巡检时间缩短到30分钟以内

当一个配备有20余台10千伏开关柜的变电站出现异响时,如何快速识别故障区域?“很难直接用耳朵分辨异响来源,过去只能逐个检查。”国网马鞍山供电公司运维检修专工汪隆臻说,“现在使用声纹识别装置,能快速锁定出现故障的位置。”

所谓声纹识别装置,由中心联合科大讯飞与国家电网安徽电科院共同研发。“中心此前就在探索声纹技术如何应用于工业化场景,沟通后发现安徽电科院也有这方面需求,于是‘一拍即合’。”科大讯飞工业智能研究院副院长李俊说。

声纹识别装置还能判断故障原因。“我们的专业技术人员加入研发,分析各类声音样本代表何种故障,进而训练装置的算法模型。”安徽电科院电力运检工程师张晨晨说。

如今,声纹识别装置已应用于浙江、安徽、广东、宁夏等地的40余座变电站,能够准确发现局部放电、短路冲击、夹件松动、冷却器异响等问题,将单站巡检时间缩短至30分钟以内,还降低了人工现场作业的频次和安全风险。

声纹识别只是中心提供的多种工业AI(人工智能)方案的一种。各类方案加速落地,为传统产业集聚新动能。

中心工业AI项目负责人黄伟这段时间忙着和同事一起,给合肥海尔工业园的空调总装生产线安装智能质检设备。“此前有一条生产线安装了智能质检设备,效果不错,现在要在更多生产线上进行铺设。”黄伟说。

过去,一名工人一天要检测千余台空调。“检查品牌标识时,因为反复观看,很可能会出现视觉疲劳。”合肥海尔空调器有限公司总经理戴永胜说,“如果是具备语音交互功能的产品,还需要工人发出语音指令。”为提高检测效率,戴永胜找到国家智能语音创新中心,联手研发智能质检设备。

记者在现场看到,智能质检设备形如在生产线上加装了半封闭式长方体铁盒。当空调由生产线进入时,设备内部音箱发出语音指令,摄像头和录音设备则会判定产品给出的回应是否正确。分布在其他位置的扫码器、摄像头,还会对商标、能效等级、型号铭牌等信息进行确认。当产品“走”出质检设备时,检测结果随之在后台显示。

“智能质检设备可以完成产品功能、语音交互、标识外观等7类20余条质检任务,准确率高达98.5%。”戴永胜介绍,一条生产线的质检设备,每天可完成超4000台产品的检测,未来计划在公司家电生产线上全面应用。

AI模型全托管云服务平台——

支持超过1000个算法模型上线运行

作为语音领域头部企业,科大讯飞掌握大量语音识别、语音合成的算法模型。“不同语种涉及不同算法,过去每套算法各自分散落地,耗时周期长,人力投入大,需要做大量重复的建设和运维工作。”国家智能语音创新中心AI模型全托管云服务平台项目总监郑威说。

吴江照也认同:“创新型企业或者科研院所如果想让某套算法落地,不仅需要算法工程师,还要有工程框架设计师、测试人员、运维人员,同时还要有算力资源的支持。”

2020年初,中心和科大讯飞的语音云平台研发部共同开发了AI模型全托管云服务平台。将设计好的算法导入其中,就能实现科研成果落地,整个过程一般不超过两天。

如今,平台托管的算法模型种类不限于智能语音领域。应用型企业可以选择需要的算法模型,“就像逛超市一样,大家对自然语言理解、图像识别、声纹识别等方面的需求,都可以在平台上找到对应的能力引擎。”吴江照说。

平台为商汤科技、小牛翻译、中科大等多个厂商和高校提供托管服务,支持超1000个算法模型的运行。平台接入总应用数超200万,累计覆盖终端用户近40亿,日均总服务量超20亿次。

围绕创新成果落地,一系列政策举措相继实施:合肥市经信局举办产业融合对接会,邀请20余家重点制造业企业参会,6家企业初步达成合作意向;安徽省印发《打造通用人工智能产业创新和应用高地若干政策》,提出加快全时全域场景应用,构建良好产业生态。

“各项举措持续支持,中心的创新动能将不断增强。”吴江照说。

编辑手记

了解企业需求服务产业发展

祁嘉润

“声音可以做什么?”回想上学时,物理老师提问,想必现在的孩子们会给出与过去截然不同的答案。语音助手、智能声控、AI交互……声音,给人们日常生活带来越来越多的可能性。

国家智能语音创新中心的故事,传递出声音的另一种力量:帮助电器企业检测智能语音交互情况,用声纹技术让电力检修变得更容易、更高效……声音领域的科技创新成果加速落地,给制造业以强大赋能。

以科技创新引领产业创新。制造业创新中心连接着科研机构、高校和企业,在服务产业发展上具有得天独厚的优势,应下大力气,主动了解企业需求、行业趋势、产业短板,及时将科技创新成果应用到具体产业和产业链上,充分发挥自主创新策源地、科技成果转化地的作用。

每日福利更多>>

消息称一汽丰田总部迁天津,不愿意去的员工最高 N+7 补偿 配新蓝鲸2.0T+爱信8AT,长安CS75 PLUS Ultra 13.19万起售 宁德时代发布磐石底盘 时速120撞击不起火 想买MPV的等等,比亚迪夏即将上市,“冰箱、彩电、大沙发”都有 魏建军:坚守长期主义和底线思维,才能行稳致远 长安汽车荣获碳达峰领跑者企业,科技创变打造“数智新汽车” 看看领克Z20、Model Y、宝马iX1,谁才是Z世代的心头好 问界M8黑色版本曝光!颜值比M9还高,想买理想L8的再等等? 美观野性配置足,最接地气的方盒子吉利牛仔太原上市 网上没赢过,现实没输过——丰田在华60年经历了哪些? 以过度配置打造越级体验,ID.与众重塑15万级纯电SUV“黄金标准” 宁德时代磐石底盘,如何让车企“新车套壳就下线”? 领克版“路虎揽胜”再曝新图,看完颜值,网友:卖40万必爆款 两款澳洲五星安全皮卡大PK:长城山海炮VS全新悍途,谁更强? 小鹏G9全系23.39W起!还看什么小米、特斯拉? 又是一个998 低成本高性能 吉利雷达金刚皮卡能掀桌子吗? 年终岁末大场面,鸿蒙智行四界齐聚央视直播间 秦L降价了!2025年车市价格战酝酿中,但买车有福了? 72小时深度体验MG ES5机会来了!MG ES5“想开了,不试不嫁”试驾启动 下一代G50 3系渲染图!新世代设计语言会是什么样? 15万级的子品牌电车,小鹏Mona M03和萤火虫精品小车怎么选 蔚来李斌:到2035年 全球前十车企至少有一半是中国的 2025年自主或超德系,成豪华车市场最大系别 阿维塔三车系升级AVATR.OS 4.1.4:智能驾驶与车机体验全面提升 比亚迪香港特区新能源车销量破万,海豹车型成新里程碑 长安飞行汽车首飞成功!在重庆“打飞的”,梦想快要照进现实了? 徐长明:双政策拉动150万辆国内消费,汽车出海前景广阔 没有卖不好的车,只有不合适的价格!别克微蓝6已跌破9万? 四大品牌齐发力,2025年长安系多款重磅新车要上 长安汽车豪掷千亿,飞行汽车与人形机器人双翼齐飞!