WAIC前线|声网发布新版对话式 AI 引擎,集成声纹识别、数字人与视觉理解功能
7月28日消息,2025世界人工智能大会(WAIC)上,声网正式发布其新版对话式 AI 引擎,该版本新增声纹识别、数字人与视觉理解三项核心功能,实现从“能说话”到“能理解、能共情”的跨越式升级,进一步拓展对话式 AI 在多模态交互中的边界。
据介绍,新版引擎引入声纹识别功能,可精准识别个体声音特征,有效区分多说话者并屏蔽背景噪音,为多用户并发对话提供技术支撑。
数字人能力方面,声网支持接入如商汤等主流方案,赋予 AI 拟人化表情与动作,适用于虚拟客服、教育陪伴等情境对话场景。
视觉理解功能则令 AI 能“看懂”用户环境与图像信息,支持拍照识图与实时手势识别,实现“所见即所说”。
在WAIC现场,声网同步展示了一系列搭载该引擎的 AI 硬件,包括 AI 毛绒宠物“芙崽 Fuzozo”、家庭陪伴机器人“赋之 EBO Air 2 Plus”,以及集成双屏/单屏对话式 AI 开发套件的玩具与教育终端,覆盖从儿童教育到智能陪伴的多样场景。(袁宁)
2、通讯丨通航11座城 每周83趟航班——埃塞俄比亚航空大力拓展中国市场
3、新华图讯丨泰柬代表团在马来西亚出席边境局势特别会议,马来西亚 泰国 领土纠纷