会员登录 | 会员注册 | 返回首页
需求项目名称 人工智能产业中声像识别关键技术的研究及产业化
行业分类: 电子信息
项目类型:
专利类型:
填表时间:
截止时间:
单位名称: 福建新大陆自动识别技术有限公司
提供资金:
合作方式:
主要内容及技术指标: "一、技术难题和攻关内容: 在智能制造、智能物流和智能零售领域,需要更便捷的人机交互方法解放双手、更智能的图像缺陷检测技术、极限环境下的条码识别等。围绕上述需求,重点攻克声纹识别、语音识别、图像少样本缺陷检测、图像超分辨重建等技术难题。 技术难点: 1.在嘈杂的工作环境下,能够通过根据声纹进行实现身份识别,在特定语境下实现实时连续语音识别、获取其中的语义信息,将上述功能集成于便携设备中,形成技术自主可控的、高可用的产品。 2.在图像缺陷检测问题中,成对标签数据的获取所需成本高、时间长;需重点攻关基于少样本学习的缺陷检测算法。研究内容包括:粗粒度语义表征挖掘,粗细粒度表征相结合的位置、目标检测,显式及隐式数据增广等算法。 3.低光远距离条件下的条码识别率目前仅能达到65%,对其进行超分辨率重建可提升识读率。重点攻关基于超轻量卷积神经网络的实时低功耗超分重建方式,设计面向有限稀疏值输入二值化输出的高效卷积,提升对不同环境样本超分重建的泛化性能。 上述技术是智能制造、智能物流以及智能零售行业的共性卡脖子问题,具备高复用性,重点是实现各项技术在低功耗嵌入式设备上的集成,突破核心引擎研发与优化、工程化,实现自主技术引领行业发展,助力产业升级。 二、技术攻关后希望达到的预期技术目标: 语音识别方面: 1.实现操作人员声纹特征的识别,能够识别操作人员的身份,声纹库中人员数量不超过300人,在信噪比(SNR)15 dB条件下,声纹识别准确率不低于97%。 2.实现信噪比15 dB的环境下、特定语境情况下的云端(在线)、设备端(离线)语音识别;云端(在线)语音识别准确率不低于97%、识别响应时间小于500ms,设备端(离线)语音识别准确率不低于95%、识别响应时间小于700ms;能够识别汉语普通话,包括该语境下的常用字词、英文字母和单词、阿拉伯数字。 3.可针对应用场景对常用词句指令或者口音进行定制化模型训练,提升识别准确率。 少样本学习方面: 1.对于缺陷检测任务,训练集中仅包含少量异常样本,测试集合中的异常样本数量及种类远大于训练集合的情况下,异常样本检测准确率>95%, 异常样本召回率>99%。 2.对于语义分割任务,针对所提供的实采工业数据集,在5%标签数据训练下所得分割结果的平均交并比(mIoU)达到98%。 超分辨重建方面: 1.码区分辨率为4万像素; 2.将0.9PPM左右的输入图像重建为至少2PPM的高清图像,边端基于AI芯片(RK3399Pro)重建时间<=40ms,识别率达到94%;云端基于GPU(2080TI)的重建时间<=25ms,识别率达到98%。 2023年12月31日前完成。研发总预算初步预测5000万元,申请科技局财政资金不超过200 万元,福建新大陆自动识别技术有限公司愿意为该技术难题攻关提供研发资金不少于4800万元。 三、企业期望产权归属:双方独立研发所产生的知识产权归各自所有,共同研发所产生的知识产权归双方共同所有。双方有责任为合作中了解到他方的技术秘密及商业秘密保守机密,不得向合作之外其他任何单位或个人泄漏。任何一方不得擅自将共同拥有的知识产权向合作之外的单位或个人转让、公开发表或泄漏。 四、企业承接转化后预期的经济、社会效益:(1)经济效益:新增产值1亿元、利润2000万元、税收1000万元; (2)社会效益:本部项目通过此商业模式的创新,可以减少或避免上下游企业建设一次性投入。声像处理自动化,极大地减少运营成本,提高效率,增加反应速度,加快资金周转,提高企业管理水平,使企业取得竞争优势。对发展我省的信息识别产业共性技术、关键配套技术,产业带动性强,可形成具有较大规模和较强竞争能力的人工智能产业集群。对提升依靠创新实现可持续发展的能力等方面具有重要意义,可为人工智能产业发展和竞争力提高提供有力的支撑。"
项目需求人: 福建新大陆自动识别技术有限公司