一种训练基于数据量化与硬件加速的模型的方法及系统【中国发明】
2024-11-13
一、专利名称及专利号
名称:《一种训练基于数据量化与硬件加速的模型的方法及系统》
专利号:ZL202110211440.1
二、应用领域
本发明涉及机器学习领域,尤其涉及的是一种训练基于数据量化与硬件加速的模型的方法及系统。
三、专利说明
1、摘要:
本发明公开了一种训练基于数据量化与硬件加速的模型的方法及边缘智能系统,通过在模型训练的前向传播阶段将边缘智能模型的处理数据转换为低比特定点数,从而使得边缘智能模型的计算成本有效降低,并采用误差补偿机制保障最终模型的质量和推理结果的准确性。在模型训练的后向传播阶段采用梯度截断机制,保障模型更新过程的平稳性。解决了现有技术中边缘智能设备端的模型在训练与推理过程中的计算与存储开销较大,且模型的预测准确性较低,难以胜任高动态的实时性任务的问题。
2、背景:
目前的边缘智能往往针对特定的应用场景进行设计,同时需要额外专门硬件的支持,缺乏算法的可移植性、接口的易用性与模型的通用性。此外,目前的方法大多基于数据模拟层面的算法设计,难以真正发挥底层硬件的加速性能。同时,机器学习应用通常涉及到模型参数的训练,以往的方法大多用于预测与推理,不适用于网络的训练环境,因此无法满足现实场景下边缘智能的实时性与动态性需求。简言之,现有的边缘智能设备端的模型在训练与推理过程中的计算与存储开销较大,难以实现底层硬件的加速,且模型的预测准确性较低,难以胜任高动态的实时性任务。
因此,现有技术还有待改进和发展。
四、相关文件下载