【
仪表网 行业标准】由 TC28(全国信息技术标准化技术委员会)归口,中国电子技术标准化研究院 、华为技术有限公司等单位起草的国家标准计划《人工智能 面向机器学习的系统规范》征求意见稿已完成编制,现公开征求意见。
在《人工智能标准化白皮书(2021)版》中,对人工智能系统框架、智能运算平台架构有深入的解读:机器学习计算框架与算法管理、分布式计算平台、异构资源池化与调度、智能芯片等,是产业迫切的标准需求。
国际上,人工智能标准刚刚起步。ISO/IEC JTC1/SC42 人工智能分委会 2017 年底正式成立。由美国代表团在 SC42 牵头立项“基于机器学习的人工智能框架”。从目前草案来看,机器学习平台能力,包含机器学习框架、算法、流程、生命周期管理、基础设施等是系统的最重要部分。
国内人工智能标准也在逐步制定中。例如征求意见阶段的国家标准《信息技术 人工智能 平台计算资源技术要求》是人工智能系统平台资源层架构和能力的细化。
在国际、国内标准都处于起步阶段的时期,编制本标准并推动在试点行业的验证实施,有利于增强标准对产业的指引,促进相关技术和成果的应用和推广。同时本标准领先于国际标准制定,有助于推动国内技术和标准成果贡献、影响国际标准。本标准也是后续面向机器学习的人工智能系统相关标准的依据。
本文件按照GB/T 1.1-2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
本文件给出了面向机器学习的系统的框架,规定了系统的技术要求。本文件适用于各领域的机器学习系统及相关解决方案的规划、设计及开发,可作为评估、选型及验收的依据。
机器学习运行时组件:
机器学习运行时组件是为保障机器学习应用按照预期在特定机器学习系统上运行所必要的软件环境,包括设备驱动软件和算子库。
设备驱动软件负责机器学习各种类型任务的调度与执行,包括为机器学习任务分配提供资源管理通道,为应用提供存储管理、设备管理、执行流管理、事件管理、核函数执行功能。算子库提供机器学习算法在设备执行调度的最小计算单元,包括面向机器学习计算任务的通用算子和面向特定设备计算加速任务的优化算子。
机器学习框架:
机器学习框架包含模型训练、模型推理及机器学习算法库三个模块,为机器学习应用开发、优化、验证和部署过程中提供工具支撑。
模型训练模块用于机器学习应用设计开发阶段,该模块提供自动微分、损失函数、优化器等调用接口,支持模型定义、自动分布式并行训练、多硬件后端适配等能力。
模型推理模块用于机器学习应的验证部署阶段,该模块提供模型加载、微调、性能评估、转换等接口,提供模型部署及推理加速等能力。
算法库面向机器学习训练、推理及模型性能优化任务,提供预先优化好的算法,以封装函数库的方式供用户调用,提升机器学习模型开发、优化、验证、部署的效率。
安全性要求:
a) 应提供对训练数据、部署模型、算法程序和服务接口的访问权限管理;
b) 应提供抵御对抗样本攻击、噪声污染的能力;
c) 应支持对访问用户的访问历史查询;
d) 应提供对权重文件的防篡改能力以及保护能力;
e) 应支持将任务详细状态输出到日志;
f) 应支持分布式任务的认证、鉴权和加密通信能力;
g) 应支持部分模型的可解释能力;
h) 应支持部分模型的差分隐私训练能力;
i) 应支持部分模型和任务的稳健性评估;
j) 宜支持对非法输入进行屏蔽。
可扩展性要求:
a) 应提供标准化数据接入规范,降低维护和运行机器学习模型的成本;
b) 应提供用不同领域的标准化技术堆栈,为机器学习算法集成提供有效的接口;
c) 应提供模型部署到生产环境的标准化流程,降低系统整合风险;
d) 应提供机器学习生存周期管理工具,为机器学习模型提供测试支持。
全部评论