用户在训练模型过程中,存在因硬件故障而产生的训练失败场景。针对硬件故障场景,ModelArts提供容错检查功能,帮助用户隔离故障节点,优化用户训练体验。 容错检查包括两个检查项:环境预检测与硬件周期性检查。当环境预检查或者硬件周期性检查任一…
针对您在本地或使用其他工具开发的算法,支持上传至ModelArts中统一管理。在创建自定义算法过程中,您需要关注以下内容: 前提条件 进入创建算法页面 设置算法基本信息 设置算法启动方式 输入输出管道设置 定义超参 支持的策略 添加训练约束…
AI模型开发的过程,称之为Modeling,一般包含两个阶段: 开发阶段:准备并配置环境,调试代码,使代码能够开始进行深度学习训练,推荐在ModelArts开发环境中调试。 实验阶段:调整数据集、调整超参等,通过多轮实验,训练出理想的模型,…
登录ModelArts管理控制台。 在左侧导航栏中,选择“训练管理 > 训练作业”,进入“训练作业”列表。 在“训练作业”列表中,单击作业名称,进入训练作业详情页 在训练作业详情页的左侧,可以查看此次训练作业的基本信息和算法配置的相关…
ModelArts支持在新版开发环境中开启TensorBoard和MindInsight可视化工具。在开发环境中通过小数据集训练调试算法,主要目的是验证算法收敛性、检查是否有训练过程中的问题,方便用户调测。 ModelArts可视化作业支持…
MetaValidation算子概述 ModelArts的数据校验通过MetaValidation算子实现。当前ModelArts支持jpg、jpeg、bmp、png四种图片格式。物体检测场景支持xml标注格式,不支持“非矩形框”标注。针对…
Ascend场景日志说明 使用Ascend资源运行训练作业时,会产生Ascend相关日志。Ascend训练场景下会生成device日志、plog日志、proc log单卡训练日志、MindSpore日志、普通日志。 其中,Ascend训练场…
PCC算子概述 ModelArts的数据清洗通过PCC算子实现。图像分类或者物体检测的数据集中可能存在非所需类别的图像,需要将这些图像去除掉,以免对标注、模型训练造成干扰。 图1 PCC算子效果 参数说明 表1 数据清洗-PCC算子参数说明…
ModelArts模型转换页面计划2024年2月29日下线,您可以通过链接下载ATC模型转换工具,线下转换成om格式模型,或通过链接下载MindSpore Lite离线转换模型工具,转换为mindir格式模型进行推理。其中ModelArts…
在训练作业详情页,训练日志窗口提供日志预览、日志下载、日志中搜索关键字、系统日志过滤能力。 预览 系统日志窗口提供训练日志预览功能,并支持查看不同计算节点日志,您可以通过右侧下拉框选择目标节点预览。 图1 查看不同计算节日志 当日志文件过大…