常见工作流
工作流一 — 从原型到生产
当你在构建新项目且需要验证后再广泛部署时,使用此工作流。
采集样本(每类 20–50 张)
↓
提交训练任务(数分钟)
↓
热替换到测试设备
↓
在实际条件下验证
↓
如需重训则重训(重复以上步骤)
↓
打包为个人 SDK 或企业批量
↓
部署到生产设备
关键原则: 热替换用于学习和验证。SDK 打包用于分发。不要跳过实地验证步骤——实验室准确率和真实场景准确率往往不同。
工作流二 — 设备群部署
当你要将已验证的模型部署到多台设备或多个站点时,使用此工作流。
从已验证模型出发(来自工作流一或已有项目)
↓
创建企业批量 SDK
↓
为每个站点或客户签发授权密钥
↓
对设备群运行批量烧录操作
↓
在模型管理看板中确认激活状态
↓
按站点配置 Agent 工作流(如果各站点行为不同)
关键原则: 授权密钥在部署前签发。在视部署为完成之前,确认所有密钥均已激活。
工作流三 — 模型更新
当情况变化,现有模型需要重训时,使用此工作流。
识别失败模式(模型在遗漏什么或错分什么?)
↓
采集针对失败模式的新样本
↓
将样本添加到现有项目(不要新建项目)
↓
重训(在现有训练历史基础上构建)
↓
同时对原始测试集和新样本进行验证
↓
使用与原始相同的路径部署更新(热替换 / 批量)
关键原则: 重训是在增加能力——不会消除之前的学习。如果重训后原有类别准确率下降,新样本可能缺乏代表性。在部署前先排查。
工作流四 — 离线野外部署
当设备将在没有网络的情况下运行时,使用此工作流。
有网络时完成模型训练和验证
↓
打包目标部署路径
↓
为离线运行配置 Agent 工作流:
- 设置检测结果本地记录
- 配置告警在下次联网时发送
↓
在维护窗口期间通过 USB 或局域网部署到设备
↓
确认断网设备上的推理正在运行
↓
下次联网时确认已记录的事件已同步
关键原则: 边缘推理无需联网运行。只有需要访问外部服务的 Agent 工作流动作(发送告警、API 调用)需要网络——而且如果网络不稳定,可以将这些动作缓冲起来。
常见问题排查
模型在实际场景中的准确率低于测试时
可能原因:训练图像的采集条件与实际运行条件不同。直接从实际操作摄像头在真实条件下采集新图像后重训。
热替换部署未激活
确认设备固件版本兼容。检查设备连接后重试部署流程。
Agent 工作流告警未触发
确认工作流配置中的检测置信度阈值与模型实际输出一致。在调整阈值之前,使用实时测试视图查看真实置信度分数。
SDK 密钥签发后显示为未激活
设备必须连接一次网络才能激活新签发的密钥。确认设备在密钥签发后至少进行了一次有网络的会话。