
分册 8Checklist、mig_docs 交付、对话输出格式【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills对应执行步 6归档收口无主流程独立 §。完整迁移在 part-05 评测达标后按 workflow.md闭环检查收口。Checklist可直接复制粘贴给进度任务进度可行性预判part-02已完成迁移链路、IO 契约、风险分级、Phase 13 计划结论与风险表已写入Mig_report§2.2门禁part-03迁移开始时已确保mig_docs/目录存在已按 4.0.1 生成/读取mig_docs/working/environment.md门禁part-03已阅读 README/requirements 等并完成 4.0.3 适配判定AUTO / MANUAL_STOP / UNKNOWN未因 part-02 通过而跳过若为MANUAL_STOP已输出手动需求清单并已停止自动化 NPU 训练/推理步骤待用户补齐后再刷新environment.md明确目标硬件与 CANN/驱动/工具链版本收集工程依赖与基线推理入口requirements/setup/脚本记录基线优先检索项目完整训练日志并摘录否则精度指标 延迟/吞吐默认GPU可复现输入或 §2.6 接口已在Mig_Readme.md填写数据集与测试用途对照短测/冒烟/训练/推理等及下载方式与过程若无完整训练日志已按推荐顺序在§2.6准备GPU训练与推理调用接口NPU 数据可先就绪Mig_report.md/Compare.md与之一致确认框架/工程栈与输入/输出 shape固定/动态策略填写环境信息快照表见 part-03-environment.md §4.2 表环境验证npu-smi、框架 Ascend 插件可导入、运行时依赖若处于沙箱npu-smi info与框架插件检查在沙箱内检测不到或不稳定时已在沙箱外用同一组命令复检并记录两侧结果与最终采信结论见 part-03 §4.0.1环境快照mig_docs/working/environment.md已读 / 本次已更新或生成本轮变更是否已同步更新Mig_report/Mig_Readme/Compare/environment.md在mig_docs/内若出现失败/回滚Mig_report.md§7是否已更新含现象、复现、根因、修复、验证§8是否注明运行日志路径本机环境检测结论可直接测试 / 仅输出环境目标清单落地方案与待补齐项已按environment-setup-objectives.md对齐环境准备目标并在environment.md/ 对话中留下对应证据或缺口说明FP16 路径确定精度目标先行步 4 收口part-04 §5.0含 §5.6 smokeMig_report§4§6、Mig_Readme§4§5 已填smoke 已在 NPU 跑通并勾选 §6迁移后最小验证NPU 前向 少量样本 记录启动命令与日志Golden 样本基线与 NPU 数值一致性抽查可选代码级迁移适配推理 smoke固定输入、输出 shape/无 NaN由环境检测和用户意愿决定可选若迁移后仍训练代码级迁移适配训练 smoke单 batch 前向反向一步或极少 step可选若迁移后仍训练训练短测part-05§8.1.1代码迁移后loss相对起点稳定下降约 30%50%即通过并停止未在同配置下做多余重复短测可选若迁移后仍训练正式训练阶段loss/约定指标不明显时已适当加大 iteration若500step或Mig_Readme§5.3 约定值仍无改善已按part-05 §8.2转查代码/模型实现并记录Mig_report§7运行验证权重/checkpoint 能稳定加载、无异常日志可选精度对比与基线差异在允许范围内可选性能评估p50/p95或约定指标与吞吐统计方法一致推荐顺序先在NPU完成短测/约定性能并落数baseline优先项目训练日志否则在Mig_Readme.md§2.6给出GPU接口用户自测并回填已在Compare.md§2.02.1、§4 注明来源性能评估与精度对比完成后已按 workflow.md「文档一致性校验矩阵」执行统一数据同步含environment.md与Mig_report§3 版本一致形成回归结论文档及迁移报告含问题材料清单便于复盘训练/推理测试完成后已执行“归档总结收口”统一汇总迁移操作、迁移环境、预判与验证结论、训练/推理效果Summary.md已定稿最终交付含当前进程与适配状态显式快照成功时 baseline 来源〔项目日志 / GPU 实测〕、环境、数据集、指标摘要失败时算子/依赖等勾选已执行文档结构整理删除重复/无效文档、清理缓存与临时文件、统一目录入口与命名mig_docs/过程文档 最终交付working/内四份过程文档是否已随进度填写Summary.md是否在步 6 定稿mig_docs/working/environment.md是否与 part-03 / objectives 一致任务结束时上述交付物含environment.md是否已与当前状态一致见下方「规范输出」mig_docs 规范输出交付物目录迁移开始即应存在mig_docs/若为空从science-model-npu-migrationskill 仓库按 deliverables-index.md 复制mig_docs/模板含.gitignore、Summary.md与working/下四份过程模板及本 index 文件并随进度填写。工程级忽略.venv/、__pycache__/等见 deliverables-index「版本控制与临时产物」。维护迁移过程中可阶段性更新在性能评估与精度对比完成后必须按 workflow.md「文档一致性校验矩阵」执行统一数据同步Mig_report/Mig_Readme/Compare/Summary/environment.md关键数据一致。失败与回滚留痕若出现运行失败、算子不支持、精度/性能异常写入Mig_report.md§7并与Compare.md等结论一致。归档总结训练/推理测试完成后定稿mig_docs/Summary.md最终交付覆盖迁移操作、迁移环境、预判与验证part-02 part-03 迁移后验证、训练/推理效果、最终结论与后续建议须含显式「当前进程与适配状态」快照成功baseline 来源〔项目训练日志 / GPU 实测〕、测试环境、数据集与指标摘要失败算子/依赖缺失等勾选与说明。勿在Mig_report.md重复维护与 Summary 同内容的归档章节。收口清理任务收尾时应执行“结构清理”并记录结果删除重复/过期文档清理缓存与临时文件如__pycache__/、*.pyc、*.tmp、*.log确认目录中仅保留有效交付物。文件必填内容要点mig_docs/working/Mig_report.md元信息、成功标准、§2.2 可行性预判、数据集与测试用途摘要、环境快照、代码级迁移要点、启动命令、代码/配置/依赖变更清单、算子与后处理变更、验证勾选、风险与回滚、日志路径mig_docs/working/Mig_Readme.md环境准备§2.4 对齐docs/environment-setup-objectives.md§2.5environment.md依赖、CANN set_env、设备检查、§2.6 基线 GPU 训练与推理调用接口无完整训练日志时默认 GPUNPU 短测/性能落数后补齐、数据集与测试用途对照§3.1 含训练短测说明loss30%50%达标即停、下载方式与过程、数据与预处理与 IO 契约一致、NPU 推理命令与参数表若存在 NPU 训练则写训练入口、§5.3正式训练迭代与短测区分、与迁移前差异否则明确「仅推理」mig_docs/working/Compare.md基线 vs 昇腾环境表、基线选取项目训练日志优先 / 否则默认 GPU§2.1、数据集与测试用途、测量口径、精度对比表、Golden 样本摘要、性能对比表§4 注明 baseline 来源、瓶颈与原始日志路径mig_docs/Summary.md最终交付迁移全程摘要、显式快照baseline 来源项目日志或 GPU 实测、关键决策、测试结论训练/推理、达标性判断、遗留问题与下一步计划命名约定迁移报告文件名为Mig_report.md英文 report避免拼写为 reprot。对话中的输出规范除写文件外回复正文应包含说明四份核心文档与mig_docs/working/environment.md是否已创建/更新及相对仓库根路径例如mig_docs/working/Mig_report.md若本轮有失败/回滚说明Mig_report§7是否已更新。用简短摘要覆盖Mig_report中的主要变更行数或关键文件列表Compare中的达标结论一行话。若用户未指定路径默认建议项目根目录下的mig_docs/。输出格式要求 agent 按以下结构输出最终回复建议包含一段“迁移结论/下一步”若MANUAL_STOP结论须为「暂停自动化待手动项完成」迁移步骤清单Checklist4.0.3 适配判定AUTO / MANUAL_STOP / UNKNOWN一行结论若为 MANUAL_STOP附手动需求清单环境快照路径与状态mig_docs/working/environment.md已读 / 本次已更新与本机环境检测结果、执行策略直接测试 / 仅输出环境目标落地方案与待补齐项mig_docs/交付状态本轮创建/更新了哪些文件四份核心文档与environment.md是否已从 skill 复制/生成并按阶段填写可执行的命令命令模板 已知参数填充 待确认参数列表MANUAL_STOP时不应包含误导性的 NPU 全链路执行命令环境信息快照表part-03-environment.md §4.2与产物命名/路径说明精度/性能验证计划可选执行项需标注触发条件含 Golden 样本与全量指标推荐测量顺序见 part-05 §7.0 与Compare.md§2.0先NPU落数baseline优先项目训练日志否则经Mig_Readme.md§2.6 补GPUbaseline须在Compare.md写明来源文档数据同步更新结果在性能/精度完成后已按 workflow.md「文档一致性校验矩阵」对Mig_report/Mig_Readme/Compare/Summary/environment.md做统一回填与一致性校验风险点与回滚策略详见 part-06-risk-rollback.md)归档总结定稿mig_docs/Summary.md最终交付须含显式当前进程快照成功baseline 来源〔项目日志 / GPU 实测〕、环境、数据集与指标摘要失败失败类型勾选与阻塞说明收口清理结果本轮删除了哪些冗余文档/缓存文件若无可删项需明确“已检查无冗余”仅“检查当前 NPU 适配情况”时的简化输出从 part-03 直接执行并输出environment.md状态、沙箱内/外检测、4.0.3 判定AUTO/MANUAL_STOP/UNKNOWN、待补齐项。不进入part-0405、part-08 完整归档回复中明确“本次为适配状态检查路径未执行完整迁移链路”。关联索引上一环节part-05-performance-accuracy.md完整迁移主线流程总览workflow.md 步 6、闭环检查【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考