davincirunsdk

davincirunsdk


License
MIT
Install
pip install davincirunsdk==0.1.5

Documentation

davincirunsdk

为类Jupyter交互式环境提供Notebook友好的Ascend分布式训练SDK

特性

  • davincirun命令,支持Modelarts Ascend训练作业,不再需要打包davinci文件夹
  • init_rank_table 支持转换v0.1 hccl json -> v1.0 hccl json
  • start_distributed_train, wait_distributed_train 根据v1.0 hccl json启动并等待分布式训练完成

更多见SDK文档

安装及使用

安装

$pip install davincirunsdk

调试环境(开发环境)

MindSpore1.5分布式训练教程 为例,使用本SDK可改造为

import os

os.environ['DATA_PATH'] = '/cache/cifar-10-batches-bin'
from davincirunsdk import start_and_wait_distributed_train

cmd = ['python', 'resnet50_distributed_training.py']
start_and_wait_distributed_train(cmd, output_notebook=True)

训练作业

以下命令将等价于python davincirun.py train.py

$davincirun train.py

或在python文件中使用:

from davincirunsdk import init_rank_table, start_and_wait_distributed_train

init_rank_table()
start_and_wait_distributed_train(['python', 'train.py'])

AI靶场全量运行

调试环境(开发环境),不需要额外修改

更多细节见案例

LICENSE

MIT License

开发指南

克隆并安装

$git clone https://git.openi.org.cn/Wh1isper/davincirunsdk.git
$cd davincirunsdk
$pip install -e ./

单元测试

$pytest .

项目构成

notebook文件夹下是针对notebook运行环境修改的davincirun文件,以及sdk入口

davincirunsdk目录下,除了notebook外的文件,是原有davincurun代码,进行了python包改造,并按需启用了moxing对obs文件的支持

各项文档和API功能还在完善中,欢迎各位在issue中进行反馈

案例

AI靶场分布式训练支持

鸣谢

感谢华为云、鹏城实验室、AI靶场对本项目的大力支持和帮助

LINK

不如在这里给我们一个Star🌟鼓励一下!

🌟🌟🌟Github 🌟🌟🌟

🌟🌟🌟OpenI 🌟🌟🌟