Wandb使用文档-在YOLOv5中的设置

这个博客主要记录在yolov5中解释如何使用YOLOv5权重和偏差~

第一次设置

切换的细节

当您第一次训练时，W&B将提示您创建一个新帐户，并将为您生成一个**API密钥**。如果您是现有用户，您可以从https://wandb.ai/authorize检索密钥。这个键用来告诉W&B在哪里记录您的数据。你只需要提供一次密钥，然后它就会在同一台设备上被记住。

W&B将为您的培训运行创建一个云项目(默认为'YOLOv5')，并且每个新的培训运行将在该项目中提供一个唯一的运行名称project/name。你也可以手动设置你的项目和运行名称为:

$ python train.py --project ... --name ...

查看运行

在您训练时，将信息流从您的环境运行到W&B云控制台。这允许您实时监控甚至取消运行。所有重要信息都被记录:

Training & Validation losses（训练&验证损失）
Metrics: Precision, Recall, [email protected], [email protected]:0.95（评估指标）
Learning Rate over time（学习率-随时变化的）
A bounding box debugging panel, showing the training progress over time（一个边界框调试面板，显示随时间的训练进度）
GPU: Type, GPU Utilization, power, temperature, CUDA memory usage
System: Disk I/0, CPU utilization, RAM memory usage
Your trained model as W&B Artifact
Environment: OS and Python types, Git repository and state, training command

禁用wandb

在该目录中禁用wandb后的训练不会创建wandb运行

wandb disabled

如果需要重新启用wandb，请运行wandb online命令

wandb online

高级用法

您可以利用W&B工件和表格集成来轻松地可视化和管理您的数据集、模型和培训评估。这里有一些快速的例子可以帮助你入门。

1:同时进行训练和日志评估

这是前一节的扩展，但它也将在上传数据集后进行训练。这也是评估表评估比较您的预测和每个epoch的验证集的基本事实。它使用已经上传的数据集的引用，所以没有图像将从您的系统上传超过一次。

终端开启命令:

python train.py --upload_data val

py内开启

在train.py文件的add_argument（参数调节部分），对--upload_data这行加入default=True；即代表每次训练是默认开启上传验证集结果。

结果展示

2. 可视化和版本化数据集

使用W&B表记录、可视化、动态查询和理解您的数据。您可以使用以下命令将数据集记录为W&B表。这将生成一个{dataset}_wandb。Yaml文件，可以用来从数据集工件训练。

终端命令：

python utils/logger/wandb/log_dataset.py --project ... --name ... --data ..

py文件

在yolov5项目根目录下utils/loggers/wandb/log_dataset.py中。

    parser.add_argument('--data', type=str, default='data/coco128.yaml', help='data.yaml path')
    parser.add_argument('--single-cls', action='store_true', help='train as single-class dataset')
    parser.add_argument('--project', type=str, default='YOLOv5', help='name of W&B Project')
    parser.add_argument('--entity', default=None, help='W&B entity')
    parser.add_argument('--name', type=str, default='log dataset', help='name of W&B run')

3:使用数据集工件进行训练

当您按照第一节所述上传数据集时，您将获得一个新的配置文件，其名称中添加了' _wandb '。此文件包含可用于直接从数据集工件训练模型的信息。这也记录了计算结果

4:将模型检查点保存为工件

要启用实验的保存和版本控制检查点，请传递'——save_period n '和

cammand基础，其中' n '表示检查点间隔。您还可以同时记录数据集和模型检查点。如果没有通过，则只记录最终的模型

python train.py --save_period 1

5:从检查点工件运行恢复。

如果——resume参数以wandb-artifact://前缀开头，后面跟着运行路径，即wandb-artifact://username/project/runid，则可以使用artifacts恢复任何运行。这并不要求模型检查点出现在本地系统上。

python train.py --resume wandb-artifact://{run_path}

6:从数据集工件和检查点工件运行简历。

不需要本地数据集或模型检查点。语法与前一节相同，但您需要将数据集和模型检查点作为工件进行lof，即set bot——upload_dataset或train from _wandb。Yaml文件和设置——save_period

python train.py --resume wandb-artifact://{run_path}