平台:Windows

准备数据集

  • 文件夹结构规划
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    yolo_datasets/
    ├── vocdata/
    │ ├── images/ # 存放图像数据
    │ │ ├── train/ # 训练集
    │ │ ├── predict/ # 预测集
    │ │ └── detect/ # 检测集
    │ └── labels/ # 存放标签
    │ └── train/ # 训练标签
    └── weights/
    ├── best.pt # 训练权重
    └── classes.txt # 分类文件(需与LabelImg标注一致)

进行标注

  • 使用 labelImg 进行标注,修改分类文件
    1
    2
    3
    4
    # 主要的快捷键
    w 创建矩形框
    d 下一张
    a 上一张
    注意数据保存格式使用 YOLO,这会将标签以 .txt 格式保存到 labels/train 目录。

开始训练,使用CPU

  • 下载yolov5工程,配置环境
    1
    pip install -r requirements.txt
  • 修改路径配置,指定数据集合路径
    1
    2
    3
    拷贝data/***.yaml  my_data.yaml
    修改指定自己的数据集路径
    修改分类对应关系
  • 修改model配置,指定分类数量
    1
    2
    拷贝mode/***.yaml  my_model.yaml
    修改nc为自己的分类数量
  • 修改train.py
    1
    指定自己修改的my_data.yaml;my_model.yaml
  • 执行训练
    1
    2
    python train.py
    将训练的best.pt保存到`weights`目录
  • 数据集版本管理:使用git lfs存储
    1
    git lfs tract *.jpg #指定.jpg格式为lfs大文件存储