프로즌 레이어를 사용한 전이 학습

이 가이드에서는 다음과 같은 경우 YOLOv5 🚀 레이어를 고정하는 방법을 설명합니다. 이전 학습. 전이 학습은 전체 네트워크를 재학습할 필요 없이 새로운 데이터에 대해 모델을 빠르게 재학습할 수 있는 유용한 방법입니다. 대신 초기 가중치의 일부는 그대로 고정하고 나머지 가중치는 손실을 계산하는 데 사용되며 최적화 프로그램에 의해 업데이트됩니다. 이렇게 하면 일반 훈련보다 리소스가 덜 필요하고 훈련 시간이 단축되지만 최종 훈련 정확도가 떨어질 수도 있습니다.

시작하기 전에

리포지토리를 복제하고 요구사항.txt를 설치합니다. Python>=3.8.0 환경을 포함하여 PyTorch>=1.8. 모델 및 데이터 세트는 최신 YOLOv5 릴리스에서 자동으로 다운로드됩니다.

git clone https://github.com/ultralytics/yolov5  # clone
cd yolov5
pip install -r requirements.txt  # install

백본 동결

train.py와 일치하는 모든 레이어 freeze 목록은 훈련 시작 전에 그라데이션을 0으로 설정하여 고정합니다.

# Freeze
freeze = [f"model.{x}." for x in range(freeze)]  # layers to freeze
for k, v in model.named_parameters():
    v.requires_grad = True  # train all layers
    if any(x in k for x in freeze):
        print(f"freezing {k}")
        v.requires_grad = False

모듈 이름 목록을 보려면

for k, v in model.named_parameters():
    print(k)

"""Output:
model.0.conv.conv.weight
model.0.conv.bn.weight
model.0.conv.bn.bias
model.1.conv.weight
model.1.bn.weight
model.1.bn.bias
model.2.cv1.conv.weight
model.2.cv1.bn.weight
...
model.23.m.0.cv2.bn.weight
model.23.m.0.cv2.bn.bias
model.24.m.0.weight
model.24.m.0.bias
model.24.m.1.weight
model.24.m.1.bias
model.24.m.2.weight
model.24.m.2.bias
"""

모델 아키텍처를 살펴보면 모델 백본이 0-9 레이어임을 알 수 있습니다:

# YOLOv5 v6.0 backbone
backbone:
    # [from, number, module, args]
    - [-1, 1, Conv, [64, 6, 2, 2]] # 0-P1/2
    - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4
    - [-1, 3, C3, [128]]
    - [-1, 1, Conv, [256, 3, 2]] # 3-P3/8
    - [-1, 6, C3, [256]]
    - [-1, 1, Conv, [512, 3, 2]] # 5-P4/16
    - [-1, 9, C3, [512]]
    - [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32
    - [-1, 3, C3, [1024]]
    - [-1, 1, SPPF, [1024, 5]] # 9

# YOLOv5 v6.0 head
head:
    - [-1, 1, Conv, [512, 1, 1]]
    - [-1, 1, nn.Upsample, [None, 2, "nearest"]]
    - [[-1, 6], 1, Concat, [1]] # cat backbone P4
    - [-1, 3, C3, [512, False]] # 13

    - [-1, 1, Conv, [256, 1, 1]]
    - [-1, 1, nn.Upsample, [None, 2, "nearest"]]
    - [[-1, 4], 1, Concat, [1]] # cat backbone P3
    - [-1, 3, C3, [256, False]] # 17 (P3/8-small)

    - [-1, 1, Conv, [256, 3, 2]]
    - [[-1, 14], 1, Concat, [1]] # cat head P4
    - [-1, 3, C3, [512, False]] # 20 (P4/16-medium)

    - [-1, 1, Conv, [512, 3, 2]]
    - [[-1, 10], 1, Concat, [1]] # cat head P5
    - [-1, 3, C3, [1024, False]] # 23 (P5/32-large)

    - [[17, 20, 23], 1, Detect, [nc]] # Detect(P3, P4, P5)

를 사용하여 이름에 'model.0'이 있는 모든 모듈을 포함하도록 고정 목록을 정의할 수 있습니다. - 'model.9.'를 이름에 포함하도록 정의할 수 있습니다:

python train.py --freeze 10

모든 레이어 고정

Detect()에서 최종 출력 컨볼루션 레이어를 제외한 전체 모델을 고정하려면, 이름이 'model.0'인 모든 모듈을 포함하도록 고정 목록을 설정합니다. - 'model.23'이 포함된 모든 모듈을 포함하도록 설정합니다:

python train.py --freeze 24

결과

우리는 위의 두 가지 시나리오에서 기본 모델(동결 없음)과 함께 공식 COCO 사전 훈련에서 시작하여 YOLOv5m을 VOC에 대해 훈련합니다. --weights yolov5m.pt:

train.py --batch 48 --weights yolov5m.pt --data voc.yaml --epochs 50 --cache --img 512 --hyp hyp.finetune.yaml

정확도 비교

그 결과 동결하면 훈련 속도가 빨라지지만 최종 정확도는 약간 떨어지는 것으로 나타났습니다.

동결 훈련 mAP50 결과

동결 훈련 mAP50-95 결과

표 결과

GPU 사용률 비교

흥미롭게도 더 많은 모듈이 고정될수록 훈련에 필요한 GPU 메모리가 줄어들고 GPU 사용률이 낮아집니다. 이는 더 큰 모델 또는 더 큰 이미지 크기로 훈련된 모델이 더 빠르게 훈련하기 위해 프리징의 이점을 누릴 수 있음을 나타냅니다.

교육 GPU 메모리 할당된 비율

교육 GPU 메모리 사용률

지원 환경

Ultralytics 는 바로 사용할 수 있는 다양한 환경을 제공하며, 각 환경에는 다음과 같은 필수 종속성이 사전 설치되어 있습니다. CUDA, CUDNN, Python, 및 PyTorch와 같은 필수 종속 요소를 설치하여 프로젝트를 시작할 수 있습니다.

무료 GPU 노트북:
Google Cloud: GCP 빠른 시작 가이드
Amazon: AWS 빠른 시작 가이드
Azure: AzureML 빠른 시작 가이드
Docker: Docker 빠른 시작 가이드

프로젝트 상태

이 배지는 모든 YOLOv5 GitHub Actions 지속적 통합(CI) 테스트가 성공적으로 통과되었음을 나타냅니다. 이러한 CI 테스트는 교육, 검증, 추론, 내보내기 및 벤치마크 등 다양한 주요 측면에서 YOLOv5 의 기능과 성능을 엄격하게 확인합니다. 24시간마다 그리고 새로운 커밋이 있을 때마다 테스트를 수행하여 macOS, Windows 및 Ubuntu에서 일관되고 안정적인 작동을 보장합니다.

📅1 년 전 생성됨 ✏️ 1개월 전 업데이트됨