Ultralytics를 사용한 K-Fold 교차 검증
소개
본 종합 가이드는 Ultralytics 생태계 내에서 객체 탐지 데이터셋을 위한 K-Fold 교차 검증 구현 방법을 설명합니다. YOLO 탐지 형식과 sklearn, pandas, PyYAML과 같은 주요 Python 라이브러리를 활용하여 필요한 설정, 특징 벡터 생성 과정, K-Fold 데이터셋 분할 실행까지 안내해 드립니다.
프로젝트에 Fruit Detection 데이터셋을 사용하든 사용자 정의 데이터 소스를 사용하든, 본 튜토리얼은 K-Fold 교차 검증을 이해하고 적용하여 머신 러닝 모델의 신뢰성과 견고성을 강화하는 데 도움을 드립니다. 이 튜토리얼에서는 k=5 폴드를 사용하지만, 최적의 폴드 수는 데이터셋과 프로젝트의 세부 사항에 따라 다를 수 있다는 점을 유의하십시오.
시작하겠습니다.
설정
-
주석은 YOLO 탐지 형식이어야 합니다.
-
본 가이드는 주석 파일이 로컬에 있음을 가정합니다.
-
데모를 위해 Fruit Detection 데이터셋을 사용합니다.
- 이 데이터셋에는 총 8479개의 이미지가 포함되어 있습니다.
- 6개의 클래스 라벨이 포함되어 있으며, 각 라벨의 총 인스턴스 수는 아래와 같습니다.
| 클래스 라벨 | 인스턴스 수 |
|---|---|
| Apple | 7049 |
| Grapes | 7202 |
| Pineapple | 1613 |
| Orange | 15549 |
| Banana | 3536 |
| Watermelon | 1976 |
-
필요한 Python 패키지는 다음과 같습니다:
ultralyticssklearnpandaspyyaml
-
이 튜토리얼은
k=5폴드로 작동합니다. 하지만, 사용 중인 특정 데이터셋에 가장 적합한 폴드 수를 결정해야 합니다.
-
프로젝트를 위한 새로운 Python 가상 환경(
venv)을 시작하고 활성화하십시오.pip(또는 선호하는 패키지 관리자)를 사용하여 다음을 설치하십시오:- Ultralytics 라이브러리:
pip install -U ultralytics. 또는 공식 저장소를 복제할 수 있습니다. - Scikit-learn, pandas 및 PyYAML:
pip install -U scikit-learn pandas pyyaml.
- Ultralytics 라이브러리:
-
주석이 YOLO 탐지 형식인지 확인하십시오.
- 본 튜토리얼의 모든 주석 파일은
Fruit-Detection/labels디렉토리에 있습니다.
- 본 튜토리얼의 모든 주석 파일은
객체 탐지 데이터셋을 위한 특징 벡터 생성
-
아래 단계를 위해 새로운
example.pyPython 파일을 생성하는 것부터 시작하십시오. -
데이터셋의 모든 라벨 파일을 가져오십시오.
from pathlib import Path dataset_path = Path("./Fruit-detection") # replace with 'path/to/dataset' for your custom data labels = sorted(dataset_path.rglob("*labels/*.txt")) # all data in 'labels' -
이제 데이터셋 YAML 파일의 내용을 읽고 클래스 라벨의 인덱스를 추출하십시오.
import yaml yaml_file = "path/to/data.yaml" # your data YAML with data directories and names dictionary with open(yaml_file, encoding="utf8") as y: classes = yaml.safe_load(y)["names"] cls_idx = sorted(classes.keys()) -
빈
pandasDataFrame을 초기화하십시오.import pandas as pd index = [label.stem for label in labels] # uses base filename as ID (no extension) labels_df = pd.DataFrame([], columns=cls_idx, index=index) -
주석 파일에 존재하는 각 클래스 라벨의 인스턴스 수를 계산하십시오.
from collections import Counter for label in labels: lbl_counter = Counter() with open(label) as lf: lines = lf.readlines() for line in lines: # classes for YOLO label uses integer at first position of each line lbl_counter[int(line.split(" ", 1)[0])] += 1 labels_df.loc[label.stem] = lbl_counter labels_df = labels_df.fillna(0.0) # replace `nan` values with `0.0` -
다음은 채워진 DataFrame의 샘플 보기입니다:
0 1 2 3 4 5 '0000a16e4b057580_jpg.rf.00ab48988370f64f5ca8ea4...' 0.0 0.0 0.0 0.0 0.0 7.0 '0000a16e4b057580_jpg.rf.7e6dce029fb67f01eb19aa7...' 0.0 0.0 0.0 0.0 0.0 7.0 '0000a16e4b057580_jpg.rf.bc4d31cdcbe229dd022957a...' 0.0 0.0 0.0 0.0 0.0 7.0 '00020ebf74c4881c_jpg.rf.508192a0a97aa6c4a3b6882...' 0.0 0.0 0.0 1.0 0.0 0.0 '00020ebf74c4881c_jpg.rf.5af192a2254c8ecc4188a25...' 0.0 0.0 0.0 1.0 0.0 0.0 ... ... ... ... ... ... ... 'ff4cd45896de38be_jpg.rf.c4b5e967ca10c7ced3b9e97...' 0.0 0.0 0.0 0.0 0.0 2.0 'ff4cd45896de38be_jpg.rf.ea4c1d37d2884b3e3cbce08...' 0.0 0.0 0.0 0.0 0.0 2.0 'ff5fd9c3c624b7dc_jpg.rf.bb519feaa36fc4bf630a033...' 1.0 0.0 0.0 0.0 0.0 0.0 'ff5fd9c3c624b7dc_jpg.rf.f0751c9c3aa4519ea3c9d6a...' 1.0 0.0 0.0 0.0 0.0 0.0 'fffe28b31f2a70d4_jpg.rf.7ea16bd637ba0711c53b540...' 0.0 6.0 0.0 0.0 0.0 0.0
행은 데이터셋의 이미지에 해당하는 라벨 파일을 인덱싱하며, 열은 클래스 라벨 인덱스에 해당합니다. 각 행은 데이터셋에 존재하는 각 클래스 라벨의 수를 포함하는 유사 특징 벡터를 나타냅니다. 이 데이터 구조를 통해 객체 탐지 데이터셋에 K-Fold 교차 검증을 적용할 수 있습니다.
K-Fold 데이터셋 분할
-
Now we will use the
KFoldclass fromsklearn.model_selectionto generateksplits of the dataset.- 중요:
shuffle=True로 설정하면 분할 내 클래스가 무작위로 분포됩니다.random_state=M(M은 선택한 정수)으로 설정하면 반복 가능한 결과를 얻을 수 있습니다.
import random from sklearn.model_selection import KFold random.seed(0) # for reproducibility ksplit = 5 kf = KFold(n_splits=ksplit, shuffle=True, random_state=20) # setting random_state for repeatable results kfolds = list(kf.split(labels_df)) - 중요:
-
데이터셋이 이제
k개의 폴드로 분할되었으며, 각 폴드는train및val인덱스 목록을 가집니다. 결과를 명확하게 표시하기 위해 DataFrame을 구성하겠습니다.folds = [f"split_{n}" for n in range(1, ksplit + 1)] folds_df = pd.DataFrame(index=index, columns=folds) for i, (train, val) in enumerate(kfolds, start=1): folds_df[f"split_{i}"].loc[labels_df.iloc[train].index] = "train" folds_df[f"split_{i}"].loc[labels_df.iloc[val].index] = "val" -
이제 각 폴드에 대한 클래스 라벨 분포를
val에 존재하는 클래스와train에 존재하는 클래스의 비율로 계산하겠습니다.fold_lbl_distrb = pd.DataFrame(index=folds, columns=cls_idx) for n, (train_indices, val_indices) in enumerate(kfolds, start=1): train_totals = labels_df.iloc[train_indices].sum() val_totals = labels_df.iloc[val_indices].sum() # To avoid division by zero, we add a small value (1E-7) to the denominator ratio = val_totals / (train_totals + 1e-7) fold_lbl_distrb.loc[f"split_{n}"] = ratio모든 클래스 비율이 각 분할 및 클래스 전반에 걸쳐 합리적으로 유사한 것이 이상적입니다. 그러나 이는 데이터셋의 세부 사항에 따라 달라질 수 있습니다.
-
다음으로 각 분할에 대한 디렉토리와 데이터셋 YAML 파일을 생성합니다.
import datetime supported_extensions = [".jpg", ".jpeg", ".png"] # Initialize an empty list to store image file paths images = [] # Loop through supported extensions and gather image files for ext in supported_extensions: images.extend(sorted((dataset_path / "images").rglob(f"*{ext}"))) # Create the necessary directories and dataset YAML files save_path = Path(dataset_path / f"{datetime.date.today().isoformat()}_{ksplit}-Fold_Cross-val") save_path.mkdir(parents=True, exist_ok=True) ds_yamls = [] for split in folds_df.columns: # Create directories split_dir = save_path / split split_dir.mkdir(parents=True, exist_ok=True) (split_dir / "train" / "images").mkdir(parents=True, exist_ok=True) (split_dir / "train" / "labels").mkdir(parents=True, exist_ok=True) (split_dir / "val" / "images").mkdir(parents=True, exist_ok=True) (split_dir / "val" / "labels").mkdir(parents=True, exist_ok=True) # Create dataset YAML files dataset_yaml = split_dir / f"{split}_dataset.yaml" ds_yamls.append(dataset_yaml) with open(dataset_yaml, "w") as ds_y: yaml.safe_dump( { "path": split_dir.as_posix(), "train": "train", "val": "val", "names": classes, }, ds_y, ) -
마지막으로 각 분할에 대해 이미지와 라벨을 해당 디렉토리('train' 또는 'val')에 복사합니다.
- 참고: 코드의 이 부분에 소요되는 시간은 데이터셋의 크기와 시스템 하드웨어에 따라 다릅니다.
import shutil from tqdm import tqdm for image, label in tqdm(zip(images, labels), total=len(images), desc="Copying files"): for split, k_split in folds_df.loc[image.stem].items(): # Destination directory img_to_path = save_path / split / k_split / "images" lbl_to_path = save_path / split / k_split / "labels" # Copy image and label files to new directory (SamefileError if file already exists) shutil.copy(image, img_to_path / image.name) shutil.copy(label, lbl_to_path / label.name)
기록 저장(선택 사항)
선택적으로 K-Fold 분할 및 라벨 분포 DataFrame 기록을 나중에 참조할 수 있도록 CSV 파일로 저장할 수 있습니다.
folds_df.to_csv(save_path / "kfold_datasplit.csv")
fold_lbl_distrb.to_csv(save_path / "kfold_label_distribution.csv")K-Fold 데이터 분할을 사용하여 YOLO 학습
-
먼저 YOLO 모델을 로드하십시오.
from ultralytics import YOLO weights_path = "path/to/weights.pt" # use yolo26n.pt for a small model model = YOLO(weights_path, task="detect") -
다음으로 데이터셋 YAML 파일을 반복하며 학습을 실행합니다. 결과는
project및name인수에 지정된 디렉토리에 저장됩니다. 기본적으로 이 디렉토리는 'runs/detect/train#'이며, 여기서 #은 정수 인덱스입니다.results = {} # Define your additional arguments here batch = 16 project = "kfold_demo" epochs = 100 for k, dataset_yaml in enumerate(ds_yamls): model = YOLO(weights_path, task="detect") results[k] = model.train( data=dataset_yaml, epochs=epochs, batch=batch, project=project, name=f"fold_{k + 1}" ) # include any additional train arguments -
자동 데이터셋 분할을 위해 Ultralytics data.utils.autosplit 함수를 사용할 수도 있습니다:
from ultralytics.data.split import autosplit # Automatically split dataset into train/val/test autosplit(path="path/to/images", weights=(0.8, 0.2, 0.0), annotated_only=True)
결론
본 가이드에서는 YOLO 객체 탐지 모델 학습을 위해 K-Fold 교차 검증을 사용하는 과정을 살펴보았습니다. 데이터셋을 K개의 파티션으로 분할하여 다양한 폴드 전반에 걸쳐 균형 잡힌 클래스 분포를 확보하는 방법을 배웠습니다.
또한 데이터 분할 및 폴드 간 라벨 분포를 시각화하기 위한 보고서 DataFrame 생성 절차를 살펴보았으며, 이를 통해 학습 및 검증 세트의 구조에 대한 명확한 통찰력을 얻었습니다.
선택적으로 향후 참조를 위해 기록을 저장했으며, 이는 대규모 프로젝트나 모델 성능 문제 해결 시 특히 유용할 수 있습니다.
마지막으로 각 분할을 루프에서 사용하여 실제 모델 학습을 구현하고, 추가 분석 및 비교를 위해 학습 결과를 저장했습니다.
이 K-Fold 교차 검증 기법은 가용 데이터를 최대한 활용하는 견고한 방법이며, 모델 성능이 다양한 데이터 하위 집합에서 신뢰할 수 있고 일관되게 유지되도록 합니다. 그 결과 특정 데이터 패턴에 과적합될 가능성이 낮은 더 일반화되고 신뢰할 수 있는 모델이 생성됩니다.
본 가이드에서는 YOLO를 사용했지만, 이러한 단계는 대부분 다른 머신 러닝 모델에도 적용 가능함을 기억하십시오. 이 단계를 이해하면 자신의 머신 러닝 프로젝트에도 효과적으로 교차 검증을 적용할 수 있습니다.
FAQ
K-Fold 교차 검증이란 무엇이며 객체 탐지에서 왜 유용한가요?
K-Fold 교차 검증은 모델 성능을 더 신뢰성 있게 평가하기 위해 데이터셋을 'k'개의 하위 집합(폴드)으로 나누는 기법입니다. 각 폴드는 학습 데이터와 검증 데이터 역할을 모두 수행합니다. 객체 탐지 맥락에서 K-Fold 교차 검증을 사용하면 Ultralytics YOLO 모델의 성능이 다양한 데이터 분할 전반에서 견고하고 일반화되어 신뢰성이 향상됩니다. Ultralytics YOLO로 K-Fold 교차 검증을 설정하는 방법에 대한 자세한 지침은 Ultralytics를 사용한 K-Fold 교차 검증을 참조하십시오.
Ultralytics YOLO를 사용하여 K-Fold 교차 검증을 어떻게 구현하나요?
Ultralytics YOLO로 K-Fold 교차 검증을 구현하려면 다음 단계를 따라야 합니다:
- 주석이 YOLO 탐지 형식인지 확인하십시오.
sklearn,pandas,pyyaml과 같은 Python 라이브러리를 사용하십시오.- 데이터셋에서 특징 벡터를 생성하십시오.
- Split your dataset using
KFoldfromsklearn.model_selection. - 각 분할에 대해 YOLO 모델을 학습하십시오.
종합 가이드는 문서의 K-Fold 데이터셋 분할 섹션을 참조하십시오.
객체 탐지에 Ultralytics YOLO를 사용해야 하는 이유는 무엇인가요?
Ultralytics YOLO는 높은 정확도와 효율성을 갖춘 최첨단 실시간 객체 탐지를 제공합니다. 탐지, 세그멘테이션, 분류와 같은 다양한 컴퓨터 비전 작업을 지원하는 다재다능한 도구입니다. 또한 노코드 모델 학습 및 배포를 위해 Ultralytics 플랫폼과 원활하게 통합됩니다. 더 자세한 내용은 Ultralytics YOLO 페이지에서 이점과 기능을 살펴보십시오.
Ultralytics YOLO를 위해 주석이 올바른 형식인지 어떻게 확인할 수 있나요?
주석은 YOLO 탐지 형식을 따라야 합니다. 각 주석 파일은 이미지 내 경계 상자 좌표와 함께 객체 클래스를 나열해야 합니다. YOLO 형식은 객체 탐지 모델 학습을 위한 간소화되고 표준화된 데이터 처리를 보장합니다. 적절한 주석 형식에 대한 자세한 정보는 YOLO 탐지 형식 가이드를 방문하십시오.
Fruit Detection 외의 사용자 정의 데이터셋으로 K-Fold 교차 검증을 사용할 수 있나요?
네, 주석이 YOLO 탐지 형식이라면 어떤 사용자 정의 데이터셋으로도 K-Fold 교차 검증을 사용할 수 있습니다. 데이터셋 경로와 클래스 라벨을 해당 사용자 정의 데이터셋에 맞는 것으로 교체하십시오. 이러한 유연성 덕분에 모든 객체 탐지 프로젝트가 K-Fold 교차 검증을 사용하여 견고한 모델 평가의 이점을 누릴 수 있습니다. 실습 예제는 특징 벡터 생성 섹션을 검토하십시오.