서명 감지 데이터셋

이 데이터셋은 문서 내에서 사람이 작성한 서명을 감지하는 데 중점을 둡니다. 서명이 주석으로 처리된 다양한 문서 유형을 포함하며, 문서 검증 및 사기 탐지 애플리케이션을 위한 귀중한 인사이트를 제공합니다. computer vision 알고리즘 학습에 필수적인 이 데이터셋은 다양한 문서 형식에서 서명을 식별하도록 도와 문서 분석 분야의 연구와 실용적인 응용을 지원합니다.

데이터셋 구조

서명 감지 데이터셋은 다음과 같이 두 개의 서브셋으로 나뉩니다:

  • 학습 세트(Training set): 143개의 이미지와 각 이미지에 해당하는 주석을 포함합니다.
  • 검증 세트(Validation set): 35개의 이미지와 각 이미지에 대응하는 주석을 포함합니다.

응용 분야

이 데이터셋은 object detection, object tracking, 문서 분석과 같은 다양한 컴퓨터 비전 작업에 적용할 수 있습니다. 특히 문서 내 서명을 식별하기 위한 모델을 학습하고 평가하는 데 사용할 수 있으며, 다음 분야에서 중요한 응용 가치를 가집니다:

  • 문서 검증(Document Verification): 법률 및 금융 문서에 대한 검증 프로세스 자동화
  • 사기 탐지(Fraud Detection): 위조되었거나 승인되지 않은 서명 식별
  • 디지털 문서 처리(Digital Document Processing): 행정 및 법률 분야의 워크플로우 효율화
  • 은행 및 금융(Banking and Finance): 수표 처리 및 대출 문서 검증 시 보안 강화
  • 기록 연구(Archival Research): 역사적 문서 분석 및 카탈로그화 지원

또한, 학생과 연구자들이 다양한 문서 유형에 걸친 서명 특성을 연구할 수 있도록 교육 목적으로도 귀중한 자원을 제공합니다.

데이터셋 YAML

YAML(Yet Another Markup Language) 파일은 경로 및 클래스 정보를 포함한 데이터셋 구성을 정의합니다. 서명 감지 데이터셋의 경우 signature.yaml 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml에 위치해 있습니다.

ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

사용법

서명 감지 데이터셋에서 이미지 크기 640으로 100 epochs 동안 YOLO26n 모델을 학습시키려면 제공된 코드 샘플을 사용하십시오. 사용 가능한 전체 매개변수 목록은 모델의 Training 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
추론 예제
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

샘플 이미지 및 주석

서명 감지 데이터셋은 서로 다른 문서 유형과 주석이 달린 서명을 보여주는 다양한 이미지로 구성되어 있습니다. 아래는 데이터셋에 포함된 이미지 예시와 그에 해당하는 주석입니다.

Signature detection dataset sample image

  • 모자이크 이미지(Mosaiced Image): 여기에는 모자이크 처리된 데이터셋 이미지로 구성된 학습 배치가 제시되어 있습니다. 학습 기법인 모자이킹(Mosaicing)은 여러 이미지를 하나로 결합하여 배치 다양성을 높입니다. 이 방법은 다양한 서명 크기, 종횡비 및 문맥에 걸쳐 모델의 일반화 능력을 향상시키는 데 도움을 줍니다.

이 예시는 서명 감지 데이터셋에 포함된 이미지의 다양성과 복잡성을 보여주며, 학습 과정에 모자이킹을 포함하는 것의 이점을 강조합니다.

인용 및 감사의 글

이 데이터셋은 AGPL-3.0 License 하에 배포되었습니다.

FAQ

서명 감지 데이터셋은 무엇이며, 어떻게 사용할 수 있습니까?

서명 감지 데이터셋은 다양한 문서 유형 내의 사람 서명을 감지하기 위한 주석이 달린 이미지 모음입니다. 이 데이터셋은 object detection 및 추적과 같은 컴퓨터 비전 작업에 적용할 수 있으며, 주로 문서 검증, 사기 탐지 및 기록 연구에 사용됩니다. 이 데이터셋은 다양한 문맥에서 서명을 인식하도록 모델을 학습시키는 데 도움을 주어 smart document analysis 분야의 연구 및 실용적 응용에 가치가 있습니다.

서명 감지 데이터셋으로 YOLO26n 모델을 학습시키려면 어떻게 해야 합니까?

서명 감지 데이터셋으로 YOLO26n 모델을 학습시키려면 다음 단계를 따르십시오:

  1. Download the signature.yaml dataset configuration file from signature.yaml.
  2. 다음 Python 스크립트 또는 CLI 명령을 사용하여 학습을 시작하십시오:
학습 예제
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)

더 자세한 내용은 Training 페이지를 참조하십시오.

서명 감지 데이터셋의 주요 응용 분야는 무엇입니까?

서명 감지 데이터셋은 다음 용도로 사용될 수 있습니다:

  1. 문서 검증(Document Verification): 문서 내 사람 서명의 존재 여부와 진위 여부를 자동으로 검증.
  2. 사기 탐지(Fraud Detection): 법률 및 금융 문서에서 위조되었거나 사기성 있는 서명 식별.
  3. 기록 연구(Archival Research): 역사적 문서의 디지털 분석 및 카탈로그화 과정에서 역사학자와 기록 보관 전문가 지원.
  4. 교육(Education): 컴퓨터 비전 및 machine learning 분야의 학술 연구 및 교육 지원.
  5. 금융 서비스(Financial Services): 서명 진위 여부를 확인하여 은행 거래 및 대출 처리 시 보안 강화.

서명 감지 데이터셋으로 학습된 모델을 사용하여 어떻게 추론(inference)을 수행할 수 있습니까?

서명 감지 데이터셋으로 학습된 모델을 사용하여 추론을 수행하려면 다음 단계를 따르십시오:

  1. 파인튜닝된 모델을 로드하십시오.
  2. 아래 Python 스크립트 또는 CLI 명령을 사용하여 추론을 수행하십시오:
추론 예제
from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)

서명 감지 데이터셋의 구조는 어떻게 되며, 더 많은 정보는 어디에서 찾을 수 있습니까?

서명 감지 데이터셋은 두 개의 서브셋으로 나뉩니다:

  • 학습 세트(Training Set): 주석이 포함된 143개의 이미지.
  • 검증 세트(Validation Set): 주석이 포함된 35개의 이미지.

For detailed information, you can refer to the Dataset Structure section. Additionally, view the complete dataset configuration in the signature.yaml file located at signature.yaml.

댓글