서명 감지 데이터셋
이 데이터셋은 문서 내에서 사람이 작성한 서명을 감지하는 데 중점을 둡니다. 서명이 주석으로 처리된 다양한 문서 유형을 포함하며, 문서 검증 및 사기 탐지 애플리케이션을 위한 귀중한 인사이트를 제공합니다. computer vision 알고리즘 학습에 필수적인 이 데이터셋은 다양한 문서 형식에서 서명을 식별하도록 도와 문서 분석 분야의 연구와 실용적인 응용을 지원합니다.
데이터셋 구조
서명 감지 데이터셋은 다음과 같이 두 개의 서브셋으로 나뉩니다:
- 학습 세트(Training set): 143개의 이미지와 각 이미지에 해당하는 주석을 포함합니다.
- 검증 세트(Validation set): 35개의 이미지와 각 이미지에 대응하는 주석을 포함합니다.
응용 분야
이 데이터셋은 object detection, object tracking, 문서 분석과 같은 다양한 컴퓨터 비전 작업에 적용할 수 있습니다. 특히 문서 내 서명을 식별하기 위한 모델을 학습하고 평가하는 데 사용할 수 있으며, 다음 분야에서 중요한 응용 가치를 가집니다:
- 문서 검증(Document Verification): 법률 및 금융 문서에 대한 검증 프로세스 자동화
- 사기 탐지(Fraud Detection): 위조되었거나 승인되지 않은 서명 식별
- 디지털 문서 처리(Digital Document Processing): 행정 및 법률 분야의 워크플로우 효율화
- 은행 및 금융(Banking and Finance): 수표 처리 및 대출 문서 검증 시 보안 강화
- 기록 연구(Archival Research): 역사적 문서 분석 및 카탈로그화 지원
또한, 학생과 연구자들이 다양한 문서 유형에 걸친 서명 특성을 연구할 수 있도록 교육 목적으로도 귀중한 자원을 제공합니다.
데이터셋 YAML
YAML(Yet Another Markup Language) 파일은 경로 및 클래스 정보를 포함한 데이터셋 구성을 정의합니다. 서명 감지 데이터셋의 경우 signature.yaml 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml에 위치해 있습니다.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip사용법
서명 감지 데이터셋에서 이미지 크기 640으로 100 epochs 동안 YOLO26n 모델을 학습시키려면 제공된 코드 샘플을 사용하십시오. 사용 가능한 전체 매개변수 목록은 모델의 Training 페이지를 참조하십시오.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)샘플 이미지 및 주석
서명 감지 데이터셋은 서로 다른 문서 유형과 주석이 달린 서명을 보여주는 다양한 이미지로 구성되어 있습니다. 아래는 데이터셋에 포함된 이미지 예시와 그에 해당하는 주석입니다.

- 모자이크 이미지(Mosaiced Image): 여기에는 모자이크 처리된 데이터셋 이미지로 구성된 학습 배치가 제시되어 있습니다. 학습 기법인 모자이킹(Mosaicing)은 여러 이미지를 하나로 결합하여 배치 다양성을 높입니다. 이 방법은 다양한 서명 크기, 종횡비 및 문맥에 걸쳐 모델의 일반화 능력을 향상시키는 데 도움을 줍니다.
이 예시는 서명 감지 데이터셋에 포함된 이미지의 다양성과 복잡성을 보여주며, 학습 과정에 모자이킹을 포함하는 것의 이점을 강조합니다.
인용 및 감사의 글
이 데이터셋은 AGPL-3.0 License 하에 배포되었습니다.
FAQ
서명 감지 데이터셋은 무엇이며, 어떻게 사용할 수 있습니까?
서명 감지 데이터셋은 다양한 문서 유형 내의 사람 서명을 감지하기 위한 주석이 달린 이미지 모음입니다. 이 데이터셋은 object detection 및 추적과 같은 컴퓨터 비전 작업에 적용할 수 있으며, 주로 문서 검증, 사기 탐지 및 기록 연구에 사용됩니다. 이 데이터셋은 다양한 문맥에서 서명을 인식하도록 모델을 학습시키는 데 도움을 주어 smart document analysis 분야의 연구 및 실용적 응용에 가치가 있습니다.
서명 감지 데이터셋으로 YOLO26n 모델을 학습시키려면 어떻게 해야 합니까?
서명 감지 데이터셋으로 YOLO26n 모델을 학습시키려면 다음 단계를 따르십시오:
- Download the
signature.yamldataset configuration file from signature.yaml. - 다음 Python 스크립트 또는 CLI 명령을 사용하여 학습을 시작하십시오:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)더 자세한 내용은 Training 페이지를 참조하십시오.
서명 감지 데이터셋의 주요 응용 분야는 무엇입니까?
서명 감지 데이터셋은 다음 용도로 사용될 수 있습니다:
- 문서 검증(Document Verification): 문서 내 사람 서명의 존재 여부와 진위 여부를 자동으로 검증.
- 사기 탐지(Fraud Detection): 법률 및 금융 문서에서 위조되었거나 사기성 있는 서명 식별.
- 기록 연구(Archival Research): 역사적 문서의 디지털 분석 및 카탈로그화 과정에서 역사학자와 기록 보관 전문가 지원.
- 교육(Education): 컴퓨터 비전 및 machine learning 분야의 학술 연구 및 교육 지원.
- 금융 서비스(Financial Services): 서명 진위 여부를 확인하여 은행 거래 및 대출 처리 시 보안 강화.
서명 감지 데이터셋으로 학습된 모델을 사용하여 어떻게 추론(inference)을 수행할 수 있습니까?
서명 감지 데이터셋으로 학습된 모델을 사용하여 추론을 수행하려면 다음 단계를 따르십시오:
- 파인튜닝된 모델을 로드하십시오.
- 아래 Python 스크립트 또는 CLI 명령을 사용하여 추론을 수행하십시오:
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)서명 감지 데이터셋의 구조는 어떻게 되며, 더 많은 정보는 어디에서 찾을 수 있습니까?
서명 감지 데이터셋은 두 개의 서브셋으로 나뉩니다:
- 학습 세트(Training Set): 주석이 포함된 143개의 이미지.
- 검증 세트(Validation Set): 주석이 포함된 35개의 이미지.
For detailed information, you can refer to the Dataset Structure section. Additionally, view the complete dataset configuration in the signature.yaml file located at signature.yaml.