Meet YOLO26: next-gen vision AI.

Link to this sectionTổng quan về tập dữ liệu phát hiện đối tượng#

Việc huấn luyện một mô hình object detection mạnh mẽ và chính xác đòi hỏi một tập dữ liệu toàn diện. Hướng dẫn này giới thiệu các định dạng tập dữ liệu khác nhau tương thích với mô hình Ultralytics YOLO, đồng thời cung cấp thông tin chi tiết về cấu trúc, cách sử dụng và cách chuyển đổi giữa các định dạng khác nhau.

Link to this sectionCác định dạng tập dữ liệu được hỗ trợ#

Link to this sectionĐịnh dạng Ultralytics YOLO#

Định dạng Ultralytics YOLO là định dạng cấu hình tập dữ liệu cho phép bạn xác định thư mục gốc của tập dữ liệu, các đường dẫn tương đối đến thư mục hình ảnh huấn luyện/xác thực/kiểm tra hoặc các tệp *.txt chứa đường dẫn hình ảnh, cùng với một từ điển tên các lớp. Dưới đây là một ví dụ:

ultralytics/cfg/datasets/coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

Nhãn cho định dạng này nên được xuất sang định dạng YOLO với một tệp *.txt cho mỗi hình ảnh. Nếu không có đối tượng nào trong hình ảnh, không cần tệp *.txt. Tệp *.txt nên được định dạng với mỗi dòng cho một đối tượng theo kiểu class x_center y_center width height. Tọa độ khung bao phải ở định dạng xywh chuẩn hóa (từ 0 đến 1). Nếu các khung bao của bạn tính bằng pixel, bạn nên chia x_centerwidth cho chiều rộng hình ảnh, và y_centerheight cho chiều cao hình ảnh. Số thứ tự lớp phải bắt đầu từ 0.

YOLO labeled image with bounding boxes on persons and tie

Tệp nhãn tương ứng với hình ảnh trên chứa 2 người (lớp 0) và một chiếc cà vạt (lớp 27):

YOLO format label file with normalized coordinates

Khi sử dụng định dạng Ultralytics YOLO, hãy sắp xếp các hình ảnh huấn luyện và xác thực cũng như nhãn của bạn như ví dụ về tập dữ liệu COCO8 dưới đây.

YOLO dataset directory structure with train and val folders

Link to this sectionVí dụ sử dụng#

Dưới đây là cách bạn có thể sử dụng các tập dữ liệu định dạng YOLO để huấn luyện mô hình của mình:

Ví dụ
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Link to this sectionĐịnh dạng Ultralytics NDJSON#

Định dạng NDJSON (Newline Delimited JSON) cung cấp một cách thay thế để xác định tập dữ liệu cho các mô hình Ultralytics YOLO. Định dạng này lưu trữ siêu dữ liệu và các chú thích của tập dữ liệu trong một tệp duy nhất, trong đó mỗi dòng chứa một đối tượng JSON riêng biệt.

Một tệp tập dữ liệu NDJSON bao gồm:

  1. Bản ghi tập dữ liệu (dòng đầu tiên): Chứa siêu dữ liệu tập dữ liệu bao gồm loại tác vụ, tên lớp và thông tin chung
  2. Các bản ghi hình ảnh (các dòng tiếp theo): Chứa dữ liệu hình ảnh riêng lẻ bao gồm kích thước, chú thích và đường dẫn tệp
Ví dụ về NDJSON
{
    "type": "dataset",
    "task": "detect",
    "name": "Example",
    "description": "COCO NDJSON example dataset",
    "url": "https://app.ultralytics.com/user/datasets/example",
    "class_names": { "0": "person", "1": "bicycle", "2": "car" },
    "bytes": 426342,
    "version": 0,
    "created_at": "2024-01-01T00:00:00Z",
    "updated_at": "2025-01-01T00:00:00Z"
}

Link to this sectionVí dụ sử dụng#

Để sử dụng tập dữ liệu NDJSON với YOLO26, chỉ cần chỉ định đường dẫn đến tệp .ndjson:

Ví dụ
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")

# Train using NDJSON dataset
results = model.train(data="path/to/dataset.ndjson", epochs=100, imgsz=640)

Link to this sectionƯu điểm của định dạng NDJSON#

  • Tệp đơn lẻ: Tất cả thông tin tập dữ liệu nằm trong một tệp
  • Truyền phát (Streaming): Có thể xử lý các tập dữ liệu lớn theo từng dòng mà không cần tải mọi thứ vào bộ nhớ
  • Tích hợp đám mây: Hỗ trợ các URL hình ảnh từ xa để huấn luyện dựa trên đám mây
  • Khả năng mở rộng: Dễ dàng thêm các trường siêu dữ liệu tùy chỉnh
  • Kiểm soát phiên bản: Định dạng tệp đơn lẻ hoạt động tốt với git và các hệ thống kiểm soát phiên bản

Link to this sectionCác tập dữ liệu được hỗ trợ#

Dưới đây là danh sách các tập dữ liệu được hỗ trợ và mô tả ngắn gọn cho từng loại:

  • African-wildlife: Một tập dữ liệu gồm các hình ảnh động vật hoang dã châu Phi, bao gồm trâu, voi, tê giác và ngựa vằn.
  • Argoverse: Một tập dữ liệu chứa dữ liệu theo dõi 3D và dự báo chuyển động từ môi trường đô thị với các chú thích phong phú.
  • Brain-tumor: Một tập dữ liệu để phát hiện khối u não bao gồm các hình ảnh quét MRI hoặc CT với thông tin chi tiết về sự hiện diện, vị trí và đặc điểm của khối u.
  • COCO: Common Objects in Context (COCO) là một tập dữ liệu quy mô lớn về object detection, phân đoạn (segmentation) và chú thích (captioning) với 80 danh mục đối tượng.
  • COCO8: Một tập con nhỏ hơn gồm 4 hình ảnh đầu tiên từ COCO train và COCO val, phù hợp để thử nghiệm nhanh.
  • COCO8-Grayscale: Phiên bản thang độ xám của COCO8 được tạo bằng cách chuyển đổi RGB sang thang độ xám, hữu ích cho việc đánh giá mô hình một kênh.
  • COCO8-Multispectral: Phiên bản đa phổ 10 kênh của COCO8 được tạo bằng cách nội suy các bước sóng RGB, hữu ích cho việc đánh giá mô hình nhận biết phổ.
  • COCO12-Formats: Một tập dữ liệu thử nghiệm với 12 hình ảnh bao gồm 12 định dạng hình ảnh được hỗ trợ (AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WebP) để xác thực các pipeline tải hình ảnh.
  • COCO128: Một tập hợp con nhỏ hơn gồm 128 hình ảnh đầu tiên từ COCO train2017, phù hợp cho các bài kiểm tra.
  • Construction-PPE: Một tập dữ liệu có các công nhân tại công trường với nhãn thiết bị an toàn như mũ bảo hộ, áo khoác, găng tay, ủng và kính bảo hộ, bao gồm các chú thích về thiết bị thiếu như no_helmet, no_goggle để giám sát tuân thủ trong thực tế.
  • Global Wheat 2020: Một tập dữ liệu chứa hình ảnh các bông lúa cho Thử thách Lúa mì Toàn cầu 2020.
  • HomeObjects-3K: Một tập dữ liệu về các vật dụng gia đình trong nhà bao gồm giường, ghế, TV và nhiều vật dụng khác—lý tưởng cho các ứng dụng trong tự động hóa nhà thông minh, robot, thực tế tăng cường và phân tích bố trí phòng.
  • KITTI: Một tập dữ liệu có các cảnh lái xe thực tế với dữ liệu stereo, LiDAR và GPS/IMU, được sử dụng ở đây cho các tác vụ phát hiện đối tượng 2D như nhận dạng ô tô, người đi bộ và người đi xe đạp trong môi trường đô thị, nông thôn và đường cao tốc.
  • LVIS: Một tập dữ liệu phát hiện đối tượng, phân đoạn và chú thích quy mô lớn với 1203 danh mục đối tượng.
  • Medical-pills: Một tập dữ liệu gồm các hình ảnh thuốc y tế, được chú thích cho các ứng dụng như đảm bảo chất lượng dược phẩm, phân loại thuốc và tuân thủ quy định.
  • Objects365: Một tập dữ liệu chất lượng cao, quy mô lớn cho phát hiện đối tượng với 365 danh mục đối tượng và hơn 600.000 hình ảnh đã được chú thích.
  • OpenImagesV7: Một tập dữ liệu toàn diện từ Google với 1,7 triệu hình ảnh huấn luyện và 42 nghìn hình ảnh xác thực.
  • Roboflow 100: Một tiêu chuẩn phát hiện đối tượng đa dạng với 100 tập dữ liệu trải dài trên bảy lĩnh vực hình ảnh để đánh giá mô hình toàn diện.
  • Signature: Một tập dữ liệu gồm hình ảnh các tài liệu khác nhau với chữ ký được chú thích, hỗ trợ nghiên cứu xác minh tài liệu và phát hiện gian lận.
  • SKU-110K: Một tập dữ liệu về phát hiện đối tượng dày đặc trong môi trường bán lẻ với hơn 11 nghìn hình ảnh và 1,7 triệu bounding box.
  • TT100K: Khám phá tập dữ liệu biển báo giao thông Tsinghua-Tencent 100K (TT100K) với 100.000 hình ảnh đường phố và hơn 30.000 biển báo giao thông đã được chú thích để phát hiện và phân loại mạnh mẽ.
  • VisDrone: Một tập dữ liệu chứa dữ liệu phát hiện đối tượng và theo dõi đa đối tượng từ hình ảnh quay bằng máy bay không người lái với hơn 10 nghìn hình ảnh và chuỗi video.
  • VOC: Tập dữ liệu Pascal Visual Object Classes (VOC) cho phát hiện đối tượng và phân đoạn với 20 lớp đối tượng và hơn 11 nghìn hình ảnh.
  • xView: Một tập dữ liệu để phát hiện đối tượng trong hình ảnh từ trên không với 60 danh mục đối tượng và hơn 1 triệu đối tượng đã được chú thích.

Link to this sectionThêm tập dữ liệu của riêng bạn#

Nếu bạn có tập dữ liệu của riêng mình và muốn sử dụng nó để huấn luyện các mô hình phát hiện với định dạng Ultralytics YOLO, hãy đảm bảo rằng nó tuân theo định dạng được chỉ định ở trên trong mục "Định dạng Ultralytics YOLO". Chuyển đổi các chú thích của bạn sang định dạng yêu cầu và chỉ định đường dẫn, số lượng lớp và tên lớp trong tệp cấu hình YAML.

Link to this sectionChuyển đổi định dạng nhãn#

Link to this sectionĐịnh dạng tập dữ liệu COCO sang định dạng YOLO#

Bạn có thể dễ dàng chuyển đổi nhãn từ định dạng tập dữ liệu COCO phổ biến sang định dạng YOLO bằng đoạn mã sau:

Ví dụ
from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/")

Công cụ chuyển đổi này có thể được sử dụng để chuyển đổi tập dữ liệu COCO hoặc bất kỳ tập dữ liệu nào ở định dạng COCO sang định dạng Ultralytics YOLO. Quá trình này biến đổi các chú thích COCO dựa trên JSON thành định dạng YOLO dựa trên văn bản đơn giản hơn, làm cho nó tương thích với các mô hình Ultralytics YOLO.

Hãy nhớ kiểm tra kỹ xem tập dữ liệu bạn muốn sử dụng có tương thích với mô hình của bạn và tuân theo các quy ước định dạng cần thiết hay không. Các tập dữ liệu được định dạng đúng cách là rất quan trọng để huấn luyện các mô hình phát hiện đối tượng thành công.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionĐịnh dạng tập dữ liệu Ultralytics YOLO là gì và cách cấu trúc nó như thế nào?#

Định dạng Ultralytics YOLO là một cấu hình có cấu trúc để xác định tập dữ liệu trong các dự án huấn luyện của bạn. Nó bao gồm việc thiết lập đường dẫn đến các hình ảnh huấn luyện, xác thực và kiểm tra cùng các nhãn tương ứng. Ví dụ:

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

Các nhãn được lưu trong các tệp *.txt với một tệp cho mỗi hình ảnh, được định dạng là class x_center y_center width height với tọa độ chuẩn hóa. Để có hướng dẫn chi tiết, hãy xem ví dụ về tập dữ liệu COCO8.

Link to this sectionLàm cách nào để chuyển đổi tập dữ liệu COCO sang định dạng YOLO?#

Bạn có thể chuyển đổi tập dữ liệu COCO sang định dạng YOLO bằng các công cụ chuyển đổi của Ultralytics. Dưới đây là một phương pháp nhanh chóng:

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/")

Đoạn mã này sẽ chuyển đổi các chú thích COCO của bạn sang định dạng YOLO, cho phép tích hợp liền mạch với các mô hình Ultralytics YOLO. Để biết thêm chi tiết, hãy truy cập phần Chuyển đổi định dạng nhãn.

Link to this sectionNhững tập dữ liệu nào được Ultralytics YOLO hỗ trợ để phát hiện đối tượng?#

Ultralytics YOLO hỗ trợ nhiều loại tập dữ liệu, bao gồm:

Mỗi trang tập dữ liệu cung cấp thông tin chi tiết về cấu trúc và cách sử dụng phù hợp cho việc huấn luyện YOLO26 hiệu quả. Khám phá danh sách đầy đủ trong phần Các tập dữ liệu được hỗ trợ.

Link to this sectionLàm thế nào để bắt đầu huấn luyện mô hình YOLO26 bằng tập dữ liệu của tôi?#

Để bắt đầu huấn luyện mô hình YOLO26, hãy đảm bảo tập dữ liệu của bạn được định dạng chính xác và các đường dẫn được xác định trong tệp YAML. Sử dụng tập lệnh sau để bắt đầu huấn luyện:

Ví dụ
from ultralytics import YOLO

model = YOLO("yolo26n.pt")  # Load a pretrained model
results = model.train(data="path/to/your_dataset.yaml", epochs=100, imgsz=640)

Tham khảo phần Cách sử dụng để biết thêm chi tiết về việc sử dụng các chế độ khác nhau, bao gồm cả các lệnh CLI.

Link to this sectionTôi có thể tìm các ví dụ thực tế về việc sử dụng Ultralytics YOLO để phát hiện đối tượng ở đâu?#

Ultralytics cung cấp nhiều ví dụ và hướng dẫn thực tế để sử dụng YOLO26 trong các ứng dụng đa dạng. Để có cái nhìn toàn diện, hãy truy cập Blog của Ultralytics, nơi bạn có thể tìm thấy các nghiên cứu điển hình, hướng dẫn chi tiết và câu chuyện từ cộng đồng giới thiệu việc phát hiện đối tượng, phân đoạn và nhiều hơn thế nữa với YOLO26. Để biết các ví dụ cụ thể, hãy kiểm tra phần Cách sử dụng trong tài liệu.

Bình luận