Bỏ để qua phần nội dung

Meituan YOLOv6

Tổng quan

Meituan YOLOv6 là một máy dò đối tượng tiên tiến cung cấp sự cân bằng đáng kể giữa tốc độ và độ chính xác, làm cho nó trở thành một lựa chọn phổ biến cho các ứng dụng thời gian thực. Mô hình này giới thiệu một số cải tiến đáng chú ý về kiến trúc và sơ đồ đào tạo của nó, bao gồm việc triển khai mô-đun Nối hai chiều (BiC), chiến lược đào tạo hỗ trợ neo (AAT) và thiết kế xương sống và cổ được cải tiến để có độ chính xác hiện đại trên bộ dữ liệu COCO.

Meituan YOLOv6 Hình ảnh ví dụ về mô hình Tổng quan về YOLOv6. Sơ đồ kiến trúc mô hình cho thấy các thành phần mạng được thiết kế lại và các chiến lược đào tạo đã dẫn đến những cải tiến đáng kể về hiệu suất. (a) Cổ của YOLOv6 (N và S được hiển thị). Lưu ý đối với M / L, RepBlocks được thay thế bằng CSPStackRep. (b) Cấu trúc của mô-đun BiC. (c) Một khối SimCSPSPPF. (nguồn).

Các tính năng chính

  • Mô-đun nối hai chiều (BiC): YOLOv6 giới thiệu một mô-đun BiC ở cổ của máy dò, tăng cường tín hiệu nội địa hóa và mang lại hiệu suất tăng với sự suy giảm tốc độ không đáng kể.
  • Chiến lược đào tạo có sự hỗ trợ của neo (AAT): Mô hình này đề xuất AAT để tận hưởng những lợi ích của cả mô hình dựa trên neo và không có neo mà không ảnh hưởng đến hiệu quả suy luận.
  • Thiết kế xương sống và cổ nâng cao: Bằng cách đào sâu YOLOv6 để bao gồm một giai đoạn khác ở xương sống và cổ, mô hình này đạt được hiệu suất hiện đại trên bộ dữ liệu COCO ở đầu vào có độ phân giải cao.
  • Chiến lược tự chưng cất: Một chiến lược tự chưng cất mới được thực hiện để tăng hiệu suất của các mô hình YOLOv6 nhỏ hơn, tăng cường nhánh hồi quy phụ trợ trong quá trình đào tạo và loại bỏ nó theo suy luận để tránh sự suy giảm tốc độ rõ rệt.

Chỉ số hiệu suất

YOLOv6 cung cấp các mô hình được đào tạo trước khác nhau với các quy mô khác nhau:

  • YOLOv6-N: 37.5% AP trên COCO val2017 ở tốc độ 1187 FPS với GPU NVIDIA Tesla T4.
  • YOLOv6-S: 45.0% AP ở tốc độ 484 FPS.
  • YOLOv6-M: 50.0% AP ở tốc độ 226 FPS.
  • YOLOv6-L: 52.8% AP ở tốc độ 116 khung hình / giây.
  • YOLOv6-L6: Độ chính xác hiện đại trong thời gian thực.

YOLOv6 cũng cung cấp các mô hình lượng tử hóa cho các độ chính xác khác nhau và các mô hình được tối ưu hóa cho nền tảng di động.

Ví dụ sử dụng

Ví dụ này cung cấp các ví dụ suy luận và đào tạo YOLOv6 đơn giản. Để biết tài liệu đầy đủ về các chế độ này và các chế độ khác, hãy xem các trang tài liệu Dự đoán, Đào tạo, ValXuất .

Ví dụ

PyTorch được đào tạo trước *.pt Mô hình cũng như cấu hình *.yaml Các tập tin có thể được chuyển đến YOLO() lớp để tạo một thể hiện mô hình trong python:

from ultralytics import YOLO

# Build a YOLOv6n model from scratch
model = YOLO('yolov6n.yaml')

# Display model information (optional)
model.info()

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data='coco8.yaml', epochs=100, imgsz=640)

# Run inference with the YOLOv6n model on the 'bus.jpg' image
results = model('path/to/bus.jpg')

CLI Các lệnh có sẵn để chạy trực tiếp các mô hình:

# Build a YOLOv6n model from scratch and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolov6n.yaml data=coco8.yaml epochs=100 imgsz=640

# Build a YOLOv6n model from scratch and run inference on the 'bus.jpg' image
yolo predict model=yolov6n.yaml source=path/to/bus.jpg

Các tác vụ và chế độ được hỗ trợ

Dòng YOLOv6 cung cấp một loạt các mô hình, mỗi mô hình được tối ưu hóa để Phát hiện đối tượng hiệu suất cao. Các mô hình này phục vụ cho các nhu cầu tính toán và yêu cầu độ chính xác khác nhau, làm cho chúng linh hoạt cho một loạt các ứng dụng.

Loại mô hình Trọng lượng được đào tạo trước Các tác vụ được hỗ trợ Suy luận Xác nhận Đào tạo Xuất khẩu
YOLOv6-N yolov6-n.pt Phát hiện đối tượng
YOLOv6-S yolov6-s.pt Phát hiện đối tượng
YOLOv6-M yolov6-m.pt Phát hiện đối tượng
YOLOv6-L yolov6-l.pt Phát hiện đối tượng
YOLOv6-L6 yolov6-l6.pt Phát hiện đối tượng

Bảng này cung cấp tổng quan chi tiết về các biến thể mô hình YOLOv6, nêu bật khả năng của chúng trong các tác vụ phát hiện đối tượng và khả năng tương thích của chúng với các chế độ hoạt động khác nhau như Suy luận, Xác thực, Đào tạoXuất. Sự hỗ trợ toàn diện này đảm bảo rằng người dùng có thể tận dụng tối đa khả năng của các mô hình YOLOv6 trong một loạt các tình huống phát hiện đối tượng.

Trích dẫn và xác nhận

Chúng tôi xin ghi nhận những đóng góp đáng kể của các tác giả trong lĩnh vực phát hiện đối tượng thời gian thực:

@misc{li2023yolov6,
      title={YOLOv6 v3.0: A Full-Scale Reloading},
      author={Chuyi Li and Lulu Li and Yifei Geng and Hongliang Jiang and Meng Cheng and Bo Zhang and Zaidan Ke and Xiaoming Xu and Xiangxiang Chu},
      year={2023},
      eprint={2301.05586},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Giấy YOLOv6 gốc có thể được tìm thấy trên arXiv. Các tác giả đã công bố công khai tác phẩm của họ và cơ sở mã có thể được truy cập trên GitHub. Chúng tôi đánh giá cao những nỗ lực của họ trong việc thúc đẩy lĩnh vực này và làm cho công việc của họ có thể tiếp cận được với cộng đồng rộng lớn hơn.



Đã tạo 2023-11-12, Cập nhật 2024-01-07
Tác giả: glenn-jocher (5)

Ý kiến