Chuyển đến nội dung

YOLOv6 -3.0 so với PP-YOLOE+: Đánh giá các thiết bị dò vật thể công nghiệp

Khi lựa chọn một framework cho việc phát hiện đối tượng theo thời gian thực, các kỹ sư máy học thường đánh giá nhiều kiến ​​trúc hiệu năng cao khác nhau. Hai mô hình đáng chú ý trong lĩnh vực ứng dụng công nghiệp là YOLOv6PP-YOLOE+ . Cả hai mô hình này đều đã vượt qua giới hạn về độ chính xác và tốc độ, tuy nhiên chúng được thiết kế cho các hệ sinh thái và phần cứng triển khai hơi khác nhau.

Bản so sánh kỹ thuật này cung cấp cái nhìn sâu sắc về kiến ​​trúc, các chỉ số hiệu năng và phương pháp huấn luyện của chúng, đồng thời giới thiệu các giải pháp thay thế hiện đại như Ultralytics YOLO26 , vốn mang lại tính linh hoạt và dễ sử dụng vượt trội.

YOLOv6 -3.0: Động cơ công nghiệp năng suất cao

Được phát triển bởi bộ phận Trí tuệ nhân tạo thị giác tại Meituan , YOLOv6 - Phiên bản 3.0 được tối ưu hóa cao cho môi trường công nghiệp, đặc biệt là những môi trường tận dụng GPU mạnh mẽ dành cho máy chủ.

  • Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
  • Tổ chức: Meituan
  • Ngày: 13/01/2023
  • Arxiv: 2301.05586
  • GitHub: meituan/ YOLOv6

Đổi mới Kiến trúc

YOLOv6 -3.0 sử dụng kiến ​​trúc EfficientRep , được thiết kế đặc biệt để tối đa hóa việc sử dụng các bộ tăng tốc phần cứng như... NVIDIA GPU. Kiến trúc này giới thiệu một mô-đun Ghép nối hai chiều (Bi-directional Concatenation - BiC) bên trong phần cổ, cải thiện đáng kể việc kết hợp các đặc trưng đa tỷ lệ. Hơn nữa, nó tích hợp chiến lược Huấn luyện hỗ trợ neo (Anchor-Aided Training - AAT) . Phương pháp lai này tận dụng đặc điểm hội tụ mạnh mẽ của mạng dựa trên neo trong giai đoạn huấn luyện, đồng thời loại bỏ các neo trong giai đoạn suy luận để duy trì tốc độ cao đặc trưng của các mô hình không có neo.

Tìm hiểu thêm về YOLOv6

PP-YOLOE+: PaddlePaddle Nhà vô địch phát hiện của

PP-YOLOE+ là sự phát triển của PP- YOLO loạt phim, được phát triển hoàn toàn trong PaddlePaddle Khung phần mềm này được các nhà nghiên cứu của Baidu phát triển. Nó hoạt động hiệu quả trong môi trường mà hệ sinh thái Paddle đã được thiết lập vững chắc.

Đổi mới Kiến trúc

PP-YOLOE+ là một bộ phát hiện không cần neo (anchor-free detector) giới thiệu chiến lược gán nhãn động được gọi là TAL (Task Alignment Learning). Nó sử dụng kiến ​​trúc xương sống CSPRepResNet, giúp thu thập hiệu quả các đặc trưng ngữ nghĩa trong khi vẫn duy trì hiệu quả tính toán. Mô hình được tối ưu hóa cao để triển khai thông qua TensorRT Và OpenVINO Điều này khiến nó trở thành một ứng cử viên sáng giá cho việc triển khai ở biên và trên máy chủ, miễn là người dùng quen thuộc với việc sử dụng API PaddlePaddle .

Tìm hiểu thêm về PP-YOLOE+

Các yếu tố cần xem xét trong khuôn khổ

Mặc dù PP-YOLOE+ mang lại kết quả xuất sắc, nhưng sự phụ thuộc của nó vào... PaddlePaddle có thể tạo ra một quá trình học hỏi đối với các kỹ sư đã quen với PyTorch Việc sử dụng một khung phần mềm thống nhất như Ultralytics có thể giúp giảm đáng kể thời gian thiết lập.

So sánh hiệu suất

Việc đánh giá các mô hình này đòi hỏi phải xem xét sự cân bằng giữa độ chính xác trung bình ( mAP ) và tốc độ suy luận của chúng. Bảng dưới đây nêu bật hiệu suất của chúng trên... COCO Bộ dữ liệu xác thực.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Mặc dù cả hai mẫu đều thể hiện hiệu năng mạnh mẽ, YOLOv6 -3.0 thường duy trì lợi thế nhỏ về dữ liệu thô. TensorRT Tốc độ xử lý nhanh ở kích thước mô hình nhỏ hơn, giúp nó hoạt động hiệu quả cao trong việc kiểm tra tự động tốc độ cao hoặc phát hiện lỗi sản xuất. Ngược lại, PP-YOLOE+ có khả năng mở rộng tốt với số lượng tham số lớn hơn để đạt độ chính xác tối đa.

Cái Ultralytics Ưu điểm: Giới thiệu YOLO26

Trong khi YOLOv6 -3.0 và PP-YOLOE+ có khả năng cao, nhưng sự phát triển nhanh chóng của thị giác máy tính đòi hỏi các kiến ​​trúc không chỉ cung cấp tốc độ xử lý thô mà còn cả tính dễ sử dụng vượt trội, yêu cầu bộ nhớ thấp hơn và một hệ sinh thái thống nhất. Đây là nơi mà các mẫu Ultralytics YOLO , đặc biệt là YOLO11YOLO26 tiên tiến, định nghĩa lại tiêu chuẩn hiện đại.

Ra mắt vào tháng 1 năm 2026, YOLO26 thiết lập một tiêu chuẩn mới cho trí tuệ nhân tạo thị giác ưu tiên xử lý tại biên và sẵn sàng cho điện toán đám mây, mang lại những lợi thế đáng kể so với các mô hình cũ:

  • Thiết kế hoàn toàn không có NMS : Được xây dựng trên nền tảng của YOLOv10 , YOLO26 loại bỏ hoàn toàn hiện tượng Non-Maximum Suppression (NMS) một cách tự nhiên. NMS ) trong quá trình xử lý hậu kỳ. Điều này giúp đơn giản hóa đáng kể logic triển khai và giảm sự biến động độ trễ trong các cảnh phức tạp.
  • Suy luận CPU nhanh hơn tới 43%: Bằng cách loại bỏ chiến lược Distribution Focal Loss (DFL), YOLO26 tăng tốc đáng kể. CPU về hiệu năng, khiến nó vượt trội hơn hẳn so với YOLOv6 hoặc PP-YOLOE+ dành cho các thiết bị IoT và ứng dụng di động.
  • Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ các kỹ thuật huấn luyện LLM tiên tiến (như Kimi K2 của Moonshot AI), bộ tối ưu hóa lai MuSGD mang lại khả năng huấn luyện cực kỳ ổn định và hiệu quả, hội tụ nhanh hơn so với các phương pháp truyền thống. SGD hoặc AdamW .
  • ProgLoss + STAL: Các hàm mất mát tiên tiến này mang lại những cải tiến đáng kể trong việc nhận dạng vật thể nhỏ, một yếu tố quan trọng đối với ảnh chụp từ máy bay không người lái và giám sát trên không.
  • Tính linh hoạt trong nhiều nhiệm vụ: Không giống như YOLOv6 - Phiên bản 3.0 tập trung mạnh vào phát hiện, YOLO26 hỗ trợ phân đoạn đối tượng , ước tính tư thế , phân loại và phát hiện hộp giới hạn định hướng (OBB) ngay từ đầu.

Hệ sinh thái đào tạo được tinh gọn

Việc triển khai PP-YOLOE+ đòi hỏi phải quản lý... PaddlePaddle môi trường, trong khi YOLOv6 - Phiên bản 3.0 yêu cầu người dùng phải thao tác với các tập lệnh tập trung vào nghiên cứu. Ngược lại, Nền tảng Ultralytics cung cấp trải nghiệm liền mạch, dễ sử dụng từ đầu đến cuối.

Việc huấn luyện một mô hình YOLO26 hiện đại chỉ cần một vài dòng mã. Python :

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")

Giao diện lập trình ứng dụng (API) đơn giản này, kết hợp với việc sử dụng bộ nhớ thấp hơn trong quá trình huấn luyện so với các mô hình nặng về Transformer như RT-DETR , đã giúp phổ biến trí tuệ nhân tạo hiệu năng cao.

Các trường hợp sử dụng lý tưởng và chiến lược triển khai

Việc lựa chọn mô hình phù hợp quyết định sự thành công của quy trình triển khai.

Khi nào nên sử dụng YOLOv6 -3.0

  • Sản xuất tốc độ cao: Môi trường nơi camera công nghiệp truyền dữ liệu trực tiếp vào hệ thống chuyên dụng. NVIDIA GPU T4 hoặc A100, yêu cầu khả năng suy luận ổn định dưới 5ms.
  • Phân tích video phía máy chủ: Xử lý nhiều luồng video dày đặc, trong đó hiệu năng GPU thuần túy là nút thắt cổ chai chính.

Khi nào nên sử dụng PP-YOLOE+

  • Hệ sinh thái Baidu/Paddle: Môi trường doanh nghiệp đầu tư mạnh vào... PaddlePaddle ngăn xếp công nghệ hoặc triển khai cụ thể trên phần cứng được tối ưu hóa cho bộ công cụ của Baidu.
  • Hình ảnh tĩnh độ chính xác cao: Các trường hợp mà mô hình cỡ cực lớn (PP-YOLOE+x) có độ chính xác cao. mAP Điều này quan trọng hơn tốc độ triển khai tại biên.

Khi nào nên lựa chọn Ultralytics YOLO26

  • Thiết bị biên và IoT: Với... NMS Với thiết kế miễn phí và loại bỏ DFL, YOLO26 là lựa chọn không thể bàn cãi cho việc triển khai trên Raspberry Pi, NXP hoặc CPU di động.
  • Ứng dụng đa nhiệm: Các dự án yêu cầu theo dõi đối tượng , ước lượng tư thế hoặc phân đoạn đồng thời bằng cách sử dụng một API thống nhất.
  • Từ nguyên mẫu nhanh đến sản xuất: Các nhóm tận dụng Nền tảng Ultralytics để tối ưu hóa việc chú thích dữ liệu , tinh chỉnh siêu tham số và triển khai mô hình chỉ bằng một cú nhấp chuột.

Đối với các nhà phát triển muốn khám phá phạm vi rộng hơn của các mô hình phát hiện, các framework như YOLOXDAMO- YOLO cũng cung cấp các phương pháp kiến ​​trúc độc đáo đáng để xem xét. Ultralytics tài liệu.


Bình luận