Chuyển đến nội dung

YOLOv6 -3.0 so với YOLOv9 Phân tích chuyên sâu về công nghệ nhận diện đối tượng hiện đại

Lĩnh vực phát hiện đối tượng thời gian thực tiếp tục phát triển, được thúc đẩy bởi nhu cầu về độ chính xác cao hơn, độ trễ thấp hơn và sử dụng phần cứng hiệu quả hơn. Bài so sánh toàn diện này xem xét hai cột mốc quan trọng trong lĩnh vực này: YOLOv6 , được phát triển cho năng suất công nghiệp, và YOLOv9 , giới thiệu các kiến ​​trúc mới để khắc phục các nút thắt thông tin trong học sâu.

Mặc dù cả hai mô hình đều cung cấp những cải tiến kiến ​​trúc độc đáo, nhưng các nhà phát triển tìm kiếm sự cân bằng tối ưu giữa hiệu suất và sự đơn giản trong triển khai thường chuyển sang các hệ sinh thái hiện đại. Đối với những người bắt đầu các dự án mới, Ultralytics YOLO26 với khả năng hoạt động trọn gói từ đầu đến cuối là tiêu chuẩn được khuyến nghị, cung cấp độ chính xác tiên tiến nhất với trải nghiệm phát triển được đơn giản hóa đáng kể.

YOLOv6 -3.0: Tối ưu hóa năng suất công nghiệp

Được phát triển bởi Bộ phận Trí tuệ Nhân tạo Thị giác tại Meituan, YOLOv6 được thiết kế kỹ lưỡng để đạt hiệu suất tối đa trong các ứng dụng công nghiệp, đặc biệt là trên... GPU phần cứng.

  • Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
  • Tổ chức:Meituan
  • Ngày: 13 tháng 1, 2023
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6

Đổi mới Kiến trúc

YOLOv6 - Phiên bản 3.0 đã giới thiệu một số cải tiến quan trọng để tăng cường khả năng kết hợp tính năng và hiệu quả phần cứng. Kiến trúc này tích hợp mô-đun Ghép nối hai chiều (Bi-directional Concatenation - BiC) ở phần cổ, giúp cung cấp tín hiệu định vị chính xác hơn. Nó cũng sử dụng chiến lược Huấn luyện hỗ trợ neo (Anchor-Aided Training - AAT) . Cách tiếp cận này kết hợp khả năng hướng dẫn phong phú của huấn luyện dựa trên neo với tốc độ suy luận của mô hình không có neo, mang lại hiệu suất tốt hơn mà không làm chậm quá trình triển khai.

Hệ thống xương sống dựa trên thiết kế EfficientRep, được tối ưu hóa tỉ mỉ để thân thiện với phần cứng. GPU Suy luận. Điều này làm cho nó có khả năng cao trong các kịch bản sản xuất công nghiệp , nơi việc xử lý hàng loạt với số lượng lớn là điều bình thường.

Điểm mạnh và Điểm yếu

Điểm mạnh chính của YOLOv6 -3.0 nằm ở tốc độ khung hình cao trên các GPU như... NVIDIA T4, giúp nó phù hợp với việc hiểu các luồng video có mật độ cao. Tuy nhiên, việc phụ thuộc nhiều vào các tối ưu hóa phần cứng cụ thể có thể dẫn đến độ trễ không tối ưu. CPU -chỉ dành cho các thiết bị biên. Hơn nữa, việc thiết lập quy trình huấn luyện của nó có thể phức tạp hơn so với các khung công tác thống nhất hơn.

Tìm hiểu thêm về YOLOv6

YOLOv9: Thông tin Gradient có thể lập trình

Ra mắt một năm sau đó, YOLOv9 tập trung giải quyết vấn đề tắc nghẽn thông tin vốn có trong mạng nơ-ron sâu, đẩy giới hạn lý thuyết của kiến ​​trúc CNN lên cao hơn.

Đổi mới Kiến trúc

YOLOv9 Đóng góp chính của mô hình là Thông tin Độ dốc Lập trình được (Programmable Gradient Information - PGI) , đảm bảo dữ liệu quan trọng được giữ lại khi truyền qua nhiều lớp mạng, cho phép cập nhật trọng số đáng tin cậy hơn. Bên cạnh PGI, mô hình còn tích hợp Mạng Tổng hợp Lớp Hiệu quả Tổng quát (Generalized Efficient Layer Aggregation Network - GELAN) . GELAN tối đa hóa hiệu quả tham số, cho phép... YOLOv9 Đạt được độ chính xác vượt trội với số phép tính FLOP ít hơn nhiều so với các thế hệ trước.

Điểm mạnh và Điểm yếu

YOLOv9 đạt được độ chính xác trung bình ( mAP ) vượt trội trên các tập dữ liệu chuẩn như COCO , khiến nó trở thành lựa chọn ưa thích của các nhà nghiên cứu ưu tiên độ chính xác tuyệt đối. Tuy nhiên, giống như YOLOv6 , nó vẫn dựa vào phương pháp triệt tiêu không tối đa truyền thống (Non-Maximmum Suppression) NMS ) để xử lý hậu kỳ. Điều này làm tăng độ trễ và làm phức tạp quy trình triển khai mô hình , đặc biệt là khi chuyển sang các thiết bị biên sử dụng các định dạng như ONNX hoặc TensorRT .

Tìm hiểu thêm về YOLOv9

So sánh hiệu suất

Khi so sánh các mô hình này, điều cần thiết là phải xem xét sự cân bằng giữa độ chính xác, số lượng tham số và tốc độ suy luận.

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Cái Ultralytics Ưu điểm: Giới thiệu YOLO26

Trong khi YOLOv6 -3.0 và YOLOv9 Để cung cấp kiến ​​trúc mạnh mẽ, môi trường sản xuất đòi hỏi một hệ sinh thái được bảo trì tốt, yêu cầu bộ nhớ thấp và khả năng sử dụng dễ dàng vượt trội. Đây là những điểm mạnh Ultralytics Platform và các mô hình như YOLO11 và YOLO26 tiên tiến.

Ra mắt vào đầu năm 2026, YOLO26 định nghĩa lại hoàn toàn hiệu quả triển khai bằng cách loại bỏ các điểm nghẽn cũ.

Thiết kế đầu cuối bản địa

YOLO26 sở hữu thiết kế không cần NMS từ đầu đến cuối , loại bỏ hoàn toàn nhu cầu xử lý hậu kỳ bằng thuật toán Non-Maximum Suppression. Điều này giúp giảm đáng kể sự biến động độ trễ suy luận và đơn giản hóa logic triển khai ở biên mạng.

Những đổi mới chính của YOLO26

  1. Bộ tối ưu hóa MuSGD: Lấy cảm hứng từ quá trình huấn luyện LLM (như Kimi K2 của Moonshot AI), YOLO26 sử dụng sự kết hợp của... SGD và Muon. Điều này mang lại sự ổn định huấn luyện chưa từng có và tốc độ hội tụ nhanh hơn cho các tác vụ thị giác máy tính.
  2. Suy luận CPU nhanh hơn tới 43%: Không giống như YOLOv6 nặng nề GPU Về phần tiêu điểm, YOLO26 được tối ưu hóa mạnh mẽ cho các thiết bị biên. Việc loại bỏ hiện tượng mất tiêu điểm phân tán (DFL) giúp đơn giản hóa đầu đọc, làm cho nó tương thích cao với các CPU công suất thấp và phần cứng điện toán biên .
  3. ProgLoss + STAL: Các hàm mất mát nâng cao cải thiện đáng kể khả năng phát hiện vật thể nhỏ, điều này rất quan trọng đối với ảnh chụp từ trên không và robot.
  4. Tính linh hoạt vượt trội: Trong khi YOLOv6 YOLO26 chỉ đơn thuần là một công cụ phát hiện, nhưng nó xử lý liền mạch việc phân đoạn đối tượng , phân loại, ước tính tư thế và phát hiện hộp giới hạn định hướng (OBB) .

Tìm hiểu thêm về YOLO26

Đào tạo liền mạch với Ultralytics

Việc huấn luyện các mô hình hiện đại không nên đòi hỏi sự phức tạp. bash kịch bản. Cái Ultralytics Python API này cung cấp trải nghiệm được tối ưu hóa với khả năng tải dữ liệu tự động, sử dụng bộ nhớ CUDA tối thiểu và tính năng theo dõi tích hợp.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX with a single command
model.export(format="onnx")

Các trường hợp sử dụng lý tưởng

Việc lựa chọn kiến ​​trúc phù hợp hoàn toàn phụ thuộc vào môi trường triển khai mục tiêu của bạn:

  • Sử dụng YOLOv6 -3.0 cho: Tự động hóa nhà máy và phát hiện lỗi trong trường hợp có nhiều GPU cấp máy chủ (ví dụ: A100) và xử lý theo lô giúp tối đa hóa thông lượng.
  • Hãy sử dụng YOLOv9 cho: Nghiên cứu học thuật hoặc các cuộc thi đòi hỏi kết quả tốt nhất tuyệt đối. mAP trên các tập dữ liệu được tiêu chuẩn hóa như COCO đó là mục tiêu chính.
  • Sử dụng YOLO26 cho: Hầu hết các ứng dụng thương mại hiện đại. NMS - Kiến trúc không cần bộ nhớ, dung lượng bộ nhớ thấp và tốc độ cao CPU Khả năng suy luận giúp nó trở nên hoàn hảo cho các hệ thống báo động an ninh , bán lẻ thông minh và theo dõi đối tượng theo thời gian thực trên các thiết bị nhúng.

Bằng cách tận dụng hệ sinh thái Ultralytics toàn diện, các nhà phát triển có thể dễ dàng thử nghiệm với YOLOv8 . YOLO11 và YOLO26 để tìm ra sự cân bằng hiệu năng hoàn hảo cho những thách thức thực tế cụ thể của họ.


Bình luận