Chuyển đến nội dung

YOLOv5 so với YOLOv6 -3.0: Hướng dẫn toàn diện về các mô hình phát hiện đối tượng thời gian thực

Lĩnh vực thị giác máy tính liên tục phát triển, với các kiến ​​trúc mới liên tục đẩy mạnh giới hạn về tốc độ và độ chính xác. Khi lựa chọn mô hình cho dự án AI thị giác tiếp theo, các nhà phát triển thường phải so sánh các framework đa năng, đã được khẳng định với các bộ phát hiện chuyên dụng cao cấp trong ngành. Bài phân tích chuyên sâu này sẽ khám phá những khác biệt kỹ thuật giữa Ultralytics YOLOv5Meituan YOLOv6 , giúp bạn lựa chọn công cụ tốt nhất cho nhu cầu triển khai của mình.

Giới thiệu về các mô hình

Ultralytics YOLOv5: Tiêu chuẩn Đa năng

Ra mắt năm 2020, Ultralytics YOLOv5 Nó nhanh chóng trở thành tiêu chuẩn vàng cho việc phát hiện đối tượng hiệu suất cao và dễ tiếp cận. Nó nổi tiếng nhờ tính dễ sử dụng đáng kinh ngạc, quy trình huấn luyện mạnh mẽ và khả năng tích hợp triển khai rộng rãi.

YOLOv5 được thiết kế từ đầu để mang lại trải nghiệm phát triển liền mạch trong hệ sinh thái PyTorch . Nó cung cấp sự cân bằng hiệu suất tối ưu, đạt được độ chính xác trung bình tuyệt vời ( mAP Đồng thời duy trì tốc độ suy luận cao, phù hợp với nhiều kịch bản triển khai thực tế khác nhau, từ thiết bị biên đến máy chủ đám mây.

Tìm hiểu thêm về YOLOv5

YOLOv6 -3.0: Năng suất công nghiệp

Được phát triển bởi bộ phận Trí tuệ Nhân tạo Thị giác tại Meituan, YOLOv6 -3.0 được thiết kế đặc biệt cho các ứng dụng công nghiệp, ưu tiên tối đa hiệu năng xử lý thô trên các bộ tăng tốc phần cứng chuyên dụng.

  • Tác giả: Chuyi Li, Lulu Li, Yifei Geng, et al.
  • Tổ chức: Meituan
  • Ngày: 2023-01-13
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6

YOLOv6 Mục tiêu là tối đa hóa tốc độ xử lý trên các GPU như NVIDIA T4 . Nó sử dụng các phương pháp lượng tử hóa tùy chỉnh và kiến ​​trúc chuyên dụng để đạt được hiệu năng này, khiến nó trở thành ứng cử viên sáng giá cho việc xử lý máy chủ phụ trợ, nơi mà suy luận theo lô được sử dụng rộng rãi.

Tìm hiểu thêm về YOLOv6

Sự khác biệt về kiến trúc

Hiểu rõ các lựa chọn kiến ​​trúc đằng sau những mô hình này là điều vô cùng quan trọng để xác định các trường hợp sử dụng lý tưởng của chúng.

Cái YOLOv5 Ngành kiến ​​​​trúc

YOLOv5 Mô hình này sử dụng kiến ​​trúc xương sống CSPDarknet được tối ưu hóa cao kết hợp với mạng Path Aggregation Network (PANet) ở phần cổ. Cấu trúc này được tinh chỉnh kỹ lưỡng để đảm bảo yêu cầu bộ nhớ tối thiểu trong quá trình huấn luyện và suy luận. Không giống như các mô hình transformer lớn đòi hỏi lượng bộ nhớ khổng lồ... CUDA trí nhớ và thời gian huấn luyện chuyên sâu, YOLOv5 Hoạt động hiệu quả trên phần cứng tiêu chuẩn của người tiêu dùng.

Hiệu quả bộ nhớ

Ultralytics Các mô hình được thiết kế đặc biệt để tối ưu hiệu quả đào tạo. Bạn thường có thể đào tạo một mô hình... YOLOv5 mô hình trên một dòng xe tầm trung duy nhất GPU , giúp nó dễ tiếp cận hơn đối với cả các nhà nghiên cứu và các công ty khởi nghiệp.

Hơn nữa, YOLOv5 Đây không chỉ là một công cụ phát hiện đối tượng. Kiến trúc của nó mở rộng liền mạch sang các tác vụ khác, cung cấp hỗ trợ mạnh mẽ ngay từ đầu cho việc phân đoạn ảnhphân loại ảnh .

Cái YOLOv6 -3.0 Kiến trúc

YOLOv6 - Phiên bản 3.0 có kiến ​​trúc EfficientRep, được thiết kế thân thiện với phần cứng, đặc biệt là dành cho... GPU Quá trình thực thi. Nó sử dụng một mô-đun Ghép nối hai chiều (Bi-directional Concatenation - BiC) ở phần cổ để tăng cường khả năng kết hợp các tính năng.

Trong quá trình huấn luyện, YOLOv6 Nó sử dụng chiến lược Huấn luyện Hỗ trợ Neo (AAT) để ổn định sự hội tụ, mặc dù nó vẫn là một bộ dò không có neo trong quá trình suy luận. Mặc dù kiến ​​trúc này vượt trội ở... GPU - Đối với các tác vụ được tăng tốc, việc thích ứng với nhiều thiết bị biên khác nhau đôi khi phức tạp hơn so với tính di động cao của các thiết bị có tính ứng dụng cao. YOLOv5 khung.

Phân tích hiệu suất

Khi đánh giá các mô hình này, tốc độ và độ chính xác thực tế là rất quan trọng. Bảng so sánh dưới đây nêu bật hiệu năng của các kích thước mô hình khác nhau trên tập dữ liệu COCO .

Mô hìnhKích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Trong khi YOLOv6 -3.0 đạt được mức cao hơn mAP điểm số trong các biến thể lớn hơn của nó, YOLOv5 duy trì dung lượng bộ nhớ cực kỳ nhỏ gọn. Ví dụ, YOLOv5n yêu cầu ít tham số và phép tính FLOP hơn đáng kể so với các phần mềm khác. YOLOv6 phiên bản tương đương, khiến nó cực kỳ tối ưu cho thiết bị di động hoặc CPU - triển khai ràng buộc.

Hệ sinh thái và Dễ sử dụng

Yếu tố quyết định thực sự đối với nhiều nhóm kỹ thuật chính là hệ sinh thái xung quanh mô hình đó.

YOLOv6 Đây là một kho lưu trữ nghiên cứu ấn tượng, nhưng nó đòi hỏi một lượng lớn mã lập trình lặp đi lặp lại để triển khai trên nhiều định dạng khác nhau. Ngược lại, Ultralytics Cung cấp một hệ sinh thái được duy trì tốt, đặc trưng bởi trải nghiệm người dùng được tối ưu hóa. Thông qua sự thống nhất Python Với API và nền tảng Ultralytics trực quan, các nhà phát triển có thể truy cập vào khả năng quản lý tập dữ liệu liền mạch, huấn luyện chỉ bằng một cú nhấp chuột và xuất trực tiếp sang các định dạng như ONNXTensorRT .

Ví dụ mã: Thống nhất Ultralytics API

Cái Ultralytics ultralytics Gói pip cho phép bạn tải, huấn luyện và triển khai các mô hình chỉ với một vài dòng mã.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for edge deployment
model.export(format="onnx")

Các trường hợp sử dụng và Khuyến nghị

Lựa chọn giữa YOLOv5 Và YOLOv6 Điều này phụ thuộc vào các yêu cầu cụ thể của dự án, các ràng buộc triển khai và sở thích về hệ sinh thái của bạn.

Khi nào nên chọn YOLOv5

YOLOv5 là một lựa chọn tốt cho:

  • Hệ thống sản xuất đã được chứng minh: Các triển khai hiện có trong đó YOLOv5 Dài track Lịch sử hoạt động ổn định, hệ thống tài liệu đầy đủ và sự ủng hộ mạnh mẽ từ cộng đồng được đánh giá cao.
  • Đào tạo trong điều kiện nguồn lực hạn chế: Môi trường có nguồn lực hạn chế GPU nguồn lực ở đâu YOLOv5 Quy trình huấn luyện hiệu quả và yêu cầu bộ nhớ thấp hơn là những lợi thế của nó.
  • Hỗ trợ định dạng xuất khẩu đa dạng: Các dự án yêu cầu triển khai trên nhiều định dạng khác nhau, bao gồm ONNX , TensorRT , CoreMLTFLite .

Khi nào nên chọn YOLOv6

YOLOv6 được khuyến nghị cho:

  • Triển khai có nhận thức về phần cứng công nghiệp: Các kịch bản trong đó thiết kế có nhận thức về phần cứng của mô hình và việc tái tham số hiệu quả cung cấp hiệu suất tối ưu trên phần cứng mục tiêu cụ thể.
  • Phát hiện nhanh chóng trong một giai đoạn duy nhất: Các ứng dụng ưu tiên tốc độ suy luận thô trên GPU Dùng để xử lý video thời gian thực trong môi trường được kiểm soát.
  • Tích hợp hệ sinh thái Meituan: Các nhóm hiện đang làm việc trong hệ sinh thái công nghệ và cơ sở hạ tầng triển khai của Meituan .

Khi nào nên lựa chọn Ultralytics (YOLO26)

Đối với hầu hết các dự án mới, Ultralytics YOLO26 cung cấp sự kết hợp tốt nhất giữa hiệu năng và trải nghiệm dành cho nhà phát triển:

  • NMS - Triển khai biên không cần can thiệp: Các ứng dụng yêu cầu suy luận nhất quán, độ trễ thấp mà không cần sự phức tạp của quá trình xử lý hậu kỳ loại bỏ cực đại không cần can thiệp (Non-Maximum Suppression).
  • Môi trường chỉ sử dụng CPU : Các thiết bị không có bộ xử lý chuyên dụng. GPU khả năng tăng tốc, trong đó YOLO26 nhanh hơn tới 43%. CPU Suy luận mang lại lợi thế quyết định.
  • Phát hiện vật thể nhỏ: Các tình huống đầy thách thức như ảnh chụp từ máy bay không người lái hoặc phân tích cảm biến IoT, nơi ProgLoss và STAL giúp tăng đáng kể độ chính xác trong việc phát hiện các vật thể siêu nhỏ.

Tiến bước về phía trước: Lợi thế của YOLO26

Trong khi YOLOv5 vẫn là một cỗ máy làm việc đáng tin cậy và YOLOv6 -3.0 mang lại sức mạnh công nghiệp mạnh mẽ GPU Về thông lượng, công nghệ tiên tiến đã phát triển. Đối với các nhà phát triển bắt đầu các dự án mới ngày nay, con đường được khuyến nghị là Ultralytics YOLO26 .

Ra mắt vào tháng 1 năm 2026, YOLO26 đánh dấu một bước tiến vượt bậc. Nó thừa hưởng tính linh hoạt vượt trội của... Ultralytics đồng thời giới thiệu những cải tiến kiến ​​trúc mang tính đột phá:

  • Thiết kế không cần NMS từ đầu đến cuối: YOLO26 loại bỏ quá trình xử lý hậu kỳ Non-Maximum Suppression, giảm đáng kể sự biến động độ trễ và đơn giản hóa logic triển khai.
  • Tốc độ suy luận CPU nhanh hơn tới 43%: Với việc loại bỏ DFL và tối ưu hóa phần đầu, nó vượt trội hơn hẳn các thế hệ trước trên các thiết bị biên và thiết bị tiêu thụ điện năng thấp.
  • Bộ tối ưu hóa MuSGD: Tận dụng những cải tiến trong huấn luyện LLM, bộ tối ưu hóa MuSGD mới đảm bảo quá trình huấn luyện cực kỳ ổn định và tốc độ hội tụ nhanh đáng kể.
  • Tính linh hoạt vượt trội: YOLO26 xử lý liền mạch Oriented Bounding Box (OBB) , ước lượng tư thế và phân đoạn với các hàm mất mát chuyên dụng như ProgLoss và STAL để nhận dạng vật thể nhỏ một cách vượt trội.

Nếu bạn đang tìm kiếm các lựa chọn khác trong phạm vi này Ultralytics Trong hệ sinh thái này, bạn cũng có thể cân nhắc YOLO11 đa năng hoặc YOLO -World tiên tiến dành cho các tác vụ phát hiện từ vựng mở.

Kết luận

Cả hai YOLOv5 Và YOLOv6 -3.0 đã tác động đáng kể đến lĩnh vực thị giác máy tính. YOLOv6 - Phiên bản 3.0 cung cấp thông lượng tuyệt vời cho phần cứng máy chủ cao cấp, phù hợp cho các phân tích ngoại tuyến chuyên dụng. Tuy nhiên, YOLOv5 vẫn là lựa chọn vượt trội hơn đối với các nhà phát triển cần một mô hình mạnh mẽ, dễ sử dụng và cực kỳ linh hoạt được hỗ trợ bởi một nền tảng đẳng cấp thế giới.

Để đạt được sự cân bằng tối ưu giữa độ chính xác của thế hệ tiếp theo, hãy sử dụng ngôn ngữ gốc. NMS Với khả năng triển khai miễn phí và trải nghiệm phát triển tốt nhất trong ngành, nâng cấp lên YOLO26 thông qua Nền tảng Ultralytics là lựa chọn tối ưu cho các giải pháp AI thị giác hiện đại.


Bình luận