Chuyển đến nội dung

YOLOv6 -3.0 so với YOLOv5 : So sánh kỹ thuật để phát hiện đối tượng

Việc lựa chọn kiến trúc phù hợp cho dự án thị giác máy tính của bạn là một quyết định then chốt, ảnh hưởng đến hiệu suất, khả năng triển khai và bảo trì lâu dài. Hai đối thủ cạnh tranh nổi bật trong lĩnh vực phát hiện đối tượng thời gian thực là YOLOv6 -3.0 của Meituan và Ultralytics ' YOLOv5 . Hướng dẫn này cung cấp so sánh kỹ thuật chi tiết để giúp các nhà phát triển và nhà nghiên cứu lựa chọn mô hình phù hợp nhất với các yêu cầu cụ thể của họ, cho dù ưu tiên dữ liệu thô GPU thông lượng hoặc hệ sinh thái đa năng, dễ sử dụng.

Phân tích số liệu hiệu suất

Bảng dưới đây trình bày sự so sánh trực tiếp các số liệu hiệu suất trên tập dữ liệu COCO . Trong khi YOLOv6 -3.0 đẩy ranh giới của độ chính xác cao nhất trên GPU thiết bị, Ultralytics YOLOv5 duy trì danh tiếng về hiệu quả đặc biệt, đặc biệt là trên CPU và độ phức tạp của mô hình thấp hơn đáng kể (tham số và FLOP) đối với các biến thể nhẹ của nó.

Mô hìnhKích thước
(pixels)
mAP giá trị
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv6 -3.0n64037.5-1.174.711.4
YOLOv6 -3.0 giây64045.0-2.6618.545.3
YOLOv6 -3,0m64050.0-5.2834.985.8
YOLOv6 -3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Phân tích: Dữ liệu cho thấy mô hình YOLOv5n (Nano) là mô hình nổi bật trong môi trường hạn chế tài nguyên, tự hào có số lượng tham số thấp nhất (2,6 triệu) và FLOP (7,7 tỷ), điều này có nghĩa là vượt trội CPU Tốc độ suy luận cao. Điều này làm cho nó rất phù hợp cho các ứng dụng AI biên, nơi bộ nhớ và năng lượng khan hiếm. Ngược lại, YOLOv6 -3.0 mục tiêu cao hơn mAP val với cái giá phải trả là kích thước mô hình tăng lên, khiến nó trở thành ứng cử viên mạnh mẽ cho các thiết lập công nghiệp với chuyên dụng GPU phần cứng.

Meituan YOLOv6 -3.0: Độ chính xác công nghiệp

Tác giả : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
Tổ chức : Meituan
Ngày : 2023-01-13
Arxiv : https://arxiv.org/abs/2301.05586
GitHub : https://github.com/meituan/ YOLOv6
Tài liệu : https://docs. ultralytics .com/models/yolov6/

Được phát triển bởi Meituan, YOLOv6 -3.0 là một nền tảng phát hiện đối tượng được thiết kế riêng cho các ứng dụng công nghiệp. Nền tảng này tập trung vào việc đạt được sự cân bằng thuận lợi giữa tốc độ suy luận và độ chính xác, đặc biệt là tối ưu hóa hiệu suất nhận biết phần cứng trên GPU.

Kiến trúc và các tính năng chính

YOLOv6 kết hợp thiết kế xương sống hiệu quả và cấu trúc có thể tham số hóa lại (kiểu RepVGG) giúp đơn giản hóa mô hình trong quá trình suy luận, đồng thời vẫn duy trì khả năng trích xuất tính năng phức tạp trong quá trình huấn luyện. Phiên bản 3.0 đã giới thiệu các kỹ thuật như tự chưng cất và chiến lược huấn luyện hỗ trợ neo để tăng cường hiệu suất hơn nữa.

Điểm mạnh và Điểm yếu

  • Độ chính xác GPU cao: Mang lại khả năng cạnh tranh mAP điểm số trên tập dữ liệu COCO , giúp nó phù hợp với các nhiệm vụ kiểm soát chất lượng trong sản xuất.
  • Hỗ trợ lượng tử hóa: Cung cấp hỗ trợ cụ thể cho lượng tử hóa mô hình để đẩy nhanh quá trình triển khai.
  • Tính linh hoạt hạn chế: Được thiết kế chủ yếu để phát hiện đối tượng , thiếu hỗ trợ gốc cho các tác vụ rộng hơn như phân đoạn thể hiện hoặc ước tính tư thế có trong các khuôn khổ khác.
  • Chi phí tài nguyên cao hơn: Các biến thể lớn hơn yêu cầu nhiều bộ nhớ và sức mạnh tính toán hơn so với các biến thể nhẹ tương đương YOLOv5 các mô hình.

Tìm hiểu thêm về YOLOv6

Ultralytics YOLOv5 : Tiêu chuẩn hệ sinh thái

Tác giả : Glenn Jocher
Tổ chức : Ultralytics
Ngày : 26-06-2020
GitHub : https://github.com/ ultralytics / yolov5
Tài liệu : https://docs. ultralytics .com/models/ yolov5 /

Ultralytics YOLOv5 là một mô hình huyền thoại trong lĩnh vực thị giác máy tính, được ca ngợi nhờ thiết kế lấy người dùng làm trung tâm, độ tin cậy và hệ sinh thái toàn diện bao quanh. Đây vẫn là một trong những mô hình được triển khai nhiều nhất trên toàn cầu nhờ sự cân bằng giữa tốc độ, độ chính xác và tính dễ sử dụng.

Kiến trúc và các tính năng chính

YOLOv5 sử dụng xương sống CSPDarknet kết hợp với PANet để hợp nhất tính năng mạnh mẽ. Nó sử dụng cơ chế phát hiện dựa trên neo, đã được chứng minh là rất ổn định trên nhiều tập dữ liệu khác nhau. Kiến trúc này có tính mô-đun cao, cung cấp năm thang đo (n, s, m, l, x) để phù hợp với mọi thứ, từ thiết bị nhúng đến máy chủ đám mây.

Tại sao chọn YOLOv5 ?

  • Dễ sử dụng: Ultralytics ưu tiên trải nghiệm của nhà phát triển với một cách đơn giản Python API, thiết lập môi trường tự động và tài liệu hướng dẫn mở rộng.
  • Tính linh hoạt: Không giống như nhiều đối thủ cạnh tranh, YOLOv5 hỗ trợ phân loại hình ảnhphân đoạn trường hợp ngay lập tức.
  • Hiệu quả đào tạo: Được biết đến với khả năng hội tụ nhanh và sử dụng ít bộ nhớ trong quá trình đào tạo, giúp tiết kiệm chi phí tài nguyên tính toán.
  • Tính linh hoạt khi triển khai: Xuất dữ liệu liền mạch sang các định dạng như ONNX , TensorRT , CoreML , Và TFLite để tích hợp nhiều phần cứng khác nhau.

Hệ sinh thái tích hợp

Một trong những lợi thế lớn nhất của việc sử dụng YOLOv5 là Ultralytics hệ sinh thái. Tích hợp với các công cụ như Ultralytics HUB cho phép đào tạo và xem trước mô hình không cần mã, trong khi hỗ trợ tích hợp để theo dõi thử nghiệm thông qua CometMLflow hợp lý hóa quy trình làm việc của MLOps.

Tìm hiểu thêm về YOLOv5

So sánh chi tiết

Kiến trúc và Triết lý Thiết kế

YOLOv6 -3.0 dựa nhiều vào tìm kiếm kiến trúc thần kinh nhận biết phần cứng và tham số hóa lại để tối đa hóa thông lượng trên các GPU kiến trúc (như Tesla T4). Ngược lại, YOLOv5 tập trung vào thiết kế phổ quát, hoạt động đáng tin cậy trên nhiều CPU, GPU và NPU. YOLOv5 Bộ dò dựa trên mỏ neo thường dễ điều chỉnh hơn cho các tập dữ liệu tùy chỉnh có đối tượng nhỏ so với một số phương pháp không có mỏ neo.

Khả năng sử dụng và Phương pháp đào tạo

Ultralytics các mô hình được thiết kế để "sẵn sàng để đào tạo". Với YOLOv5 , các tính năng như AutoAnchor tự động điều chỉnh hộp neo theo nhãn tập dữ liệu của bạn và tính năng tiến hóa siêu tham số thông minh giúp tìm ra cài đặt đào tạo tối ưu. YOLOv6 yêu cầu thiết lập thủ công hơn so với các kho lưu trữ nghiên cứu truyền thống, điều này có thể khiến người dùng mới phải học nhiều hơn.

Các trường hợp sử dụng thực tế

  • Ultralytics YOLOv5 : lý tưởng cho việc tạo mẫu nhanh và triển khai đa dạng. Mô hình 'Nano' nhẹ của nó hoàn hảo cho việc giám sát bằng máy bay không người lái hoặc các ứng dụng di động yêu cầu suy luận thời gian thực . CPU . Việc hỗ trợ phân đoạn cũng làm cho nó trở nên có giá trị đối với các nhiệm vụ chụp ảnh y tế như phân đoạn tế bào .
  • YOLOv6 -3.0: Phù hợp nhất cho môi trường công nghiệp cố định , nơi có sẵn GPU cao cấp và số liệu chính là mAP . Ví dụ bao gồm kiểm tra quang học tự động (AOI) trong sản xuất thiết bị điện tử.

Ví dụ về mã: Chạy YOLOv5

YOLOv5 Tính đơn giản của PyTorch Hub được thể hiện rõ nhất qua khả năng chạy suy luận chỉ với vài dòng mã. Điều này giúp loại bỏ các bước cài đặt phức tạp và cho phép các nhà phát triển kiểm tra mô hình ngay lập tức.

import torch

# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Perform inference
results = model(img)

# Display results
results.show()

# Print detailed results regarding detected objects
results.print()

Sự dễ dàng tiếp cận này là một dấu hiệu đặc trưng của Ultralytics triết lý, cho phép các chuyên gia về thị giác máy tính tập trung vào việc giải quyết vấn đề thay vì gỡ lỗi các vấn đề về môi trường.

Kết luận

Cả hai kiến trúc đều đóng vai trò quan trọng trong bối cảnh thị giác hiện đại. Meituan YOLOv6 -3.0 cung cấp một lựa chọn hấp dẫn cho người dùng tập trung hoàn toàn vào việc tối đa hóa độ chính xác phát hiện trên GPU phần cứng.

Tuy nhiên, Ultralytics YOLOv5 vẫn là lựa chọn hàng đầu cho hầu hết các nhà phát triển nhờ tính linh hoạt vượt trội , hiệu quả đào tạohệ sinh thái mạnh mẽ . Khả năng triển khai dễ dàng lên các thiết bị biên, cùng với hỗ trợ phân đoạn và phân loại, giúp YOLOv5 một giải pháp toàn diện cho những thách thức AI trong thế giới thực.

Đối với những ai đang tìm kiếm hiệu suất tiên tiến nhất, chúng tôi khuyên bạn nên khám phá Ultralytics YOLO11 . YOLO11 xây dựng dựa trên di sản của YOLOv5 với độ chính xác, tốc độ và khả năng đa dạng tính năng hơn nữa, đại diện cho tương lai của AI thị giác. Các mô hình chuyên dụng khác như RT-DETR cũng có sẵn cho các ứng dụng dựa trên máy biến áp.

Khám phá đầy đủ các công cụ và mô hình trong Tài liệu mô hình Ultralytics .


Bình luận